53
Pedro Vieira Alberto APONTAMENTOS DE FUNDAMENTOS DE F ´ ISICA MODERNA Coimbra 1995

APONTAMENTOS DE FUNDAMENTOS DE F¶ISICA MODERNAAPONTAMENTOS DE FUNDAMENTOS DE F ISICA MODERNA Coimbra 1995 1. INTRODUC»AO~ A RELATIVIDADE RESTRITAµ x 1.1 PRINC ‡PIO DE RELATIVIDADE

  • Upload
    others

  • View
    16

  • Download
    0

Embed Size (px)

Citation preview

  • Pedro Vieira Alberto

    APONTAMENTOS DE

    FUNDAMENTOS DE FÍSICA MODERNA

    Coimbra 1995

  • 1. INTRODUÇÃO À RELATIVIDADE RESTRITA

    § 1.1 PRINĆıPIO DE RELATIVIDADE DE GALILEU E O PROBLEMA DO ÉTER:EXPERIÊNCIA DE MICHELSON-MORLEY

    Ao viajar de carro, de comboio, de avião ou outro meio de transporte, todos nós sabemos

    que nos momentos de travagem ou de arranque sentimos exercer sobre nós forças que nos

    empurram para frente ou para trás, e que são mais ou menos intensas consoante a travagem

    ou o arranque é mais ou menos brusco. Também quando se descrevem curvas sentimos forças

    que nos empurram para a esquerda ou para a direita, consoante a curva é descrita para a

    direita ou para a esquerda, respectivamente. Em todas estas situações houve uma alteração

    de velocidade, quer em módulo (aceleração ou travagem em linha recta) quer em direcção (ao

    descrever uma curva) ou mesmo em módulo e direcção (travagem ou aceleração em curva).

    No entanto, fora desses momentos, ou seja, quando a velocidade do carro, comboio ou avião

    não varia, tudo se passa como se estivéssemos sentados na nossa casa, isto é, não sentimos

    sobre nós nenhum efeito que possa ser imputado ao facto de nos estarmos a deslocar num meio

    de transporte. O mesmo se passa em relação a qualquer outro fenómeno mecânico dentro

    do meio de transporte, isto é, que envolva forças exercidas sobre objectos e correspondentes

    movimentos, como seja atirar uma bola ao ar ou simplesmente o acto de nos levantarmos

    do assento e caminharmos no corredor do comboio ou avião. De facto, se se conseguisse

    eliminar todas as vibrações do meio de transporte e as janelas estivessem fechadas, nós não

    podeŕıamos saber se estavámos em movimento ou parados, desde que a velocidade do meio

    de transporte se mantivesse constante.

    As ideias expostas anteriormente podem ser traduzidas dizendo que as leis da Mecânica,

    e em particular a equação fundamental da Dinâmica, ~F = m~a , não dependem do estado

    de movimento do observador. Concretizando, se considerarmos o sistema de referência (ou

    referencial) S da figura 1 (lembrar que para descrevermos qualquer movimento o temos

    que referir a um sistema de eixos, ou um referencial) como sendo um sistema de referência

    inercial (isto é, um sistema de referência para o qual a equação referida atrás é válida ∗ ),

    ∗ Dizendo de outra maneira, podemos definir um sistema de referência inercial ou de inércia como um

    sistema de referência em relação ao qual todos os corpos livres (isto é, sobre os quais não actua nenhuma

    força) se deslocam com velocidade uniforme ou estão em repouso.

  • 2 Caṕıtulo 1 Introdução à Relatividade Restrita

    um sistema S′ que se desloque com uma velocidade ~v = vı̂ segundo eixo dos xx é também

    um sistema inercial, uma que as leis da Mecânica são também válidas para ele. O mesmo

    poderia ser dito, como é óbvio, para um sistema de referência que se desloque em relação a

    S com uma velocidade de módulo, direcção e sentido quaisquer, desde que constantes.

    x

    z

    y

    O

    S

    x '

    z '

    y '

    O '

    S '

    f i g . 1

    v

    O que dissemos atrás é por vezes referido na literatura como o Prinćıpio da Relatividade

    de Galileu, que podemos enunciar então da seguinte maneira:

    As leis da Mecânica são as mesmas em qualquer sistema de referência inercial.

    Repare-se que ao dizer “qualquer sistema de referência inercial” se inclui automatica-

    mente todos os sistemas de referência que se desloquem com velocidades constantes ar-

    bitrárias relativamente a um determinado sistema de inércia.

    Tudo isto decorre intuitivamente da nossa experiência diária e como tal é facilmente

    aceitável por todos. Tal era o caso também no sec. XIX, em que as leis da Mecânica eram já

    sobejamente conhecidas e aplicadas. No entanto, nesse século um outro tipo de fenómenos

    naturais muito importante foi estudado e estabelecidas as leis que o regem: estamos a referir-

    -nos ao electromagnetismo. Na verdade, em 1864 Maxwell propôs um conjunto de equações

    que regem o campo eléctrico e magnético na presença de distribuições de cargas e correntes.

    Acontece que essas equações, na ausência de cargas e correntes (diz-se “no vazio”), dão origem

    a equações de onda para os campos eléctrico e magnético, ou seja, a teoria de Maxwell prevê

    que o campo electromagnético se propage como uma onda. A velocidade de propagação

    dessas ondas no vazio é um certo número ‘c ’ que se verificou ser igual à velocidade de

    propagação da luz no vazio. Isto levou Maxwell a conjecturar que a luz fosse constitúıda por

    ondas electromagnéticas, o que mais tarde foi confirmado experimentalmente por Hertz. Esta

    descoberta levou a que se considerasse o problema do suporte material para a propagação da

    luz. Na verdade, era sabido que todos os fenómenos ondulatórios conhecidos necessitavam

    de um meio para se propagar. Por exemplo, quando se atira uma pedra à água num lago, o

  • Caṕıtulo 1 Introdução à Relatividade Restrita 3

    movimento vibratório das moléculas de água no ponto de impacto transmite-se às moléculas

    vizinhas pelo facto de haver forças entre as moléculas, o que dá origem às ondas circulares

    que observamos. O mesmo se passa em relação aos sons que ouvimos: se não houvesse um

    meio material entre nós e a fonte do som – o ar – não o podeŕıamos ouvir. Isto levou a que

    se considerasse a existência de um “éter”, uma substância existente em todo o espaço, que

    serviria de suporte à propagação da luz. Essa substância tinha propriedades contraditórias:

    deveria ser sufientemente pouco densa para que não se pudesse detectar, mas suficientemente

    viscosa para poder assegurar uma velocidade de propagação tão grande como c = 3 ×108 m/s. Além da sua função como suporte das ondas luminosas, o éter não tinha mais

    nenhuma propriedade que pudesse ser observável, o que desde logo podia levantar suspeitas

    em relação à sua própria existência. Havia, no entanto, uma consequência muito importante

    da existência do éter: ele fazia com que um determinado referencial de inércia se destacasse

    dos outros — aquele em relação ao qual o éter estava em repouso, uma vez que só em relação

    a esse é que a luz teria a velocidade c referida atrás. Na verdade, num referencial que se

    movesse com uma certa velocidade de módulo v em relação ao éter a luz (propagando-se na

    mesma direcção e sentido que o referencial) teria uma velocidade de módulo c− v , tal comoacontece com um passageiro de um carro que se desloca à velocidade de 60 km/h que vê

    outro carro com velocidade de 80 km/h a ultrapassá-lo à velocidade (relativa) de 20 km/h.

    Dada a relação ı́ntima da constante c com as constantes electromagnéticas do vazio,

    podia-se concluir que a existência do éter impedia a extensão do Prinćıpio da Relatividade

    enunciado atrás para os fenómenos luminosos, e, por arrastamento, aos fenómenos electroma-

    gnéticos, uma vez que os sistemas de inércia não eram todos equivalentes.

    A teoria do éter e a consequente existência de um referencial absoluto, relativamente ao

    qual o éter estaria em repouso, levou a que se realizassem várias experiências procurando

    determinar o movimento da Terra relativamente ao éter, através da medição de diferenças na

    velocidade de propagação da luz em direcções diferentes. A mais célebre dessas experiências

    foi a de Michelson e Morley, dois f́ısicos americanos, realizada em 1887.

    f i g . 2

  • 4 Caṕıtulo 1 Introdução à Relatividade Restrita

    O esquema simplificado da experiência está representado na figura 2. Usando um vidro

    semi-espelhado, Michelson e Morley podiam fazer com que um feixe de luz se dividisse em

    dois percorrendo a mesma distância mas em direcções perpendiculares, usando outros dois

    espelhos colocados perpendicularmente um ao outro e a distância igual ao vidro central.

    Desta maneira os dois feixes voltam a encontrar-se num ecrã onde se pode visionar a sua

    interferência ∗ . Vamos supôr que a distância entre o vidro semi-espelhado e cada um dos

    espelhos e o ecrã é D , e que a velocidade da Terra relativamente ao éter é −~v , isto é, que oéter tem a velocidade ~v em relação à Terra (ver figura 2). O feixe incidente é tal que tem a

    mesma direcção e sentido de ~v . A velocidade (em módulo) do feixe A relativamente à Terra

    antes de se reflectir no espelho A há de ser (ver figura 3)

    |~c+ ~v| = c cos θ = c√

    1− v2/c2 ,

    onde ~c é a velocidade do feixe A relativamente ao éter (cuja grandeza é igual a c). Depois

    de se reflectir, a velocidade do feixe A relativamente à Terra será

    |~c ′ + ~v| = c cos θ = c√

    1− v2/c2 .

    F e i x e A

    q c + vc

    vq

    F e i x e B

    v c ' '

    | c | = | c ' | = | c ' ' | = c

    f i g . 3v

    c ' c ' + vv + c ' '

    v - c ' 'v - c ' '

    q

    v

    c ' c ' + v

    O tempo que o feixe A demora a chegar ao ecrã depois de se reflectir no vidro semi-

    espelhado será, então,

    tA =D

    c√

    1− v2/c2 +2D

    c√

    1− v2/c2 =3D

    c√

    1− v2/c2 . (1.1)

    ∗ Como veremos mais tarde, a natureza ondulatória da luz faz com que dois feixes de luz ao se encontraremnum mesmo ponto possam interferir, isto é, as suas intensidades se possam somar ou subtrair, fazendo

    com que o feixe resultante apareça a um observador colocado nesse ponto mais claro ou mais escuro,

    respectivamente.

  • Caṕıtulo 1 Introdução à Relatividade Restrita 5

    Durante o seu percurso até atingir o ecrã, o feixe B tem três velocidades distintas:

    antes de ser reflectido pelo espelho B , depois de ser reflectido nesse espelho, e depois de

    voltar a ser reflectido no vidro semi-espelhado (ver figura 2). No primeiro caso, dado que a

    luz tem a mesma direcção e sentido oposto ao do movimento da Terra, a velocidade da luz

    relativamente à Terra será (em módulo) c+v . No 2o percurso será c−v e no 3o será idênticaà do feixe A no mesmo percurso, ou seja, c

    √1− v2/c2 (ver figura 3). Assim o tempo que

    B gasta desde a primeira incidência no vidro semi-espelhado até atingir o ecrã será

    tB =D

    c− v +D

    c+ v+

    D

    c√

    1− v2/c2 =2D

    c(1− v2/c2) +D

    c√

    1− v2/c2 (1.2)

    Subtraindo a este tempo tA dado pela eq.(1.1), obtém-se

    tB − tA = 2Dc(1− v2/c2) −

    2D

    c√

    1− v2/c2 .

    Isto significa que os dois feixes não chegam ao mesmo tempo ao ecrã e, mediante uma ligeira

    alteração no ângulo entre os espelhos, é produzida uma figura de interferência, ou seja, uma

    série de riscas claras e escuras, correspondentes aos pontos onde as intensidades dos dois

    feixes se somam e onde se anulam, respectivamente (figura 4). Note-se que uma figura deste

    tipo seria sempre obtida desde que houvesse alguma diferença, por mais ligeira que fosse, nas

    distâncias entre os espelhos e o vidro semi-espelhado. Um efeito devido inequivocamente às

    diferentes velocidades dos dois feixes pode obter-se, no entanto, se se rodar todo o sistema

    de 90 graus, trocando desse modo os papéis dos feixes A e B . O que se deveria ver então no

    ecrã seria um deslocamento das riscas claras e escuras, uma vez que, à medida que se roda

    o sistema, os dois feixes vão interferir de maneira diferente.

    f i g . 4

  • 6 Caṕıtulo 1 Introdução à Relatividade Restrita

    O resultado notável desta experiência é que não se observou qualquer deslocamento das

    franjas de interferência. Mesmo repetindo a experiência em diferentes locais e em diferentes

    épocas do ano (de maneira que a Terra tivesse uma velocidade diferente relativamente ao

    éter), o resultado continuou a ser nulo. Outras experiências do mesmo tipo, realizadas

    mais tarde, confirmaram este resultado. A conclusão que se pode tirar é que não se pode

    detectar o movimento da Terra através do éter, ou, o que é o mesmo, a velocidade da luz é a

    mesma independentemente do movimento do observador ou da fonte que a produz. Assim,

    demonstrou-se que o único efeito posśıvel da existência do éter, a alteração da velocidade

    da luz com o movimento de um observador, não existe. Isto levou a que se questionasse

    seriamente a própria existência do éter, por não ter efeitos observáveis e por, realmente, não

    ser necessário para a explicação de quaisquer factos experimentais.

    § 1.2 PRINCÍPIO DE RELATIVIDADE DE EINSTEIN: TRANSFORMAÇÕES DELORENTZ

    Tudo isto levou a que Einstein, em 1905, enunciasse o seu Prinćıpio da Relatividade da

    seguinte maneira:

    Todos os sistemas de referência inerciais são equivalentes para a realização de qualquer

    experiência f́ısica.

    Dito de outra maneira, as leis da F́ısica (tanto em Mecânica como no Electromagnetismo)

    são as mesmas em qualquer sistema de inércia. A este postulado Einstein acrescentou um

    outro:

    A velocidade da luz é a mesma em qualquer referencial de inércia.

    Este postulado vai ao encontro do resultado nulo da experiência de Michelson e Morley

    e tem, além disso, outras consequências importantes, como veremos a seguir.

    Consideremos agora um referencial S ′ que se desloca com velocidade ~v = vı̂ em relação a

    um referencial S , tal como está indicado na figura 1, de tal maneira que as origens O e O′ dossistemas S e S ′ coincidam num instante inicial t = 0. Vamos considerar também um ponto

    do espaço num determinado instante t (designamo-lo por acontecimento). Se esse ponto

  • Caṕıtulo 1 Introdução à Relatividade Restrita 7

    tiver as coordenadas (x, y, z) no sistema S , quais serão as suas coordenadas (designemo-

    -las por (x′, y′, z′)) e o instante t′ correspondente no sistema S ′? Como o movimento do

    sistema S ′ se faz segundo o eixo dos xx , as coordenadas y′ e z′ não são alteradas, isto

    é, são idênticas a y e z , respectivamente. A coordenada x′ vai ser alterada uma vez que,

    decorrido um tempo t , a origem das coordenadas O′ do sistema S ′ percorre uma distânciavt relativamente à origem O do sistema S . Por outro lado, supomos que o tempo “flui” damesma maneira para S e para S′ . De acordo com estas ideias podemos escrever

    x′ = x− vt

    y′ = y

    z′ = z

    t′ = t

    (1.3)

    A este conjunto de equações para a transformação de coordenadas entre S e S ′ chama-se

    transformações de Galileu. A ele corresponde uma transformação de velocidades, obtida

    derivando as coordenadas em ordem ao tempo:

    vx′ =dx′

    dt′=

    dx′

    dt=

    dx

    dt− v = vx − v

    vy′ =dy′

    dt′=

    dy′

    dt=

    dy

    dt= vy

    vz′ =dz′

    dt′=

    dz′

    dt=

    dz

    dt= vz

    (1.4)

    Como se pode ver, estas equações estão de acordo com a transformação de velocidades

    que usámos para acharmos a velocidade dos feixes de luz na experiência de Michelson e

    Morley e que, no fundo, que nos é intuitiva (lembrar o exemplo do carro que ultrapassa

    outro na estrada). No entanto, como é evidente, estas equações não são compat́ıveis com

    o prinćıpio da relatividade de Einstein, uma vez que a velocidade da luz não se mantém

    constante quando passamos do sistema S para o sistema S′ (basta susbstituir vx por c nas

    equações (1.4)). Por outro lado, pode também verificar-se que as equações de Maxwell se

    alteram perante estas transformações. Isto significa que as transformações de Galileu (eqs.

    (1.3)) não satisfazem o prinćıpio da relatividade de Einstein. Vamos tentar deduzir um

    conjunto de equações que satisfaçam os postulados de Einstein. Um posśıvel candidato é o

  • 8 Caṕıtulo 1 Introdução à Relatividade Restrita

    conjunto de equações (só para as coordenadas)

    x′ = γ(x− vt) (1.5 a)y′ = y (1.5 b)

    z′ = z , (1.5 c)

    onde γ é uma constante, posśıvelmente dependendo de v . A justificação para a 2a e 3a

    equações é simples: o movimento segundo o eixo dos xx não deve alterar as coordenadas y

    e z . Relativamente à 1a equação, podemos argumentar o seguinte:

    1. A equação deve ser linear, ou seja, não deve conter potências superiores a 1 em x e em t ,

    uma vez que um acontecimento em S ′ só deve corresponder a um e um só acontecimento

    em S . Dito de outa maneira, deve haver uma correspondência uńıvoca entre os valores

    de x e t e x′ e t′ .

    2. Se x = vt , isto é, se tivermos um objecto em repouso em S′ e situado na sua origem,

    devemos ter x′ = 0.

    Para tentar obter o valor de γ , vamos considerar a equação inversa de (1.5 a), ou seja,

    escrever a coordenada x′ em S′ em função de x e t :

    x = γ′(x′ + vt′) . (1.6)

    Esta equação é obtida usando os mesmos argumentos que foram utilizados para eq. (1.5 a)

    Note-se que se trocou o sinal a v porque o sistema S se desloca com uma velocidade −~v =−vı̂ relativamente a S ′ . Para saber como é que se relaciona γ′ com γ , supunhamos agoraque se invertem os eixos dos xx e dos zz dos sistemas S e S′ na figura 1. Agora os papéis

    dos sistemas S e S′ ficam trocados, uma vez que agora é o sistema S′ que se desloca com

    uma velocidade com componente −v relativamente aos novos eixos. Assim, a transformação(1.6) fica agora

    x′ = γ′(x+ vt) . (1.7)

    Por outro lado, se trocarmos os sinais de x e x′ na equação (1.5 a), temos

    x′ = γ(x+ vt) , (1.8)

  • Caṕıtulo 1 Introdução à Relatividade Restrita 9

    o que nos permite concluir que

    γ′ = γ . (1.9)

    Por outro lado, do postulado da constância da luz em qualquer sistema de inércia, sabemos

    que se x = ct , então também se deve ter x′ = ct′ . Substituindo estas expressões em (1.5 a)

    e (1.6), tendo em conta (1.9), temos

    ct′ = γt(c− v)

    ct = γt′(c+ v) .

    Multiplicando estas duas equações termo a termo temos

    c2tt′ = γ2(c2 − v2)tt′

    o que dá para γ , dividindo ambos os termos da equação por tt′ ,

    γ =1√

    1− v2/c2 . (1.10)

    Tomámos a raiz positiva porque se deverá verificar que, quando v → 0, x′ → x . Eliminandox′ entre as eqs. (1.5 a) e (1.6) temos

    x

    γ− vt′ = γ(x− vt)

    vt′ = γ(vt− x+ xγ2

    )

    t′ = γ[t+

    x

    v

    ( 1γ2

    − 1)]

    = γ(t− vxc2

    ) .

    Esta equação é notável porque nos diz o tempo não “flui” da mesma maneira em dois sistemas

    de inércia que se desloquem um em relação a outro com uma certa velocidade. Juntando

    agora todas as equações já obtidas podemos escrever o que se chama a transformação de

  • 10 Caṕıtulo 1 Introdução à Relatividade Restrita

    Lorentz entre coordenadas e instantes de tempo nos sistemas S e S′ :

    x′ =x− vt√1− v2/c2

    y′ = y

    z′ = z

    t′ =t− vx

    c2√1− v2/c2

    (1.11)

    Como se pode ver, estas transformações são bastante diferentes das transformações de

    Galileu, eqs. (1.3). Aparentemente, estas últimas estarão erradas, dado que não obedecem ao

    prinćıpio de relatividade de Einstein. No entanto, como já foi sublinhado algumas vezes, elas

    correspondem, de alguma maneira, às transformações de coordenadas que intuitivamente,

    ou se se quiser, baseando-nos na experiência do dia-a-dia, seriam correctas. Na verdade, se

    olharmos atentamente para as equações (1.11) verificamos que elas contêm a transformação

    de Galileu. Na verdade, para velocidades v muito menores do que c (escreve-se v ¿ c),γ ≈ 1 e t− vx/c2 ≈ t pelo que as eqs. (1.11) se reduzem nesse caso às equações (1.3). Ouseja, a transformação de Galileu continua válida desde que a velocidade relativa entre os dois

    sistemas de inércia seja muito pequena comparada com a velocidade da luz. Ora, no nosso

    dia-a-dia, é exactamente isso que acontece. Para termos uma ideia do efeito da correcção

    introduzida pelas equações de Lorentz (1.11) relativamente às (1.3) vamos calcular o valor

    de γ para o caso do sistema S ′ se deslocar a uma velocidade igual à de um jacto supersónico

    com velocidade igual a duas vezes a velocidade do som (cerca de 680 m/s, ou perto de 2500

    km/h). Temos

    γ =1√

    1− ( 6803×108 )

    2≈ 1 + 1

    2

    ( 6803× 108

    )2= 1 + 2, 569× 10−12 = 1, 000000000002569 ,

    o que difere de um em menos de uma parte em 1011 , ou seja uma parte em cem milhares de

    milhões! No entanto, há fenómenos observáveis em que se tem de aplicar as transformações

    de Lorentz, como o caso do decaimento de certas part́ıculas ou ainda nos fenómenos electro-

    magnéticos (na verdade, as equações do electromagnetismo apenas se mantêm invariantes

    — mantêm a mesma forma — se aplicarmos às coordenadas e ao tempo as transformações

    de Lorentz (1.11)).

  • Caṕıtulo 1 Introdução à Relatividade Restrita 11

    § 1.3 CONSEQUÊNCIAS DAS TRANFORMAÇÕES DE LORENTZ: CONTRACÇÃODE LORENTZ E DILATAÇÃO DO TEMPO

    Vamos examinar agora algumas das consequências das transformações de Lorentz. Ima-

    ginemos que no sistema S′ se encontra uma régua em repouso, disposta ao longo do eixo dos

    xx , de comprimento L0 , tal como se indica na figura 5.

    x

    z

    y

    O

    S

    x '

    z '

    y '

    O '

    S '

    f i g . 5

    v

    x 0 ' x 1 '

    L 0 }Vamos ver qual é o comprimento desta régua do ponto de vista do observador em S . Uma

    vez que a régua está em movimento para este observador, ele terá de obter as coordenadas das

    suas extremidades (para dáı calcular o comprimento) simultaneamente, ou seja, no mesmo

    instante. Sejam então x′1 e x′2 as coordenadas das extremidades da régua em S

    ′ , de tal

    maneira que L0 = x′2 − x′1 . Da primeira equação de (1.11) temos

    x′1 =x1 − vt√1− v2/c2

    x′2 =x2 − vt√1− v2/c2 ,

    onde x1 e x2 são as coordenadas das extermidades da régua medidas pelo observador em

    S . Subtraindo as equações termo a termo, temos

    x′2 − x′1 =x2 − x1√1− v2/c2 ,

    ou ainda, designado por L = x2 − x1 o comprimento da régua medido pelo observador emS ,

    L = L0√

    1− v2/c2 . (1.12)

    Como√

    1− v2/c2 < 1 então L < L0 ! Ou seja, do ponto de vista do observador em S ,o comprimento da régua é menor do que o que é medido por outro observador em S ′ ! A

  • 12 Caṕıtulo 1 Introdução à Relatividade Restrita

    este fenómeno dá-se o nome de contracção de Lorentz e implica que todos os objectos que se

    desloquem a uma velocidade v próxima da da luz apareçam a um observador contráıdos na

    direcção do seu movimento. Note-se que os comprimentos medidos em direcções perpendicu-

    lares ao movimento (no nosso caso, perdendiculares ao eixo dos xx) se mantêm inalterados,

    de acordo com a 2a e 3a equações de (1.11). Por exemplo, um cubo com 20 cm de aresta que

    se desloque a uma velocidade v = 3/5 c parecerá a alguém que o observe um paraleliṕıpedo

    de secção quadrada de 20 cm de aresta e com comprimento na direcção do movimento igual

    a 20√

    1− 9/25 = 20× 4/5 = 16 cm ∗ .

    Outro fenómeno “estranho” que decorre das transformações de Lorentz prende-se com o

    tempo. Da última equação (1.11) é desde logo evidente que a forma com o tempo flui não

    é a mesma para dois observadores nos sistemas S e S ′ . Consideremos então um relógio em

    repouso em S ′ num certo ponto do eixo dos xx de coordenada x′ . Como se relacionarão os

    intervalos de tempo medidos por um observador em S ′ e os medidos por um observador em

    S nesse relógio? Consideremos para isso a equação inversa da última equação em (1.11),

    isto é, a equação que dá o tempo medido em S como função da posição e do tempo em S ′ .

    Para obter essa equação, basta trocar o sinal de v , uma vez que, do ponto de vista de S ′ , o

    sistema S tem uma velocidade −v segundo o eixo dos xx , ou seja,

    t =t′ + vx

    c2√1− v2/c2 . (1.13)

    Aplicando esta equação ao relógio referido para dois instantes t′1 e t′2 medidos em S

    ′ , temos

    t1 =t′1 +

    vx′

    c2√1− v2/c2

    t2 =t′2 +

    vx′

    c2√1− v2/c2 ,

    (1.14)

    onde t1 e t2 são os correspondentes instantes medidos por um observador em S no mesmo

    ∗ Na verdade, se tal experiência se pudesse fazer, o observador veria um paraleliṕıpedo deformado, devido

    à diferença de tempos de chegada ao observador da luz vinda dos vários pontos do cubo.

  • Caṕıtulo 1 Introdução à Relatividade Restrita 13

    relógio. Subtraindo as equações termo a termo, temos

    t2 − t1 = t′2 − t′1√1− v2/c2 > t

    ′2 − t′1 (1.15)

    Ou seja, os intervalos de tempo medidos pelo observador em S são maiores dos que os

    medidos pelo observador em S ′ . Isto quer dizer que, do ponto de vista do observador em

    S , o tempo passa mais devagar, ou seja, para este observador, todos os fenómenos em S ′

    processam-se a um ritmo mais lento. A lentidão é tanto maior quanto mais a velocidade v

    do sistema S ′ se aproximar da velocidade da luz c . A este fenómeno chama-se dilatação do

    tempo. Devemos notar que apenas o observador em S nota esta lentidão, uma vez que para

    um observador em S ′ tudo se passa ao ritmo normal.

    Há confirmações experimentais deste facto. A mais citada refere-se ao decaimento de

    uma part́ıcula chamada muão, que tem um tempo de vida τ = 2 × 10−6 segundos. Estapart́ıcula é detectada na Terra ao ńıvel do mar e provém de decaimentos de outras part́ıculas

    que atingem a alta atmosfera (constituindo o que se chama os raios cósmicos). A velocidade

    t́ıpica dos muões é de cerca 2, 994 × 108 m/s, ou 0, 998c . Ora, a esta velocidade, o muãodeveria percorrer uma distância d = 2, 994×108×2×10−6 = 600 metros. Como os muões sãocriados a vários quilómetros de altitude, isto significa que nunca poderiam ser detectados à

    superf́ıcie da Terra, o que não é verdade! A solução deste problema está em nos apercebermos

    que um observador à superf́ıcie da Terra mede um tempo de vida do muão diferente de τ

    pelo facto de este se deslocar com uma velocidade próxima da da luz relativamente a ele.

    Podemos obter esse tempo de vida, que designamos por τ ′ , aplicando a fórmula (1.15):

    τ ′ =τ√

    1− v2/c2 =2× 10−6√

    1− (0, 998c/c)2 = 31, 7× 10−6 s . (1.16)

    A distância percorrida seria então de d′ = 2, 994× 108 × 31, 7× 10−6 = 9500 metros, o quejá explica porque é os muões são detectados à superf́ıcie da Terra.

    A dilatação do tempo também foi verificada em experiências realizadas em 1971 e 1975

    usando um relógio de Césio que foi transportado de avião a jacto à volta do mundo e depois

    comparado com um relógio idêntico que ficou em terra. Embora a diferença de tempo

    prevista pela Relatividade Restrita seja muito pequena — a velocidade do avião é muito

    pequena comparada com a velocidade da luz — foi posśıvel detectar um atraso no relógio

    que viajou de avião relativamente ao que ficou em terra, dada a alt́ıssima precisão deste tipo

    de relógios.

  • 14 Caṕıtulo 1 Introdução à Relatividade Restrita

    § 1.4 SIMULTANEADADE. DIAGRAMAS ESPAÇO-TEMPO

    Outra consequência das transformações de Lorentz é que acontecimentos que são si-

    multâneos num referencial (isto é, ocorrem no mesmo instante) não o são noutro referencial.

    Consideremos, por exemplo, dois acontecimentos no sistema S que ocorrem no mesmo ins-

    tante t0 e em dois pontos do eixo dos xx de coordenadas x1 e x2 . Aplicando a equação de

    transformação do tempo, temos

    t′1 =t0 − vx1/c2√1− v2/c2

    t′2 =t0 − vx2/c2√1− v2/c2

    (1.17)

    sendo t′1 e t′2 os tempos medidos no sistema S

    ′ para os dois acontecimentos. Se subtrairmos

    as equações termo a termo, obtemos

    t′2 − t′1 =v(x1 − x2)/c2√

    1− v2/c2 6= 0 ,

    Ou seja, os mesmos acontecimentos já não simultâneos em S′ ! Este facto é consequência do

    tempo não “fluir” com a mesma rapidez para observadores com movimento relativo. Note-se,

    no entanto, que por mais velocidade de que um observador esteja animado, o tempo nunca

    muda de sentido, isto é, a ordem temporal dos acontecimentos nunca se inverte, embora eles

    se sucedam mais lentamente. Isto significa que um observador numa nave espacial que se

    desloque a uma velocidade próxima da da luz, ao observar a Terra, nunca verá as pessoas a

    ficarem cada vez mais novas, as plantas a converterem-se outra vez em sementes, etc.!

    Um facto interessante acerca das transformações de Lorentz (1.11) é que a quantidade

    c2t2 − x2 não se altera quando se passa do sistema S para o sistema S ′ . Na verdade, secalcularmos c2t′2 − x′2 usando as equações (1.11) temos

    c2t′2 − x′2 =γ2[(

    ct− vcx)2

    −(x− vt

    )2]=

    = −γ2(x− vt+ ct− v

    cx)(

    x− vt− ct+ vcx)

    = γ2(c− v

    )(c+ v

    )(t+

    x

    c

    )(t− x

    c

    )= c2t2 − x2 ,

  • Caṕıtulo 1 Introdução à Relatividade Restrita 15

    onde γ = 1/√

    1− v2/c2 . Para uma transformação de Lorentz geral em que as coordenadasy e z também sejam modificadas, pode demonstrar-se que a quantidade

    s2 = c2t2 − x2 − y2 − z2

    se mantém invariante. Este facto permite dar uma interpretação geométrica às trans-

    formações de Lorentz, por analogia com o que se passa com uma rotação no espaço. Neste

    último caso, o que se mantém invariante (constante) é o módulo do vector posição dos pon-

    tos que são rodados relativamente à origem do sistema de coordenadas (por exemplo, os

    pontos de uma esfera centrada na origem das coordenadas). Isto quer dizer que, embora as

    coordenadas dos vectores rodados sejam diferentes das iniciais, a soma dos seus quadrados

    x2 + y2 + z2 se mantém constante. Podemos imaginar que as transformações de Lorentz

    operam uma espécie de rotação não só no espaço, mas também no tempo, dado que elas

    “misturam” as coordenadas x, y, z com os instantes t . A esse espaço conjunto com quatro

    dimensões formado pelas coordenadas e pelo tempo chama-se espaço-tempo e a um ponto

    desse espaço (definido pelos quatro valores x, y, z, ct) ∗ um acontecimento. Por outro lado,

    a um vector definido neste espaço chama-se um tetravector ou quadrivector. Uma diferen-

    ça importante em relação aos vectores “normais” do espaço a três dimensões é de como

    é calculado o seu “módulo” ao quadrado. Por exemplo, para o tetravector posição (com

    componentes x, y, z, ct), ele é definido como sendo

    c2t2 − x2 − y2 − z2

    em vez de c2t2 + x2 + y2 + z2 . Desta maneira que podemos afirmar que o “módulo” deste

    tetravector se mantém constante perante uma tranformação de Lorentz. De acordo com esta

    regra, define-se a “distância” (intervalo) ao quadrado entre dois acontecimentos como

    (∆s)2 = c2(∆t)2 − (∆x)2 − (∆y)2 − (∆z)2 . (1.18)

    Este intervalo permite-nos estabelecer um critério para saber quando um acontecimento

    pode causar outro. Na verdade, como veremos na próxima secção, a teoria da Relatividade

    Restrita tem como consequência que nada se pode deslocar com velocidades superiores à

    da velocidade da luz no vazio c . Isto significa que não há interacções instantâneas, isto é,

    ∗ Notar que o tempo vem multiplicado por c.

  • 16 Caṕıtulo 1 Introdução à Relatividade Restrita

    qualquer influência que um objecto exerça sobre outro tem um limite superior para a sua

    velocidade de propagação. Ou seja, qualquer fenómeno (por exemplo a presença de uma

    carga eléctrica) que se produza num certo ponto do espaço de coordenadas x, y, z no ins-

    tante t só poderá influenciar o estado de um objecto colocado no ponto de coordenadas

    x+∆x, y +∆y, z +∆z no instante t+∆t (por exemplo, outra carga) se tivermos

    distância entre os dois acontecimentos

    tempo decorrido entre os dois acontecimentos=

    √(∆x)2 + (∆y)2 + (∆z)2

    ∆t≤ c ,

    ou ainda, elevando ao quadrado ambos os termos da desigualdade e multiplicando por (∆t)2 ,

    c2(∆t)2 ≥ (∆x)2 + (∆y)2 + (∆z)2 ⇔ c2(∆t)2 − (∆x)2 − (∆y)2 − (∆z)2 ≥ 0 .

    Conclúımos portanto que para dois acontecimentos estarem relacionados é necessário que

    o intervalo espaço-temporal entre eles, definido por (1.18), seja maior ou igual a zero. Em

    particular, só será igual a zero se a interacção se propagar à velocidade c (tal seria o caso das

    duas cargas referidas atrás, desde que fossem colocadas no vazio). Aos três tipos de valores

    posśıveis de (∆s)2 dão-se os seguintes nomes:

    (∆s)2 =

    < 0 intervalo do tipo espaço

    = 0 intervalo do tipo luz

    > 0 intervalo do tipo tempo .

    x

    c t

    f i g . 6

    c t = xc t = - x

    A L G U R E SA LG U

    R ES

    F U T U R O

    P A S S A D O

    a c o n t e c i m e n t o 1

    Na figura 6 estão esquematizados estes três casos num diagrama espaço-temporal em

    que se representa apenas a dimensão espacial x . Se considerarmos o acontecimento 1 na

    origem dos eixos (x = 0, t = 0) então os acontecimentos futuros (t > 0) que ele poderá

    influenciar ou os aconteciamentos passados (t < 0) que o poderão ter influenciado situam-se

    na zona sombreada, limitada pelas rectas de equações ct = x e ct = −x . Os acontecimentossituados nestas rectas correspondem à propagação da interacção com velocidade c no sentido

  • Caṕıtulo 1 Introdução à Relatividade Restrita 17

    do eixo positivo e negativo dos xx , respectivamente. Se considerássemos também os eixos

    dos yy e dos zz as rectas converter-se-iam num cone a quatro dimensões: é o chamado

    cone de luz. Em resumo, todos os acontecimentos dentro e à superf́ıcie do cone de luz

    podem ser relacionados com o acontecimento 1, correspondendo a (∆s)2 > 0 e (∆s)2 = 0,

    respectivamente. Para todos os acontecimentos fora do cone de luz, ao contrário, não se

    pode estabelecer nenhuma relação de causa e efeito com o acontecimento 1.

    § 1.5 TRANSFORMAÇÃO DE VELOCIDADES

    Usando as transformações de Lorentz, vamos ver agora como observadores nos sistemas

    S e S ′ que temos vindo a considerar medem a velocidade de um certo objecto. No sistema

    S ′ , esta será dada pela variação da posição do objecto relativamente ao tempo, medidos em

    S ′ . Assim, para a componente da velocidade segundo o eixo dos xx temos

    vx′ =dx′

    dt′=

    =dt

    dt′dx′

    dt

    =1dt′dt

    d

    dt

    x− vt√1− v2/c2

    =vx − v1− vvx

    c2, (1.19)

    onde vx =dxdt

    e se utilizaram as expressões de x′ e t′ em (1.11). As expressões das

    componentes da velocidade segundo os eixos dos yy e zz no sistema S ′ obtêm-se de uma

    maneira análoga:

    vy′ =dy′

    dt′=

    dt

    dt′dy′

    dt=

    vy√

    1− v2/c21− vvx

    c2(1.20 a)

    vz′ =dz′

    dt′=

    dt

    dt′dz′

    dt=

    vz√

    1− v2/c21− vvx

    c2. (1.20 b)

    Tal como acontecia com as tranformações de Lorentz, podemos verificar que estas equa-

    ções se reduzem às eqs. (1.4) deduzidas da transformação de Galileu quando a velocidade v

  • 18 Caṕıtulo 1 Introdução à Relatividade Restrita

    de S ′ é muito pequena comparada com c . Podemos também notar que as componentes y e

    z da velocidade em S ′ dependem da sua componente x em S .

    É interessante verificar que estas equações satisfazem o postulado de Einstein relativo à

    velocidade da luz. Realmente, se fizermos vx = c e vy = vz = 0 obtemos

    vx′ =c− v1− vc

    c2

    = cc− vc− v = c , (1.21)

    sendo vy′ = vz′ = 0. Repare-se que este resultado é independente de v , isto é, por mais

    depressa que “persigamos” um raio de luz, este desloca-se em relação a nós sempre com

    velocidade c !

    § 1.6 “MASSA” RELATIVı́STICA

    Usando as relações deduzidas na secção anterior, vamos agora ver o que acontece à massa

    de um corpo na relatividade restrita. Antes de mais nada, vamos estabelecer o que se entende

    por massa: por conveniência vamos defini-la como o coeficiente que multiplica a velocidade

    para dar a quantidade de movimento, ou seja,

    ~p = m~v . (1.22)

    Mais tarde vamos analisar brevemente as consequências desta definição. Vamos também

    supôr que a quantidade de movimento se conserva nas colisões relativistas. Consideremos

    então a colisão de dois corpos idênticos, que designamos por A e B , de tal maneira que A

    está em repouso no sistema S e B está em repouso no sistema S ′ (ver figura 7). Tal como

    temos vindo a considerar, o sistema S ′ move-se com uma velocidade ~v com a direcção e

    sentido do eixo positivo dos xx relativamente ao sistema S .

    x

    z

    y

    O

    S

    x '

    z '

    y '

    O '

    S '

    f i g . 7

    v

    AB

  • Caṕıtulo 1 Introdução à Relatividade Restrita 19

    Consideramos também que a colisão não é frontal, mas sim que os corpos chocam “de

    raspão”. Sendo assim, do ponto ponto de vista de um observador em S , o corpo B tem

    uma velocidade ~v antes do choque, e uma certa velocidade ~vB depois do choque. Dadas

    as caracteŕısticas do choque, esta velocidade terá também uma certa componente segundo o

    eixo dos yy , que vamos designar por vBy . O corpo A , por sua vez, terá uma certa velocidade

    ~vA com uma componente segundo y igual a vAy . Por outro lado, um observador em S′ vê o

    corpo A a aproximar-se com velocidade −~v do corpo B antes do choque. Depois do choqueos corpos A e B terão velocidades que designamos por ~vA′ e ~vB ′ , respectivamente, com

    componentes segundo o eixo dos yy de vAy′ e vBy

    ′ (ver figura 8).

    S i s t e m a S S i s t e m a S '

    f i g . 8A n t e s d o c h o q u e

    D e p o i s d o c h o q u ey

    x

    vB

    v B

    v x Bv y B

    A

    v A

    v x Av y A

    - v A

    v ' Av ' y A

    v ' x A

    B

    v ' Bv ' y B

    v ' x B

    Podemos notar que do ponto de vista dos dois observadores em S e S ′ a colisão é

    exactamente a mesma, dado que os corpos são idênticos, sendo a única diferença o facto de

    as velocidades antes do choque serem simétricas. Isto quer dizer que, aplicando o prinćıpio

    da relatividade, os resultados da colisão devem ser semelhantes para os dois observadores.

    Em particular, o corpo que “bate” (B no sistema S e A no sistema S ′ ) no corpo que está

    em repouso deve adquirir a mesma velocidade segundo o eixo dos yy ∗ do ponto de vista dos

    dois observadores. Por outras palavras, devemos ter

    |vBy | = |vAy ′| . (1.23)

    Aplicando agora a conservação da quantidade de movimento segundo o eixo dos yy ao choque

    visto do sistema S , temos

    mA|vAy | = mB|vBy | , (1.24)

    ∗ Em módulo, porque se por exemplo o corpo B for “para cima” (componente da velocidade segundo o

    eixo dos yy positiva) o corpo A deve ir “para baixo”, ou seja, deve ter a componente da velocidade

    segundo o eixo dos yy negativa.

  • 20 Caṕıtulo 1 Introdução à Relatividade Restrita

    onde consideramos mA e mB as massas dos corpos A e B , respectivamente. Por outro lado,

    podemos relacionar vAy′ e vAy usando a equação (1.20 a). Desta maneira, obtemos

    mA|vAy | = mB|vAy |√

    1− v2/c2

    1− vvAx

    c2

    ⇔ mB = mA1− vv

    Ax

    c2√1− v2/c2 . (1.25)

    Se supusermos agora que a colisão se dá de tal maneira que os corpos mal se toquem, e que

    portanto o corpo A se mantenha praticamente em repouso depois do choque (sendo então

    vAx ≈ 0), esta última equação vem

    mB =m

    (0)A√

    1− v2/c2 . (1.26)

    Como supusemos os corpos idênticos, a massa de A medida em repouso (designada aqui por

    m(0)A ) deve ser igual à massa de B em repouso, pelo que esta equação nos diz que um corpo

    tem a sua massa modificada pelo facto de deslocar com uma certa velocidade (notar que v

    é a velocidade do corpo B )!. Este é um resultado notável, que podemos exprimir dizendo

    que um corpo em movimento com uma certa velocidade de módulo v adquire uma massa m

    igual a

    m =m0√

    1− v2/c2 . (1.27)

    A massa m0 designa-se por massa de repouso. Uma consequência imediata deste resultado

    é que a equação de Newton já não se pode escrever indiferentemente como ~F = m~a ou

    ~F =d~pdt

    , uma vez que a massa já não é constante. A equação tem agora a seguinte forma

    ~F =d~p

    dt= m

    d~v

    dt+

    dm

    dt~v , (1.28)

    ou seja, a força já não é igual à massa vezes a aceleração! No entanto, se v ¿ c , m ≈m0 e dm/dt ≈ 0 e obtemos a equação de Newton ~F = m0~a . O facto da força não serparalela à aceleração, leva alguns autores a evitar chamar “massa” a m , dado que esta já

    não representa mais o coeficiente que traduz a inércia do corpo, ou seja, a sua resistência a

    ser acelerado. Apenas m0 (para baixas velocidades) tem essa propriedade, além de poder

  • Caṕıtulo 1 Introdução à Relatividade Restrita 21

    ser considerado uma caracteŕıstica intŕınseca do corpo, ao contrário de m , que depende da

    velocidade do corpo. No entanto, neste curso vamos adoptar a definição de massa (1.22),

    por ser conveniente para perceber a relação que existe entre massa e energia.

    Outra consequência da equação (1.27) é que, quando a velocidade do corpo se aproxima

    de c , m tende para infinito. O mesmo acontece com a sua derivada, pelo que, da equação

    (1.28), vemos que para acelerar um corpo cuja velocidade é quase igual a c é necessário

    exercer uma força enorme, tanto maior quanto mais a velocidade se aproxima de c . Isto

    quer dizer que nunca se pode acelerar um corpo até à velocidade c , ou seja, a velocidade da

    luz c é um limite superior para a velocidade de qualquer corpo. Como já foi referido atrás,

    isto inclui as part́ıculas que medeiam as várias interacções entre corpos, o que significa que

    estas não são interacções instantâneas. Convém precisar que este limite superior refere-se

    apenas à velocidade da luz no vazio. É posśıvel que haja part́ıculas que se desloquem com

    velocidades superiores à da luz num certo meio com um ı́ndice de refracção n > 1, onde a

    velocidade da luz é cn = c/n < c . Quando isso acontece, a part́ıcula pode emitir um tipo de

    luz que tem uma frente de onda ∗ cónica (ver figura 9). A luz deste tipo chama-se radiação

    de Čerenkov, e pode ser vista nos reactores nucleares de piscina, como o de Sacavém, sob a

    forma de uma luz azulada.

    cn t

    1 2 3v t

    cnv >

    f i g . 9

    Podemos notar, a propósito, que este é um fenómeno que é comum a qualquer tipo de

    ondas. São bem conhecidas as ondas formadas a partir da quilha de um barco que se desloca

    num lago com velocidade superior à velocidade de propagação da ondas na água. As ondas

    de choque de um avião supersónico que se desloca com uma velocidade superior à do som

    têm também a mesma origem.

    ∗ A intersecção das várias ondas esféricas emitidas nos vários pontos do percurso.

  • 22 Caṕıtulo 1 Introdução à Relatividade Restrita

    § 1.7 RELAÇÃO ENTRE MASSA E ENERGIA

    Na última secção vimos que podemos definir uma massa que depende da velocidade do

    corpo a que diz respeito. Ora, como sabemos, à velocidade de um corpo está associada uma

    energia, a energia cinética. Vamos ver que relação se pode estabelecer entre aquela massa e

    a energia do corpo. Consideremos o trabalho realizado por uma força ~F num deslocamento

    infinitesimal d~r . Como sabemos, esse trabalho é igual a uma variação infinitesimal da energia

    cinética dT , ou seja,

    dT = ~F . d~r .

    Se considerarmos a variação da energia por unidade tempo (a potência) temos

    dT

    dt= ~F .~v . (1.29)

    Usando a equação de Newton e a eq. (1.22), esta relação pode ser escrita como

    dT

    dt=

    1

    m

    d~p

    dt.~p =

    1

    2m

    dp2

    dt, (1.30)

    onde se utilizou a igualdade dp2/dt = d~p2/dt = 2~p. (d~p/dt). Usando agora a equação (1.27),

    podemos escrever

    m2(1− v

    2

    c2

    )= m20

    m2 − p2

    c2= m20

    p2 = (m2 −m20)c2 .

    (1.31)

    Substituindo em (1.30) ficamos com

    dT

    dt=

    1

    2m

    d(m2 −m20)c2dt

    =d(mc2)

    dt. (1.32)

    Esta relação é muito importante, porque nos diz que a variação da energia cinética é igual à

    variação de mc2 , o que nos sugere a identificação da energia cinética com mc2 a menos de

  • Caṕıtulo 1 Introdução à Relatividade Restrita 23

    uma constante. Na verdade, foi isso mesmo que Einstein fez, ao propôr que um corpo em

    repouso tivesse uma energia dada por

    E = m0c2 . (1.33)

    Em movimento, o corpo tem então uma energia que, de acordo com (1.32), deve ser dada

    por

    E = T +m0c2 = mc2 . (1.34)

    O significado destas equações é de que o corpo tem uma energia associada à sua massa,

    mesmo em repouso, ou seja, um corpo tem um conteúdo energético dado pela sua massa

    vezes a velocidade da luz no vazio ao quadrado. Por exemplo, um grama de matéria tem

    uma energia igual a 10−3×9×1016 = 9×1013 Joules, equivalente à energia que produz umacentral térmica de grande dimensão durante cerca de um dia! Note-se que a equivalência entre

    massa e energia estende-se a qualquer tipo de energia, de tal maneira que a massa de uma

    part́ıcula composta, formada por duas part́ıculas cuja soma da energia potencial e cinética

    é negativa, tem uma massa inferior à soma das massas das duas part́ıculas separadamente.

    Dado o valor de c2 , qualquer pequena diferença de massa pode dar origem a quantidades

    enormes de energia. É assim que se explica a grande quantidade de energia proveniente da

    fissão de dois núcleos de urânio e que é usada nas centrais nucleares para a produção de

    energia eléctrica. É mesmo posśıvel transformar toda a massa de uma part́ıcula em energia

    nas reacções de aniquilação de part́ıculas e anti-part́ıculas, como é o caso do electrão e

    positrão. Ao aniquilar-se, dão origem a dois fotões (referir-nos-emos mais tarde a este tipo

    de part́ıculas) que, no sistema de referência em que o electrão e positrão estão em repouso,

    têm energia igual a m0c2 , sendo m0 a massa de repouso do electrão (que é a mesma do

    positrão).

    Tem interesse verificar que podemos obter a expressão usual da energia cinética para

    velocidades baixas a partir de (1.34). Na verdade, podemos escrever

    T = (m−m0)c2 = m0c2( 1√

    1− v2/c2 − 1). (1.35)

    Se v ¿ c , então 1/√

    1− v2/c2 − 1 = (1− v2/c2)−1/2 − 1 ≈ 1/2(v2/c2), uma vez se tem, deuma maneira geral

    (1± x)α = 1± αx+ . . . ≈ 1± αx se x ¿ 1 , (1.36)

  • 24 Caṕıtulo 1 Introdução à Relatividade Restrita

    sendo α um número real. Substituindo em (1.35) temos

    T =1

    2m0v

    2 . (1.37)

    Para concluir este caṕıtulo vamos deduzir duas relações fundamentais da teoria da rela-

    tividade entre a energia E de um corpo e a sua quantidade de movimento ~p . A primeira

    pode obter-se de (1.34) e (1.22) e dá

    ~p =E

    c2~v . (1.38)

    A segunda pode obter-se de (1.34) e (1.27). Na verdade, temos

    m2(1− v

    2

    c2

    )= m20 ⇔ E2

    (1− v

    2

    c2

    )= m20c

    4 ⇔ E2 = E2v2

    c2+m20c

    4 .

    Usando a equação (1.38) podemos escrever finalmente

    E2 = p2c2 +m20c4 . (1.39).

    Desta equação podemos ver que mesmo uma part́ıcula de massa de repouso nula pode ter

    energia. Esse é caso do fotão, a que nos referiremos mais tarde.

  • 2. INTRODUÇÃO À TEORIA DA RADIAÇÃO

    § 2.1 ONDAS: SUAS CARACTERı́STICAS E PROPRIEDADES

    Todos nós já vimos ondas a propagarem-se: num lago, quando uma pedra cai na água,

    formam-se ondas circulares concêntricas; quando agitamos a extremidade de uma corda,

    esse movimento transmite-se ao longo da corda. O som é também uma onda que se propaga

    (aqui, são modificações na pressão do ar que se propagam). Como já foi referido no caṕıtulo

    anterior, o campo electromagnético também se pode propagar no vazio sob a forma de

    uma onda. A luz do Sol ou de uma lâmpada é composta de ondas deste tipo. De uma

    maneira geral, podemos dizer que uma onda é a propagação pelo espaço de uma variação

    de determinada grandeza f́ısica (deslocação da superf́ıcie um ĺıquido, pressão do ar, campo

    eléctrico e magnético).

    Vamos agora caracterizar um tipo de ondas particularmente importante, as ondas sinu-

    soidais. Imaginemos que aplicamos à extremidade de uma corda disposta na horizontal (que

    podemos supôr coincidir com o eixo dos xx) um movimento periódico harmónico simples

    de frequência ν . Podemos então descrever a posição da extremidade da corda num certo

    instante pela coordenada y(t). Em particular, se considerarmos que inicialmente (t = 0) a

    extremidade da corda tem uma coordenada y = A e que é movimentada “para baixo” nos

    instantes subsequentes (ver figura 10)

    {Ax

    t = 0

    y

    f i g . 1 0

    então a função y(t) será dada por

    y(t) = A cos(2πνt) . (2.1)

    quantidade A chama-se a amplitude da vibração e pode ver-se que −A ≤ y(t) ≤ A paraqualquer valor de t . Como é que este movimento da extremidade se vai propagar aos outros

  • 26 Caṕıtulo 2 Introdução à teoria da radiação

    pontos da corda? É razoável supôr que um ponto da corda com coordenada x terá também

    um movimento harmónico simples com a mesma frequência ν e amplitude A . A função

    genérica que descreve um tal movimento tem a forma y(t) = A cos(2πνt + ϕ), onde ϕ é a

    chamada fase na origem. Isto significa que podemos escrever a coordenada y de um ponto

    da corda com coordenada x como

    y(x, t) = A cos(2πνt+ ϕ(x)) (2.2)

    dependendo a fase ϕ(x) da coordenada x . Para determinarmos esta função vamos supôr

    que a onda se propaga com uma certa velocidade v . Isto significa que o deslocamento que a

    extremidade da corda tem no instante t = 0 “chegará” ao ponto da corda com coordenada

    x no instante t = x/v , e que portanto nesse instante (e nesse ponto x) o argumento do

    coseno deverá ser igual ao que era no instante t = 0 para a extremidade da corda, ou seja,

    zero (ver eq. (2.1)) ∗ . Isto permite-nos escrever

    2πνx

    v+ ϕ(x) = 0 → ϕ(x) = −2πνx

    v,

    ou seja, a coordenada y do ponto de coordenada x da corda num instante qualquer t é, de

    acordo com a eq. (2.2), dada por

    y(x, t) = A cos[2πν(t− xv)] (2.3)

    x

    y

    fig. 11

    l

    Se tirássemos uma fotografia à onda, ou seja, fixássemos a onda num certo instante

    t , ela teria um aspecto semelhante ao que se mostra na figura 11. distância entre dois

    ∗ Também se chama ao argumento do coseno “fase”, podendo então nós dizer que a fase em t = 0 e em

    x = 0 (extremidade da corda), que é igual a zero, se propagou ao ponto de coordenada x ao fim do

    tempo t = x/v.

  • Caṕıtulo 2 Introdução à teoria da radiação 27

    picos (ou dois vales) vizinhos da onda assim obtida chama-se comprimento de onda, cujo

    valor é normalmente indicado pela letra grega λ . Podemos relacioná-lo com a frequência

    e a velocidade de propagação reparando que a fase varia de 2π radianos entre dois picos

    vizinhos. Temos então

    y(x, t) = y(x+ λ, t) ⇒ 2πν(t− xv) = 2πν(t− x+ λ

    v) + 2π ⇔ 2πνλ

    v= 2π ,

    o que permite escrever

    λ =v

    ν. (2.4)

    Desta equação vemos que a velocidade de propagação v é igual ao produto da frequência

    pelo comprimento de onda, isto é, v = λν . A equação (2.3) pode agora ser escrita como

    y(x, t) = A cos[2π(νt− xλ)] . (2.5)

    É conveniente definir ainda a frequência angular ω e o no de onda k ∗

    ω = 2πν (rad/s) variação da fase (em radianos) por unidade de tempo,

    k =2π

    λ(rad/m) variação da fase (em radianos) por unidade de comprimento.

    De acordo com estas definições, podemos escrever o deslocamento (dado pela coordenada y )

    no ponto x e no instante t provocado por uma onda sinusoidal com frequência angular ω e

    no de onda k como

    y(x, t) = A cos(ωt− kx) . (2.6)

    A velocidade de propagação v vem agora dada por

    v = λν =2π

    k

    ω

    2π=

    ω

    k. (2.7)

    ∗ Note-se que existem alguns autores que chamam a 2π/λ no de onda reduzido, chamando no de onda

    a 1/λ. Esta nomenclatura é mais lógica, porque na verdade 1/λ representa o número de ondas por

    unidade de comprimento. No entanto, iremos adoptar aqui a definição do texto por ser a mais usada.

  • 28 Caṕıtulo 2 Introdução à teoria da radiação

    A esta velocidade também se chama velocidade de fase.

    Imaginemos agora duas ondas com a mesma amplitude e cujas frequências e nos de onda

    diferem de pequenas quantidades ∆ω e ∆k , tal que os deslocamentos correspondentes são

    dados por

    y1(x, t) = A cos(ωt− kx)

    y2(x, t) = A cos[(ω +∆ω)t− (k +∆k)x] .(2.8)

    O efeito conjunto destas duas ondas é descrito pela soma das funções y1(x, t) e y2(x, t). A

    onda resultante desta interferência é dada pela função

    y(x, t) = y1(x, t) + y2(x, t) = A cos(ωt− kx) +A cos[(ω +∆ω)t− (k +∆k)x]

    = 2A cos[12(2ω +∆w)t− 1

    2(2k +∆k)x

    ]cos

    (12∆wt− 1

    2∆kx

    ),

    onde se usou a fórmula cos a+ cos b = 2 cos[12(a+ b)

    ]cos

    [12(b− a)

    ]. Uma vez que conside-

    rámos que ∆ω e ∆k são muito pequenos comparados com ω e k , respectivamente, temos

    que 2ω +∆ω ≈ 2ω e 2k +∆k ≈ 2k , o que nos permite escrever

    y(x, t) = 2A cos(ωt− kx) cos(12∆wt− 1

    2∆kx

    ). (2.9)

    y

    2p/D k

    xfig. 12

    A forma desta onda está representada na figura 12. Examinando a eq.(2.9), vemos que ela

    descreve uma onda com frequência angular ω , no de onda k , e com uma amplitude que tem

    ela própria uma frequência 12∆w e no de onda 1

    2∆k . Diz-se que a primeira onda está modu-

    lada pela segunda. Ora, de acordo com o que vimos anteriormente, a onda “interna” propaga-

    -se com uma velocidade vf = w/k , enquanto a onda que modula esta última se propaga com

    uma velocidade vg = (∆w/2)/(∆k/2) = ∆w/∆k . Esta última velocidade representa a ve-

  • Caṕıtulo 2 Introdução à teoria da radiação 29

    locidade com que se propaga o grupo de ondas. Define-se a velocidade de grupo de uma onda

    como a razão ∆w/∆k quando ∆k → 0, ou seja

    velocidade de grupo = vg =dω

    dk. (2.10)

    Podemos notar que para uma onda sinusoidal que se propaga a uma velocidade v se tem

    w = kv , e que portanto neste caso a velocidade de fase é igual à velocidade de grupo e ambas

    iguais a v . No entanto, quando se combinam duas ou mais ondas com frequências angulares

    e nos de onda diferentes, já tal não acontece. Na natureza as ondas que aparecem são de

    uma maneira geral uma sobreposição de um número muito elevado de ondas de frequências

    angulares e nos de onda diferentes (ou, o que é o mesmo, de comprimentos de onda diferentes).

    Nesses casos, a velocidade de propagação da onda é a sua velocidade de grupo. A velocidade

    de fase não tem significado f́ısico relevante e, como veremos mais tarde, pode até ser maior

    do que a velocidade da luz!

    As ondas têm várias propriedades notáveis. Uma delas é possibilidade de interferirem

    sem se perturbarem mutuamente. Dito de outra maneira, se tivermos duas ondas com uma

    extensão finita que se propagam na mesma direcção mas em sentidos contrários, elas vão

    interferir a partir de certo instante (o deslocamento correspondente é a soma dos produzidos

    por cada uma) mas depois separam-se mantendo cada uma a sua forma original (ver figura

    13).

    y

    fig. 13

    x

    y y

    x x

    Existem dois tipos de interferência de duas ondas sinusoidais particularmente impor-

    tantes. Consideremos então duas ondas desse tipo com a mesma amplitude e o mesmo

    comprimento de onda, dadas pelas funções

    y1(x, t) = A cos

    ϕ1︷ ︸︸ ︷(ω1t− kx)

    y2(x, t) = A cos

    ϕ2︷ ︸︸ ︷(ω2t− kx) .

    (2.11)

  • 30 Caṕıtulo 2 Introdução à teoria da radiação

    Se num certo instante as fases ϕ1 e ϕ2 forem tais que |ϕ2 − ϕ1| = 2nπ , n = 0, 1, 2, 3, . . . , ovalor dos cosenos é o mesmo, o que significa que a onda rsultante da interferência tem uma

    amplitude que é igual à soma das amplitudes, 2A . Diz-se então que há uma interferência

    construtiva. Se, por outro lado, |ϕ2 − ϕ1| = (2n + 1)π , os “vales” e os “picos” das duasondas coincidem no espaço e a onda resultante tem uma amplitude nula, ou seja, a onda

    desaparece. Diz-se então que há uma interferência destrutiva. Estas duas situações estão

    ilustradas na figura 14.

    fig. 14

    + = + =

    Outras propriedades das ondas incluem a reflexão e refracção, que têm a ver com a

    mudança de direcção da propagação das ondas quando incidem na fronteira entre dois meios

    em que a velocidade de propagação é diferente (ver figura 15) e a difracção.

    fig. 15

    Esta última propriedade resulta do facto de, sendo uma onda resultante da propagação no

    espaço de uma perturbação, se verificar que cada ponto atingido pela perturbação funciona

    com uma fonte de uma nova perturbação. Isto mesmo se pode constatar quando uma onda

    atinge uma parede com um orif́ıcio. Quer se trate de uma onda circular (os pontos que

    têm o mesmo deslocamento formam circunferências) ou plana (os pontos que têm o mesmo

    deslocamento formam linhas rectas), verifica-se que uma onda circular se propaga a partir

    desse orif́ıcio. Na figura 16 isso é ilustrado para uma onda que se propaga à superf́ıcie de

    um ĺıquido. Note-se que este efeito é mais pronunciado quando as dimensões do orif́ıcio são

    da mesma ordem de grandeza do comprimento de onda da onda que incide na parede.

    Um efeito semelhante é obtido se a onda incide num obstáculo de dimensões comparáveis

  • Caṕıtulo 2 Introdução à teoria da radiação 31

    fig. 16

    com o seu comprimento de onda. Nas extremidades do obstáculo são geradas ondas circulares,

    tendo como resultado que as ondas se possam propagar por detrás do objecto. É este efeito

    que explica a formação da penumbra por objectos iluminados e a propagação do som em

    zonas não acesśıveis directamente pela fonte (“dobrando” uma esquina, por exemplo), uma

    vez que os comprimentos de onda t́ıpicos do som vão do cent́ımetro ao metro, ou seja, são

    da ordem de grandeza das dimensões dos objectos do nosso dia-a-dia.

    Se tivermos uma onda a incidir numa parede com duas fendas, as ondas resultantes vão

    interferir e formar o que se chama uma figura de difracção. Se medirmos a amplitude da onda

    resultante num plano a uma certa distância da parede veremos que existem pontos onde ela é

    máxima e outros em que ela se anula. Esses pontos correspondem respectivamente a pontos

    em que o caminho percorrido pelas duas ondas difere de um número inteiro de comprimentos

    de onda (e portanto a diferença de fase entre as ondas é de um múltiplo de 2π radianos),

    e em que a diferença de caminho percorrido é de um número ı́mpar de semi-comprimentos

    de onda ((2n+ 1)λ/2) (a diferença de fase é então um número ı́mpar de π radianos) ∗ (ver

    figura 17).

    fig. 17d1 d2

    Interferência construtiva

    Interferência destrutiva

    n = 0,1, 2, 3, ...|d d n1 2- l|=

    |d d1 2- |=2 1n+

    2l

    Dito de outra maneira, esses são pontos em que há interferência construtiva e destrutiva,

    respectivamente. Se as ondas são luminosas, esses pontos aparecem sob a forma de zonas

    claras e escuras alternadas. Quando existem apenas duas fendas essas zonas tornam-se

    ∗ Tem-se respectivamente ∆ϕ = ωt − kx − [ωt − k(x + nλ)] = knλ = 2πnλ/λ = 2nπ e ∆ϕ = ωt − kx −[ωt− k(x+ (2n+ 1)λ/2)] = k(2n+ 1)λ/2 = π(2n+ 1)λ/λ = (2n+ 1)π, com n = 0, 1, 2, . . ..

  • 32 Caṕıtulo 2 Introdução à teoria da radiação

    progressivamente menos intensas e mais difusas. No entanto, quando se tem muitas fendas,

    separadas por distâncias da ordem do comprimento de onda da onda incidente (formando

    o que se chama uma rede de difracção) as várias ondas produzidas a partir das fendas

    contribuem para formar uma zona extensa de zonas claras e escuras. Este efeito tem várias

    aplicações práticas, uma das quais iremos referir na secção seguinte.

    § 2.2 RADIAÇÃO ELECTROMAGNÉTICA: RAIOS X, SUA PRODUÇÃO E DIFRAC-ÇÃO EM CRISTAIS

    Um tipo especialmente importante de ondas são as ondas electromagnéticas, de que já

    falámos anteriormente. Neste caso, em vez de uma corda ou de moléculas de água é o campo

    eléctrico e magnético que oscila. Estas ondas podem ser produzidas por cargas oscilantes,

    por exemplo. A luz, ou, de uma maneira geral, a radiação electromagnética, é composta

    por ondas electromagnéticas. Uma onda electromagnética sinusoidal polarizada linearmente

    está representada na figura 18, sendo ~E e ~B os vectores campo eléctrico e magnético,

    respectivamente.

    EB

    direcção de propagação

    fig. 18

    No nosso dia-a-dia encontramos muitos exemplos de ondas electromagnéticas: a luz que

    nos chega do Sol ou que é produzida pelas lâmpadas, as ondas de rádio e televisão, as micro-

    ondas usadas nos fornos com o mesmo nome, os feixes de ondas infravermelhas usados nos

    telecomandos e para aquecer comida, etc.. Na medicina usam-se os raios X e raios γ (gama).

    Os raios laser também são formados por ondas electromagnéticas. O que distingue os vários

    tipos de luz é o seu comprimento de onda (ou a sua frequência, uma vez que λν = c). Por

    exemplo, as ondas de rádio têm um comprimento de onda maior do que as micro-ondas, a

    luz vermelha tem maior comprimento de onda do que a luz azul. Por sua vez, a luz azul tem

  • Caṕıtulo 2 Introdução à teoria da radiação 33

    um comprimento de onda maior do que a luz ultravioleta, responsável pelo bronzeamento

    da nossa pele e assim sucessivamente, tal como está representado no esquema seguinte

    (1 Å=10−10 m):

    λ decrescente

    −→ondas de rádio < micro-ondas < infravermelhos < luz viśıvel < ultravioleta < raios X < raios γ

    λ ≈ km – 0,1m cm – 0,1mm 0,01mm 0,8µm – 0,4µm 100 – 10 Å Å 0,01 Å

    Repare-se que todas estas ondas são do mesmo tipo: a única coisa que as distingue é o

    seu o comprimento de onda. No entanto, esta diferença faz com que elas interajam de uma

    maneira completamente diferente com a matéria.

    Dentro dos várias tipos de ondas electromagnéticas citados acima, vamos agora estudar

    com mais detalhe os raios X, que têm uma importância particular em F́ısica pelo facto de o

    seu comprimento de onda ser da ordem dos Å, que é a dimensão t́ıpica dos átomos e do seu

    espaçamento num sólido.

    Os raios X foram descobertos em 1895 por Roentgen. Foi desde logo observado que eles

    atravessavam facilmente a matéria e que impressionavam chapas fotográficas. Dáı nasceu a

    ideia de se usarem os raios X para fins médicos (em Coimbra foram feitas radiografias cerca

    de um ano depois de os raios X terem sido descobertos).

    Os raios X são produzidos por electrões que, ao serem acelerados por uma diferença de

    potencial elevada, colidem com um certo metal resistente a altas temperaturas (tungsténio,

    por exemplo), contido numa ampola onde se fez o vácuo (ver figura 19).

    fig. 19

    raios X

    electrões

    ampola

    cátodometal

    + _

    Vários espectros (quer dizer, distribuições da intensidade da radiação em função do

    comprimento de onda) de raios X estão representados na figura 20. Não vamos fazer aqui

    um estudo detalhado destes espectros, mas vamos notar apenas que, além da intensidade

  • 34 Caṕıtulo 2 Introdução à teoria da radiação

    dos raios X produzidos aumentar com o potencial acelerador, existe um valor mı́nimo do

    comprimento de onda a partir do qual começa a haver emissão de raios X, que é inversamente

    porporcional ao potencial acelerador. Dado que os raios X são produzidos pelo choque dos

    electrões acelerados com os electrões do material em causa, este facto só se pode interpretar

    à luz da teoria quântica da radiação, de que falaremos na secção 2.3.

    f i g . 2 0

    0

    2

    4

    6

    8

    1 0

    0 0 , 2 0 , 4 0 , 6 0 , 8 10

    2

    4

    6

    8

    1 0

    1 2

    0 0 , 2 0 , 4 0 , 6 0 , 8 1

    Intens

    idade

    relativa

    Intens

    idade

    relativa

    C o m p r i m e n t o d e o n d a ( Å ) C o m p r i m e n t o d e o n d a ( Å )

    2 0 k V

    3 0 k V

    4 0 k V

    5 0 k VM o l i b d é n i o 3 5 k V

    T u n g s t é n i o 3 5 k V

    A l v o d e t u n g s t é n i o

    A natureza ondulatória dos raios X foi estabelecida relativamente cedo. Em 1906 de-

    monstrou-se que eles podiam ser polarizados fazendo incidir um feixe de raios X sucessiva-

    mente em dois alvos de um mesmo material polarizador (carbono), dispostos numa direcção

    perpendicular à do feixe incidente. Verificou-se que a intensidade dos raios X segundo uma

    direcção perpendicular ao plano formado pelos alvos e pelo feixe incidente era nula. Isto é

    uma propriedade t́ıpica das ondas, e no caso particular de uma onda electromagnética quer

    dizer que depois das duas incidências o vector campo eléctrico “vibra” segundo a direcção

    em que não se observam raios X ∗ .

    Outro fenómeno caracteŕıstico das ondas é, como já referimos, a difracção. Os raios X

    não são excepção. Como também já foi referido, a obtenção de figuras de difracção ńıtidas

    envolve o uso de uma rede de difracção em que as fendas ou as distâncias entre os obstáculos

    à progressão das ondas sejam da mesma ordem de grandeza do seu comprimento de onda.

    Ora, no caso dos raios X esse valor é da ordem de 1 Å. Uma rede de difracção com distâncias

    dessa ordem não se pode construir com objectos macroscópicos, mas essa é exactamente

    a ordem de grandeza da distância entre átomos num sólido. Foi por isso que foi sugerido

    em 1912 que se usassem cristais para realizar experiências de difracção com raios X. Nessas

    experiências, cada átomo, ao receber a radiação X, vai comportar-se um emissor de uma onda

    ∗ O vector campo magnético “vibra” numa direcção perpendicular à do campo eléctrico, e ambas as

    direcções são perpendiculares à direcção de propagação da onda (ver figura 18).

  • Caṕıtulo 2 Introdução à teoria da radiação 35

    secundária, de uma maneira análoga ao que acontece com uma onda num ĺıquido quando

    incide num obstáculo (ver figura 16).

    Por outro lado, podemos imaginar um cristal como sendo constitúıdo por planos de

    átomos separados por uma certa distância. Acontece que a interferência das ondas produzidas

    por átomos adjacentes num plano tem como efeito que as ondas resultantes têm uma direcção

    que faz um ângulo com o plano igual ao ângulo do feixe incidente (chama-se por isso a este

    fenómeno reflexão de Bragg, do f́ısico W. Bragg, que o estudou pela primeira vez). A

    condição para que dois feixes emergentes da incidência em dois planos paralelos adjacentes

    interfiram construtivamente pode ser obtida a partir da figura 21.

    fig. 21

    12

    3

    d

    q q

    q q1

    2

    3

    1

    2

    3

    d sinq

    1

    2

    3

    diferença de caminho = 2d sinq

    planos de difracção

    Na verdade, como já sabemos, a diferença de caminho entre os dois feixes tem de ser

    igual a um número inteiro de comprimentos de onda. Da figura 21 podemos ver que essa

    diferença é igual a 2d sin θ , sendo d a distância entre os planos e θ o ângulo de incidência

    (reflexão) dos feixes nos planos. Assim, obtemos a condição

    2d sin θ = nλ n = 1, 2, . . . . (2.12)

    Assim, para determinados planos de um certo cristal (um certo valor de d) e um certo

    tipo de raios X (um certo valor de λ) a equação (2.12) diz-nos quais são os valores de θ

    que permitem obter uma interferência construtiva. Nas primeiras experiências de difracção

    de raios X, usou-se o conhecimento do espaçamento dos átomos num certo cristal para

    determinar o comprimento de onda da radiação X incidente. Hoje em dia, este fenómeno é

    utilizado para determinar a estrutura cristalina de um sólido a partir de radiação X com um

    comprimento de onda conhecido.

  • 36 Caṕıtulo 2 Introdução à teoria da radiação

    § 2.3 TEORIA QUÂNTICA DA RADIAÇÃO: EFEITO FOTO-ELÉCTRICO E EFEITODE COMPTON

    Vimos na secção anterior como os raios X são produzidos a partir de electrões acelerados

    e algumas das suas propriedades que os identificam como ondas electromagnéticas. Vamos

    ver agora como pode acontecer o fenómeno inverso, isto é, haver radiação electromagnética

    capaz de produzir electrões. É esse o caso do efeito foto-eléctrico.

    Consideremos um feixe de luz (radiação electromagnética) que incide numa superf́ıcie

    metálica. Verifica-se experimentalmente que são emitidos electrões desde que a radiação

    tenha uma frequência maior que um certo valor mı́nimo, que depende do metal em causa.

    Estes electrões podem então estabelecer uma corrente eléctrica. É este o efeito usado nos

    mecanismos de abertura automática de portas (há um feixe de luz que é interrompido quando

    as pessoas se aproximam da porta, o que por sua vez interrompe um circuito e desencadeia

    a abertura da porta). O estudo deste efeito pode ser feito através de uma experiência cujo

    esquema simplificado está representado na figura 22.

    fig. 22electrões

    luz

    V

    A

    + _

    Nesta experiência faz-se incidir um feixe de luz num metal (sódio, por exemplo) num

    tubo onde se fez o vácuo e que contém também um eléctrodo que se mantém a uma certa

    diferença de potencial relativamente ao metal. Os electrões que são emitidos pelo metal e

    que chegam ao eléctrodo dão origem a uma corrente que é medida por um ampeŕımetro.

    No circuito está também um volt́ımetro que permite medir a diferença de potencial entre o

    metal e o eléctrodo.

    Se a diferença de potencial entre o metal e o eléctrodo for positiva, o campo eléctrico

    criado opõe-se ao deslocamento dos electrões para o eléctrodo. Ao aumentar este potencial

    verifica-se, tal como seria esperado, que a corrente gerada pelos electrões diminui até que, a

    partir de um certo valor V0 , deixa de haver corrente. Como um electrão ao ir do metal para

  • Caṕıtulo 2 Introdução à teoria da radiação 37

    o eléctrodo perde uma energia igual eV , onde e é o módulo da carga de um electrão e V

    é a diferença de potencial aplicada, então isto significa que a energia cinética máxima com

    que os electrões são emitidos do metal será

    Tmax =1

    2mv2max = eV0 , (2.13)

    sendo m a massa do electrão. Por outro lado, verifica-se que o valor V0 , a que chamamos

    o potencial de paragem, não depende da intensidade da radiação incidente sobre o metal,

    desde que essa radiação tenha sempre o mesmo comprimento de onda. Apenas a corrente

    aumenta quando aumenta a intensidade da radiação, tal como está representado na figura

    23.

    f i g . 2 3

    P o t e n c i a l V 0

    Corre

    nte de

    foto-

    electr

    ões f r e q u ê n c i a = n = c o n s t a n t e

    I 2 = 2 I 1

    I 1

    I 3 = 3 I 1T m a x

    nn 0

    Por outro lado, quando se aumenta a frequência da radiação, o valor de V0 aumenta,

    verificando-se que a dependência é linear e que existe uma frequência mı́nima abaixo da qual

    não há emissão de electrões (ver figura 23). Estes resultados estão em profundo desacordo

    com a teoria das ondas electromagnéticas. Na verdade, de acordo com esta teoria, uma

    onda electromagnética tem uma densidade de energia (energia por unidade de volume) ²

    proporcional a

    ² ∝ |~E|2 ∝ I (energia por unidade de tempo e por unidade de superf́ıcie) ,

    ou seja, a energia transmitida aos electrões pela onda electromagnética incidente no metal

    devia ser proporcional à sua intensidade I . Por outro lado, a radiação (e portanto a sua

    energia) devia distribuir-se pelos átomos do metal, o que levaria a esperar que devia decorrer

    um certo tempo até que se concentrasse a quantidade de energia suficiente num electrão para

    que ele se pudesse libertar do átomo a que está ligado. Por exemplo, para uma intensidade

    da radiação incidente da ordem de 10−10 W/m2 e para luz viśıvel com λ = 5× 10−7 m seria

  • 38 Caṕıtulo 2 Introdução à teoria da radiação

    necessário esperar cerca de 10 horas para que se acumulasse a energia necessária (cerca de

    10−18 J) para que o electrão fosse emitido. Ora, numa experiência realizada em 1928, foi

    estabelecido que a demora na emissão de um electrão depois da radiação incidir no metal

    devia ser inferior a 3 × 10−9 s!. Em conclusão, podemos dizer que a teoria ondulatória(clássica) da radiação estava em desacordo com os resultados experimentais em dois pontos:

    1 – O potencial de paragem devia aumentar com a intensidade da radiação e não com a

    frequência, como é observado;

    2 – A radiação, ao espalhar-se pelos átomos do metal devia dar origem a um atraso con-

    siderável entre o momento em que a radiação começa a incidir no metal e o momento

    em que os electrões (também chamados foto-electrões) começam a ser emitidos. Esse

    atraso não é verificado nas experiências, o que parece indicar que a energia da radiação

    de alguma maneira se concentra nos foto-electrões.

    A resposta para estas contradições já tinha sido dada em 1905, quando Einstein propôs

    que a luz fosse constitúıda por part́ıculas, chamadas fotões, que tinham energia hν onde h

    é a chamada constante de Planck e ν a frequência da radiação. Esta sugestão estava ligada

    com a hipótese do f́ısico alemão Planck, formulada em 1900, segundo a qual a energia da

    radiação, em vez de assumir valores cont́ınuos, era dada por múltiplos de hν . No entanto,

    Einstein foi mais longe, propondo que a luz existisse em “pacotes” (“quanta”) de energia,

    cada um com energia hν . Desta maneira, fica explicado o facto da energia dos foto-electrões

    depender da frequência e não da intensidade da radiação quando a frequência se mantém

    constante. Na verdade, ao aumentar a intensidade está apenas a aumentar-se o número de

    fotões que chegam ao metal, e portanto o número de foto-electrões emitido, e não a sua

    energia. Justifica também o facto de não haver atraso entre a absorpção da radiação pelos

    electrões e a sua emissão, pois a energia de cada fotão é absorvida por um único electrão.

    De acordo com o que se disse acima, Einstein propôs a seguinte fórmula para relacionar

    a energia da radiação incidente (de cada fotão) e a energia do foto-electrão:

    hν =1

    2mv2 +W , (2.14)

    onde W , chamada função de trabalho, é a energia necessária para “arrancar” o electrão da

    superf́ıcie do metal, e v a velocidade do foto-electrão. Podemos então definir uma frequência

    ν0 tal que

    W = hν0 , (2.15)

  • Caṕıtulo 2 Introdução à teoria da radiação 39

    que podemos interpretar como sendo a frequência mı́nima que a radiação deverá ter para

    libertar o electrão da superf́ıcie do metal. Se aplicarmos a fórmula (2.14) ao caso em que

    os electrões adquirem a energia cinética máxima para uma certa frequência da radiação

    incidente, e usando as equações (2.13) e (2.15), podemos escrever

    hν =1

    2mv2max +W = eV0 + hν0

    V0 =h

    e(ν − ν0) . (2.16)

    Esta última equação traduz exactamente a dependência linear existente entre a energia

    cinética máxima (ou V0 ) e a frequência obtida experimentalmente (ver figura 23). Em 1916

    Millikan determinou o declive da recta do gráfico de V0 em função de ν e verificou ser

    igual a h/e (recorde-se que nessa altura já se conhecia o valor da constante de Planck h e,

    naturalmente, da carga do electrão). Foi assim confirmada experimentalmente a fórmula de

    Einstein (2.14).

    Existe outro fenómeno que apenas se pode explicar recorrendo à natureza corpuscular da

    luz: o efeito de Compton. Antes de descrever a experiência em que este efeito é observado,

    vamos ver qual é o valor da quantidade de movimento que tem um fotão.

    Como acabámos de ver, a energia de um fotão de acordo com a teoria de Einstein é

    E = hν . Por outro lado, sabe-se da teoria clássica do electromagnetismo que uma onda

    electromagnética tem uma quantidade de movimento dada por p = E/c . Comparando com

    a fórmula relativista (1.39)

    E =√

    p2c2 +m20c4

    p2 =E2

    c2−m20c2 , (2.17)

    vemos que, no caso de um fotão, se tem m0 = 0, ou seja, um fotão é uma part́ıcula com

    massa de repouso nula. Note-se que este é um caso em que a designação “massa de repouso”

    não faz muito sentido, uma vez que, deslocando-se o fotão à velocidade da luz no vazio c ,

    não existe nenhum sistema de referência no qual se possa observar o fotão em repouso (ver

    secção 1.5). No entanto, de acordo com definição de massa dada na secção 1.6, podemos

    associar ao fotão uma massa dada por

    m =p

    c=

    E

    c2=

    c2=

    h

    cλ, (2.18)

  • 40 Caṕıtulo 2 Introdução à teoria da radiação

    em que se usou a relação c = λν . Desta última equação vemos também que a quantidade de

    movimento do fotão (em módulo) é dada por h/λ . O efeito Compton consiste precisamente

    na colisão de uma part́ıcula com estas caracteŕısticas de energia e quantidade de movimento

    (o fotão) com electrões.

    fig. 24

    D

    cristal

    feixe de raios X

    q

    a

    a / 2

    D - Detector

    A

    A - Alvo

    Em 1922, Compton realizou uma experiência que consistia em fazer incidir um feixe

    de raios X monocromático (isto é, com um só comprimento de onda) num alvo e medir o

    comprimento de onda da radiação que emergia com um certo ângulo θ em relação à direcção

    de incidência. Para isso fez incidir essa radiação num cristal e analisou com um detector

    a radiação reflectida que fazia um certo ângulo α com o feixe incidente (na figura 24 está

    representado um esquema da experiência). Como já vimos anteriormente, conhecendo o

    espaçamento entre os planos do cristal em que se produz a reflexão de Bragg da radiação,

    pode determinar-se o comprimento de onda da radiação incidente no cristal. Os resultados

    das medidas da intensidade da radiação I(α) como função do ângulo α para um alvo de

    carbono estão representados na figura 25.

    Os picos correspondem à interferência construtiva dos raios X emergentes do cristal, ou

    seja, aos quais se pode aplicar a lei de Bragg (eq. (2.12)). Podemos então dizer que ao

    primeiro pico corresponde o comprimento de onda da radiação incidente no alvo e aos outros

    picos a radiação emergente com comprimentos de onda maiores do que o inicial.

    Este resultado pode ser entendido se considerarmos que a luz é constitúıda por fotões

    que perdem energia ao colidirem com os electrões nos átomos do alvo. Como a energia do

    fotão é inversamente proporcional ao comprimento de onda da radiação (E = hν = hc/λ)

    isso significa que o comprimento de onda da radiação emergente é maior. O primeiro pico

    observado corresponde ao choque que se dá com electrões fortemente ligados e que, portanto,

    não sofrem nenhum recuo depois do choque. Isto implica, por sua vez, que o fotão não perde

    energia e por consequência que o seu comprimento de onda se mantém inalterado.

  • Caṕıtulo 2 Introdução à teoria da radiação 41

    fig. 25

    I(a)

    q

    jm, v

    n = cl

    n =' cl'

    y

    x

    Vamos analisar agora com mais detalhe o que se passa quando um fotão com energia

    hν e quantidade de movimento h/λ colide com um electrão em repouso. Vamos considerar

    que o electrão se pode mover livremente, o que é uma hipótese razoável para os electrões

    periféricos dos átomos, e que se trata de uma part́ıcula relativ́ıstica, aplicando-se-lhe portanto

    as fórmulas das secções 1.6 e 1.7. O esquema da colisão está representado na figura 25. Us-

    ando o prinćıpio de conservação da quantidade de movimento e decompondo as quantidades

    de movimento segundo os dois eixos x e y (ver figura 25) temos

    h

    λ= mv cosϕ+

    h

    λ′cos θ

    mv sinϕ =h

    λ′sin θ

    ou

    h

    λ− h

    λ′cos θ = mv cosϕ

    mv sinϕ =h

    λ′sin θ

    , (2.19)

    sendo m a massa do electrão (a massa relativ́ıstica, tal como a definimos na secção 1.6), v

    a sua velocidade depois do choque e λ′ o comprimento de onda do fotão depois do choque.

    Por outro lado, uma vez que a energia total é conservada pelo choque, temos

    hν +m0c2 = hν ′ +mc2 , (2.20)

    sendo m0 a massa de repouso do electrão. Elevando ambos os membros das equações (2.19)

    ao quadrado e somando-os obtém-se

    h2

    λ′2+

    h2

    λ2− 2h

    2

    λλ′cos θ = m2v2 . (2.21)

  • 42 Caṕıtulo 2 Introdução à teoria da radiação

    Da eq. (2.20) obtemos, usando a relação ν = c/λ ,

    h(ν − ν ′) = (m−m0)c2

    h

    λ− h

    λ′= (m−m0)c .

    Somando 2m0c a cada um dos membros desta última equação obtemos a equação h/λ −h/λ′ +2m0c = (m+m0)c . Multiplicando termo a termo esta equação com a anterior temos

    (hλ− h

    λ′

    )[(hλ− h

    λ′

    )+ 2m0c

    ]= (m2 −m20)c2 . (2.22)

    Da relação entre a massa m e a massa m0 m = m0/√

    1− v2/c2 , podemos tirar a relaçãom2v2 = (m2 −m20)c2 . Então, i