217
Mecnica Quntica June 24, 2013 Contents 1 Introduªo 3 1.1 Ondas e partculas .......................... 3 1.2 Ondas de Partculas ......................... 7 1.2.1 Espalhamento de um œnico elØtron ............. 10 1.3 Pacotes de ondas ........................... 11 1.3.1 Velocidade de grupo ..................... 13 1.4 Incertezas ............................... 15 1.5 A verdade (pelo menos atØ agora) .................. 18 1.6 O Ætomo de Bohr ........................... 21 1.7 Quantizaªo de Sommerfeld ..................... 25 2 Mecnica 34 2.1 Preliminar ............................... 34 2.2 Equaıes de Euler-Lagrange ..................... 35 2.2.1 Coordenadas generalizadas ................. 36 3 Transformada de Legendre 40 4 Equaıes de Hamilton 41 4.0.2 Signicado fsico da Hamiltoniana ............. 43 4.1 Princpio variacional (opcinal) .................... 44 4.1.1 Exemplo: a braquistocrna.................. 48 4.1.2 Equaıes de Euler-Lagrange ................. 50 5 ParŒnteses de Poisson 52 6 Vetores e equaıes lineares 54 6.1 Operadores, autovetores e autofunıes no R n ........... 61 6.1.1 Produto externo ....................... 62 6.1.2 Auto-vetores ......................... 66 6.2 Mudana de base ........................... 67 6.3 Espao de Hilbert ........................... 69 6.4 O espao L 2 .............................. 72 1

Mecânica Quântica - Segunda Quantização

Embed Size (px)

DESCRIPTION

Este Estudo trata da Mecânica Quântica não relativística. Neste modelo se considera, por exemplo, uma partícula carregada (um elétron) se movendo num certo potencial (o núcleo). A estrutura quântica do próprio núcleo não é muito relevante, mas penas o potencial (ou o campo) que ele gera. Neste caso, dizemos que o campo é externo, i.e., o próprio campo não é quantizado. Este é o setor de uma partícula da mecânica quântica não-relativística. Para a análise de estruturas internas do próprio núcleo esta abordagem é completamente inadequada. Uma vez que a dinâmica dos processos ocorre em uma escala relativística e, o que é mais importante, a intensidade dos campos é suficiente para criar novas partículas. Destarte, não podemos mais nos limitar ao setor de uma partícula e precisamos trabalhar no chamado espaço de Fock, ou, de outra forma, realizarmos a segunda quantização. Onde se considera como a primeira quantização a quantização canônica (ou de Dirac), ou a associação de observáveis clássicos com operadores quânticos. Ao estudarmos a segunda quantização estamos entrando nos domínios da Teoria Quântica de Campos.

Citation preview

Mecânica Quântica

June 24, 2013

Contents

1 Introdução 31.1 Ondas e partículas . . . . . . . . . . . . . . . . . . . . . . . . . . 31.2 Ondas de Partículas . . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2.1 Espalhamento de um único elétron . . . . . . . . . . . . . 101.3 Pacotes de ondas . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3.1 Velocidade de grupo . . . . . . . . . . . . . . . . . . . . . 131.4 Incertezas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151.5 A verdade (pelo menos até agora) . . . . . . . . . . . . . . . . . . 181.6 O átomo de Bohr . . . . . . . . . . . . . . . . . . . . . . . . . . . 211.7 Quantização de Sommerfeld . . . . . . . . . . . . . . . . . . . . . 25

2 Mecânica 342.1 Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342.2 Equações de Euler-Lagrange . . . . . . . . . . . . . . . . . . . . . 35

2.2.1 Coordenadas generalizadas . . . . . . . . . . . . . . . . . 36

3 Transformada de Legendre 40

4 Equações de Hamilton 414.0.2 Signi�cado físico da Hamiltoniana . . . . . . . . . . . . . 43

4.1 Princípio variacional (opcinal) . . . . . . . . . . . . . . . . . . . . 444.1.1 Exemplo: a braquistocrôna. . . . . . . . . . . . . . . . . . 484.1.2 Equações de Euler-Lagrange . . . . . . . . . . . . . . . . . 50

5 Parênteses de Poisson 52

6 Vetores e equações lineares 546.1 Operadores, autovetores e autofunções no Rn . . . . . . . . . . . 61

6.1.1 Produto externo . . . . . . . . . . . . . . . . . . . . . . . 626.1.2 Auto-vetores . . . . . . . . . . . . . . . . . . . . . . . . . 66

6.2 Mudança de base . . . . . . . . . . . . . . . . . . . . . . . . . . . 676.3 Espaço de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . 696.4 O espaço L2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

1

6.5 Rigged Hilbert space . . . . . . . . . . . . . . . . . . . . . . . . . 786.6 Operadores simétricos, ou hermitianos . . . . . . . . . . . . . . . 806.7 Operadores diferenciais . . . . . . . . . . . . . . . . . . . . . . . . 866.8 Domínio dos operadores . . . . . . . . . . . . . . . . . . . . . . . 936.9 Operadores auto-adjuntos . . . . . . . . . . . . . . . . . . . . . . 946.10 Operadores lineares . . . . . . . . . . . . . . . . . . . . . . . . . . 95

7 Postulados da Mecânica Quântica 987.1 Interpretação probabilística . . . . . . . . . . . . . . . . . . . . . 1007.2 Conseqüências físicas do primeiro postulado . . . . . . . . . . . . 1027.3 Valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

8 Quantização canônica 1058.1 Evolução temporal . . . . . . . . . . . . . . . . . . . . . . . . . . 1068.2 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1138.3 Realização do espaço de Hilbert . . . . . . . . . . . . . . . . . . . 1138.4 Rotações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1348.5 Espinores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138

9 Ressonância 143

10 Observáveis compatíveis 14910.1 Relações de incerteza . . . . . . . . . . . . . . . . . . . . . . . . . 153

11 Sistemas de várias partículas 15411.1 Interação de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . 15711.2 Dois spins acoplados . . . . . . . . . . . . . . . . . . . . . . . . . 161

12 Realização de espaços de dimensão in�nita 16812.1 O operador de multiplicação . . . . . . . . . . . . . . . . . . . . . 16812.2 O operador de posição . . . . . . . . . . . . . . . . . . . . . . . . 17012.3 O operador de momento . . . . . . . . . . . . . . . . . . . . . . . 17412.4 O problema do ordenamento . . . . . . . . . . . . . . . . . . . . . 17512.5 Partícula na caixa . . . . . . . . . . . . . . . . . . . . . . . . . . 17712.6 O momento da partícula . . . . . . . . . . . . . . . . . . . . . . . 183

12.6.1 Sistemas com vários graus de liberdade . . . . . . . . . . 18612.7 O oscilador harmônico . . . . . . . . . . . . . . . . . . . . . . . . 187

12.7.1 Normalização . . . . . . . . . . . . . . . . . . . . . . . . . 192

13 Potenciais centrais 19513.1 Autovalores e autovetores do momento angular . . . . . . . . . . 19613.2 O átomo de hidrogênio . . . . . . . . . . . . . . . . . . . . . . . . 204

13.2.1 Acoplamento spin-órbita . . . . . . . . . . . . . . . . . . . 208

14 Teoria das perturbações 21014.1 Acoplamento spin-órbita (continuação) . . . . . . . . . . . . . . . 215

2

1 Introdução

Nesta parte do curso vamos estudar a MQ não relativística. Neste modelose considera, por exemplo, uma partícula carregada (um elétron) se movendonum certo potencial (o núcleo). A estrutura quântica do próprio núcleo não émuito relevante, mas apenas o potencial (ou o campo) que ele gera. Neste caso,dizemos que o campo é externo, i.e., o próprio campo não é quantizado. Esteé o setor de uma partícula da mecânica quântica (MQ) não-relativística.Para a análise de estruturas internas do próprio núcleo esta abordagem é

completamente inadequada. Uma vez que a dinâmica dos processos ocorre emuma escala relativística e, o que é mais importante, a intensidade dos campos ésu�ciente para criar novas partículas. Destarte, não podemos mais nos limitarao setor de uma partícula e precisamos trabalhar no chamado espaço de Fock,ou, de outra forma, realizarmos a segunda quantização. Onde se considera comoa primeira quantização a quantização canônica (ou de Dirac), ou a associaçãode observáveis clássicos com operadores quânticos. Ao estudarmos a segundaquantização estamos entrando nos domínios da Teoria Quântica de Campos(TQC). Este será um assunto da última parte deste curso.Vamos relembrar alguns pontos vistos no curso de quântica e de Física mod-

era.

1. Hipótese de Planck: A troca de energia entre as paredes do negro e acavidade são quantizadas. Ou seja, a parede é tratada como osciladoresque só podem oscilar múltiplos inteiros de sua freqüência natural. Mas aprópria radiação não é quantizada. Esta hipótese resolvia o problemada catástrofe do ultravioleta.

2. Hipótese de Einstein: Além da radiação é emitida em múltiplos inteirosda freqüência natural e está localizada no espaço na forma de pacotes deenergia (fótons). Isso explica o efeito fotoelétrico. Nesta descrição a radi-ação se comporta como inda enquanto se propaga (com todos os fenômenosondulatórios de interferência) e como uma partícula quando é detectada.Temos a dualidade onda-partícula para a radiação eletromagnética.

3. Hipótese de De Broglie: não apenas a luz (partículas sem massa) apresentauma dualidade onda-partícula, mas todas as entidades da natureza. Ouseja,qualquer quantidade que possua um momento p terá a eleassociado uma onda. Esta hipótese foi comprovada pelo espalhamentode elétrons pelas camadas subseqüentes de um cristal.

1.1 Ondas e partículas

O que signi�ca a dualidade onda-partícula?Vamos primeiro analisar a diferença nos conceitos clássicos de ondas e partícu-

las.Imagine a superfície de um aquário cuja metade está separada por uma

parede com duas fendas. Na parte do aquário antes da parede batemos (de

3

Figure 1: Figura 2 - Retirada de The Feynman Lectures on Physics.

forma bem regular) na superfície da água com uma régua. Isso gerará ondasplanas, com uma certa freqüência (igual ao ritmo da régua), que chegarão até aparede com os furos. Do outro lado desta parede temos um detector que podemedir a intensidade da onda que chega, ou seja, ele mede a amplitude (claro quea amplitude vai variar com o tempo, mas registramos apenas o máximo) que aágua sobe e desce (o que equivale à energia da onda). Estamos interessados, naverdade, na razão entre a amplitude que sai dos dois furos e a amplitudeque chega até o detector. Imagine também que não há re�exão nasparedes do nosso aquário.Primeiro nós tampamos um dos furos (o 2), movemos o nosso detector em

toda a coordenada x e vemos o que ele registra. Como a onda é circular, paramanter a energia constante, a amplitude deve cair com o raio. Assim, o detectorregistrará uma maior intensidade quanto mais próximo ele estiver do furo 1. Umgrá�co desta intensidade teria a forma I1 (x) da �gura 2-b. Se repetirmos agorao experimento com apenas a fenda 2 aberta, o detector irá registrar a intensidadeI2 mostrada na �gura 2-b.O que ocorre então quando os dois furos estão abertos? Neste caso a dis-

tribuição da intensidade não é tão simples. Como as duas ondas circularessão produzidas em pontos diferentes haverá certos pontos onde a cristade uma onda encontrará a crista da outra, se intensi�cando, e outros onde acrista de uma encontrará o vale da outra, se anulando. Mais especi�camente,qualquer ponto cuja diferença da distância entre os furos seja um múlti-

4

plo inteiro do comprimento de onda a combinação, ou a interferência,será máxima. Para pontos onde esta diferença tenha um valor semi-inteirodo comprimento de onda esta interferência será completamente destrutiva.Com isso, a intensidade registrada pelo detector será como a I12 (x) mostradana �gura 2-c.Vamos dar ao processo acima uma descrição mais precisa. Ao tamparmos

o furo 2 e colocarmos o detector num certo ponto x a amplitude da onda variacom o tempo como a parte real da quantidade

A1 = h1 exp (i!t) ; h1 2 C :

A quantidade h1 é complexa para levar em conta todas as diferentes fases daoscilação em diferentes pontos do espaço. Toda a dependência na posiçãoestá nesta fase h1 = h1 (x), ou seja, em pontos diferentes a onda oscila coma mesma freqüência, mas com fase diferente. Pontos a mesma distância dofuro estão em fase. Em especial, para diferentes valores de x a onda terá fasediferente, pois a onda é circular e estes pontos estão em raios diferentes

h1 = jh1j exp (i�1) ; �1 = �1 (x) :

Nesta descrição, a intensidade da onda registrada pelo detector quando o furo2 está tampado é proporcional (não é igual, porque estamos dividindo pelaintensidade total dos furos, h1 = h1 (r)) a

I1 / jA1j2 = jh1j2 :

O mesmo valendo para o experimento com o furo 1 tampado

A2 = h2 exp (i!t) ; h2 2 C ;

I2 / jA2j2 = jh2j2 :

Quando os dois furos estão abertos a intensidade, no mesmo ponto x acima,será proporcional a

I12 / jA1 +A2j2 = jh1 exp (i!t) + h2 exp (i!t)j2 = j(h1 + h2)j2

/ jh1j2 + jh2j2 + 2 jh1j jh2j cos�� = �(x) = �1 (x)� �2 (x)

Ou seja, toda a oscilação da amplitude I12 esta na fase das quantidades com-plexas h1 e h2.Se chamarmos de A a intensidade total que sai dos dois furos, podemos

escrever:I12 (x) =

1

A

�jh1j2 + jh2j2 + 2 jh1j jh2j cos�

�:

Remark 1 É importante deixar claro que, nesta descrição, a onda que sai deum furo interfere com a onda que sai do outro furo. Ou seja, quando falamosem interferência queremos dizer sempre a interferência entre, no mínimo, duascoisas.

5

Figure 2: Figura 3 - Retirada de The Feynman Lectures on Physics.

O que acontece agora se �zermos um experimento semelhante ao anterior,mas com partículas e não ondas. Imagine uma metralhadora montada numcavalete não muito bem �xado. Na frente desta metralhadora temos uma paredecom dois furos e, depois desta parede um dispositivo capaz de coletar as balasque passam pelo furo. Este dispositivo pode ser colocado em qualquer ponto aolongo da parede numa posição que marcamos com a coordenada x.O experimento é realizado colocando o detector em uma posição x, ligando a

metralhadora, em seguida desligamos a metralhadora (isso é importante), peg-amos o detector e contamos o número de balas no seu interior. Esta quantidade,dividida pelo número de balas que passou pelos furos, pode ser interpretadocomo a intensidade I de balas em x.Realizamos primeiro o experimento com a fenda 2 fechada. Como os buracos

são da ordem de grandeza das balas estes as espalharão em todas as direções epodemos esperar que estas se acumulem preferencialmente na frente do buraco1 (ou em algum outro ponto em torno deste, devido a geometria do furo). Issonos daria uma intensidade registrada na forma I1 da �gura.Se agora repetimos o experimento com a fenda 1 tampada, esperamos obter

uma intensidade I2 como a da �gura.

Problem 2 O que acontece agora se ambas as fendas estão abertas?

Neste caso, devemos esperar que as balas se espalhem como a soma destasintensidade

I12 (x) = I1 (x) + I2 (x) :

O que nos dá o valor de I12 mostrado na �gura. Ou seja,

6

Remark 3 para partículas não observamos os efeitos de interferência apresen-tado pelas ondas.

Temos agora uma questão no mínimo curiosa:

1. É sabido desde tempos remotos que a luz apresenta o fenômeno de interfer-ência. Quando a luz passa por um experimento de duas fendas observamosas �guras de interferência descritas na experiência do aquário.

2. A teoria de Einstein dos fótons, bem como os dados experimentais doespalhamento Compton e do efeito fotoelétrico, nos mostram que a radi-ação é composta por quantidades bem localizadas no espaço, ou seja, secomporta como partículas.

Mas, como deve ter �cado claro, ondas e partículas são coisas diferentes edevem se comportar de forma diferente.Este comportamento bizarro da luz de, para certos experimentos, se com-

portar como onda e, para outros, se comportar como partícula, foi chamadode dualidade onda-partícula. Como veremos, este estranho efeito é a chave damecânica quântica.

1.2 Ondas de Partículas

O problema descrito na seção anterior toma uma proporção ainda maior coma hipótese de de Broglie (apresentada em sua tese de doutorado em 1924).Segundo está o comportamento onda-partícula (ou a dualidade onda-partícula)não seria peculiar a luz, mas a todas as quantidades presentes na natureza.De acordo com a hipótese de Einstein temos que a luz é composta de fótons

com energia

E = h� =) � =E

hOu, em termos do comprimento de onda,

� =c

�) E = h

c

�) � =

hc

E:

Se o fóton viaja a velocidade da luz (hipótese de Einstein) este não deve termassa, mas, por ter energia, ele possui um momento

E2 � (cp)2 = 0 =) E = cp :

Substituindo na expressão para o comprimento de onda e uma frequência

� =hc

E=h

p; � =

E

h:

A hipótese de de Broglie foi estender este resultado, valido para o fóton, ea�rmar: qualquer quantidade que possua um momento p terá a eleassociado uma onda cujo comprimento vale

� =h

p:

7

Problem 4 O que signi�ca exatamente �ter associado uma onda�?

Na época de de Broglie isso signi�ca apenas que todas as entidades comum momento p apresentariam um comportamento ondulatório, de interferênciaetc, correspondente a uma onda de comprimento �. Falaremos mais sobre issodepois, mas agora vamos ver uma conseqüência deste fato.Se a hipótese de de Broglie é verdadeira, um elétron em movimento deve

se comportar como uma onda com o comprimento de ondas acima. Assim, serealizarmos um experimento de dupla fenda (ou experimento de Young1) comelétron, devemos observar uma �gura de interferência. Este experimento foifeito e esta �gura foi observada!O experimento original realizado envolve o espalhamento de elétrons pelas

diferentes camadas de um cristal, mas experiências mais modernas são bem maispróximas a do experimento de Young.Para descrever este experimento você deve imaginar algo como a nossa ex-

periência com a metralhadora. Ou seja, existe um dispositivo que emite elétrons(e.g., um �o aquecido), estes elétrons são atirados com uma certa velocidade con-tra uma chapa com furos (e.g., através de um campo elétrico) e, ao passarempelo furo, são coletados por algum detector. Temos então uma intensidade I deelétrons no detector. Se os elétrons se comportarem como partículas, devemosesperar a intensidade

I12 = I1 + I2 ; (1)

igual a da metralhadora. Já se eles se comportarem como ondas, devemosesperar uma intensidade

I12 / jA1 +A2j2 ; (2)

igual a das ondas no aquário. O fato é que, se o diâmetro e a distânciaentre os furos for da ordem de grandeza do comprimento de ondados elétrons emitidos, realmente uma �gura de interferência (2) éobservada!Temos aqui algo muitíssimo mais curioso:No experimento das ondas no aquário, temos que a onda plana inicial, ao

passar pelos furos, cria duas outras ondas e estas se interferem. Ou seja, éa interferência de uma onda com a outra. Entretanto, em experimentos comelétrons é possível obter uma intensidade muito pequena do feixe. De sorteque é possível garantir que apenas um elétron seja emitido, por exemplo, numintervalo de alguns segundos.Neste caso, apenas um elétron passa pelos furos de cada vez. Estes elétrons

se acumulam na parede com o detector formando uma �gura de interferência.

Problem 5 Se o elétron bateu na parede antes do próximo ser lançado, com oque ele interferiu para temos uma �gura de interferência?

1Thomas Young, 1800.

8

Mais ainda, é possível colocar detectores para saber por qual fenda o elétronpassou. Ao colocarmos estes detectores, podemos garantir que o elétron passouapenas por uma das fendas (i.e., diferente das ondas, não detectamos uma partedos elétrons em cada fenda). Mas, sempre que colocamos estes detectores (epodemos com isso garantir que o elétron é uma partícula) a �gura de interfer-ência desaparece e passamos a observar uma intensidade (1) igual a das balasda metralhadora.Por que o elétron muda o seu comportamento dependendo da nossa obser-

vação?Discussões deste tipo estarão presentes em todo o nosso curso.Uma vez que a hipótese acima uni�ca o comportamento de todas as entidades

na natureza, podemos agora descrever de forma, num certo sentido, equivalenteo nosso experimento com ondas e com balas, i.e., partículas. Ou seja, tantoas ondas como as partículas possuem uma onda associada que descreve o seucomportamento. Mas como descrever então as duas �guras de intensidade difer-ente? Imagine então um emissor (uma metralhadora) que atira partículas (e.g.,elétrons) ou fótons com comprimento de onda e freqüência

� =h

p; � =

E

h

Ambos são agora descritos por como uma onda que vamos supor na forma

A = h exp (i!t) ; h 2 C

lembrando que a fase de h, que depende de � é diferente em cada ponto doespaço, � = � (x). Quando esta onda atinge os dois furos temos o comportamentopeculiar às ondas de gerarem duas novas ondas em cada furo (como descrito nocaso das ondas no aquário)

A1 = h1 exp (i!t) ; h1 2 CA2 = h2 exp (i!t) ; h2 2 C

onde, por terem a sua fonte em pontos distintos, cada hi possui uma fase �idiferente. Onde chamamos de hi a amplitude da onda i. Separamos a nossaonda desta forma porque estamos interessados no seu comportamento num de-terminado ponto x. Isto é um comportamento ondulatório, i.e., ao assumirmosque uma quantidade se comporta como uma onda, estamos dizendo que estecomportamento existe. Entretanto você não deve pensar que o elétronse dividiu em dois, cada um representando uma das ondas do furo,nem que ele passou pelos dois furos. A interpretação do que signi�ca estadivisão da onda em duas é um problema central em mecânica quântica. Comoveremos, a interpretação deste efeito é o que separa a chamada antiga da novamecânica quântica. Mas voltemos para as nossas ondas.(Soma das intensidades)A intensidade de cada onda no ponto x, quando um dos furos está tam-

pado, é proporcional aIi / jhij2

9

(lembre que Ii tinha a mesma forma para ondas e balas). Agora, supondoque, ao �m da experiência, você observou uma �gura de interferência, i.e., vocêobservou I12 da �gura 2, isso signi�ca que a intensidade �nal é proporcional à

I12 / jh1 + h2j2 (3)

Suponha agora que, por alguma razão, você não observou uma �gura de interfer-ência, i.e., você observou uma intensidade I12 como a da �gura 3, isso signi�caque esta intensidade é proporcional a soma das intensidades:

I12 / jh1j2 + jh2j2

Assim, a mesma descrição permite obter os dois tipos de comporta-mento. Ou seja:

1. quando as entidades se comportam como ondas a intensidade �nal é omódulo quadrado da soma das amplitudes (quantidades complexas),

2. mas quando se comporta como partículas, a intensidade �nal é asoma dos módulos quadrados das intensidades.

A razão da nossa entidade se comportar de uma ou outra forma está rela-cionado com uma série de características do experimento, e.g., o diâmetro e aseparação dos furos em relação ao comprimento de onda. Além das possíveisinterferências que possamos causar no sistema (ou outros mistérios que surgirãocom a interpretação da nova MQ). Os detalhes de quando devemos esperar umou outro comportamento serão discutidos nas seções seguintes.

1.2.1 Espalhamento de um único elétron

Primeiro vamos tentar entender porque é razoável supor que o elétron, ou ofóton, é uma partícula. Ou seja, que o comportamento ondulatório apresentadopelo elétron não se refere a uma onda no sentido físico (algo que carrega algumaforma de energia). Em primeiro lugar temos o fato descrito que ao colocarmosdetectores no experimento de duas fendas sempre detectamos a entidade emapenas uma das fendas e não detectamos absolutamente nada (nenhuma formade energia) na outra fenda.Vamos agora preparar um experimento de duas fendas com um único elétron.

Neste experimento preparamos a fonte para emitir um único elétron, o fazemospassar através de um anteparo com duas fendas e o detectamos no �nal. Bem,por ser apenas um elétron não esperamos ter nenhuma �gura de interferên-cia. Imagine ago que preparamos várias cópias deste experimento, exatamenteiguais, e os enviamos para cientistas nas mais diferentes partes do mundo, oudo universo. Cada cientista, ao receber o experimento, ira acioná-lo e registraro ponto onde a partícula caiu. Em seguida ele pegará este dado e nos envia devolta o resultado da medida.Depois de algum tempo, tendo recebido os dados de todos os experimentos,

nós os plotarmos em um único grá�co. O que obtemos com isso: uma �gura deinterferência!

10

Remark 6 Observe que não importa quando cada cientista realize o experi-mento, tudo que importa é que todos sejam iguais.

Imagine agora que cada cientista colocou um detector para saber, por qualfenda o elétron passou. Neste caso, como seria de se esperar, não teremosnenhuma �gura de interferência. Ou seja, a medida interferiu no sistema edestruiu a �gura de interferência.Imagine agora que todos �zeram o experimento sem trapacear (sem tentar

detectar o elétron). Mas uma parte deles (digamos uns 60%) não nos enviou osdados. O que acontece com a �gura neste caso? Neste caso teremos uma menorintensidade no número de elétrons detectado em cada ponto, mas, mesmo assim,continuaríamos observando a �gura de interferência. Podemos ainda imaginarque, depois de digitados os dados no computador, um problema no HD nos fezperder 60% dos dados. Plotando os dados que não se perderam ainda temos anossa �gura.

Remark 7 Ou seja, podemos jogar fora uma boa parte dos nossos dados semcomprometer em nada a �gura.

Imagine agora o seguinte variante. Cada cientista escolheu aleatoriamenteuma das fendas e colocou um detector apenas em uma fenda. Ao realizar oexperimento este cientista pode ter ou não detectado algo. Entretanto, mesmoque ele não tenha detectado absolutamente nada ele sabe por quefenda o elétron passou. Ou seja, se ele não detectou o elétron na fenda ondecolocou o detector, é porque ele passou pela outra fenda. Feito isso, apenas oscientistas que não detectaram nada nos enviam os seus dados. Assim,nós recebemos apenas os dados dos cientistas que não in�uenciaramna trajetória do elétron. Ou seja, neste caso não podemos dizer que oelétron foi espalhado por nada emitido pelo nosso detector. De nenhuma formainteragimos com o elétron, mas sabemos exatamente por qual fenda cada elétronpassou. Desta forma, novamente perderemos uma parte dos dados (digamos60%). Mas o que ocorre agora se plotarmos os dados? A �gura de interferênciafoi destruída!Resumindo, nós sabemos que o elétron é uma partícula, porque quando

o detector não detectou o elétron ele também não detectou nada (não detectoua presença de nenhuma onda) e não interagimos com esta partícula. Emesmo assim destruímos a �gura de interferência.

1.3 Pacotes de ondas

Uma onda, e.g., na direção x e de comprimento � está espalhada por toda adireção x. Mas uma partícula, e.g., um elétron, ocupa uma região �nita doespaço. Como então compatibilizar o comportamento ondulatório com o deuma partícula?A idéia aqui, que vai sofrer algumas modi�cações no futuro, é que é possível

se atenuar a intensidade de uma onda através da superposição de outras ondas.Por exemplo, considere duas ondas de mesma amplitude, uma de número de

11

Figure 3: Figura 4

onda k e outra com número de onda k +�k, com freqüência, respectivamente� e � +��. A sobreposição destas ondas nos dará

1 = sin (kx� !t) ; 2 = sin ((k +�k)x� (! +�!) t) ; = 1 + 2 = sin (kx+ !t) + sin ((k +�k)x+ (! +�!) t) ;

usando ago

sinA+ sinB = 2 cos1

2(A�B) sin 1

2(A+B)

temos

(x; t) = 2 cos1

2(�!t��kx) sin

�(kx� !t) + 1

2(�kx��!t)

�;

considerandokx� !t >> �kx��!t ;

podemos escrever

(x; t) = 2 cos1

2(�!t��kx) sin (kx� !t)

ou seja, para um tempo �xo, e.g., t = 0, temos

(x; 0) = 2 cos1

2(�kx) sin (kx)

como�k << k

a nossa onda oscila com número de onda k maior (igual a da onda original),mas toda ela tem uma amplitude modulada por �k.Desta forma, podemos atenuar a onda em alguns pontos do espaço. Se

continuarmos este processo somando uma in�nidade de ondas, podemos obterum pacote de ondas concentrado em apenas uma região do espaço. Este processoé o mesmo de tomar a decomposição em série de Fourier da onda acima.

Remark 8 Podemos obter uma onda localizada numa certa região do espaçoatravés de um pacote de ondas.

12

Figure 4: Figura 5

1.3.1 Velocidade de grupo

Uma onda se move com velocidade V = �=k. Entretanto, quando trabalhamoscom a combinação de um grupo de ondas formando um pacote, temos tambéma velocidade de movimento do pacote como um todo. Lembre-se que cadaonda tem uma velocidade e a velocidade do pacote não é igual a velocidadede nenhuma destas ondas individualmente. Além disso, não estamos supondoque o pacote mantém a sua forma com o tempo. Ou seja, como as ondas têmvelocidades diferentes o pacote pode se deformar (se espalhar, ou se contrais)com um tempo, mas continua sendo um pacote e estamos falando da velocidadedo movimento deste pacote. Esta velocidade é chamada de velocidade de grupog e está relacionada com a velocidade da envoltória que modula nosso pacote.Voltando ao nosso exemplo anterior de duas ondas temos

(x; t) = 2 cos1

2(�!t��kx) sin

�(kx� !t) + 1

2(�kx��!t)

�:

Se seguirmos a velocidade da primeira crista, ou do primeiro nó, temos que nesteponto o cosseno tem seu valor máximo (igual a um), ou seja,

1

2(�!t��kx) = 0 =) x

t=�!

�k= 2�

d�

dk= g

usandok =

2�

�; ! = 2�� ;

temos que a primeira, parte do produto (que é a envoltória da nossa onda)possui uma velocidade

g = 2�d�

dk;

13

usando a hipótese de De Broglie

2�

k= � =

h

p; � =

E

h:

temos

g = 2�d�

dk=dE

dp

Usando agora a relação relativística

E2 � (pc)2 =�mc2

�2 ) 2E dE = c22p dp

temosg = c2

p

E:

Usando as expressões da energia e do momento relativístico

E = c:p0 =mc2q1� u2

c2

; p = pi = m�i =mq1� u2

c2

ui

onde u é a velocidade da partícula de massa m, temos

g = u

ou seja, a velocidade de grupo é igual a velocidade u da partícula.

Exercise 9 Repita o cálculo acima para o caso de fótons (m = 0) e mostre queg = c.

Assim, uma quantidade localizada no espaço (uma partícula) pode ser vistacomo um pacote de ondas se movendo com a velocidade de grupo (mas estainterpretação será alterada no futuro).Mas se a nossa �partícula� é formada por uma in�nidade de ondas com

freqüências e comprimentos de número de onda diferentes e sabemos que

p =h

�=

h

2�k ; E = h� :

Problem 10 Qual é a�nal o momento e a energia da nossa onda (ouda partícula associada)?

Esta é mais uma das questões centrais da mecânica quântica.

14

1.4 Incertezas

Voltando então ao problema dos nossos pacotes de onda, resta-nos entendercomo as várias freqüências e comprimentos de onda presentes no pacote se rela-cionam com o momento e a energia da partícula. Um resultado muito conhecidoem problemas envolvendo pacotes de onda é que o pacote não possui umcomprimento de onda de�nido, mas sim todo um range de comprimentosque varia de � a � +�� (ou k a k +�k). Da mesma forma, usando a relaçãode de Broglie

p =h

�=

h

2�k ;

podemos a�rmar que a partícula associada ao pacote não possui um momentodeterminado, mas que seu momento está dentro do range entre

p e p+�p

Entretanto, sempre que a partícula interage com algo transferindomomento, e.g., num problema de espalhamento, esta transfere um momentobem de�nido. O que indica que, dos valores no range acima, apenas umdeterminado valor se manifesta quando observamos a interação dopacote em algum experimento.Na velha mecânica quântica este fenômeno foi explicado como se, quando

observado, a entidade perdesse seu comportamento ondulatório e agisse comouma partícula de posição e momento bem de�nidos. Observe que o mesmoacontece no problema de espalhamento de duas fendas, mesmo quando temos aformação da �gura de interferência. Cada elétron, ou fóton, é detectado numaposição especí�ca, com momento e energia bem determinados. Mesmo que,ao passar pelas fendas, estes apresentem um comportamento puramente ondu-latório (permitindo a interferência entre duas ondas).Assim, mais uma vez, nainterpretação da velha mecânica quântica, as entidades, quando não obser-vadas, se comportam como ondas (espalhadas numa certa região do espaçoe com momento dentro de um range), mas, quando observadas, toda estaregião se concentra numa área compatível com as dimensões das partículas as-sociadas, ou ainda, no caso de elétrons e fótons, toda a região da onda secontrai, ou colapsa, num único ponto e todo o seu range de momentocolapsa num único valor. Este fenômeno foi chamado de colapso da funçãode onda.Assim, a todo pacote de onda temos associada um range de valores do mo-

mento que, ao ser observada a partícula, nos dará um valor especí�co (mas umvalor qualquer dentro deste range). Dizemos então que a partícula associada aonda possui um (único) momento, mas este valor possui uma incerteza dentrodo range

p e p+�p

Ou ainda, quando uma partícula é descrita por um pacote de ondas, o momentoassociado ao seu comportamento corpuscular possui uma incerteza dentro dosvalores acima.

15

O mesmo ocorre com a manifestação da posição do comportamento corpus-cular da entidade. Um pacote de onda, como o da �gura 5, se estende por umaregião do espaço geralmente muito maior que as dimensões da partícula a eleassociada. Dizemos então que, quando este pacote colapsar, o caráter corpuscu-lar da partícula poderá se manifestar em toda a região �x. Ou ainda, a posiçãoda partícula possui uma incerteza �x.Assim, a toda a entidade está associada um pacote de onda, que, ao ser ob-

servado, irá colapsar numa partícula. Antes deste colapso, a partícula associadaao pacote possui uma incerteza �x em sua posição e �p em seu momento.Se usarmos o exemplo simples do nosso pacote de duas ondas senoidais

(x; t) = 2 cos1

2(�!t��kx) sin

�(kx� !t) + 1

2(�kx��!t)

�;

podemos estimar a espessura de um dos pacotes como a distância entre os pontosx1 e x2 tais que

�x1 =

�k; 0�= 2 cos

1

2

��k� �

�k

��sin (kx) = 0

�x2 =

2�

�k; 0

�= 2 cos

1

2

��k

�2�

�k

��sin (kx) = 0

com o que temos

�x = x2 � x1 =�

�k=) �x�k = � :

Este resultado pode ser generalizado para um conjunto de in�nitas ondas for-mando um pacote verdadeiramente concentrado. Utilizando resultados obti-dos com as desigualdades das transformadas de Fourie (uma conseqüência dochamado teorema de Plancherel) é possível obter a desigualdade

�x�k � 12

Não vamos nos preocupar aqui com este desenvolvimento matemático, pois nofuturo obteremos o mesmo resultado através de argumentos mais simples e, numcerto sentido, mais gerais.Usando agora a relação de de Broglie

p =h

2�k =) �k =

2�

h�p

temos

�x�p � 12

h

2�=) �x�p � ~

2; ~ =

h

2�

com ~ (agá-barra) uma constante introduzida por Dirac. Este resultado repre-senta um caso particular de um desenvolvimento (devido a Dirac) que veremosno futuro e é conhecido como relação de incerteza de Heisenberg.

16

Em especial, observe que se não há incerteza no número de onda, nossapartícula é descrita apenas por uma única onda que, conseqüentemente, estaráespalhada em todo o espaço. Ou seja, uma partícula de momento bem de�nidotem a incerteza na posição in�nita.Relações semelhantes podem ser derivadas quanto estudamos o range de

freqüências do pacote. Neste caso temos uma relação entre o tempo e a energiado sistema:

�E�t � ~2

Exercise 11 Usando�t�! � 1

2

obtenha a relação acima.

Esta relação é um pouco mais difícil de ser interpretada e, por isso, voltare-mos a ela apenas quando estudarmos alguns exemplos concretos. Uma analogia(talvez) útil seria a a�nação de um instrumento musical. A soma de duas fre-qüências próximas produz o efeito de batimento, ou seja, se duas freqüênciasmuito próximas são tocadas juntas ouvimos uma variação na intensidade dosom. Quanto mais as freqüências se aproximam maior o intervalo entre os picosdesta variação. Isso é usado para a�nar um instrumento com uma freqüênciapadrão. Quando o tempo é longo, o instrumento está a�nado. Entretanto, paragarantir que a freqüência seja exatamente a desejada, precisaríamos garantir queo tempo do batimento é in�nito. Neste sentido, quanto maior a incertezana energia de um sistema, por exemplo entre dois níveis de energia,maior será a instabilidade do sistema e, para garantirmos que o sistemaestá num nível de energia bem de�nido, teríamos de veri�car que jamais haverátransição entre os dois níveis.A relação acima representa uma das maiores diferença entre a mecânica

quântica e toda a física anterior. Estes conceitos de incertezas em quantidadesfísicas já eram utilizados em várias teorias anteriores, como, por exemplo, amecânica estatística. Mas, neste caso, a incapacidade de se observar com pre-cisão as características do sistema estavam relacionadas com alguma limitaçãoprática. Por exemplo, em mecânica estatística o grande número de constitu-intes dos sistemas físicos torna impraticável a aplicação da mecânica clássicacomo o desenvolvimento de cada ente. Assim, estas teorias trabalham com mé-dias sujeitas a desvios. Entretanto, o caráter da incerteza da MQ é inerente aprópria teoria. Ou seja, não é possível se determinar com precisão ab-soluta a posição e o momento de qualquer entidade física. Conseqüen-temente, não apenas estes valores, mas toda a evolução temporal da entidade(que na mecânica é uma conseqüência da posição e momento) possuirá tambémuma incerteza. Não sabemos o estado �nal de nenhum sistema, mas apenasintervalos de valores onde ele pode se encontrar. Este comportamento podeter duas interpretações. Na primeira o sistema possui um valor bem de�nidode posição e momento, mas não nos é permitido conhecer estes valores (comose estes valores estivessem �escondidos� no sistema). Neste caso é como se a

17

partícula existisse, mas não fossemos capazes de olhar para ela. Na segunda,estes valores realmente não existem bem de�nidos em nenhuma entidade física,até o momento em que esta é observada. Neste caso, é como se a partícularealmente não existisse enquanto não olhamos para ela.A defesa dos pontos de vista acima (ou de algo parecido com eles) gerou

uma verdadeira ruptura entre os defensores e fundadores da MQ. Einstein, umgrande defensor do primeiro ponto de vista chegou a dizer coisas como �entãoa lua não está lá quando eu não estou olhando pra ela�. Um ponto aindamais importante sobre estes dois pontos de vista é que, a primeira vista, elespodem parecer apenas diferenças �losó�cas. Entretanto, em 1964, John StewartBell apresentou meios quantitativos que permitiriam, através de experimentos,veri�car qual destes pontos de vista correspondia com o comportamento danatureza. Mas isso é uma outra história...

1.5 A verdade (pelo menos até agora)

Vamos primeiro fazer uma breve retrospectiva. Em 1901 Planck apresentouseu trabalho solucionando o problema da radiação do corpo negro. Nestetrabalho surge a estranha idéia da energia dos osciladores (elétrons) poder as-sumir apenas valores separados por intervalos discretos. Como se, de algumaforma, o movimento destes elétrons não tivesse uma forma contínua.Esta mesma idéia está por trás do problema do calor especí�co, onde, como sepor conseqüência da quantização dos níveis de energia, os graus de liberdade nãofossem mais acessíveis para energias muito baixas. O movimento das coisasnão se apresentava de forma contínua em escalas muito baixas de ener-gia. Em seguida, 1905, temos a explicação de Einstein do efeito fotoelétrico,nesta explicação, a radiação (quantizada por Planck) emitida por cargas emmovimento, não apenas tinha uma quantidade discreta de energia, mastambém estava localizada numa região �nita do espaço. Esta inter-pretação deu a luz, que até então era tratada como uma onda, um carátercorpuscular. Temos então o curioso efeito da dualidade onda-partícula daluz. O espalhamento Compton, veri�cado em 1922, corroborou a hipótese deEinstein.As coisas se tornam ainda mais estranhas com a hipótese de de Broglie, em

1925, de que o comportamento dual onda-partícula, não era uma peculiaridadeda luz, mas sim de todas as entidades da natureza. Temos então a idéia das�ondas de matéria�. Todas as coisas então possuem um comportamento ondu-latório, mas, ao serem detectadas, comportam-se como partículas. A hipótesede de Broglie foi comprovada em 1927 no experimento de Davisson-Germeratravés do espalhamento de elétrons por cristais.Um grande problema para esta nova teoria é a interpretação do que sig-

ni�ca �sicamente a função de onda associada às partículas. Por não transportarnenhuma forma de energia, esta onda certamente não poderia ser reconhecidacomo uma onda no sentido ordinário da física. Como veremos adiante, a teoriaevoluiu muito, no sentido de fazer várias previsões que foram con�rmadas exper-imentalmente e explicar uma série de dados até então inexplicáveis. Todos estes

18

resultados foram obtidos a partir do modelo atômico de Bohr (1913), e dodesenvolvimento de duas formulações independentes de como este novo conceitode �ondas de matéria� deve ser aplicado. Estas formulações foram propostaspor Schrödinger, em 1926, e a outra por Heisenberg, em 1927. Mas todosestes resultados e formulações não foram su�cientes para elucidar o mistério dosigni�cado físico da função de onda.As relações de incerteza de Heisenberg, apresentadas em 1925, per-

mitiram quanti�car quando deveríamos esperar um comportamento ondulatórioou corpuscular das entidades físicas. Se a incerteza na posição �x é pequena, aentidade estará localizada no espaço e se comportará como um corpúsculo. Jáquando a incerteza no momento �p é pequena, a entidade não estará localizadano espaço e se comportará como uma onda. Entretanto, estas relações não ex-plicavam porque, por maior que fosse a incerteza na posição, a entidadesempre era detectada numa região. Ou seja, qual o mecanismo docolapso da função?As idéias de Niels Bohr e Heisenberg sobre as incertezas inerentes nos proces-

sos de detecção das partículas (quando falamos partículas, estamos dizendo qual-quer coisa) remetem naturalmente as idéias de medida de posição e velocidadeda mecânica estatística e, naturalmente, a idéia de probabilidades. Mas foi ape-nas em 1927 que Max Born apresentou o que é considerado hoje a corretainterpretação da função de onda. O postulado de Born a�rma que:

� A intensidade da função de onda associada à partícula representa a prob-abilidade da partícula ser detectada naquela região do espaço.

Ou seja, se (x; y; z) é um pacote de onda associado a uma partícula (lembreque a intensidade é proporcional ao módulo quadrado da função de onda) então

j (x; y; x)j2 dx dy dz = j j2 dV ;

é a probabilidade da partícula ser detectada no volume dV .Dentro desta interpretação a função de onda associada à partícula perde

todo o seu caráter físico, no sentido de não estar relacionado com o trans-porte de nenhuma quantidade mensurável. Ou seja, não é possível semedir, ou observar, diretamente a função de onda. Além disso, uma vezque partículas podem ser observadas e preservam a sua �realidade física�, nosentido usual de serem detectadas, esta interpretação privilegia a idéia de queas entidades físicas em todos os processos são partículas.Sendo as ondas a probabilidade de se encontrar a partícula em algum lu-

gar (usaremos a partir daqui esta linguagem). Esta interpretação elimina oproblema do colapso da função de onda, mas, obviamente, temos ainda deencontrar um �sentido físico�para os fenômenos de interferência causados poresta função de onda. A�nal, como algo que não transporta nenhuma quanti-dade física (momento, energia etc) pode interferir no comportamento das quan-tidades físicas. Este problema está diretamente relacionado com a formulaçãoda MQ proposta por Feynman, em 1948. Voltaremos a este problema quandotratarmos especi�camente da hipótese de Born, ou da chamada Interpretação

19

de Copenhague. Só é importante ter em mente que uma boa parte do desen-volvimento a seguir foi feito antes desta interpretação. Mas, mesmo que seuscriadores não tivessem esta interpretação em mente (ou mesmo não a aceitassemposteriormente), tudo se torna bem mais fácil de entender se, desde já, seguirmosas idéias de Born.

20

1.6 O átomo de Bohr

Por que os átomos (em especial o átomo de hidrogênio) emitem radiações apenasem freqüências com intervalos bem de�nidos? E por que o elétron não colapsano núcleo átomico?O problema acima foi resolvido por um modelo proposto por Bohr em 1913,

através dos seguintes postulados:

1. O átomo de hidrogênio existe apenas em níveis discretos de energia. Estesníveis são caracterizados pelos seguintes valores discretos do momentoangular dos elétrons em órbitas circulares

2�p� = nh ; n 2 N� :

onde p� é o momento angular do elétron. Quando o elétron possui umdestes valores de momento angular, ele está estável, i.e., não irradia.

2. Quando um átomo efetua uma transição do nível de energia En para umEm ele irradia (se En > Em) ou absorve (se En < Em) um fóton deenergia:

h� = jEn � Emj :

Uma boa motivação para estes postulados foi apresentada por de Broglie em1924??, usando a sua própria hipótese de ondas. O elétron pode ser descritopor uma onda. Se ele está numa orbita onde a sua energia está bem de�nida(pois sabemos exatamente a energia que ele emite ao sair desta órbita), entãoa sua função de onda deve ser uma onda de freqüência bem de�nida e não umpacote. Esta onda de comprimento bem de�nido está distribuída portodo o percurso acessível ao elétron. Com isso, pela hipótese de uma órbitacircular de raio r, no perímetro da circunferência deve caber um número inteirodo comprimento de onda

2�r = n�

Usando a relação

� =h

p;

temos2�rp = nh ;

onde rp é o momento angular do elétron

p� = rp

Com isso, sendo a força coulombiana uma força central (que preserva o momentoangular), podemos escrever

2�rp = pr

Id� =

Iprd� =

Ip� d� = nh ;

21

Figure 5: Órbita de Bohr e a onda de de Broglie para n = 4. Figura retiradado Libo¤.

que é a primeira hipótese de Borh. Ou seja, esta hipótese esta relacionadacom o argumento que a onda que descreve o elétron tem comprimentode onda bem de�nido e este comprimento deve ser condizente com otamanho da órbita.A segunda hipótese de Bohr está diretamente relacionada com as hipóteses

de Einstein e Planck de que a radiação eletromagnética é emitida em pacotescom energia h�.Vejamos agora quê resultados podemos obter do modelo de Bohr. Primeira-

mente, o colapso do átomo é eliminado por um postulado.Como a órbita é estável, a força centrípeta (estamos usando o sistema de

unidades Gaussiano)

mac = mv2

r=

p2�mr3

;

deve contrabalançar a atração da força coulombiana (para o núcleo tendo amesma carga do elétron)

e2

r2=

p2�mr3

=) r =p2�e2m

: (4)

Usando a primeira hipótese de BohrIp� d� = nh =) 2�p� = nh =) p� = n~

temos

rn =n2~2

e2m= n2a0 ; a0 =

~2

me2

22

Onde a0 ( 0,53 Å) é chamado raio de Bohr e corresponde ao primeiro raiopermitido do modelo. A energia do elétron numa dada órbita é a soma de suaenergia cinética e potencial:

E =1

2mv2 � e2

r=

p2�2mr2

� e2

r

usando (4)e2

r=

p2�mr2

=) E =p2�2mr2

� p2�mr2

= � p2�2mr2

Usando agora o valor de rn e a hipótese de Bohr

En = �n2~2

2m

�1

n2a0

�2= � ~2

2ma20

1

n2

= �R1n2

; R1 =~2

2ma20

o valor negativo apenas indica que a força é de ligação. Ou seja, o elétron temenergia zero no in�nito e, quanto mais perto do núcleo, mais ligado (i.e., maisestável) e menor a sua energia. O rótulo n, que caracteriza o nível de energia,é chamado de número quântico principal.O resultado acima nos permite calcular a energia de transição entre dois

níveis de energia

h�n!m = Em � En = �R1�1

m2� 1

n2

�= En!m :

Tudo que precisamos agora é comprara este resultado com o experimental, i.e.,com a séries de Balmer e Lyman. Primeiro vamos esquecer a constante e escr-ever:

En!m /�1

n2� 1

m2

�com n = 1 para a série de Lyman (??) e n = 2 para a série de Balmer (??). Emoutras palavras, se o modelo de Bohr está correto, a série de Lyman representatransições dos níveis excitados para o nível de menor energia (nível fundamen-tal), enquanto a série de Balmer representa as transições dos níveis mais excita-dos para o primeiro nível excitado. Isso é fácil de entender. Como as medidasde Balmer se referem a espectro estelar, ou outros corpos em alta temperatura,o menor nível que o átomo de hidrogênio pode atingir neste ambiente (por estarem equilíbrio térmico) é o primeiro estado excitado. Caso ele tente ir para oestado fundamental, o próprio meio fornecerá energia para que ele se excite.Já os resultados de Lyman se referem a gases a temperatura ambiente, onde onível do primeiro estado excitado (como veremos) é muito maior que a energiatérmica do meio, de sorte que os átomos podem perfeitamente se encontrar noestado fundamental.O grande sucesso do modelo de Bohr para explicar e prever o comportamento

atômico foi um grande triunfo para a MQ. Uma vez que este modelo estava

23

Figure 6: Figura retirada do Eisberg.

em completo acordo com as hipóteses de Einstein e de Broglie e com dadosexperimentais.Entretanto, como veremos, o modelo de Bohr é muito simpli�cado e não pode

dar conta de todos os fenômenos observados no espectro do átomo de hidrogênio.Naquela época, medidas mais precisas das linhas espectrais mostravam que osníveis de energia En eram, na verdade, vários níveis muito próximos, i.e., sãoobservadas radiações com freqüências muito próximas. Esta é a chamada estru-tura �na do átomo de hidrogênio. Voltaremos a este problema, juntamente comoutras características não contempladas pelo modelo de Bohr, no futuro.

24

1.7 Quantização de Sommerfeld

A teoria quântica estava sendo criada, então a idéia (que não é muito diferenteda de hoje) seria procurar as características peculiares desta teoria para umcaso especí�ca e generalizar para todos os casos. Como fez de Broglie com adualidade onda-partícula do fóton.A solução de Planck para o corpo negro corresponde a uma quantização

nos níveis de energia (ou das amplitudes de oscilações) do oscilador harmônico.Enquanto a quantização de Bohr do átomo de hidrogênio corresponde a umaquantização do momento angular (ou das órbitas) do elétron no átomo. Existealguma relação entre estes dois processos?Perceba que para obter os níveis de energia e os raios das órbitas de Bohr,

partimos do modelo clássico, cuja energia é dada por

E =1

2mv2 � e2

r=

p2�2mr2

� e2

r:

E impusemos que estes níveis são discretizados segundo a regra:

p� = n~ :

O mesmo equivale (teoria de Planck) a partir da expressão clássica para o os-cilador harmônico e impor uma regra de quantização nas amplitudes.Todos estes dois modelos partem de uma teoria clássica conhecida e "quan-

tizam" o problema clássico através de uma certa regra de quantização sobrealguma quantidade física mensurável.

Remark 12 Existiria uma forma de sistematizar esta regra de quantização dasquantidades físicas, de sorte que pudéssemos obter as versões quânticas de outrossistemas classicamente conhecidos.

A um procedimento deste tipo damos o nome de regra de quantização, ousimplesmente, quantização.

Remark 13 Quantização é o problema central da física teórica atual.

Em primeiro lugar, na mecânica clássica qual quantidade precisa ser con-hecida para descrevermos completamente o comportamento de um sistema (i.e.,a sua evolução temporal)?Na formulação de Hamilton da mecânica toda a evolução de um sistema clás-

sico pode ser determinado conhecendo-se a chamada hamiltoniana do sistema,H (q; p; t). A hamiltoniana é uma função dos momentos p e das coordenadasq generalizadas do sistema e, no geral, do tempo. Neste formalismo a evoluçãodo sistema é dada pelas equações de Hamilton

_pi = �@H

@qi; _qi =

@H

@pi

Para sistemas conservativos, nos quais H (q; p) não depende do tempo, ahamiltoniana pode ser identi�cada com a energia do sistema.

25

Uma grande vantagem no uso das equações de Hamilton e das coordenadasgeneralizadas é que as equações para cada coordenada têm a mesma forma inde-pendente do sistema de coordenada escolhido. Isso não acontece, por exemplo,na equação de Newton. Para coordenadas cartesianas, as equações do movi-mento são:

Fi = mdxidt

=) Fx = m�x ; Fy = m�y

Já se usarmos coordenadas polares

x1 = r cos � ; x2 = r sin � ;

� = y cos � � x sin � ;r = x cos � + y sin � ;

as equações passam a ter a forma

Fr = m�r +mr _�2 ; F� = mr�� + 2m _r _� :

Inclusive, uma forma simples de se obter as expressões acima é usando asequações de Hamilton. Em coordenadas polares, a energia da partícula, numpotencial U , vale:

K =1

2m (v�)

2+1

2m (vr)

2=1

2m�r _��2+1

2m ( _r)

2

Introduzindo o momento angular p� e o momento radial pr

p� = rp = rmv� = r2m _�

pr = mvr = m _r

podemos escrever

K =p2�2mr2

+p2r2m

assim, a energia total do sistema e, conseqüentemente, a hamiltoniana, tem aforma

H =p2�2mr2

+p2r2m

+ U (r; �)

De onde temos as equações de Hamilton:

_p� = �@H

@�= �@U

@�; _pr = �

@H

@r= �@U

@r� p2�mr3

_� =@H

@p�=

p�mr2

; _r =@H

@p2=prm

Para obter, por exemplo, a equação para r, podemos derivar a última dasequações acima com relação ao tempo

�r =_prm

26

E usar a equação para _pr:

m�r = _pr = �@U

@r� p2�mr3

usando a expressão para o momento angular, p� = r2m _�, temos

m�r + rm _�2 = �@U@r

= Fr :

e o mesmo procedimento pode ser usado para obter F� = �@U=@�.Vejamos como �ca a descrição do oscilador harmônico na mecânica de Hamil-

ton. Para um oscilador harmônico

E =1

2mv2 +

1

2kx2 =) H (q; p) =

p2

2m+ kx2

Assim, as equações de Hamilton têm a forma

_p = �@H@x

= �kx ;

_x =@H

@p=

p

m

Derivando a segunda equação do relação ao tempo e usando a primeira temos

�x =_p

m=) �x = �kx

m=) m�x+ kx = 0 ;

que é conhecida equação do oscilador harmônico.Como toda a informação esta contida na hamiltoniana e esta depende apenas

das posições e momentos, podemos descrever a evolução do sistema através deuma curva no plano p� q, chamado espaço de fase.Por exemplo, no caso do OH, para uma dada energia (i.e., um valor �xo de

H) temos

E =p2

2m+1

2m!2x2

ou seja, as trajetórias formam uma �gura fechada, neste caso, mais es-peci�camente, uma elipse. Isso acontece porque a coordenada x é periódica.Assim, para qualquer coordenada periódica, a trajetória no espaço

de fase forma uma �gura fechada. Por ser fechada, esta �gura certamenteencerra uma área.Classicamente esta área pode assumir qualquer valor, mas, se a energia só

puder assumir valores discretos, conseqüentemente esta área também só poderáassumir valores discretos. Assim, ao quantizar os níveis de energia do OH,automaticamente quantizamos as áreas das trajetórias do oscilador no espaçode fase.Esta idéia está diretamente relacionada com ás relações de incerteza pois,

enquanto classicamente os estados das partículas são pontos, quanticamentedevem ser áreas com valores

�q�p � ~2:

27

Ou seja, a relação de incerteza implica que as órbitas de um oscilador, oude qualquer outra variável periódica, não pode ter uma área menor que�q�p � ~=2. Em especial:

Remark 14 O oscilador, cujo centro da órbita é conhecido, não pode parar e,obrigatoriamente, tem uma energia mínima diferente de zero!

O mesmo vale para um elétron numa orbita circular em torno do próton.Como a massa do próton é muito maior que a do elétron, seu comprimentode onda (do próton), para uma mesma velocidade, é muito menor. Assim,podemos localizar o próton (centro da orbita), numa região muito menor quepoderíamos localizar o elétron. Assim, imaginando que sabemos onde está opróton, o elétron numa órbita circular de raio r deve respeitar

�r = 2�r =) �r�p � ~2=) r�p � �p� �

~4�

:

Resumindo, as relações de incerteza implicam valores mínimos paraas áreas das coordenadas periódicas no espaço de fase. E a hipótese dePlanck implica ainda que estas áreas crescem apenas em quantidadesdiscretas.

28

A regra de quantização de Sommerfeld, ou a regra de quantização da velhaMQ, é uma generalização dos resultados acima. Esta regra impõe que:

� Para qualquer coordenada periódica a órbita da trajetória no espaçode fase só pode assumir valores múltiplos da constante de PlanckI

H(q;p)=E

pi dqi = nih :

O fator inteiro de proporcionalidade ni recebe o nome de número quântico.(Planck)Vejamos como esta regra está relacionada com a hipótese de Planck.

� O primeiro passo é identi�car a coordenada periódica.

Neste caso, obviamente estamos falando da posição (coordenada cartesiana)do oscilador. Qualquer ponto a ser alcançado pelo oscilador será revisitadoperiodicamente. Então, a nossa coordenada periódica é x e o momento a elaconjugado é o momento linear p = m _x.Agora precisamos escrever a hamiltoniana, do sistema usando esta coorde-

nada e momento. Como o sistema é conservativo, a hamiltoniana não dependedo tempo e é igual a energia total do oscilador

H (p; x) =p2

2m+1

2m!2x2 = E

Como a energia do sistema se conserva, para uma dada energia (amplitude deoscilação), podemos escrever

p =

s2m

�E � 1

2m!2x2

�Com o que podemos calcularI

p dx =p2mE

I r1� m

2E!2x2 dx

fazendo (aqui está implícito que x é periódica)rm

2E!x = sin � =) dx =

1

!

r2E

mcos � d�

e usando que para um período completo � 2 [0; 2�] temosIp dx =

1

!

r2E

m

p2mE

Z 2�

0

p1� sin2 � cos � d�

= 2E

!

Z 2�

0

cos2 � d�

29

usandocos2 a =

1

2(cos (2a) + 1)

temos Ip dx =

E

!

�Z 2�

0

cos (2�) d� +

Z 2�

0

1 d�

�= 2�

E

!=E

�:

Usando a regra e quantização de SommerfeldIp dx =

E

�= nh) En = nh�

obtermos a regra de quantização de Planck.(Bohr)Vejamos agora como esta regra está relacionada com os postulados de Bohr.

Assumindo o modelo de Bohr, temos que as órbitas são circulares em torno donúcleo. Mais uma vez, precisamos identi�car a coordenada periódica. Nestecaso, obviamente estamos falando do ângulo � que identi�ca a posição para umcerto raio R. Como a nossa variável de posição é um ângulo, o momento aela relacionado é um momento angular p� = R2me

_�. Neste caso, como a forçacoulombiana é central e conserva momento angular, temosI

p� d� = p�

Z 2�

0

d� = 2�p�

Usando agora a regra de quantização de Sommerfeld temos:Ip� d� = nh = 2�p� =) p� = n~

Que é o primeiro postulado de Bohr.Assim, a aplicação direta da regra de quantização de Sommerfeld permite

obter (sistematicamente) os resultados de Planck e Bohr.A grande vantagem do processo está no fato de podemos agora aplicar esta

regra para outros sistemas. Isto foi feito por Sommerfeld para tentar explicara estrutura �na do átomo de hidrogênio. O ponto de partida é que a restriçãode Bohr de que as órbitas devem ser circulares talvez seja forte demais. Vamosentão (seguindo Sommerfeld) relaxar esta restrição e admitir órbitas elípticas.Neste caso, continuamos tendo a variável angular � periódica, mas, agora, a

variável radial r também pode variar dentro de um valor mínimo a (raio menorda elipse) até um valor máximo b (raio maior da elipse). A energia cinética totaldo sistema agora é a soma da energia cinética de cada uma das variáveis:

K =1

2m (v�)

2+1

2m (vr)

2=1

2m�r _��2+1

2m ( _r)

2:

30

E temos agora dois momentos, um conjugado a variável angular (momento an-gular)

p� = rp = rmv� = r2m _� =) _� =p�r2m

;

e outro conjugado a variável radial (momento linear radial)

pr = mvr = m _r =) _r =prm

:

Com estes momentos a energia cinética pode ser escrita como

K =p2�2mr2

+p2r2m

E, mais uma vez como o sistema é conservativo, a hamiltoniana é a energia totaldo sistema:

H (pr; p�; �; r) =p2�2mr2

+p2r2m� e2

r= E (5)

Antes de tudo, note que a variável radial também é periódica r 2 [a; b].Temos agora duas variáveis periódicas e, conseqüentemente, dois númerosquânticos I

p� d� = n�h ;

Ipr dr = nrh :

Como o potencial do nosso problema não mudou, continuamos tendo a con-servação do momento angular e, conseqüentemente, continuamos tendo a regrade quantização I

p� d� = n�h =) p� = n�~

Para a coordenada radial, usamos novamente a lei de conservação de energia, eescrevemos

pr = �

s2m

�E +

e2

r� p2�2mr2

�Onde o sinal de + se refere a trajetória de a ! b e o de � de b ! a. Como sóestamos admitindo órbitas elípticas, temosI

pr dr = 2

Z b

a

s2m

�E +

e2

r� p2�2mr2

�dr = 2�p�

�ab� 1�:

Aplicando agora a regra de quantização de Sommerfeld temosIpr dr = hnr =) p�

�ab� 1�= ~nr =)

nrn�=a

b� 1

onde, para uma órbita circular

a = b =) nr = 0

31

ou sejanr 2 N ; n� 2 N� :

Além disso, seguindo um procedimento análogo ao que �zemos para encon-trar os níveis de energia do átomo de Bohr, para uma órbita estável devemoster

p2�2mr2

+p2r2m� e2

r= 0 ;

de onde obtemos as relações

a =(n� + nr)

2 ~2

�Ze2; b = a

n�(n� + nr)

:

Voltando para (5)

Enr;n� = ��Z2e4

2~21

(n� + nr)2 :

De�nindon � nr + n�

podemos escrever

a =n2~2

�Ze2; b = a

n�n; En = �

�Z2e4

2~21

n2

Nosso problema tem dois números quânticos. Com a energia depende apenas den, continuamos usando este número e chamado de número quântico principal.Além disso, temos agora o número quântico azimutal n�.(Degenerescência)O ponto novo nesta descrição é o surgimento de estados de energia degener-

ados, i.e., estado diferentes com o mesmo valor de energia. Por exemplo,para o primeiro estado excitado devemos ter n = 2. Mas isso pode ser obtidotanto fazendo

nr = 0; n� = 2;

numa orbita circular, ounr = 1; n� = 1:

numa órbita elíptica. Estes dois níveis são diferentes (estados, ou con�gurações,diferentes para o elétron), mas representam elétrons com a mesma energia. Ouseja, agora especi�car o estado de energia do elétron não é su�ciente para saber-mos em que estado ele está. Para isso, devemos dar nr e n�, ou n e n�.Da mesma forma, para n = 3 podemos ter

n� = 3 =) nr = 0

n� = 2 =) nr = 1

n� = 1 =) nr = 2

32

De forma geral, para um dado nível de energia n temos n estados degenerados.Para os químicos, os níveis com nr = 0 (maior n�) é chamado de s (sharp),

o nível nr = 1 é chamado de p (principal). O procedimento segue este esquemacom a nomenclatura d para nr = 1 (sharp, principal, di¤use, e fundamental, orestante sendo nomeado em ordem alfabética). Um nível é nomeado pelo valorde n e nr, ou seja, o estado fundamental (único) é chamado 1s (n = 1; nr = 0ou n = 1; n� = 1). Já para o primeiro estado excitado, temos dois estados 2s e2p, e assim segue

1s

2s 2p

3s 3p 3d

...

Esta divisão dos níveis (dependendo da excentricidade da órbita) está rela-cionada com a estrutura �na do átomo de hidrogênio.Como dissemos acima, todos os níveis com mesmo n possuem a mesma

energia. Mas as linhas espectrais observadas se referem a freqüências diferentese, conseqüentemente, a diferentes energias.

Exercise 15 Então como estes estados de mesma energia podem gerar tran-sições com diferentes energias?

O ponto observado por Sommerfeld é que todo o tratamento usado até aquié clássico e não leva em conta os efeitos da Teoria da Relatividade. Ao se moverno campo puramente elétrico gerado pelo núcleo, o elétron, em seu referencial,enxerga um campo magnético e este campo faz com que órbitas circulares e elíp-ticas tenham uma energia diferente. Este efeito pode ser acentuada colocando-seo átomo num campo magnético externo. O resultado obtido por Sommerfeldusando a mecânica relativística foi

En;n� = ��Z2e4

2~2n2

�1 + Z2

�2

n

�1

n�� 3

4n

��;

onde � ' 1=137 é a chamada constante de estrutura �na. Voltaremos a falarsobre isso (com detalhes) no tratamento do átomo de hidrogênio no �nal destecurso. Mas agora já sabemos que os níveis de energia do átomo de hidrogêniopossuem a estrutura da �gura abaixo.O modelo de Sommerfeld, apesar de explicar adequadamente os níveis de

energia tomando em conta a estrutura �na, ainda não é su�ciente para explicaroutras observações. Medidas ainda mais precisas mostram que mesmo os níveisdescritos acima possuem uma separação em outros níveis. Esta nova diferença,muito menor que a anterior, é chamada de estrutura hiper�na do átomo dehidrogênio. Esta estrutura não aparece no nosso modelo porque ele ainda émuito simpli�cado. O elétron, além de massa e carga, possui também umacaracterística interna chamada spin. Para dar conta da estrutura hiper�na,precisamos incluir esta característica no nosso modelo.

33

2 Mecânica

Como vimos no caso da quantização de Sommerfeld, a descrição da MecânicaClássica (MC) adequada para se introduzir um processo de quantização não éa formulação de Newton. Isso é verdade em geral. Tanto para os processosda velha mecânica quântica, quanto da nova até a sua evolução relativística (aTeoria Quântica de Campos). Um primeiro ponto que podemos salientar é que,tendo como base uma descrição ondulatória, as equações envolvidas no processode descrição quântica devem, assim como a equação de onda, envolver derivadasparciais. Enquanto a mecânica de Newton envolve derivadas totais. Além disso,como veremos a seguir, existe uma semelhança muito grande (notada bem antesdo advento da MQ) entre estas outras descrições da MC (Hamilton, Lagrangeetc) e a descrição das características da luz na óptica geométrica. De umaforma geral, não só nesta parte do curso como na segunda parte (Moderna II) éimpossível apreciar o processo de surgimento e evolução da MQ sem um conhec-imento (ainda que enciclopédico) da descrição clássica da Mecânica Analítica.Destarte, dedicaremos algum tempo para ganharmos uma certa familiaridadecom os termos e expressões envolvidos na Mecânica Analítica.

2.1 Preliminar

Se f = f (a; b) é uma função de duas variáveis a; b então

df =@f

@ada+

@f

@bdb

e, da mesma forma, se

df = g:da+ h:db =) f = f (a; b)

34

não importando de quais variáveis depende g e h. Pois, independente destavariáveis, a função f só varia quando alteramos a e b.Se

df = g:da+ h:db =) g =@f

@a; h =

@f

@b

2.2 Equações de Euler-Lagrange

Partindo da equação de Newton temos

Fi = md2xidt2

(6)

Para forças conservativas

Fi = �@U

@xi= m

d

dt_xi (7)

A energia cinética em coordenadas cartesianas é dada por (onde, assim como nanotação da relatividade, estamos admitindo que sempre existe uma somatóriaimplícita quando dois índices se repetem)

T =1

2( _xk)

2; ( _xk)

2=Xi

_x2k

com isso temos

@T

@ _xi=m

2

@

@xi( _xk) ( _xk) =

1

2

��@ _xk@ _xi

�_xk + _xk

@ _xk@ _xi

�=m

2[(�ik) _xk + _xk�ik] = m _xi

Voltando em (7)

� @U@xi

=d

dtm _xi =

d

dt

@T

@ _xi=) d

dt

@T

@ _xi+@U

@xi= 0 ; i = 1; 2; 3: (8)

Para siatema conservativos a energia potencial depende apenas das coordenadasU = U (xi; t). Enquanto a energia cinética é, em coordenadas cartesianas2 , umafunção apenas das velocidades, T = T ( _xi). Podemos com isso de�nir umafunção que depende de x e _x

L (xi; _xi; t) = T ( _xi)� U (xi; t)

com isso@L

@ _xi=@T

@ _xi;@L

@xi= � @U

@xi2Em coordenadas polares, por exemplo, a energia cinética

T =1

m

�_r2 + _r2 _�2

�;

depende da coordenada 6 r.

35

Substituindo em (8) temos

d

dt

@L

@ _xi� @L

@xi= 0

A função L é chamada de lagrangiana do sistema e as (3) equações acima asequações de Lagrange.

2.2.1 Coordenadas generalizadas

Pela construção acima vemos que as equações diferenciais parciais de Lagrangesão equivalente a equações de Newton. A princípio equações diferenciais parciaissão mais complicadas que EDO. Entretanto, existe uma grande vantagem nasequações de Lagrange.Suponha que você queira resolver o problema de pêndulo sob a ação da

gravidade. O ideal, neste caso, é usar a coordenada polar �. Para obter asequações do movimento na mecânica de Newton você deve escrever

x = R cos � ; y = R sin � ;

calcular �x e �y, substituir na equação de Newton e usar o vínculo

x2 + y2 = R2 :

Vamos ver como obter as equações do movimento na mecânica de Lagrange.Primeiro nos obtemos a energia cinética

T =1

2mv2 ; v = R _� =) T =

1

2mR2 _�2

enquanto a energia potencial é dada por

V (�) = mgR (1� cos �)

Com isso temos

L = T � V = 1

2mR2 _�2 �mgR (1� cos �)

Se esquecermos por um instante que estamos usando coodenadas polares e us-armos as equações de Lagrange (trocando x por �) temos

@L

@�=

@

@�

�1

2mR2 _�2 �mgR (1� cos �)

�= mgR

@

@�(cos �) = �mgR sin �

@L

@ _�=

@

@ _�

�1

2mR2 _�2 �mgR (1� cos �)

�= mR2 _�

com isso,

d

dt

@L

@ _�� @L

@�=

d

dt

�mR2 _�

�+mgR sin �

= mR2�� +mgR sin � = 0

36

ou ainda�� +

g

Rsin � = 0 :

Que é precisamente a equação que seria obtida a partir da equação de Newtone o laborioso processo descrito acima.Este resultado pode ser provado de forma geral usando uma transformação

geral de coordenadas.Para veri�car isso imaginamos uma transformação qualquer (inversível) das

coordenadas (também chamado transformação de ponto)

xi = xi (q; t) ; qi = qi (x; t)

com isso, podemos escreverL = L (q; _q; t)

ou3

L = L (x; _x; t)

Resultados que vamos precisar

1. Calculando

_qj =dqjdt

=@qj@xi

dxidt+@qj@ _xi

d _xidt+@qj@tj

=@qj@xi

_xi +@qj@t

vemos que

_qj =dqjdt

=@qj@xi

_xi +@qj@t

(9)

2. Lembrando agora que

qi = qi (x; t) =)@qj@xi

= fij (x; t) ;@qj@t

= gi (x; t)

podemos escrever4

_qj = fij _xi + gi

3Na verdade, a funçãoL (x; _x; t)

não é a mesma função das coordenadas L (q; _q; t), ou seja, se formos rigorósos devemos esvrece~L (q; _q; t). Mas podemos esquecer o til lembrando que estamos usando a de�nição de que alagrangiana é uma função escalar das coordenadas. Seu valor num determinado ponto físiconão se altera por uma mudança das coordenadas.

4Lembre que seqi = qi (q; t) ;

temosd

dtqi = fi (q; _q; t) ;

mas@qi

@t= fi (q; t) :

37

e calcular@ _qj@ _xm

=@fij@ _xm

_xi + fij@ _xi@ _xm

+@gi@ _xm

onde nem f nem g dependem de _x,

@ _qj@ _xm

= fij@ _xi@ _xm

= fij�im = fmj =@qj@xm

ou seja,@qj@xi

=@ _qj@ _xi

: (10)

3. Usando (9) temos

_qj =@qj@xi

_xi +@qj@t

=)

@ _qm@xi

=@2qm@xi@xj

_xj +@qm@xj

@ _xj@xi

+@2qm@xi@t

=@2qm@xi@xj

_xj +@2qm@xi@t

(11)

4. Vamos agora calcular

L (q; _q; t) =) @L

@xi=

@L

@qm

@qm@xi

+@L

@ _qm

@ _qm@xi

:

Substituindo (11) temos

@L

@xi=

@L

@qm

@qm@xi

+@L

@ _qm

�@2qm@xi@xj

_xj +@2qm@xi@t

�(12)

5. lembrando qued

dtf (x; t) =

@f

@xm_xm +

@f

@t

fazendo

fkj (x; t) =@qk@xj

temosd

dt

@qk@xj

=@2qk

@xm@xj_xm +

@2qk@t@xj

(13)

Voltaldo agora para a nossa lagrangiana L (q; _q; t) temos

@L

@ _xj=

@L

@qk

@qk@ _xj

+@L

@ _qk

@ _qk@ _xj

e lembrando que q não depende de _x

@L

@ _xj=

@L

@ _qk

@ _qk@ _xj

(14)

38

Usando (10)@L

@ _xj=

@L

@ _qk

@qk@xj

Derivando em relação ao tempo

d

dt

@L

@ _xj=

�d

dt

@L

@ _qk

�@qk@xj

+@L

@ _qk

d

dt

@qk@xj

(15)

Substituindo (13) na relação acima

d

dt

@L

@ _xj=

�d

dt

@L

@ _qk

�@qk@xj

+@L

@ _qk

�@2qk

@xm@xj_xm +

@2qk@t@xj

�: (16)

Subtraindo (16) e (12) temos

d

dt

@L

@ _xi� @L

@xi=

�d

dt

@L

@ _qk

�@qk@xi

+@L

@ _qn

�@2qn

@xm@xi_xm +

@2qm@t@xi

�� @L

@qm

@qm@xi� @L

@ _qn

�@2qn@xi@xj

_xj +@2qn@xi@t

�=

�d

dt

@L

@ _qk

�@qk@xi

+@L

@ _qn

��@2qn

@xm@xi� @2qn@xi@xm

�_xm +

@2qm@t@xi

� @2qn@xi@t

�� @L

@qm

@qm@xi

=

��d

dt

@L

@ _qm

�� @L

@qm

�@qm@xi

Como a nossa transformação é geral e L (x; _x; t) obedece as EL, podemosa�rmar que �

d

dt

@L

@ _qm

�� @L

@qm= 0 :

Ou seja, as EL têm a mesma forma para qualquer sistema de coordenada.Assim, utilizando as equações de Lagrange temos uma liberdade completa

na escolha das coordenadas do sistema, o que pode ser utilizado explorando assimetrias do problema. Ou seja, a principal vantagem das equações de Lagrangeé que elas independem do sistema de coordenadas usados. Com isso, se qi é umconjunto qualquer de coordenadas que descrevem um sistema mecânico, estesistema deve obedecer as equações de Lagrange

d

dt

@L

@ _qi� @L

@qi= 0 : (17)

As coordenadas qi são chamadas de coordenadas generalizadas.

Remark 16 Mais uma vez, enquanto a equação de Newton (6) só tem estaforma em coordenadas cartesianas, as equações de Lagrange (17) têm esta formaem qualquer sistema de coordenadas.

Exercise 17 Uma conta (miçanguinha) de massa m pode se mover livrementenuma barra rígida e reta que gira com velocidade constante !. Escreva a equaçãodo movimento da conta.

39

3 Transformada de Legendre

Em uma série de problemas em física é importante mudarmos as variáveis queusamos num problema. Por exemplo, na termodinâmica uma quantidade muitoimportante é a energia interna de um sistema U (S; V ). Um inconvenientedesta quantidade é que ela depende da entropia S, uma quantidade que nãopode ser medida diretamente com nenhum instrumento. Entretanto, pelas leisda termodinâmica, sabemos que a temperatura T de um corpo é a variação dasua energia interna com a entropia

T =@U

@S: (18)

Vamos então de�nir uma nova quantidade F como

F = T:S � U (19)

Diferenciando esta quantidade temos

dF = TdS + SdT � dU ;

Sabendo que U = U (S; V ) temos

dU =@U

@SdS +

@U

@VdV ; (20)

com isso

dF = TdS + SdT � @U

@SdS � @U

@TdT

=

�T � @U

@S

�dS + SdT � @U

@VdV

O fato importante na de�nição de F é que, usando (18), temos

dF = SdT � @U

@VdV ; (21)

ou seja, a função (19) assim de�nida não depende da entropia

F = F (T; V )

Com isso

dF =@F

@TdT +

@F

@VdV ;

comparando com (21) temos

S =@F

@T;@F

@V= �@U

@V:

O importante da quantidade F , chamada energia livre de Helmholtz, é que eladepende da temperatura e do volume, ambas quantidades que, diferente daentropia, podem ser medidas com instrumentos usuais.

40

� Ou seja, podemos determinar F estudando as variações das característicado sistema com respeito ao seu volume e a sua temperatura.

O procedimento acima é um exemplo de um procedimento mais geral chamadode transformada de Legendre. De forma geral, se f = f (x1; x2; :::; y1; y2; :::)podemos de�nir uma nova função

g = piyi � f

(somatória em i) onde

pi =@f

@yi

com isso

dg = (dpi:yi + pi:dyi)� df

= (dpi:yi + pi:dyi)��@f

@xidxi +

@f

@yidyi

�=

��pi �

@f

@yi

�dyi + dpi:yi �

@f

@xidxi

�que, pela de�nição de pi,

dg = yi:dpi �@f

@xidxi

Ou seja a função g não depende mais de yi, mas sim de um novo conjunto devariáveis pi.

4 Equações de Hamilton

Nosso objetivo agora é usar a transformada de Legendre nas equações de La-grange. Primeiramente lembramos que, pela de�nição acima

L = L (qi; _qi) ;

ou seja, a Lagrangiana depende das posições e das velocidades.Agora vamos de�nir a quantidade

H = pi _qi � L (22)

onde

pi =@L

@ _qi

é chamado momento conjugado da variável qi (i.e., para q = x temos um mo-mento linear, para q = � um momento angular e, no caso geral, um momento

41

conjugado). Das equações de Lagrange temos que, se uma determinada coorde-nada qm não aparece na Lagrangiana (chamada de coordenada cíclica)

@L

@qm= 0 =) d

dt

@L

@ _qi= _pi = 0 =) pi = const:

então o momento associado a esta coordenada se conserva (e.g., para umapartícula livre L = T o momento linear em qualquer direção se conserva).Seguindo o procedimento da seção anterior temos

dH = dpi: _qi + pi:d _qi � dL :

Lembrando que L = L (q; _q) temos

dL =@L

@qidqi +

@L

@ _qid _qi ;

com isso

dH = dpi: _qi + pi:d _qi ��@L

@qidqi +

@L

@ _qid _qi

�;

=

�pi �

@L

@ _qi

�d _qi + _qi:dpi �

@L

@qidqi ;

e pela de�nição de pi

dH = _qi:dpi �@L

@qidqi (23)

e, como esperávamos, a função H assim obtida é uma função de q e p e não maisde _q, H = H (q; p). A quantidade H assim de�nida é chamada de Hamiltoniana.Sabendo que H = H (q; p) temos

dH =@H

@qidqi +

@H

@pidpi :

Lembrando agora que q e p são coordenadas independentes em H (assim comoq e _q eram em L, i.e, obviamente _q depende de q, mas é exatamente está relaçãoque queremos encontrar ao resolver a equações de Lagrange) e comparando com(23) temos

@H

@pi= _qi ;

@H

@qi= � @L

@qi

Se usarmos agora as equações de Lagrange temos

@L

@qi=

d

dt

@L

@ _qi

Lembrando a de�nição de p

pi =@L

@ _qi=) @L

@qi=

d

dtpi = _pi

42

Com o que@H

@pi= _qi ;

@H

@qi= � _pi : (24)

Estas são as chamadas equações de Hamilton (EH).Qual a vantagem destas equações?Uma vantagem prática destas equações é que elas possuem apenas derivadas

de primeira ordem. Como a equação de Newton, a equação de Lagrange pos-sui derivadas das velocidades o que resulta em derivadas de segunda ordem naposição. Obviamente perdemos algo ao ganharmos esta facilidade. O ponto éque temos dois pares de EH, ou seja, usando a transformada de Legendre con-seguimos transformar um sistema de n equações diferenciais de segunda ordemnum sistema de 2n equações diferenciais de primeira ordem5 .

4.0.2 Signi�cado físico da Hamiltoniana

No caso geral, a energia cinética de um sistema é uma função quadrática dasvelocidades generalizadas

T = aij _qi _qj ; aij = aij (q)

(somatória em i e j) no caso de coordenadas cartesianas aij = �ij12m. Diferen-

ciando a expressão acima temos

@T

@ _qk=X�

aij@ _qi@ _qk

_qj + aij _qi@ _qj@ _qk

�=X

(aij�ik _qj + aij _qi�jk)

=Xij

aij�ik _qj +Xij

aij _qi�jk

=Xj

akj _qj +Xi

aik _qi

=Xi

aki _qi +Xi

aik _qi

Multiplicando por _qk e efetuando uma somatória em k temosXk

@T

@ _qk_qk =

Xi;k

aki _qi _qk +Xi;k

aik _qi _qk

= T + T = 2T

5Na verdade, esta não é a maior vantagem da EH, mas sim que, além de todo o conjunto detransformações de coordenadas disponíveis na formulação de Lagrange, tempos agora um con-junto muito maior de transformações a nossa disposição. Voltaremos a isso quando falarmosem transformações canônicas.

43

Este resultado é conhecido como teorema de Euler. Se usarmos agora esteresultado na de�nição de H temos

H =Xi

pi _qi � L

=Xi

@L

@ _qi_qi � (T � U)

=Xi

@T

@ _qi_qi � (T � U)

= 2T � T + U= T + U :

Ou seja, a hamiltoniana é a energia total do sistema.Observe que, diferente da Lagrangiana (T �U) a energia total do sistema é

uma quantidade que pode ser medida e, além disso, é uma quantidadeconservada para um sistema isolado. Esta é outra vantagem da teoria deHamilton. Assim, utilizando a mecânica de Hamilton podemos, a partir daenergia total do sistema e de um sistema de 2n equações de primeira ordem,estudar a dinâmica dos corpos.

4.1 Princípio variacional (opcinal)

Um problema importante e comumente encontrado é o seguinte: dada umafunção y = f (x) para quais valores de x a função f , e conseqüente y, possuivalores máximos e mínimos (estes valores são chamados de extremos da função).A resposta, obviamente, são os pontos onde a derivada de f se anula.Um problema bem mais complicado, e interessante, é o seguinte: considere

a integral

I =

Z b

a

F (y (x) ; y0 (x) ; x) dx

onde F é uma dada função de y (x), y0 = dy=dx e x. Assim, para cada funçãoy (x) diferente I assume um valor diferente. Para quais funções y(x) a integralI é um extremos?Antes um pouco de nomenclaturas. Dada uma certa função y(x) podemos

calcular o valor de I. A quantidade I, que depende de uma função, e não apenasde um número, é chamada de funcional. Outro ponto importante é que dado dosvalores y(x0) = a1 e y0(x0) = a2 é sempre possível encontrar uma função y(x)que satisfaça esta condição. Neste sentido, as variáveis y e y0 são tratadas emF como sendo independentes. Agora, para calcular I nós não podemos darapenas o valor de y(x) num dado ponto x0, mas sim o valor desta função em todoo intervalo x 2 [a; b], ou seja, precisamos dar toda uma curva y(x). Dada umacurva o valor da derivada desta curva está completamente determinada. Assim,em I não é possível se especi�car separadamente o valor de y e y0. Resumindoenquanto F é uma função de y, y0 e x

F = F (y; y0; x)

44

Figure 7: Figura retirada do Marion.

enquanto I é um funcional apenas de y

I = I [y] :

Nosso problema de encontrar a função y para a qual I é um extremo é umproblema do chamado cálculo variacional.Por que a derivada de uma função é nula nos extremos? Isso ocorre porque a

variações do parâmetro (x) em torno deste ponto não geram variações na funçãoy(x) (pelo menos até primeira ordem em dx). O mesmo acontece com umafunção de duas variáveis (o que pode ser visualizado facilmente) ou com funçõescom um número qualquer de variáveis (o que não é tão simples de visualizar). Ouseja, se estivermos num ponto extremo da função, ao deslocarmos o argumentouma quantidade in�nitesimal não haverá variação da nossa função. A idéia pordetrás do cálculo variacional é exatamente a mesma. Se tivermos encontradoa função y(x) para a qual nosso funcional I [y] é um extremos, esperamos queao variamos um pouco esta função (ou seja, pegarmos uma curva �y(x) muitopróxima a y (x)) o valor do nosso funcional não irá variar (Figura).Suponha que y (x) é a função que resolve este problema (obviamente esta é

a função que queremos encontra). O fato de y (x) ser um extremo de I signi�caentão que com pequenas variações em torno de y (x) o valor do integrando nãovaria apreciavelmente (de forma análoga ao cálculo ordinário). Vamos entãoanalisar como I varia se substituímos y pela função (Figura)

�y (x) = y (x) + "� (x)

45

para uma função � (x) que, apesar de arbitrária, vamos supor dada, i.e., vamosvariar apenas o valor de ". Como queremos estudar todas as funções que passampelo mesmo ponto inicial e �nal devemos ter

�y (a) = y (a) ; �y (b) = y (b) =) �y (a) = �y (b) = 0 :

Para a variação acima (onde y e � são funções conhecidas) nosso integrando Ipassa a ser uma função (pois " é um número) de "

I [y]! I (") =

Z b

a

F (y + "�; y0 + "�0; x) dx :

O ponto é que agora, como é uma função, podemos usar o resultado do cálculousual é dizer que para " = 0 a nossa função I é um extremo e, consequentemente,sua derivada é nula, ou seja,

dI

d"

����"=0

= 0 : (25)

Tudo que precisamos agora é de�nir a diferencial dI=d". Fazemos isso da formausual

dI

d"= lim"!0

I [y + "]� I [y]"

= lim"!0

1

"

"Z b

a

F (y + "�; y0 + "�0; x) dx�Z b

a

F (y; y0; x) dx

#

= lim"!0

1

"

Z b

a

[F (y + "�; y0 + "�0; x)� F (y; y0; x)] dx

=

Z b

a

lim"!0

[F (y + "�; y0 + "�0; x)� F (y; y0; x)]"

dx :

Agora

F (y + "�; y0 + "�0; x) = F (y; y0; x) +@F

@y"� +

@F

@y0"�0 +O

�"2�

ou seja

lim"!0

F (y + "�; y0 + "�0; x)� F (y; y0; x)"

=@F

@y� +

@F

@y0�0

com issodI

d"=

Z b

a

�@F

@y� +

@F

@y0�0�dx : (26)

Lembrando que �0 = d�=dx podemos integrar o segundo membro da expressãoacima por partesZ b

a

@F

@y0d�

dxdx =

�@F

@y0�

�ba

�Z b

a

�d

dx

@F

@y0

�� dx : (27)

Agora usamos o fato de que a função � (x) (apesar de arbitrária) deve se anularnos extremos � (a) = � (b) = 0Z b

a

@F

@y0d�

dxdx = �

Z b

a

�d

dx

@F

@y0

�� dx :

46

Substituindo em (26) temos

dI

d"=

Z b

a

�@F

@y� �

�d

dx

@F

@y0

��

�dx

=

Z b

a

�@F

@y��d

dx

@F

@y0

��� dx : (28)

Voltando agora para (25) temos�dI

d"

�"=0

= 0 =

Z b

a

�@F

@y��d

dx

@F

@y0

��� dx

Para qualquer função � (x). Isso só é possível se o integrando for zero

@F

@y��d

dx

@F

@y0

�= 0 :

Para F uma função de várias variáveis este resultado tem de ser válido inde-pendentemente para cada variação

@F

@yi��d

dx

@F

@y0i

�= 0 (29)

Esta é a chamada equação de Euler.Observe que, no �nal, a nossa expressão (28) não depende de ". Além disso,

para lembrar que não estamos falando do cálculo usual, as pessoas inventam umnovo símbolo para a derivada (mas é apenas um símbolo)

dI

d"� �I [y] = �

Z b

a

F (y; y0; x) dx :

E lesse a variação funcional de I. Ou ainda, se mudarmos a notação para � � �ye usarmos a notação acima, (28) pode ser escrita como

dI

d"� �I [y] =

Z b

a

�@F

@y��d

dx

@F

@y0

���y dx (30)

e, em analogia com o cálculo ordinário de uma função f (x), costuma-se escrever

df =df

dxdx! �I [y] �

Z b

a

�I

�y�y dx =

Z b

a

�@F

@y��d

dx

@F

@y0

���y dx ;

ou seja,�I

�y=@F

@y��d

dx

@F

@y0

�e lesse, a derivada funcional de I [y] em relação a função y (x). Mais uma vez,isso é apenas uma notação6 , mas é importante que você a conheça porque ela émuito usada em livros e artigos.

6Obviamente existe muito mais por trás do cálculo variacional. Mas se trabalharmos apenascom funções bem comportadas (e.g., diferenciáveis em todos os pontos), na grande maioriados casos podemos encarar � apenas como uma notação.

47

Figure 8: Figura retirada do Marion de Mecânica.

Com isso, nesta simbologia, a nossa expressão �ca

�I [y] = �

Z b

a

F (y; y0; x) dx = 0 =) �I

�y=

�d

dx

@F

@y0i

�� @F

@yi= 0 :

e lesse que, o fato da derivada funcional de I ser um extremo implica na equaçãode Euler.

4.1.1 Exemplo: a braquistocrôna.

Um problema variacional bastante famoso, proposto em numa revista ciêntí�capor Bernoulli em 1696, é o chamado problema da braquistocrôna (do grego,o tempo mais curto). Imagine dois pontos num plano, (x1; y1) e (x2; y2), seuma força constante for aplicada na direção x e uma partícula de massa m semover do primeiro ponto ao segundo sob ação desta força, qual o caminho queesta partícula deve percorrer para efetua o trajeto no menor tempo possível?Imagine que você quer colocar um cano para guiar o movimento de uma bolinhae quer saber a forma do cano para minimizar o tempo de percurso. A respostado problema acima é exatamente a trajetória que a sua pedra terá de fazer.Ou ainda, imagine que você pendure uma corrente entre os dois pontos acima(onde a força é, novamente, a gravidade), que curva esta corrente irá desenhar(esta curva se chama catenária)? Todos estes exemplos se referem ao mesmoproblema. Vamos então a sua solução. Para fazer uma referência mais naturala força gravitacional, colocamos os eixos como na �gura abaixoSabemos que a energia total do sistema T + U se conserva. Colocando o

zero do potencial no ponto de início (x1; y1) e considerando que a partículafoi lançada do repouso na direção x (podemos ignorar qualquer velocidade nadireção y pois, como não há forças nesta direção, ela se conserva) temos que no

48

ponto inicialEi = T + U = 0

Seguindo a analogia da força gravitacional temos

F = mg = �@U@x) U = �mgx

T =1

2mv2

A conservação de energia nos dá

T + U = 0 =) v =p2gx

Com issods

dt= v ) dt =

1

vds) t =

Z (x2;y2)

(x1;y1)

1

vds

onde(ds)

2= (dx)

2+ (dy)

2

Finalmente, o tempo vale

t =

Z (x2;y2)

(x1;y1)

1p2gx

q(dx)

2+ (dy)

2

=

Z (x2;y2)

(x1;y1)

s1 + y02

2gxdx =

1p2g

Z (x2;y2)

(x1;y1)

r1 + y02

xdx

y0 =dy

dx

Ou seja, o nosso problema se reduz a minimizar a integral (como (2g)�1=2 éuma constante)

I =

Z (x2;y2)

(x1;y1)

F (y0; x) dx ; F (y0; x) =

s1 + y02

2gx

Onde, neste caso, a função F não depende explicitamente de y. A solução donosso problema é, então, a função y que obedece a equação de Euler (29)

@F

@y��d

dx

@F

@y0

�= 0

Como, neste caso, F não depende explicitamente de y

@F

@y= 0) d

dx

@F

@y0= 0) @F

@y0= C

@F

@y0=

@

@y0

r1 + y02

x=

y0px (1 + y02)

= C

49

Assim, a curva que a partícula deve seguir y (x) deve ser solução da equação

y0px (1 + y02)

= C ) y02 = xC2 + xy02C2 ) y0 =

sxC2

(1� xC2) ;

ou ainda,

dy

dx=

sxC2

(1� xC2) ) y =

Z x2

x1

xp(2ax� x2)

dx ;

2a = 1=C2

Fazendox = a (1� cos �)) dx = a sin � d�

temos

y =

Za (1� cos �) d� =

ou seja, a curva procurada é

y = a (� � sin �) + const.

Com isso, a nossa curva obedece

x = a (1� cos �) ; y = a (� � sin �)

que são as equações paramétricas de uma curva chamada ciclóide.Se a sua partícula for uma conta guiada por um �o (com massa) e você

prender o �o nos pontos acima o �o assumirá exatamente esta a forma quelevará a partícula entre os dois pontos no menor tempo, i.e., o �o formará umacatenária.A parte da curva entre o ponto (x1; y1) até o seu mínimo é chamada de curva

tautocrônica (como muito bem observado pela senhorita Palma), i.e., é a curvana qual o tempo gasto por um objeto para deslizar sem fricção em gravidadeuniforme até seu ponto de mínimo é independente de seu ponto de partida (esteproblema foi resolvido por Christiaan Huygens em 1659).

4.1.2 Equações de Euler-Lagrange

O ponto importante para nós no desenvolvimento acima é o seguinte: suponhaque a nossa variável é o tempo (x ! t) e que a função que procuramos seja atrajetória de uma partícula com coordenada generalizada q(t) (y (x) ! q (t)).Alem disso, suponha que a função F que estamos integrando seja exatamente alagrangiana L do sistema. Com issoZ b

a

F (y; y0; x) dx!Z b

a

L (q; _q; t) dt

50

Figure 9: Figura retirada do Marion de Mecânica.

e a expressão (28) toma a forma:

Z b

a

L (q; _q; t) dt = 0 =)�d

dt

@L

@ _qi

�� @L

@qi= 0 :

Que é exatamente a equação de Lagrange obtida anteriormente. Por isso estasequações são chamadas de equações de Euler-Lagrange (EL).A integral Z

L (q; _q; t) dt � S [q]

é chamada de ação. Usando a linguagem do cálculo funcional, podemos obteras equações de EL se impusermos que a derivada funcional da ação seja um ex-tremo. Esta exigência recebe o nome de princípio da mínima ação (ou princípiode Hamilton).Neste sentido as equações de Lagrange e, consequentemente, toda a mecânica,

podem ser construídas a partir do princípio da mínima ação e esta construçãoé equivalente a mecânica de Newton (perceba que este é um caminho diferentedo seguido no início deste texto).O fato da mecânica de Lagrange ser uma conseqüência do princípio da mín-

ima ação tem uma conseqüência crucial na questão do comportamento ondu-latório ou corpuscular da luz. Porque todos os resultados da óptica geométricapodem ser obtidos a partir de um princípio muito semelhante chamado princí-pio de Fermat do tempo mínimo. Este princípio estabelece que ao atravessarmeios diferentes, dentre todos os caminhos possíveis o feixe luminoso escolheaquele que minimiza o tempo da sua trajetória. Este princípio determina todos

51

os efeitos de refração e re�exão. Como analogia, imagine que você está debicicleta na praia e quer atravessar a avenida da orla para chegar num pontoa 45o da normal à avenida. Qual caminho você deve seguir para chegar maisrápido? O menor caminho é, obviamente, uma linha reta. Mas, como a bi-cicleta se move com maior facilidade no asfalto é conveniente que você passemenos tempo na areia. Porém, se você se mover na direção normal na praia adistância percorrida será muito maior. Encontrar o caminho que minimize estetempo é um problema de cálculo variacional. Assim, a trajetória tanto daluz como das partículas pode ser obtida por um princípio de mínimode um funcional.

5 Parênteses de Poisson

Existe uma forma bastante compacta de se escrever as EH através dos chamadosparênteses de Poisson (PP). Os PP de duas funções f (q; p) e g (q; p) são de�nidoscomo

ff; gg =Xi

�@g

@qi

@f

@pi� @f

@qi

@g

@pi

�Vamos calcular os PP de uma função g em relação ao Hamiltoniano

fg;Hg =Xi

�@g

@qi

@H

@pi� @H

@qi

@g

@pi

�Usando agora as eq. de Hamilton temos

fg;Hg =Xi

�@g

@qi

@H

@pi� @H

@qi

@g

@pi

�=Xi

�@g

@qi( _qi)� (� _pi)

@g

@pi

�=Xi

�@g

@qi_qi + _pi

@g

@pi

�=Xi

�@g

@qi

dqidt+@g

@pi

dpidt

�Lembrando agora que

dg =Xi

�@g

@qidqi +

@g

@pidpi

�+@g

@tdt

dg

dt=Xi

�@g

@qi

dqidt+@g

@pi

dpidt

�+@g

@t

temos

_g =dg

dt= fg;Hg+ @g

@t

52

Ou seja, calculando os PP de qualquer função da posição e momento com ohamiltoniano temos a variação temporal desta função.Em especial, para as variáveis de posição e momento temos

_qk = fqk;Hg =Xi

�@qk@qi

@H

@pi� @H

@qi

@qk@pi

�=Xi

�ik@qk@qi

@H

@pi=@H

@pk

_pk = fpk;Hg =Xi

�@pk@qi

@H

@pi� @H

@qi

@pk@pi

�= �@H

@qk

Ou seja, podemos escrever as EH como

_pk = fpk;Hg ; _qk = fqk;Hg

Observe queff; gg = �fg; fg

de sorte quefh; hg = 0

Assim, do resultado acima temos

_H = fH;Hg+ @H

@t=@H

@t

Ou, se o Hamiltonianao (a energia) não depende explicitamente do tempo

_H = 0 =) H = E = const.

A energia do sistema se conserva.Mais ainda, para qualquer quantidade h (q; p) que não dependa explicita-

mente do tempo, temos que

se fh;Hg = 0 =) h = const.

Quando os PP de duas quantidades é nulo

ff; gg = 0

dizemos que estas quantidades comutam.Assim, uma quantidade se conserva se ela comuta com o H.Se calcularmos os PP das próprias variáveis q e p temos

fqk; pmg =Xi

�@qk@qi

@pm@pi� @pm

@qi

@qk@pi

�=Xi

�ik�im

fqk; pmg = �km

53

Que são chamadas regras canônicas de comutação. E as variáveis sãochamadas de canonicamente conjugadas.Como vimos anteriormente, as EL mantém a sua forma para qualquer trans-

formação de ponto nas coordenadas. Dos resultados acima vemos que as EHmanterão a mesma forma (e, conseqüentemente, descreverão a mesma dinâmica)para qualquer transformação inversível

Pk = Pk (p; q) ; Qk = Qk (p; q)

que mantenha as regras canônicas de comutação

fQk; Pmg = fqk; pmg = �km :

Vemos assim que a liberdade na escolha das coordenadas e dos momentos é nateoria de Hamilton. Transformações que mantém a forma canônica dos PP sãochamadas de transformações canônicas.Resumindo:

1. na MC toda a informação que caracteriza o sistema está contido nas var-iáveis (q; p). Estas quantidades podem ser desenhadas em um grá�co quese chama espaço de fase. Ou seja, dado um ponto no espaço de fase eu seio momento é a posição do sistema. Diz-se então que pontos no espaçode fase representam os estados físicos do sistema.

2. Para um sistema conservativo (onde H não depende explicitamente dotempo) toda a dinâmica do sistema (variação temporal das quantidades)depende apenas de H. Dado H a evolução de qualquer quantidade f podeser calculada pelos parêntese de Poisson

_f = ff;Hg :

3. A liberdade na escolha das coordenadas que descrevem corretamente adinâmica do sistema está contida nas regras canônicas de comutação

fqk; pmg = �km :

Estes são os resultados necessários para se entender o processo de quantiza-ção canônica.

6 Vetores e equações lineares

Além da mecânica analítica, um segundo ferramental indispensável para o nossodesenvolvimento é a álgebra linear e vetores.Uma das estruturas mais simples e fundamentais que temos são os números

inteiros (Z). Neste conjunto temos a de�nição de duas operações: soma e mul-tiplicação. A generalização desta idéia, ou seja, a �xação destas propriedades

54

algébricas relaxando uma ou outra característica leva a construção de outrasestruturas matemáticas como monóides, grupos, anéis, espaços vetoriais etc.Um espaço vetorial V é qualquer conjunto de elementos onde de�nimos uma

regra de composição entre estes elementos, que simbolizamos geralmente pelosinal de soma (+ : V ! V ). Ou seja, dado dois elementos quaisquer v1; v2 2 V ,sabemos realizar a composição:

8 v1; v2 2 V : v1 + v2 = v3 2 V ; (closure)

Ademais estabelecesse uma outra regra, chamada de produto com um escalar(� : R; V ! V ), da composição dos elementos deste conjunto sobre o corpo dosreais (ou dos complexos). Ou seja:

8 v1 2 V; a 2 R : a:v1 = av1 = v3 2 V ;

Além disso, esta operação de soma deve respeitar (lembre-se que podemosde�nir diferentes somas, e.g., soma de setas, de matrizes.):

a Associativa: v1 + (v2 + v3) = (v1 + v2) + v3.

b Comutativa: v1 + v2 = v2 + v1.

c Elemento identidade: 9 0 2 V : v + 0 = v; 8 v 2 V .d Elemento inverso: 8 v 2 V; 9 � v 2 V : v + (�v) = 0 :e Distributiva pelo produto com um escalar: a (v1 + v2) = av1 + av2.

f Distributiva pela soma escalar: (a1 + a2) v = a1v + a2v

g compatível com a multiplicação escalar do carpo: a1 (a2v) = (a1a2) v

Um conjunto ordenado de n números reais x1; x2; ::xn pode ser chamado deum vetor de dimensão n, ou um vetor num espaço n dimensional, denotamos esteespaço por Rn (i.e., a coleção de n números reais). Usualmente esta quantidadeé simbolizada como jxi. Cada um dos elementos xi (i = 1; 2; ::; n) é chamado decomponente i do vetor. Se todas as componentes são nulas, o vetor é chamadode vetor nulo e usualmente simbolizado por 0 (mas lembre-se que este símboloé, na verdade, a coleção de n zeros). Para n = 2, ou n = 3 o vetor pode serinterpretado geometricamente como as coordenadas cartesianas de uma seta queinicia na origem e termina neste ponto.Para n > 3 a visualização geométrica não é possível, mas as expressões

algébricas e a terminologia continuam as mesmas.Para números reais arbitrário a; b 2 R a quantidade a jxi+b jyi = jzi fornece

um novo vetor (também de dimensão n) cujas componentes são dadas por

zi � axi + byi :

55

Uma estrutura adicional que podemos incluir no nosso espaço vetorial (masque não faz parte da de�nição desta estrutura) é a operação

hxj yi = x1y1 + x2y2 + :::+ xnyn =nXi=0

xiyi ; (31)

chamada de produto interno dos vetores jxi e jyi. Esta quantidade também échamada de projeção de jyi em jxi, ou a componente de jyi na direção jxi (ouvice-versa).Fácil ver que o produto interno de�nido acima é:

1. Simétrico: hxj yi = hyj xi

2. Linear: jzi = a jyi+ b jwi : hxj zi = a hxj yi+ b hxj wi

Observe que podemos obter a expressão da linearidade acima se simbolica-mente escrevermos

hxj zi = (hxj) (a jyi+ b jwi) = hxj a jyi+hxj b jwi = a hxj jyi+b hxj jwi � a hxj yi+b hxj wi

Ou seja, a linearidade permite interpretar a quantidade hxj a esquerda do sím-bolo de produto como sendo também um vetor, chamado de vetor dual do vetorjxi. Esta notação simbólica é chamada notação de Dirac. Ou seja, hxj é umoutro espaço vetorial também formado por uma seqüência de número e de�nidocom as operações de soma e produto acima. Dizer que este espaço é outro espaçovetorial signi�ca, em especial, dizer que não podemos realizar composições dotipo

hxj+ jwi =?

Dizemos que dois vetores jxi e jyi são ortogonais quando

hxj yi = 0 :

Para n = 2 e 3 esta terminologia possui um signi�cado imediato. Pois, nestecaso, numa representação geométrica onde cada termo da seqüência é a compo-nente de uma seta num sistema cartesiano, quaisquer dois vetores que respeitama igualdade acima fazem entre si um ângulo de 90o. Por exemplo, para n = 2,os vetores

jxi = (1; 1) ; jyi = (1;�1)

temoshxj yi = 1� 1 = 0 :

E é fácil ver que estes vetores no plano tem entre si um ângulo de 90o. Maisuma vez, para n > 3, a interpretação geométrica não pode ser mais usada, masa nomenclatura continua a mesma.O produto interno de um vetor com ele mesmo

hxj xi � jxj2

56

é chamado de norma do vetor. A raiz positiva da normaphxj xi � jxj � 0

é chamado de comprimento do vetor (alguns autores chamam esta raiz denorma). Mais uma vez, para n = 2 ou 3, esta quantidade representa o com-primento (ou a distância) da origem até as coordenadas do ponto. Observeque

hxj xi = 0 =) jxi = 0 ; xi = 0 ; i = 1; 2; :::n :

Um vetor para o qualhxj xi = 1 ;

é chamado de vetor unitário, ou vetor normalizado.As de�nições acima também podem ser escritas identi�cando os vetores jxi

com matrizes de n linhas

jxi =

[email protected]

1CCCANeste caso, o produto vetorial pode ser realizado identi�cando o dual do vetorcomo a matriz de n colunas (ou a transposta) correspondente

hxj =�x1 x2 � � � xn

�e identi�cando a operação de produto interno com a multiplicação usual dematrizes

hyj xi = hxj jyi =�y1 y2 � � � yn

�0BBB@

x1x2...xn

1CCCA =nXi=0

xiyi :

Um conjunto de m vetores jx1i ; jx2i ; ::: jxmi são ditos linearmente depen-dentes, se

9ai (i = 1; ::;m) 2 R ;mXi=1

a2i 6= 0 :mXi=1

ai jxii = 0

caso contrário, eles são linearmente independentes.Num espaço de dimensão n qualquer conjunto de n vetores jwii (distintos

e não nulos) e linearmente independentes formam uma base do espaço. Ouseja, qualquer vetor jxi pode ser escrito como:

9ai (i = 1; ::; n) 2 R ;mXi=1

a2i 6= 0 : jxi =mXi=1

ai jwii :

57

Ou, de outra forma, num espaço de dimensão n dado o conjunto de n vetor fjwiig(não nulos) LI, qualquer outro vetor é LD a este conjunto. Ou ainda, numespaço de dimensão n qualquer conjunto de n+1 vetores é LD. As quantidadesai da expressão acima são chados de componente do vetor jxi na base fjwiig.Se o conjunto de n vetores LI jwii são também ortogonais entre si

hwij wji = 0 para i 6= j

dizemos que esta base é ortogonal.Um conjunto de m vetores jeii que respeitam

heij eji = �ij ; (32)

i.e., são ortogonais entre si e normalizados, são chamados de ortonormais. Sem = n (onde n é a dimensão do espaço) estes vetores formam uma base, chamadade base ortonormal.Observe que, se fjwiig é uma base ortogonal do nosso espaço, podemos

facilmente construir com eles uma base ortonormal fjeiig fazendo

jeii =1

jwijjwii =

1phwij wji

jwii

Este procedimento se chama a normalização dos vetores jwii.Dada uma base ortonormal fjeiig podemos facilmente usar o produto

interno para encontrar as componentes de um vetor qualquer nesta base. Bastapara isso tomar o produto interno do vetor expandido com os elementos da base

jxi = a1 je1i+ a2 je2i+ ::: =) he1j jxi = a1 he1j e1i+ a2 he1j e2i+ ::

Usando agora (32) temos

he1j xi = a1 he1j e1i = a1

ou, de forma geralai = he1j xi :

Assim, numa base ortonormal as componentes do vetor nesta base é o produtointerno do vetor com cada elemento da base (ou a projeção de jxi na direçãojeii).Além disso, para uma base ortonormal, temos

hxj yi ="nXi=1

ai heij#24 nX

j=1

bj jeji

35 = nXi=1

nXj=1

aiaj heij eji

=nXi=1

nXj=1

aibj�ij =nXi=1

aibi :

Que é uma expressão idêntica a de�nição anterior do produto interno (31), masagora com as componetes do vetor na base fjejig. Assim, o produto interno

58

entre dois vetores pode ser calculado pelas componentes originais deste vetor oupela suas componentes em qualquer base ortonormal.Lembre que o nosso vetor é a seqüência ordenada x1; x2; ::: ou seja

jxi =

[email protected]

1CCCAEstas são as componentes do vetor e não se referem à base alguma. Já asquantidades ai acima são as componentes numa determinada base.Em especial, para o produto interno de um vetor com ele mesmo, i.e., a

norma deste vetor, temos

jxj2 = hxj xi ="nXi=1

ai heij#24 nX

j=1

aj jeji

35 = nXi=1

nXj=1

aiaj heij eji

=

nXi=1

nXj=1

aiaj�ij =

nXi=1

a2i :

Exemplo: Voltando para o nosso exemplo em 2 dimensões tomemos o vetorcom componentes x1 = 1; x2 = 2. Que na representação matricial assume aforma

jxi =�12

�a norma deste vetor vale

jxj2 = (x1)2 + (x2)2 = 12 + 22 = 5Uma base para este espaço é qualquer conjunto de dois vetores LI. Por exemplo,temos a base

jf1i =�11

�; jf2i =

�23

�Fácil ver que

a jf1i+ b jf2i = 0 = a

�11

�+ b

�23

�) a+ 2b = 0) a = �2b

2 + 3b = 0) a = �3b ;

que só pode ser satisfeita para a = b = 0. Logo jf1i e jf2i são LI e, consequente-mente, formam uma base do espaço. Entretando

hf1j f2i =�1 1

�� 23

�= 5 6= 0 ;

esta base não é ortogonal. As componentes de jxi na base fjfiig valem

jxi = c1 jf1i+ c2 jf2i = c1

�11

�+ c2

�23

�=

�c1 + 2c2c1 + 3c2

�=

�12

�c1 + 2c2 = 1) c1 = 1� 2c2 ;c1 + 3c2 = 2) 1� 2c2 = 2� 3c2 ) c2 = 1) c1 = �1 :

59

(temos de resolver o sistema de equações). Assim, as componentes de jxi nabase fjfiig valem: c1 = 1, c2 = �1. Fácil ver que

(c1)2+ (c2)

2= 1 + 1 = 2 6= 5 = (x1)2 + (x2)2 ;

ou seja, não podemos usar estas componentes para calcular a norma do vetor.Tomemos agora outros dois vetores

jw1i = jf1i ; jw2i =�

1�1

�:

Facil ver que estes vetores também são LI. Mas, além disso

hw1j w2i =�1 1

�� 1�1

�= 1� 1 = 0 :

Assim, fjwiig é uma base ortogonal. As componentes c0i de jxi nesta basevalem

c01

�11

�+ c02

�1�1

�=

�12

�c01 + c

02 = 1) c01 = 1� c02

c01 � c02 = 2) c02 = �1

2

c01 = 1 +1

2=3

2

Mais uma ver(c01)

2+ (c02)

2=9

5+1

4=41

206= 5 :

Mas, como a nossa nova base fjwiig é ortogonal, podemos aplicar o processo denormalização e de�nir uma nova base fjeiig com

je1i =jw1ijw1j

=1p2

�11

�je2i =

jw2ijw2j

=1p2

�1�1

�As componentes c00i de jxi na base fjeiig valem

jxi = c001 je1i+ c002 je2i =1p2

�c001 + c

002

c001 � c002

�=

�12

�c001 + c

002 =p2) c001 =

p2� c002

c001 � c002 = 2p2) c002 = �

p2

2

c001 =p2 +

p2

2=3

2

p2

60

onde agora podemos usar a projeção

c001 = he1j xi =1p2

�1 1

�� 12

�=

3p2;

c001 = he2j xi =1p2

�1 �1

�� 12

�= � 1p

2;

(não precisamos resolver o sistema de equações). Além disso, nas componentesde jxi na base ortonormal fjeiig temos

(c001)2+ (c002)

2=1

2+9

2= 5 = (x1)

2+ (x2)

2= jxj2

�Um conjunto de m vetores fjeiig ortonormais, com m = n, é também

chamado de um conjunto ortogonal completo. Para m < n os vetores fjeiigsão chamados de um conjunto ortogonal incompleto. Este conjunto forma umabase para um sub-espaço de dimensão m do espaço vetorial de dimensão n.Assim, encontrar uma base para um espaço vetorial é equivalente a encontrar

um conjunto completo de vetores ortogonais (e normalizá-los).Uma base bastante muito conveniente (e simples de construir) é a seguinte

je1i =

0BBBBB@1000...

1CCCCCA ; je2i =

0BBBBB@0100...

1CCCCCA ; je3i =

0BBBBB@0010...

1CCCCCA ; :::

Fácil ver que esta base é ortonormal. Além disso, nesta base as componentesdo vetor são exatamente as componentes do vetor na base

jxi =

0B@ x1x2...

1CA =nXi=1

ai jeii ) ai = heij xi = xi : (33)

Esta é a chamada base canônica.

6.1 Operadores, autovetores e autofunções no Rn

Em Rn dado um conjunto de n2 números reais Mij (i; j = 1; 2; :::n) podemosde�nir o seguinte mapa entre as componentes de dois vetores jxi e jyi desteespaço

yi =nXk=1

Mikxk

ou, simbolicamentejyi = M jxi

61

onde o chapéu indica queM não é um número, mas sim o que chamamos de op-erador. Ou seja, dado um espaço vetorial, um operador é um mapa entre vetoresdeste espaço (M : V ! V ). Na notação matricial introduzida anteriormente, osoperadores podem ser identi�cados como matrizes n� n.Como exemplo, vamos estudar as operações de rotações num plano. Ou seja,

vamos trabalhar num espaço com n = 2. Suponha que um vetor neste espaçotenha coordenadas (x1; x2). Se aplicarmos uma rotação de um ângulo � nosentido anti-horário, neste vetor quais as componentes (x01; x

02) do novo vetor

obtido? Fazendo desenhos no plano é fácil ver que�x01x02

�=

�cos � � sin �sin � cos �

��x1x2

�:

Ou seja, o conjunto de quatro números Rij , ou a matriz

R (�) =

�cos � � sin �sin � cos �

�;

é um operador de rotação no nosso espaço bidimensional. Um casoparticular é o operador de rotação de um ângulo de 1800

R (�) =

��1 00 �1

�:

Um outro exemplo é o operador que troca a troca a coordenada x1 por �x1 (i.e.,coloca um espelho no plano normal a x2), chamado de operador de paridade emx1

P1 =

��1 00 1

�: (34)

Observe que isso não é nenhuma rotação.

6.1.1 Produto externo

Além do produto interno, realizado entre vetores de um certo espaço vetorial,podemos também de�nir o produto entre vetores de dois (ou mais) espaçosvetoriais diferentes

a� b ; a 2 V1 ; b 2 V2 :

A quantidade assim obtida é um novo vetor num terceiro espaço vetorial V3 comdimensão

dimV3 = dimV1:dimV2 :

Na representação matricial, onde todo vetor é uma matriz m�n, uma forma

62

bastante conveniente de implementar o produto tensorial é através da de�nição

AB =

0B@ a11 � � � a1m...

. . ....

a1n � � � anm

1CAB �0B@ a11B � � � a1mB

.... . .

...a1nB � � � anmB

1CA

=

0BBBBBBB@a11

B11 � � �...

. . .

!� � � a1m

B11 � � �...

. . .

!...

. . ....

a1n

B11 � � �...

. . .

!� � � anm

B11 � � �...

. . .

!

1CCCCCCCA: (35)

Ou seja, é a matriz formada quando multiplicamos a matriz da direita com cadaelemento da matriz da esquerda. Este é o chamado produto de Kronecker.No espaço vetorial das seqüência, que estamos trabalhando, temos dois es-

paços vetoriais diferentes: o espaço dos vetores e o espaço dos duais. Podemosassim estabelecer o produto externo entre dois elementos de cada um destesespaços

M = jxi � hyj :

Pela de�nição acima é fácil ver que esta nova matriz tem componentes

Mij = xiyj : (36)

ou seja, neste caso, M é a matriz

M =

0BBB@x1y1 x1y2 � � � x1ynx2y1 x2y2 � � � x2yn...

.... . .

...xny1 xny2 � � � xnyn

1CCCA :

Usando o produto de Kronecker, para o produto de dois vetores temos numespaço com n = 3 temos

jxi�hyj=

0@ x1x2x3

1A� y1 y2 y3��

0@ x1�y1 y2 y3

�x2�y1 y2 y3

�x3�y1 y2 y3

�1A =

0@ x1y1 x1y2 x1y3x2y1 x2y2 x2y3x3y1 x3y2 x3y3

1A ;

(37)que na mais é que a expressão (??) organizada numa forma matricial. A quan-tidade acima é chamada um tensor de segunda ordem.

63

Da de�nição acima é fácil ver que

(jyi � hxj)T =

240@ x1x2x3

1A � y1 y2 y3�35T

0@ y1y2y3

1A � x1 x2 x3�

= jxi � hyj :de forma geral

(A�B)T = BT �AT :

Se jxi 2 V e dimV = n a quantidade acima pode ser vista como um vetornum espaço V 0 de dimensão n2, ou, por ser uma matriz n�n, como um operadoragindo no espaço V . Ou seja, matematicamente um tensor de segunda ordempode ser pensado visto como um operador. Para o produto de�nido acima(entre um tensor e o dual), em MQ estamos interessados apenas em M comoum operador agindo em V .A aplicação deste operador num vetor jzi é a multiplicação matricial

M jzi = (jxi � hyj) jzi =

0BBB@x1y1 x1y2 � � � x1ynx2y1 x2y2 � � � x2yn...

.... . .

...xny1 xny2 � � � xnyn

1CCCA0BBB@

z1z2...zn

1CCCA =

0BBB@Pni=1 zix1yiPni=1 zix2yi...Pn

i=1 zixnyi

1CCCA

=

0BBB@x1Pni=1 ziyi

x2Pni=1 ziyi...

xiPni=1 ziyi

1CCCA =

0BBB@x1 hyj zix2 hyj zi

...xn hyj zi

1CCCA =

[email protected]

1CCCA hzj yi= jxi hzj yi (38)

A notação de Dirac possui uma forma muito conveniente de expressar oproduto externo acima e, ao mesmo tempo, salientar a interpretação de Mcomo um operador:

jxi � hyj � jxi hyjpois, com isso, a aplicação deste produto externo num vetor jzi pode ser sim-bolicamente calculado como

(jxi � hyj) jzi � (jxi hyj) jzi = jxi hyj jzi � jxi hyj zi :Que é exatamente a expressão (38).A de�nição acima, apesar de ser apenas uma mudança de notação, simpli�ca

absurdamente a nossa vida. Suponha, por exemplo, que você tenha 2 operadores

P1 = je1i � je2i ; P1 = je2i � je2i

je1i =1p2

�11

�; je2i =

1p2

�1�1

64

e quer saber qual operador corresponde a composição destes operadores P =P1P2. Na notação matricial temos:

P1 = je1i � je2i =1

2

�1 �11 �1

�;

P2 = je2i � je1i =1

2

�1 1�1 �1

�P = P1P2 =

1

4

�1 �11 �1

��1 1�1 �1

�=1

4

�2 22 2

�=1

2

�1 11 1

�Usando a notação de Dirac, temos

P = P1P2 = (je1i he2j) (je2i he1j) = je1i he2j e2i he1j = je1i he1j

=1

2

�1 11 1

�Ou seja, apenas no �nal das contas precisamos usar a forma explicita das ma-trizes.Além disso, a notação de Dirac nos permite identi�car uma série de pro-

priedades de certos operadores. Vejamos, por exemplo, o seguinte operador

M =

nXi=1

jeii � heij =nXi=1

jeii heij

onde fjeiig é uma base ortonormal qualquer de um espaço de dimensão n.Assim, qualquer vetor pode ser decomposto em

jxi =nXk=1

ck jeki

e a aplicação do nosso operador em jxi fornece

M jxi =nXi=1

jeii heijnXk=1

ck jeki =nXi=1

nXk=1

ck jeii heij eki

=nXi=1

nXk=1

ck jeii �ik =nXk=1

ck jeki = jxi

para qualquer vetor do nosso espaço. Com isso concluímos que

M jxi = jxi ; 8 jxi 2 V ) M = I

Onde I é o operador identidade no nosso espaço (numa representação matricial

65

a matriz unitária). O argumento pode também ser facilmente invertido

jxi =nXk=1

ck jeki ) ck = hekj xi ) jxi =nXk=1

hekj xi jeki =nXk=1

jeki hekj xi

=

nXk=1

jeki hekj!jxi )

nXk=1

jeki hekj = I :

Estas manipulações mostram a força da notação de Dirac.A expressão

nXk=1

jeki hekj = I ; (39)

chama-se resolução da identidade.Entretanto em MQ ocorre também o produto externo de dois vetores e não

apenas de um vetor com o dual. Neste caso, para jxi 2 V1 ; jyidimV1 = 2 ejyi 2 V2 ;dimV2 = 3, temos

jxi jyi � jxyi =�x1x2

0@ y1y2y3

1A =

0BBBBBB@x1

0@ y1y2y3

1Ax2

0@ y1y2y3

1A

1CCCCCCA =

0BBBBBB@x1y1x1y2x1y3x2y1x2y2x2y3

1CCCCCCAQue, obviamente, não é um operador nem em V1 nem em V2, mas sim um vetornum novo espaço com dim = 2� 3 = 6. Como veremos com detalhes no futuro,este produto descreve um sistema quântico composto de dois subsistemas jxi ejyi (e.g., duas partículas).

6.1.2 Auto-vetores

Uma relação entre operadores e vetores que é de especial interesse é quando aaplicação de um operador sobre um vetor resulta num vetor na mesma direção(i.e., proporcional) ao vetor original. Isso é, quando:

M jxi = a jxi ; a 2 R ; jxi 6= 0:

Neste caso, dizemos que jxi é um autovetor do operador M e que a é o autovalordo autovetor jxi.Por exemplo, se aplicarmos o operador P (34) no vetor

jp1i =�01

�teremos

P jp1i =��1 00 1

��01

�=

�01

�= jp1i ;

66

Ou seja, o vetor jp1i é um autovetor de P com autovalor 1. Já o vetor

jp2i =�10

�) P jp2i =

��1 00 1

��10

�=

��10

�= �

�10

�= � jp2i :

Assim, jp2i é outro autovetor de P , mas com auto valor �1: Já o vetor

jp3i =�11

�)��1 00 1

��11

�=

��11

�6= a jp3i

então, jp3i não é auto vetor de P . Da mesma forma, qualquer vetor é au-tovetor de R (�) com autovalor �1, pois

R (�) jxi =��1 00 �1

��x1x2

�= �

�x1x2

�= � jxi :

Além disso, o operador R (�=2) não possui nenhum autovetor.Observe que, se jxi é autovetor de M com autovalor m,

M jxi = m jxi ;

o vetorjx0i = a jxi ; a 2 R ;

também será autovetor com o mesmo autovalor

M jx0i = Ma jxi = aM jxi = am jxi = m (a jxi) = m jx0i :

Com isso, dizemos que jxi e jx0i são os mesmos autovetores. Usualmente estare-mos interessados em vetores normalizados, assim, teremos apenas um vetor e aconstante multiplicativa é determinada no processo de normalização.

6.2 Mudança de base

Como vimos anteriormente, a forma explicita das componentes do vetor depen-dem de qual base escolhemos.Se numa certa base fjeiig um vetor jvi tem componentes

jvi =Xi

vi jeii

numa outra base fje0iig este mesmo vetor terá outras componentes

jvi =Xi

v0i je0ii

Se você escolher uma certa base ortonormal fjeiig, como comparar suasquantidades com as de algém que ecolheu outra base ortonormal fje0iig? Ouseja, como vi se relaciona com v0i?

67

Para saber isso basta lembrar que todos estes vetores fomam uma base doespaço. Assim, podemos escrever

jeii =Xj

aij��e0j� ;

onde, sendo nossa base ortonormal, os coe�cientes desta expanção tem a forma

aij =e0j�� eii =) jeii =X

j

e0j�� eii je0ii

Assim, para um vetor qualquer jvi podemos escrever

jvi =Xi

vi jeii =Xi

Xj

vie0j�� eii ��e0j� =X

j

Xi

vie0j�� eii!��e0j� : (40)

Ou seja, se vi são as componentes de jvi na base fjeiig as componentes v0i destemesmo vetor na base fje0iig são

v0j =Xi

vie0j�� eii

As quantidades he0ij eji também podem ser organizadas numa matriz comlinha i e coluna j. Esta matriz é chamada de matriz de mudança da base fjeiigpara a base fje0iig.Vemos assim como é conveniente identi�carmos nossos vetores com matrizes.

De forma geral, todas as quantidades com um único índice podem ser vistoscomo uma matriz coluna de n elementos e qualquer quantidade com dois índicescomo uma matriz n� n.A expressão (40) acima pode ser facilmente obtida se usarmos a resolução

da identidade (39)nXj=1

��e0j� e0j�� = I :

Pois

jvi =Xi

vi jeii = I jvi =nXj=1

��e0j� e0j�� nXi=1

vi jeii

=nXj=1

nXi=1

vi��e0j� e0j�� eii :

Ou seja, a resolução da identidade nos permite mudar de base num espaçovetorial.

68

6.3 Espaço de Hilbert

Nosso objetivo aqui é obter uma generalização dos resultados da seção anterior.O primeiro ponto é lembrar que nossos vetores, e os números que multiplicamestes vetores, são todos reais. Assim, a primeira generalização que podemosfazer é dizer que um vetor num espaço de dimensão n é qualquer seqüência denúmeros complexos �1; �2; :::; �n (�i 2 C) e que nossos vetores podem semultiplicados também por números complexo

� j�i+ � j i = j�i ; �; � 2 C ;

com�i = ��i + � i :

Até aqui nada mudou. O ponto agora é que devemos lembrar que se � é umnúmero complexo, podemos ter

�2 < 0 ;

(e.g., para � = i). Isso implica que a somatória do quadrado de númeroscomplexo não é uma quantidade positiva de�nida e, consequentemente, a normade�nida anteriormente pode nos dar valores negativos. Não queremos ter vetoresde norma negativa (isso é, na verdade, contra a de�nição do que é uma norma).Podemos resolver este problema lembrando que

�:�� � 0; 8� 2 C

onde, além disso,�:�� = 0) � = 0 :

Assim, podemos recuperar a característica de positividade da nossa norma se,no lugar de (31) de�nirmos o produto interno como

h�j i = ��1 1 + ��2 2 + :::+ ��n n =nXi=1

��i i ; (41)

com isso temos, novamente,

j�j2 = h�j �i =nXi=0

��i�i � 0

comj�j2 = 0 =) j�i = 0 :

A única diferença neste produto interno é que, no lugar da simetria, temosagora uma simetria conjugada

h�j i =nX

i=0i

��i i =

nXi=0

(�i� i) =

nXi=0

�i� i

!= h j �i :

69

Da mesma forma, no que se refere a representação matricial, continuamosrepresentando nossos vetores por matrizes coluna

j�i =

0BBB@�1�2...�n

1CCCAmas, para ser compatível com o produto interno (41), devemos de�nir o dual dej�i, não apenas como o transposto, mas como o transposto conjugado

h�j =���1 ��2 � � � ��n

�:

Com a de�nição acima vemos que, para o produto externo entre os vetores,no lugar de

jxi hyj = (jyi hxj)T :

temos agora

j i h�j = (j�i h j)T :

A segunda generalização que vamos fazer é permitir que a dimensão doespaço assuma qualquer valor, incluindo o in�nito. Ou seja, vamos admitirespaços com n =1. Esta é, na verdade, a motivação deste desenvolvimento.Neste caso, obviamente não podemos mais representar nossos vetores por ma-

trizes. Mas podemos continuar usando todas as expressões anteriores (fazendon =1).A grande diferença é que antes, bastava que cada elemento do nosso ve-tor estivesse bem de�nido (não fosse in�nito) e, certamente, todas as expressõesde�nidas também estariam bem de�nidas.Agora, para n = 1, pode acontecer de cada elemento do nosso vetor estar

bem de�nido, e mesmo assim não conseguirmos calcular quantidades como, porexemplo, o produto interno. Ou seja, agora precisamos exigir que as somatóriasde�nidas anteriormente convirjam.Por exemplo, podemos de�nir as componentes do nosso �vetor�como

xk =1

k1=2; k 2 N� :

Cada componente está bem de�nida. Em especial, para n!1

x1 =1

(1)1=2= 0 :

Entretanto, se desejarmos calcular a norma deste �vetor�teremos7

jxj2 =1Xk=1

1

k1=21

k1=2=

1Xk=1

1

k�!1 :

7Lembre que1Xn=1

1

ns

diverge para s � 1.

70

E não podemos utilizar para estas componentes a noção de norma que é indis-pensável em todas as nossas análises. Destarte, se quisermos de�nir um espaçovetorial tratável, devemos exigir que os vetores do nosso espaço respeitem arestrição

1Xk=1

j�kj <1 :

Ou seja, para nós agora, vetores são todas as seqüência, �nitas e in�nitas, sobreo corpo dos complexos, tal que a soma do módulo quadrado convirja.Um espaço vetorial de dimensão arbitrária (incluindo in�nito) sobre o corpo

dos complexos onde (para todo elemento) está de�nido um produto interno,juntamente com uma condição técnica de completeza8 forma um espaço deHilbert.Todo o desenvolvimento da MQ, é o estudo do espaço de Hilbert.Todos os conceitos desenvolvidos anteriormente, incluindo a noção de ortog-

onalidade e base, são válidos no EH. A diferença é que agora a nossa base podeconter in�nitos termos.

Problem 18 Mas será que, como os casos anteriores, este espaço possui umabase?

Para um espaço de dimensão N (�nito) qualquer, podemos sempre construiruma base fjeiig na forma canônica

je1i =

0BBB@100...

1CCCA ; je2i =

0BBB@010...

1CCCA ; � � � ; jeN i =

[email protected]

1CCCA : (42)

Sendo cada jeii uma matriz N � 1. Obviamente, qualquer vetor jxi pode serescrito como:

jxi =

[email protected]

1CCCA =NXk=1

xk jeki

Onde, como vimos, as componentes de um vetor qualquer na base canônicasão as próprias componentes do vetor.Além disso, esta base é ortonormal

heij eji = �ij :

8Convergência de todas as seqüências de Cauchy j n � lj ! 0.

71

Podemos imaginar uma base do nosso espaço de Hilbert das seqüenciaisin�nitas como uma coleção de in�nitos termos na forma (42). Ou seja,

je1i =

0BBB@100...

1CCCA ; je2i =

0BBB@010...

1CCCA ; je3i =

0BBB@010...

1CCCA ; � � � (43)

O ponto aqui é que, para qualquer um destes elementos, temos

heij eii = 1 <1 =) jeii 2 H ; i = 1; 2; 3; :::

Ou seja, todos os (in�nitos) elementos desta seqüência estão em H. Além disso,qualquer elemento de H pode ser escrito como

j�i =1Xk=1

�k jeki ; �k 2 C :

Com isso, fjekig forma uma base do nosso espaço H. Esta base possui in�ni-tos elementos e, conseqüentemente, nosso espaço tem dimensão in�nita.

6.4 O espaço L2

A generalização da dimensão introduzida anteriormente parece a mais geral quepodemos fazer. Isso seria verdade se não existissem vários tipos de in�nito,também chamado de cardinalidade. Este é um assunto bastante complicadoda teoria dos conjuntos. Na verdade, a cardinalidade mede o �tamanho� deum conjunto. Mas, como vimos, a dimensão de um espaço está diretamenterelacionada com o tamanho (ou o número de elementos) da base.Para um conjunto qualquer podemos considerar duas noções: tamanho

do conjunto e o número de elementos deste conjunto. Para qualquerconjunto com um número �nito de elementos estas noções coincidem. Um con-junto com três elementos tem um tamanho, ou cardinalidade, três. Além disso,para conjuntos �nitos, sempre que pegamos uma parte deste conjunto (um sub-conjunto) este tem um tamanho menor que o original. A comparação entre ostamanhos dos conjuntos está ligada com a idéia de bijeção entre os elementosdestes conjuntos.

Remark 19 Se podemos criar uma bijeção entre dois conjuntos, então estesconjuntos tem o mesmo tamanho.

Assim, o conjunto de 3 frutas tem o mesmo tamanho do conjunto de 3animais. Esta idéia também é válida para conjuntos com in�nitos termos. Mas,neste caso, a noção de cardinalidade e número de elementos não é mais a mesma.Por exemplo, tomemos o conjunto dos naturais N e o conjunto dos números

pares P . Certamente estes conjuntos não têm os mesmos elementos. Em especialo número 1 está no primeiro conjunto e não está no segundo. Mais ainda, qual-quer elemento do segundo conjunto está no primeiro,mas o contrárionão é verdade.

72

Problem 20 Qual destes conjuntos é maior?

Poderíamos então imaginar que o conjunto dos naturais é maior que o con-junto dos números pares. Entretanto, é possível estabelecer uma bijeção entre osnaturais e os números pares. Obviamente, dado um número natural n, podemosfácilmente associar a ele o número par

p = 2n

Mas, além disso, dado um número par p 2 P associamos a ele (de formaunívoca) o natural

n =p

2

Ou seja, a cada número inteiro temos um (único) número par associadoe vice-versa. Isto mostra que os dois conjuntos têm o mesmo tamanho,ou a mesma cardinalidade.Assim, para conjuntos in�nitos, podemos pegar apenas uma parte deste

conjunto e obter um conjunto com o mesmo tamanho.Vejamos um exemplo um pouco mais complicado. Recapitulando, um dos

resultados da teoria dos conjuntos é que sempre que for possível estabeleceruma bijeção entre dois conjuntos estes conjuntos têm a mesma cardinalidade.Peguemos, por exemplo, o conjunto dos naturais N, i.e., a seqüência0BBB@

123...

1CCCAe a seqüência de um par ordenado de naturais, o produto N�N, i.e., as seqüências0BB@

1; 1 1; 2 � � �

2; 1 2; 1...

... � � � . . .

1CCAProblem 21 Qual destes conjuntos é maior?

Aparentemente o segundo conjunto tem mais elementos que o primeiro. En-tretanto, estes dois conjuntos podem ser mapeados (um-pra-um) através dodiagrama de Cantoridenti�cando n ! (x; y) ou seja

0 ! (0; 0) ; 1 ! (1; 0) ; 2 ! (0; 1) ; 3 ! (2; 0) ; 4 ! (1; 1) ; 5 ! (0; 2) ; 6 ! (3; 0) :::

Desta forma, o par ordenado N�N tem a mesma cardinalidade de N, ouseja, são do mesmo tamanho e tem o mesmo tipo de in�nito. Como resultadodisso, os números racionais Q, que podem ser escritos como a=b, com a; b 2 Ne b > 0 tem a mesma cardinalidade dos naturais.

73

Figure 10: Figura da Wikipedia

Mais ainda, com argumentos semelhantes é possível mostrar que qualquerseqüência �nita de números naturais N � N � ::: � N pode ser mapeado nosnaturais N e conseqüentemente, tem a mesma cardinalidade. Esta cardinalidadeé chamada de in�nito (pois N é in�nito) contável. Também chamado de @0(aleph-0).

Remark 22 Assim, se os elementos que formam a base de um conjunto temuma cardinalidade contável (possui uma bijeção com N) dizermos que a dimen-são do espaço é contável.

Talvez você imagine com isso que todos os conjuntos in�nitos têm a mesmacardinalidade, mas isso não é verdade.Agora, se você considerar o conjunto dos reais, é impossível estabelecer

uma relação um-pra-um entre este conjunto e os naturais. Mais precisamente,é possível estabelecer a relação

N �! R ;

mas a inversa nãoR 9 N :

Podemos dizer que, apesar de ambos serem in�nitos, o conjunto dosreais é maior que o dos naturais. Mais ainda, qualquer intervalo �nito dareta real, e.g. [0; 1], tem mais elemento que qualquer seqüência �nita de todosos naturais.Assim, se você �zer um HD de computador capaz de armazenar todos os

naturais, este HD pode encher e não registrar os reais (ou mesmo um internalodos reais).

74

Com isso, os reais são de uma cardinalidade diferente (maior) que os naturais.Dizemos que o conjunto dos reais é um in�nito incontável. Também chamadode @1 (aleph-1).

Remark 23 Assim, se não for possível estabelecer uma bijeção entre os ele-mentos da base e N, mas for possível estabelecer entre R, os elementos queformam a base de um conjunto tem uma cardinalidade incontável dizermos quea dimensão do espaço é incontável.

Remark 24 Vemos então que todo o desenvolvimento apresentado na seçãoanterior sobre o espaço de Hilbert diz respeito, na verdade, apena a in�nitoscontáveis.

Do que foi dito acima, vemos que o nosso espaço H, de�nido anteriormente,tem dimensão in�nita, mas contável. Pois possui uma base com um in�nitocontável de elementos fjekig. A existência de diferentes tipos de in�nito nos levaa crer (o que é verdade) que possam existir também espaços com uma dimensão(e consequentemente uma base) in�nita incontável.Considere agora uma função f (x) sobre os reais num intervalo x 2 [a; b].

Esta função pode ser considerada uma seqüência0BBBBB@f (x1)f (x2)f (x3)...

f (xn)

1CCCCCAentretanto, neste caso o índice da nossa seqüência (x) não é um númeronatural N, mas um número real R. Pois podemos fazer x2 � x1 < " para qualvalor de ". Assim, entre quaisquer dois elementos existem in�nitos elemento:0BBBBBBBBBBB@

f (x1)...

f (x1;0001)...

f (x2)...

f (xn)

1CCCCCCCCCCCA(44)

Este tipo de seqüência é, certamente, diferente da de�nida anteriormente. Maisprecisamente, a nossa seqüência, assim como a anterior, possui in�nitos termos,mas esta seqüência possui um in�nito incontável de termos.Assim, aquele HD hipotético capaz de registrar uma seqüência in�nita (xk),

não seria capaz de registrar a função acima.Certamente o procedimentoanterior para a construção de uma base canônica falha neste caso.

75

Com isso, não há nenhuma razão para crer que os resultados desenvolvidosna seção anterior sejam válidos para funções sobre os reais.Vamos então tentar construir um espaço vetorial para as nossas funções f .

Como uma extensão natural da notação anterior, se queremos um vetor querepresente a nossa função f (x) ; x 2 [a; b], podemos chamá-lo de jfi. Ou seja,jfi é a coleção ordenada de todos os valores da função num certo intervalo (a�seqüência� simbólica (44)). Observe que jfi não é a função calculada numponto, mas uma quantidade abstrata que representa uma coleção in�nita determos.A soma destas quantidades pode ser de�nido de forma análoga a anterior.

Ou seja, a �seqüência�simbólica

jwi = � jfi+ � jgi ; �; � 2 C

é de�nida como a coleção ordenada de todos os pontos w (x) = �f (x) +�g (x) ; x 2 [a; b].Na construção do nosso espaço, assim como �zemos anteriormente, o primeiro

ponto é a construção de um produto interno. Podemos fazer isso apenas gener-alizando a expressão anterior para o caso de duas �seqüências contínuas� jfi ejgi (todas de�nidas, sempre, no mesmo intervalo)

h�j i =nXi=0

��i i �! hf j gi =Z b

a

�f (x) g (x) dx :

Com isso, novamente, garantimos a positividade do produto

hf j fi � 0 ; hf j fi = 0 =) jfi = 0 ;

onde a última igualdade signi�ca f (x) = 0 para x 2 [a; b].Novamente, para que o nosso produto faça sentido, devemos exigir que

hf j fi =Z b

a

jf (x)j2 dx <1 : (45)

Ou seja, o nosso espaço é o espaço das funções de quadrado integrável no inter-valo [a; b], também chamado L2 (a; b).O fato de que a soma (de�nida acima) de duas funções de quadrado integrável

é também ser de quadrado integrável, garante que L2 (a; b) é um espaço vetorial(assim como as nossas seqüências em H).O ponto (e toda a di�culdade do trabalho) é estudar a dimensão deste espaço.Para isso, podemos invocar aqui o resultado de Fourie. Para qualquer função

(bem comportada) que respeite (45), de�nida no intervalo [��; �] existe umacorrespondência unívoca entre esta função e a seqüência (contável)

f (x) =1X

k=�1xk exp (ikx) (46)

76

onde

xj =1p2�

Z b

a

f (x) exp (�ikx) dx (47)

Ou seja, registrar a seqüência contável xj é equivalente a registrar a função(de�nida num intervalo incontável) f (x).Assim, apesar do HD hipotético não poder registrar o valor da função em

todos os pontos, ele pode registrar a seqüência fxkg e, com isso, reconstruir afunção (exatamente) em todos os pontos. Ou ainda, mesmo estando a funçãode�nida num contínuo de pontos, não precisamos de um conjunto incontávelpara especi�car a função. O fato de esta ser de quadrado integrável cria umarelação entre estes pontos, de sorte que eles possam ser especi�cados pelo con-junto menor formado por uma seqüência contável de pontos.Mais ainda, existe uma relação unívoca entre o espaço das funções em

L2 (a; b) e o espaço das seqüências contáveis in�nitas. O que mostra que estesdois espaços têm a mesma dimensão. Ou seja, se existir uma base contável paraa seqüência fxkg existirá também uma base contável para L2. Observe queainda não falamos nada sobre as sequencias acima (em especial, não sabemosse estas seqüências pertencem a um espaço de Hilbert).Ou ainda, existe uma base contável para o espaço L2 (a; b).Além disso, existe um resultado, devido a Parseval, que a�rmaZ �

��jf (x)j2 dx =

1Xj=�1

x2j

Ou seja, se a seqüência xj pertence ao nosso espaço de Hilbert H sef 2 L2. Ou seja, para toda sequencia xk 2 H existe uma função

f (x) =1X

k=�1xk exp (ikx) ; f 2 L2

e para toda a função f 2 L2 existe uma seqüências

xj =1p2�

Z b

a

f (x) exp (�ikx) dx ; fxkg 2 H :

Podemos assim considerar L2 (a; b) como um espaço de Hilbert H. E dizerque a função f (x) pertence ao espaço de Hilbert L2.Observe que as próprias funções

1p2�exp (�ikx)

pertencem a L2 (��; �). Assim, se chamarmos estas funções de jeki (ou seja,jeki é a coleção de todos os valores da função exp (�ikx) =

p2� no intervalo

(��; �)), podemos escrever (46) como

jfi =1X

k=�1xk jeki :

77

Observe que

hekj eji =1

2�

Z �

��exp (�i (k � j)x) dx = �kj :

Ou seja, fjekig é uma base (contável) para o nosso espaço L2 (��; �) e estabase é ortonormal. Além disso, xk são as componentes de jfi nesta base.Sendo nossa base ortonormal, as componentes de f nesta base são simplesmentea projeção:

xk = hekj fi =1p2�

Z b

a

f (x) exp (�ikx) dx ; (48)

que são as componentes xk da série de Fourie (47).Estas funções fjekig são um exemplo de funções ortogonais.Assim, dado um vetor jfi 2 L2 podemos trabalhar com as componentes

deste vetor f(x), ou com as componentes xk deste vetor na base fjekig.Vemos então que todo o ferramental desenvolvido para seqüência de quadrado

somável é válido para funções de quadrado integrável. Além disso, as noções denorma

jf j =phf j fi

e ortogonalidadehf j gi = 0

podem agora ser estendida para estas funções.Mais ainda, quando valamos agora sobre um vetor j�i, podemos estar fa-

lando de uma matriz coluna, de uma seqüência in�nita, ou mesmo de umafunção. Toda as manipulações formais com j�i são idênticas e, apenas quandoprecisarmos calcular alguma quantidade explicitamente, precisamos especi�carqual dos espaços de Hilbert estamos falando.

6.5 Rigged Hilbert space

Para o caso em que o intervalo se torna in�nito [�1;1], as nossas funções debase

1p2�exp (�ikx)

não pertencem mais a H. Entretanto, ainda assim é possível escrever

hek0 j eki =1

2�

Z 1

�1exp [i (k � k0)x] dx � � (k � k0) ;

E, mais ainda, para qualquer função f (k) bem comportada temosZ 1

�1� (k � k0) f (k) dk = f (k0) :

78

Mas agora, como tanto k como x são contínuos, podemos também introduziros �vetores�fjexig, cujas componentes são

ex (k) =1p2�exp (�ikx) = (ek (x))

Da mesma forma que antes temos

hex0 j exi =1

2�

Z 1

�1exp [i (x0 � x) k] dk = � (x0 � x)

com Z 1

�1� (x� x0) f (x) dx = f (x0)

No que segue, mudaremos a notação para

jexi � jxi ; jeki � jki

Se para qualquer vetor (este sim um vetor) legitimo jfi 2 L2 (�1;1) de�nir-mos a quantidade

jfi =Z 1

�1jx0i hx0j fi dx0

temos

hxj fi =Z 1

�1hxj x0i hx0j fi dx =

Z 1

�1� (x0 � x) hx0j fi dx = f (x)

Podemos dizer que a projeção de jfi na direção do �vetor� jxi é exatamente acomponente f(x).Da mesma forma, fazendo

jfi =Z 1

�1jk0i hk0j fi dk0

Lembrando agora que (48)

f (k) = hkj fi = 1p2�

Z b

a

f (x) exp (�ikx) dx ;

é exatamente a componente de Fourie da função f (onde estamos usando f(k) enão xk porque k é contínuo) temos:

hk jfi =Z 1

�1hkj k0i f (k0) dk0 =

Z 1

�1� (k0 � k) f (k0) dk0 = g (k)

Podemos dizer que a projeção de jfi na direção do �vetor� jki é exatamente acomponente f(k).As funções ex (k) e ek (x) acima estão de�nidas no chamado espaço de Hilbert

generalizado. Neste espaço podemos tratar os vetores fjxig e fjkig como uma

79

base e dizer que f(x) são as componentes de jfi na base fjxig e f(k) suascomponentes na base fjkig.Além disso, pela resolução da identidade temosZ 1

�1jx0i hx0j dx0 =

Z 1

�1jk0i hk0j dk0 = I

temos

jfi =Z 1

�1jx0i hx0j fi dx0 = I

Z 1

�1jx0i hx0j fi dx0

=

Z 1

�1

Z 1

�1jk0i hk0 jx0i hx0j fi dk0dx0

da forma explicita das funções temos

hkj xi = 1p2�exp (�ikx) :

é a matriz de mundança da base fjxig para a base fjkig. Podemos assim tratara transformada de Fourie apenas como uma mudança de base.

6.6 Operadores simétricos, ou hermitianos

Como vimos anteriormente, o produto externo de dois vetores j�i e j�i podeser visto como um operador. Se um operador M é de�nido como

M = j�i h�j ;

então, seu hermitiano conjugado (ou o seu adjunto) M+ será

M+ � j�i h�j :

Para o caso do espaço de dimensão �nita, este operador é apenas o transpostoconjugado da matriz M , mas a nomenclatura continua para o caso de dimen-são in�nita. Neste caso podemos imaginar nossos operadores como matrizesquadradas in�nitas.O produto interno do vetor jzi = M jxi com o vetor jyi vale

hyj zi = hyj�M jxi

�;

podemos eliminar o parênteses acordando que o operador sempre age no vetor adireita (o que é equivalente a acordar que o conjugado do operador age no dualdo vetor a esquerda, hyj zi = hwj xi com jwi = M+ jyi, mas basta convencionarque ele age a direita). Com isso, temos

hyj M jxi = hy j�i h� jxi = h� jyi hx j�i = hx j�i h� jyi = hxj M+ jyi (49)

80

onde usamoshy j�i = h� jyi :

O operador M acima é dito simétrico, ou hermitiano se

M = M+ ) j�i h�j = j�i h�j :

De forma geral, para qualquer operador M : H ! H podemos de�nir o seuadjunto M+ : H ! H usando (49)

M+ : hyj M jxi = hxj M+ jyi ;8x; y 2 H :

Assim, para um operador simétrico, ou hermitiano, temos

M = M+ ) hyj M jxi = hxj M jyi ; (50)

ou seja, para espaços de dimensão �nita são matrizes cuja transposto conjugadoé igual a ela mesma. Por exemplo, qualquer matriz na forma0BBB@

a11 a12 a13 � � ��a12 a22 a23 � � ��a13 �a23 a33 � � �...

......

. . .

1CCCA ; aii 2 R ; i = 1; 2; 3::

Propriedades dos operadores hermitianos:Imagine agora que você encontrou um autovetor j�i de um operador her-

mitiano M com autovalor �, ou seja,

M j�i = � j�i ;

observe que estamos usando a mesma letra apenas por conveniência, mas � 2 Cenquanto j�i 2 H.Com isso, a propriedade acima fornece

hyj M jxi = hxj M jyi =)h�j M j�i = h�j� j�i = � h� j�i = h�jM j�i = h�j� j�i = ��h� j�i :

Mash�j �i = h�j �i

com isso� h�j �i = �� h�j �i

comoh�j �i 6= 0 ; h�j �i <1,

81

temos� = ��) � 2 R :

Ou seja, todos os autovalores de um operador hermitiano são reais.Na mecânica clássica os estados de um sistema são identi�cados como pontos

no chamado espaço de fase. Ou seja, dado um ponto no espaço de fase eu sei tudosobre o sistema. Já na mecânica quântica estes estados são identi�cados comvetores no espaço de Hilbert. Ou seja, saber qual vetor representa o sistemaé saber tudo sobre ele. Além disso, observáveis (quantidade que podem sermedidas) são associadas a operadores agindo neste espaço. Um dos postuladosda MQ a�rma que os valores possíveis de se obter numa medida deste observávelsão (apenas) o autovalor do operador correspondente. Outro postulado a�rmaque este operador é hermitiano. O resultado acima mostra que esta exigência énecessária para que valores medidos sejam reais.Exemplo: Num espaço de dimensão 2 o operador

�2 =

�0 �ii 0

�:

(em MQ este é um dos operadores associados ao spin das partículas). É hermi-tiano.Vamos encontrar seus autovalores. O processo geral é o seguinte: Encontrar

um autovetor signi�ca resolver a equação

M j�i = � j�i )�M � �I

�j�i = 0 :

A quantidade M ��I é um novo operador. Para um espaço de dimensão �nita,este operador é uma nova matriz. Vamos chamar esta nova matriz de

T = M � �I

Nossa equação �caT j�i = 0

Se T é uma matriz inversível, podemos calcular T�1 e multiplicar pelos doislados da expressão acima

T�1T j�i = T�10) j�i = 0 :

Ou seja, se T é inversível, o vetor j�i é único e vale j�i = 0. Assim, M não teráautovetor. Portanto: A única forma de M ter autovetor é que T = M � �Inão tenha inversa. Para que uma matriz não tenha inversa, basta que

det T = det�M � �I

�= 0 :

Para o nosso casoM = �2

82

Logo devemos exigir que

det (�2 � I�) =����� 0 �i

i 0

�� �

�1 00 1

����� = ����� �� �ii ��

����� = 0 ;ou seja,

�2 � (�i:i) = �2 � 1 = 0 =) �2 = 1 =) � = �1 :

Vemos então que �2 tem dois autovaloes �1 = 1 e �2 = �1 e, como esperado,ambos são reais.�Suponha agora que temos dois autovetores de um operador hermitiano

M j�i = � j�i ; M j i = j i

com� 6= :

Para estes vetores podemos calcular

h j M j�i = h j� j�i = � h j�i ;h�j M j i = h�j j i = h� j i

além disso, usando (49) temos

h j M j�i = h�j M j i =) � h j �i = �h j �i = � h�j i = h�j i

onde usamos que �; 2 R. Com isso

[�� ] h�j i = 0 :

Se usarmos agora � 6= a igualdade acima implica

h�j i = 0 :

Ou seja, autovetores correspondentes a autovalores distintos são or-togonais.O resultado acima fornece uma forma prática e bastante útil de encontramos

bases ortogonais para um espaço qualquer. Bastando, para isso, encontrarmosoperadores hermitianos neste espaço.Exemplo: Voltemos a nossa matriz

�2 =

�0 �ii 0

�Sendo esta matriz hermitiana, devemos esperar que seus auto vetores sejamortogonais. Encontremos então estes autovetores. Voltando a equação de auto-valores,

(�2 � �I) j�i = 0)��� �ii ��

���1�2

�= 0

83

sabemos que � = �1. Para � = 1 temos��1 �ii �1

���1�2

�= 0) ��1 � i�2 = 0

i�1 � �2 = 0

Primeiro note que, se multiplicarmos a primeira equação por �i temos

i�1 � �2 = 0

que é idêntica a segunda equação. Assim, na verdade, temos apenas umaequação e duas incógnitas. Isso nada mais é do que uma conseqüência dofato da matriz �

�1 �ii �1

�não possuir inversa (ou ter determinante nulo). Lembre-se que construímos osvalores de � impondo esta exigência. Assim, usando a única equação que temos

i�1 � �2 = 0) i�1 = �2

Ou seja, o nosso autovetor tem a forma

j�+i =�

�1i�1

�= �1

�1i

�para qualquer valor �1 2 C. Lembre-se que, se multiplicarmos um autovetorpor uma constante ele continua sendo um autovetor (pois apontará na mesmadireção). Portanto não há nada de estranho em termos um fator arbitrário.Tudo isso está relacionado com o fato da nossa matriz não ser inversível.Isso é uma característica geral destes problemas. Para um sistema qualquer

de dimensão N , construímos seus autovalores � de um operador M exigindoque a matriz M � �I não tenha inversa. Isso faz com que, para estes valoresde �, tenhamos um sistema de N � 1 equações para N incógnitas. Com issosempre teremos uma parâmetro livre nos nossos autovetores. É aexistência deste parâmetro que nos permite normalizar nossos vetores. Ou seja,escolhemos este parâmetro de forma que nossos vetores tenham norma 1.Com isso, o autovetor associado ao autovalor 1 vale

�+ = +1 ; j�+i = �1

�1i

�:

Da mesma forma, encontramos o autovetor associado ao auto-valor � = �1�1 �ii 1

���1�2

�= 0) �1 � i�2 = 0

i�1 + �2 = 0:

Onde já sabemos que podemos usar apenas uma destas equações. Assim, usandoa segunda equação,

i�1 + �2 = 0) �i�1 = �2

84

Ou seja, o autovetor associado ao auto-valor � = �1 vale

�� = �1 ; j��i = �1

�1�i

�:

Como vimos, uma vez que �+ 6= �� devemos esperar que os vetores j��i e j�+isejam ortogonais. De fato

h�+j ��i = ��1�1 �i

�� �1

�1�i

�= j�1j2 (1� 1) = 0 :

Assim, fj�+i ; j��ig formam uma base ortogonal do nosso espaço. Podemosainda normalizar esta base fazendo

je�i =j��iph��j ��i

=1

j�1jp1 + 1

�1

�1�i

�=

1p2

�1j�1j

�1�i

�=

1p2ei��

1�i

�; � 2 R:

Ou seja, a nossa normalização também está de�nida a menos de umaconstante. Como veremos, os princípios da MQ nos permitem �xar arbitrari-amente esta constante. Escolhendo o caso mais simples � = 0 temos

je�i =1p2

�1�i

�:

Da mesma forma, podemos de�nir o vetor normalizado

je+i =1p2

�1i

�estes vetores respeitam

he+j e�i = 0 ; he+j e+i = he�j e�i = 1

e, consequentemente, formam uma base ortonormal do nosso espaço.Este resultado é geral. Para um espaço de Hilbert H de dimensão N qual-

quer, inclusive in�nito, dado um operador hermitiano M neste espaço, os auto-vetores deste operador formam uma base deste espaço. Assim, qualquer vetorj i 2 H pode ser escrito como

j i =NXk=1

ck j�ki

ondeM j�ki = �k j�ki :

85

Os resultados anteriores nos permitem também veri�car diretamente a re-lação de completeza. Calculando

je�i he�j =1

2

�1 i

���

1�i

�=1

2

�1 i�i 1

�;

je+i he+j =1

2

�1 �i

�� 1i

�=1

2

�1 �ii 1

�;

temos

je�i he�j+ je+i he+j =1

2

��1 i�i 1

�+

�1 �ii 1

��=

�1 00 1

�:

6.7 Operadores diferenciais

Recapitulando os resultados do exemplo anterior: ao resolvermos o problemade autovetores para o operador �2 2 R2 obtivemos dois vetores ortogonais numespaço de duas dimensões. Um resultado que vamos usar sem provar, pois issoconsumiria um tempo razoável, é:

Remark 25 Dado um operador hermitiano (não degenerado) num espaço deHilbert de dimensão N , este operador possui N autovetores (que, como sabemos,são ortogonais). Consequente, a coleção de todos os autovetores de um operadorhermitiano forma uma base para o espaço de dimensão arbitrária N .

Esta é uma forma bastante prática para construir bases para espaços e éexatamente o que vamos usar para construir nossas funções ortogonais.Para qualquer espaço de dimensão �nita o procedimento anterior para encon-

trar os autovetores pode ser aplicado (obviamente com uma di�culdade algébricacrescente).Mas e quando N =1? Como resolver um sistema de in�nitas equações?Primeiramente, vamos analisar melhor o tipo de operadores que podem surgir

em espaços de dimensão in�nita. Como vimos a correspondência

jfi =Xk

ck jeki ; ck = hf j eki =1

2�

Zf (x) exp (�ikx) dx

para funções L2 permite tratar a função (de�nida num intervalo contínuo), comoa seqüência discreta ck.Lembre que, uma vez de�nida uma base, podemos pensar nos operadores

como atuando, não diretamente nos vetores, mas nos elementos da base. Ouseja, para um operador D agindo em H dado pelo produto esterno

D = j�i h�j ;

e cada um destes vetores possui uma decomposição na base escolhida

j�i =Xi

�i jeii ; j�i =Xi

�i jeii

86

signi�ca que nosso operador, nesta mesma base, possui a decomposição

D =Xmn

Dmn jemi henj

ondeDmn = �m ��n :

A ação deste operador num vetor j i pode ser escrito como

j i =Xi

i jeii ) D j i =Xmn

Dmn jemi henjXi

i jeii =Xmn

Dmn n jemi :

(51)Ou seja, o novo vetor j�i = D j i tem componentes

j�i =Xi

�i jeii ; �i =Xn

Din n :

Podemos assim pensar na atuação do operador D em H como a atuação damatriz Dnm nas componentes do vetor numa determinada base ortonormal ecalcular D j i como X

n

Din n ;

que nada mais é que o produto da matriz quadrada D pela matriz coluna .Lembre que, apesar de estarmos usando a mesma letra, j i e são quanti-

dades diferentes. O vetor

j i =

0B@ x1x2...

1CArepresenta uma seqüência xk que independe da base, enquanto as componentes k dependem da base. Assim, se vamos trabalhar com o produto matricial D devemos lembrar que todas estas quantidades (diferente de xk) dependem dabase.O ponto da explicação acima é que operadores atuando em vetores

podem ser vistos, uma vez �xada uma base, como matrizes atuandonas componentes do vetor nesta base. Isso implica que:A cada operador D agindo no espaço das funções, existe uma matriz D

(in�nita) agindo no espaço das seqüências in�nitas que de�nem as componentesdo vetor jfi 2 L2. Assim como podemos tratar tanto as seqüência como asfunções, podemos trabalhar tanto com D : L2 ! L2 quanto com D : C1 ! C1dependendo da conveniência. Mais ainda, a cada operador agindo em C1, ouseja, uma matriz quadrada in�nita, corresponde um operador agindo em L2.Voltemos para a nossa base fjekig com componentes

ek (x) =1p2�exp (ikx)

87

e, para os coe�cientes ck da nosso função f de�nidos nesta base (i.e., os coe�-cientes da série de Fourie)

jfi =Xn

ck jeki ; (52)

vamos estudar a ação do seguinte operador

D =

0BBBBBBBBBB@

. . ....

......

......

. . .� � � �i:2 0 0 0 0 � � �� � � 0 �i:1 0 0 0 � � �� � � 0 0 0 0 0 � � �� � � 0 0 0 i:1 0 � � �� � � 0 0 0 0 i:2 � � �. . .

......

......

.... . .

1CCCCCCCCCCA= �mn (in) :

Ou seja, a matriz diagonal onde a k-ésima componente é a multiplicação de ipór k.Lembre-se que, pela de�nição da soma de nossos vetores em L2 o vetor jfi

(52) tem componentes

f (x) =1p2�

Xn

ck exp (ikx) :

Pelo que vimos acima, existe um operador D atuando em jfi cuja ação é oproduto da matriz acima com as suas componentes, ou seja, a aplicação desteoperador no vetor jfi fornece (51)

jfi =Xk

ck jeki =) D jfi =Xmn

Dmncn jemi

Lembrando agora que, no nosso caso,

Dmn = i�mnn

temosjgi � D jfi =

Xmn

i�mnncn jemi =Xn

incn jeni :

Ou seja, as componentes do vetor jgi = D jfi valem

g (x) =Xn

incn exp (inx) :

Mas estas componentes também podem ser escritas como

g (x) =Xn

cnd

dxexp (inx) =

d

dx

Xn

cn exp (inx) =d

dxf (x)

88

Assim, as componentes do novo vetor jgi são as derivadas das compo-nentes de jfi. Podemos então identi�car o operador D associando a matriz Dcom o operador diferencial d=dx agindo nas componentes do vetor jfi, ou ainda,como um operador diferencial

D =d

dx

agindo no espaço das funções de quadrado integrável.Da mesma forma, podemos construir operadores que correspondem à difer-

enciais de ordem mais alta. Assim, um tipo bastante especial de operadores queagem em L2 são operadores diferenciais.Cabe aqui uma observação sobre a MQ. O exposto acima nos diz que a

igualdadejfi =

Xk

ck jeki ; jfi 2 L2 (a; b) :

nos da a liberdade de trabalhar tanto no lado esquerdo, i.e., operadores difer-enciais agindo no espaço das funções, quanto no direito, i.e., matrizes agindoem seqüência contáveis. Nos primórdios da MQ havia duas teorias quânticasaparentemente independentes. A teoria de Schroedinger, baseada numa equaçãodiferencial, e a teoria de Heisenberg, baseada na álgebra de matrizes. Grossomodo, podemos dizer que estas duas teorias são as mesmas (ou equivalentes).Apenas que a teoria de Schroedinger trabalha no lado esquerdo da igualdadeacima (i.e., no espaço L2), enquanto a teoria de Heisenberg trabalha no ladoesquerdo (i.e., no espaço R1). Dizemos que é a mesma teoria utilizando umarepresentação diferente do espaço de Hilbert.Da mesma forma que em R1, se M é um operador em L2 este se relaciona

com seu adjunto pela relação (49)

hf j M jgi = hf j j�i h�j jgi = h� jfi hg j�i = hg j�i h� jfi = hgj M+ jfi ;

ou, explicitando o produto interno,

hf j M jgi =Z b

a

�f (x)hMg (x)

idx

hgj M+ jfi =Z b

a

�g (x)hM+f (x)

idx

Usando a igualdade hf j M jgi = hgj M+ jfiZ b

a

�f (x)hMg (x)

idx =

Z b

a

�g (x)hM+f (x)

idx =

Z b

a

g (x)hM+f (x)

idx =

Z b

a

hM+f (x)

ig (x) dx

(53)A relação acima de�ne o adjunto dos operadores agindo em L2.Em especial, para operadores hermitianos, temos a relação (47)

hf j M jgi = hgj M jfi :

89

que fornece Z b

a

�f (x)hMg (x)

idx =

Z b

a

hMf (x)

ig (x) dx ;

assim, dado um operador M no espaço das funções a igualdade acima permiteveri�car se este operador é (ou não) hermitiano.Exemplo: vamos veri�car se o operador

D =d

dx

agindo em L2 (a; b) é hermitiano. Para isso calculamos

hf j D jgi =Z b

a

�f (x)hDg (x)

idx =

Z b

a

�f

�dg

dx

�dx :

Usando agora uma integração por partes temosZ b

a

�f

�dg

dx

�dx =

��fg�ba�Z b

a

�d �f

dx

�g dx

Ou ainda, se observamos que �d �f

dx

�=

�df

dx

�temos Z b

a

�fhDgidx =

��fg�ba�Z b

a

hDfig dx 6=

Z b

a

hDfig dx

Ou seja, nosso operador não é simétrico em L2 (a; b).Mais ainda, para o caso de operadores de dimensão in�nita, não basta termos

a forma do operador, mas precisamos também �xar certas características nasnossas funções.Observe que, graças ao termo de fronteira

��fg�ba, devemos esperar que nen-

hum operador diferencial seja hermitiano em L2 (a; b). Entretanto, podemostentar contornar este problema. Uma vez que nosso operador não é simétricoem todo o espaço L2(a; b), podemos tentar encontrar um sub-espaço de L2 onde(talvez) ele seja simétrico. Vamos, por exemplo, de�nir o subespaço das funçõesque valem zero nas extremidades. Ou seja, nosso espaço não é todo o espaçoL2, mas:

L2 (a; b) � L02 (a; b) ��g; g0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c:

Onde estamos exigindo

1. as funções pertençam a L2 (a; b), obviamente;

90

2. a derivada das funções também pertençam a L2 (a; b). Isso é necessárioporque nosso operador é uma diferencial e, para que este seja um operadorno nosso espaço, ele deve levar funções do espaço em outras funções domesmo espaço. Ou seja, Df 2 L2 (a; b). Esta exigência deve ser ampliadaquando tratamos de operadores diferenciais de ordem mais alta.

3. as funções sejam nulas nas extremidades, f (a) = f (b) = 0. Isso énecessário (na nossa esperança de simetrizar o operador) para eliminaro termo de fronteira da integração por partes;

4. Finalmente, as funções devem ser absolutamente contínuas (a:c:). Esteé um detalhe técnico intrincado, mas podemos simpli�cá-lo dizendo que,grosso-modo, funções absolutamente contínuas são aquelas que podem serintegradas por partes. Isso certamente é válido para todas as funçõesbem comportadas que vamos trabalhar. Ou seja, esta teoria vale tambémpara funções que não sejam in�nitamente diferenciáveis e que possuemcertas descontinuidades em suas derivadas. Mas isso é muito mais do queprecisamos.

Neste espaço L02 (a; b) temosZ b

a

�fhD0g

idx = �

Z b

a

hD0f

ig dx 6=

Z b

a

hD0f

ig dx

Onde colocamos uma linha no operador para indicar que este age no espaço L0.Mas, ainda assim, nosso operador não é hermitiano.Mais ainda, podemos escrever a relação acima comoZ b

a

�fhD0g

idx =

Z b

a

h�D0f

ig dx

lembrando da relação (53) temosZ b

a

�f (x)hD0g (x)

idx =

Z b

a

hD0+f (x)

ig (x) dx

comparando as duas relações acima temos

D0+ = �D0 : (54)

Entretanto, tudo isso era de se esperar, pois se olharmos para a matriz rela-

cionada com este operado

D =

0BBBBBB@

. . ....

......

. . .� � � �i2 0 0 � � �� � � 0 0 0 � � �� � � 0 0 i2 � � �. . .

......

.... . .

1CCCCCCA91

vemos que os elementos diagonais desta matriz não são reais. Além disso, setirarmos o transposto conjudado desta matriz temos

DT =

0BBBBBB@

. . ....

......

. . .� � � i2 0 0 � � �� � � 0 0 0 � � �� � � 0 0 �i2 � � �. . .

......

.... . .

1CCCCCCA = �D

que nada mais é que a relação (54).O exemplo acima mostra que, se quisermos um operador hermitiano, deve-

mos partir de uma matriz hermitiana. Partamos então da matriz

D2 =

0BBBBBBBBBB@

. . ................. . .

� � � 2 0 0 0 0 � � �� � � 0 1 0 0 0 � � �� � � 0 0 0 0 0 � � �� � � 0 0 0 1 0 � � �� � � 0 0 0 0 2 � � �. . .

................ . .

1CCCCCCCCCCA;

que pode ser hermitiana ao agir sobre certas seqüência. Observe que

D2 = iD ;

o que, obviamente, fornece

D2 = iD = id

dx:

Vamos então calcular novamente

hf j D2 jgi =Z b

a

�f (x)hD2g (x)

idx =

Z b

a

�f

�idg

dx

�dx

Usando novamente uma integração por partes temosZ b

a

�f

�idg

dx

�dx = i

��fg�ba� iZ b

a

�d �f

dx

�g dx

Observe agora que

i

�d �f

dx

�= i

�df

dx

�= �

�idf

dx

�;

pois �{ = �i. Com isso temosZ b

a

�f

�idg

dx

�dx = i

��fg�ba+

Z b

a

�id �f

dx

�g dx

92

Novamente, para eliminarmos o termo de fronteira, de�nimos o operador D02

que atua no espaço L02 (a; b) de�nido anteriormente, com issoZ b

a

�f

�id

dxg

�dx =

Z b

a

�id

dxf

�g dx

que pode ser escrito comoZ b

a

�fhD02gidx =

Z b

a

hD02fig dx

Ou seja, o operador D02 é hermitiano.

6.8 Domínio dos operadores

Um ponto extremamente importante no que foi exposto acima é que o operadorD2, que age em L2, não é hermitiano, mas já o operador D0

2, que age em

L02 (a; b) ��g; g0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c:

é hermitiano.Certamente um operador que é hermitiano é diferente de um operador que

não é hermitiano, ou seja, D2 é diferente de D02. Assim, apesar destes dois

operadores terem a mesma forma

id

dx

ou seja, atuam da mesma maneira, eles atuam em espaços diferentes e,conseqüentemente, são operadores diferentes.O espaço de atuação de um operador é também chamado de domínio deste

operados. Indicamos o domínio de D por D�D�, ou seja

D�D02

�=�g; g0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c:

Assim:

Remark 26 Em espaços de dimensão in�nita, um operador não é apenas umaregra de atuação mas também a especi�cação do domínio onde esta atuação éválida. A mesma regra, para domínios diferentes, especi�ca operadores difer-entes.

A especi�cação deste domínio não apenas traduz as características físicas dosistema na descrição quântica, mas também in�uencia nos resultados teóricosesperados.Na prática as características do nosso operador, como ser ou não hermitiano,

depende da �xação das condições de fronteira do problema. Além disso, para ocaso de funções com singularidades, depende da especi�cação do comportamentodestas funções nas fronteiras dos pontos de singularidade.Além disso, como veremos no futuro, estas condições de fronteira estão di-

retamente ligadas com propriedades físicas do sistema.

93

6.9 Operadores auto-adjuntos

Voltemos nossa atenção agora para o operador adjunto. Ou seja, qual o domíniodo operador adjunto D+

2 para que D2 seja hermitiano?Como vimos, o adjunto de um operador M pode ser de�nido pela expressão

(53)Z b

a

hM+f (x)

ig (x) dx �

Z b

a

�f (x)hMg (x)

idx ; 8g 2 D

�M�; f 2 D

�M+

�;

onde devemos notar que o operador M agem em g, i.e., g 2 D�M�, enquanto

o operador M+ age em f , i.e., f 2 D�M+

�. A pergunta acima pode ser

formulada da seguinte forma: Uma vez �xado um domínio D(M) no qual M ésimétrico, qual o domínio de M+ que não quebra esta simetria?Para o nosso operador D0

2 sabemos que

D�D02

�=�g; g0 2 L2 (a; b) ; g (a) = g (b) = 0; a:c:

: (55)

E quais podem ser as funções f para que a relaçãoZ b

a

�fhD02gidx =

Z b

a

hD02fig dx =

Z b

a

hD0+2 fig dx

se mantenha (lembrando que D02 no lado direito da igualdade é, na verdade, o

adjunto de D02). Voltemos para a forma completa da integral por partesZ b

a

�fhD02gidx = i

��fg�ba+

Z b

a

hD02fig dx

=

Z b

a

hD02fig dx+ i

��f (b) g (b)� f (a) g (a)

�Para que nosso operador seja simétrico, basta que o último termo se anule.Então, a nossa pergunta se torna:

� quais podem ser as funções f para que o último termo se anule?

Lembrando que, pela de�nição do domínio (55) de D02Z b

a

�fhD02gidx =

Z b

a

hD02fig dx+ i

��f (b) :0� �f (a) :0

�=

Z b

a

hD02fig dx ;

para qualquer valor �nito de �f (b) e �f (a) e, consequentemente, para qualquervalor de f (b) e f (a). Ou seja, as funções f onde age D+

2 não precisam seanular nas fronteiras. Ou ainda, além de serem L2 não precisamos colocarmais nenhuma restrição nestas funções. Assim, o domínio de D+0

2 , paraque D2 seja hermitiano vale

D�D+02

�=�f; f 0 2 L2 (a; b) ; a:c:

:

94

Vemos explicitamente que

D�D+02

�6= D

�D02

�;

ou seja, apesar de terem a mesma forma

D02 = i

d

dx; D+0

2 = id

dx

(pois o operador é simétrico) os operadores D02 e D

+02 são operadores difer-

entes. Este ponto pode parecer uma tecnicalidade, mas será importante nofuturo.No procedimento acima, partimos de um operador D2 que não é hermi-

tiano e de�nimos um novo operador D02 (que tem a mesma forma de D2, mas

atua num espaço diferente) que é, fazendo uma restrição no domínio de D2. Feitoisso, podemos obter o domínio do adjunto D+0

2 que não quebre esta simetria.Além disso, como veremos no futuro, a especi�cação do domínio do operador

(ou das condições de fronteira) é como introduzimos as características físicas donosso problema na descrição quântica.Operadores hermitianos M para os quais

D�M�= D

�M+

�são chamados de operadores auto-adjuntos. Ou seja, todo operador auto-adjuntoé hermitiano, mas o contrário não é verdade.

6.10 Operadores lineares

Como vimos, um tipo de operador que age em nosso espaço L2 são operadoresdiferenciais. Da forma mais geral possível, um operador diferencial linear,agindo no espaço das funções de quadrado integrável tem a forma tem a forma

L = a0 (x) + a1 (x)d

dx+ a2 (x)

d2

dx2+ :::

=mXn=0

an (x)dn

dxn(56)

onde m é chamado a ordem do operador. Estes operadores são lineares

L (c1 1 + c2 2) = c1L 1 + c2L 2 ; c1; c2 2 C

se exigirmos que L i 2 L2.Obviamente nem todas as funções em L2 possuem sua derivada de ordem m

em L2, além disso, como vimos no exemplo anterior, condições de contorno (ouconsiderações físicas) podem impor certas restrições nas funções nas fronteiras,i.e., �xar o valor de (a) e (b). Assim, geralmente, um operador não atua emtodo L2, mas sim num subconjunto D (L) � L2.

95

Remark 27 Para especi�carmos um operador L devemos sempre informar suaexpressão diferencial (56) e seu domínio de atuação.

Uma equação diferencia linear tem a forma

L = f (x) :

O caso com f � 0 é chamado de equação homogênea.Pela condição de linearidade, vemos que, se 1 e 2 são soluções da equação

homogênea para o operador L então qualquer combinação c1 1+ c2 2 tambémserá solução da equação homogênea de L. De forma mais geral, uma combinaçãoarbitrária de soluções da equação homogênea também é uma solução. Este é oprincípio da superposição.O hermitiano conjugado de um operador L, chamado de L+, é de�nido

através do produto interno e através da expressão (??)

h 2j L+ j 1i = h 1j L j 2i ;

ou seja, dado um operador L de�nimos o seu conjugado pela expressãoZ b

a

[L+ 1 (x)] 2 (x) dx �Z b

a

�1 (x)hL 2 (x)

idx :

Exemplo: Se

L =d

dx

e D (L) são as funções 2 L2 (a; b) com 0 2 L2 e (a) = (b) = 0 encontreL+. Este é o mesmo exemplo que resolvemos acima. Pela de�nição temos

h 1j L j 2i =Z b

a

�1 (x)hL 2 (x)

idx =

Z b

a

�1 (x)

�d

dx 2 (x)

�dx

se nossas funções são absolutamente contínuas, i.e., podem ser integradas porpartes, temosZ b

a

�1 (x)

�d

dx 2 (x)

�dx = [ �1 (x) 2 (x)]

ba �

Z b

a

�d

dx �1 (x)

�[ 2 (x)] dx

=

Z b

a

�� d

dx 1 (x)

��[ 2 (x)] dx =

Z b

a

hL+ 1 (x)

i 2 (x) dx

assim

L+ = � d

dx

Esta é a forma diferencial de L+. Para de�nirmos completamente este operadorprecisamos ainda especi�car D (L+).Exemplo: O operador

L = c ; c 2 C

96

Novamente

h 2j L+ j 1i =Z b

a

hL+ 1 (x)

i 2 (x) dx � h 1j L j 2i

=

Z b

a

� 1 (x) [c 2 (x)] dx

=

Z b

a

[c� 1 (x)] 2 (x) dx

=

Z b

a

hL+ 1 (x)

i 2 (x) dx ;

assimL+ = c� :

A princípio o domínio de L+ pode ser todos o espaço L2 (e, é claro, a restriçãoL+ 2 L2). Entretanto, podemos impor certas característica no operador L(e.g., hermiticidade) que, para serem mantidas, restringem também o domíniode L+.Exemplo: Como vimos anteriormente, o operador

L = id

dx; D

�L�=� ; 0 2 L2 (a; b) ; (a) = (b) = 0; a:c:

é hermitiano, mas não é auto-adjunto. Pois

D�L+�=�f; f 0 2 L2 (a; b) ; a:c:

6= D

�L�:

Vamos agora de�nir o operador

Lc = id

dx; D

�Lc

�=� ; 0 2 L2 (a; b) ; a:c: ; (a) = c (b)

; c 2 C

Usando o procedimento usual temos

h 1j Lc 2E= [ �1 (x) 2 (x)]

ba +

DL 1

��� 2i= �1 (b) 2 (b)� �1 (a) 2 (a) +

DL 1

��� 2i= [ �1 (b)� c �1 (a)] 2 (b) +

DL 1

��� 2i6=DLc 1

��� 2iPara tentar simetrizar este operador, vamos tentar de�nir o domínio de D

�L+�

como

D�L+c

�=� ; 0 2 L2 (a; b) ; a:c: ; (a) = c (b)

= D

�L�

97

com isso,

h 1j L 2E= [ �1 (b)� c �1 (a)] 2 (b) +

DL 1

��� 2i= [ �1 (b)� cc� �1 (b)] 2 (b) +

DL 1

��� 2i= [1� cc�] �1 (b) 2 (b) +

DL 1

��� 2i=h1� jcj2

i �1 (b) 2 (b) +

DL 1

��� 2iVemos então que nosso operador será simétrico se (e somente se)

jcj2 = 1 =) c = ei� ; � 2 R :

ou seja, se de�nirmos o operador

L� = id

dx; D

�L�

�=� ; 0 2 L2 (a; b) ; a:c: ; (a) = ei� (b)

; � 2 R :

Assim, o novo operador L�, diferente de L, é um operador auto-adjunto.

A fase �, apesar de não possuir um análogo clássico (i.e., não é possívelespeci�car esta fase apenas olhando o sistema clássico), pode in�uenciar nosresultados esperados (e.g., níveis de energia) para certos potenciais. Assim,para estes potenciais esta fase pode ser determinada experimentalmente atravésda medido do espectro de energia do sistema.

Dos exemplos acima vemos que, no primeiro caso o D�L+�é maior que

o D�L�, D

�L+�� D

�L�, enquanto no segundo caso D

�L+�= D

�L�. É

possível provar que D�L�� D

�L+�, i.e., o domínio de L nunca é maior que

o domínio de L+. O que �zemos no segundo exemplo foi restringir o domínio

de L+, que chamamos de D�L+�

�. Obviamente D

�L+��� D (L+). Assim,

se D (L+) 6= D (L), como no primeiro exemplo, as vezes (mais nem sempre)é possível reduzir o domínio do adjunto de forma que o novo operador sejaauto-adjunto.Vemos assim que todo operador auto-adjunto é, por de�nição, hermitiano,

mas o contrário não é verdade. Esta diferença, que a primeira vista pareceuma tecnicalidade, possui importantes conseqüências tanto matemáticas quantofísicas.

7 Postulados da Mecânica Quântica

A MQ pode ser construída através de algumas regras ou postulados. Como umprimeiro postulado temos:

98

Remark 28 O estado de um sistema físico é completamente descrito por umvetor (normalizado) no espaço de Hilbert

j i 2 H :

E vetores que di�ram apenas por uma fase representam o mesmo estado físico.Sabendo-se agora qual vetor representa o sistema, sabemos todas as caracterís-ticas físicas deste sistema.

Neste momento não podemos falar muito sobre este postulado, mas voltare-mos a isso no futuro. Contudo, precisamos começar por ele uma vez que todo odesenvolvimento depende desta associação.Uma vez preparado um sistema no laboratório, este sistema �será�um vetor

no espaço de Hilbert. Precisamos agora saber como descrever (dentro da teoria)a manipulação, a evolução temporal e as possíveis medidas que fazemosneste sistema.Quando um sistema no estado j i sofre qualquer tipo de modi�cação ele

passa a ser descrito por um novo vetor j 0i. Ou seja (qualquer) modi�caçõesno sistema são transições

j i ! j 0i

Estas transições podem ser descritas por operadores agindo em H,

j 0i = M j i

Assim, tudo que acontece com o sistema pode ser representado porum operador agindo em H.Um tipo muito especial destes operadores são exatamente as medidas que

podemos fazer no sistema (e.g., sua energia), ou seja, tudo o que podemosobservar do sistema. Estas quantidades são chamadas de observáveis.Outro postulado da MQ a�rma que :

Remark 29 A todas quantidades clássicas mensuráveis (e.g., H) estão associ-ados operadores auto-adjuntos (H) agindo nos vetores de H: H �! H .

Para sistemas de dimensão �nita podemos de�nir os observáveiscomo operadores hermitianos. Assim, na maior parte do que segue penseneste observáveis como matrizes simétricas.Para entendermos melhor este postulado, precisamos ainda de um terceiro

postulado.(Valores são auto-valores)Se M é um operador (hermitiano) relacionado com um observável m (i.e.,

m é o valor que o aparelho que mede esta quantidade pode marcar), e se nolaboratório efetuarmos uma medida deste observável os únicos valores pos-síveis de se obter são os auto-valores do operador M (ou seja, o valor mmarcado no aparelho é necessáriamente um autovalor de M). Ou seja:

99

Remark 30 Uma medida do observável M pode fornecer apenas autovaloresdeste operador e, logo após uma medida em que se obteve o valor mn o sistemaestará no estado j ni.

Assim, se H é o operador que representa a energia do sistema, sabemos queeste operador possui uma série de auto-vetores e auto-valores.

H j ni = En j ni

O que o postulado acima sobre os autovalores nos diz é que, numa medida daenergia do sistema, podemos obter apenas um dos valores En acima.

7.1 Interpretação probabilística

Problem 31 Mas qual é a física por trás de toda esta descrição matemática?

Esta física está descrita pela chamada interpretação probabilística. A quala�rma que:Se um sistema se encontra num determinado estado, dado por um vetor j i,

a probabilidade de que este sistema seja encontrado num estado j�i é dado por:

jh�j ij2 =( PN

i=1��i i ; j�i ; j i 2 RNR b

a�� (x) (x) dx ; j�i ; j i 2 L2 (a; b)

:

Problem 32 Mas o que signi�ca o sistema estar num estado e ser encontradoem outro?

Este é o ponto principal de tudo que �zemos até aqui e a maior diferençaentre a teoria clássica e quântica. Lembre-se que um operador hermitiano Hpossui um conjunto de autovetores e autovalores reais

H j ni = En j ni ; En 2 R :

Além disso, o conjunto de seus auto-vetores formam uma base doespaço H. Isso signi�ca que qualquer vetor j i pode ser escrito como

j i =NXi=1

cn j ni ; cn 2 C :

Podemos também fazer a a�rmação inversa e dizer que a todo vetor temosassociado um estado físico. Assim, por exemplo, imagine que o sistema estánum estado j i cuja decomposição é dada por

j i = c1 j 1i+ c2 j 2i

Este é um vetor especí�co e algum estado especí�co do sistema.

100

Problem 33 Qual a energia deste estado?

Pelo postulado sobre a medida e os autovalores, sabemos que, numa medidada energia do sistema, podemos obter apenas os valores En. Isso é geral. Parasabermos o que iremos obter numa medida do estado j i acima, lembramosque, logo após uma medida, o sistema se encontra no auto-estadodo auto-valor correspondente. Assim, podemos fazer a pergunta: qual aprobabilidade P (E1) de, numa medida da energia, obtermos o valor E1. Nestecaso, logo após a medida, o sistema se encontrará no estado (observe que amedida modi�cou o sistema9) j 1i. Assim, pela interpretação probabilística, aresposta a nossa pergunta vale:

P (E1) = jh 1j ij2 :

Para cálcular efetivamente este valor, lembramos que os auto-estados de umoperador hermitiano são ortogonais (i.e., eles formam uma base ortonormal)

h 1j i = h 1j (c1 j 1i+ c2 j 2i)= c1

e a quantidade procurada vale

P (E1) = jh 1j ij2 = jc1j2 :

Assim, o módulo quadrado do coe�ciente da expansão de um vetor numacerta base de um observável é a probabilidade de se obter o autovalor corre-spondente na medida deste observável.Da mesma forma a quantidade���h 2j A j 1i���2 (57)

(i.e., o módulo quadrado do produto interno de dois vetores no espaço deHilbert), deve ser interpretado como a probabilidade de um sistema que seencontrava inicialmente no estado j 1i, mudar para o estado �nal j 1i após aação do operador A.

Remark 34 Um ponto importante é que esta descrição probabilística não éuma ignorância nossa sobre o sistema (como ocorre na teoria clássica),mas uma característica intrínseca do sistema. Por exemplo, classica-mente você pode produzir uma partícula e, por uma ignorância no processo deconstrução, você não sabe exatamente qual a energia desta partícula. Assim,usando uma certa descrição clássica (por exemplo, usando o ferramental damecânica estatística) você é capaz de fazer uma previsão desta energia e calcu-lar qual a probabilidade da partícula ter energia E1. Mas então você faz uma

9Dizemos assim que o sistema que estava numa superposição de ondas (ou num pacote deondas) colapsou para uma das ondas do pacote. Este efeito é chamado de colapso da funçãode onda.

101

medida da energia e obtém (porque é tudo uma probabilidade) uma energia E2.Suponha agora que você seja capaz de produzir com este mesmo equipamento,exatamente sobre as mesmas condições (o que é possível em teoria), umasegunda partícula idêntica a primeira (ou você construiu dois equipamentosexatamente iguais). Neste caso, dentro das condições ideais colocadas, pelo re-sultado da primeira partícula você sabe que, para esta segunda, P (E1) = 0 eque, numa medida da energia, você obterá certamente o valor E2. Quantica-mente isso não é necessariamente verdade. Se você produzir duas partículasidênticas no estado j i acima (e isso é possível!) e efetuar uma medida daenergia destas duas partículas você poderá obter valores diferentes com probabil-idade P (E1) = jc1j2 e P (E2) = jc2j2.

Remark 35 Outro ponto a se notar é que sob certas condições (como vimosno átomo de Bohr) observáveis como energia podem assumir apenas valoresdiscretos. Não existe nenhum análogo clássico para este comportamento.

7.2 Conseqüências físicas do primeiro postulado

Pela de�nição de probabilidade, sabemos que se P (E1) e a probabilidade denuma medida do observável obtermos o valor E1 e P (E2) de se obter o valorE2. Então a probabilidade de se obter E1 ou E2 vale

P (E1jE2) = P (E1) + P (E2) :

Assim, a quantidadeNXi=1

jcnj2 ;

é a probabilidade de se obter qualquer valor possível, ou ainda a probabilidadedo sistema ser encontrado em um estado qualquer, conseqüentemente,

NXi=1

jcnj2 = 1 :

Que, como você deve se lembrar, signi�ca que as própria seqüências cn pos-síveis formam um espaço de Hilbert.Outra forma de dizer a mesma coisa acima é exigir que o estado esteja

normalizadojh j ij2 = 1 :

Que pode ser lida como: se sabemos que o sistema está no estado j i a probabil-idade dele ser encontrado neste estado é 100%. Observe que, para todo estadoquântico

jh j ij2 <1 =) j i 2 H :

e além dissojh j ij2 = 1 (normalizado):

102

Além disso, se de�nirmos uma novo estado

j 0i = ei� j i

que di�ra apenas por uma fase temos

jh 0j ij2 =��h j ei� i��2 = ��ei���2 = 1

Ou seja, este estado apresenta a mesma probabilidade (i.e., a mesma carac-terística física) de j i (no futuro veremos que estes estados são �sicamenteindistinguiveis). Vemos então como a interpretação probabilística se relacionacom o primeiro postulado.Além disso, vemos que o processo de normalização, que antes possuía uma

utilidade técnica bastante conveniente na de�nição das bases de H, agora estárelacionado como a interpretação probabilística da MQ. Ou seja, para usarmosa interpretação probabilística obrigatoriamente devemos exigir quenossos vetores estejam normalizados.Um ponto importante é observar que a fase referida acima deve ser global.

Como vimos, na descrição quântica um sistema pode estar numa superposiçãode dois estados

j i = a j 1i+ b j 2i ;o estado acima é equivalente ao estado

j 0i = ei� [a j 1i+ b j 2i] ;

mas não é equivalente ao estado

j 00i = ei�a j 1i+ b j 2i :

A fase não-global presente no estado j 00i gera fenômenos de interferênciaque permitem (�sicamente) distinguir este estado de j i.Podemos ver também o signi�cado físico da ortogonalidade dos auto-estados

de um operador hermitiano. Ou seja, se após uma medida obtivermos o valorE2 o sistema estará no estado j 2i a probabilidade de, logo após esta medida,o sistema ser encontrado no estado j 3i deve ser nulo

h 3 j 2i = 0 :

E o fato destes vetores j ni formarem uma base signi�ca que nosso sistemapode, em princípio assumir qualquer valor do observável, com uma certa prob-abilidade jcnj2.Além disso, o fato de operadores hermitianos terem apenas autovalores reais

está relacionado com medidas nos darem apenas valores reais.

7.3 Valor esperado

Dada uma in�nidade de cópias idênticas do sistema, podemos nos perguntarsobre o valor médio de algum observável. Ou seja, pegamos uma in�nidade

103

de exemplares desta coleção de sistema, efetuamos em cada um a medida deum certo observável M e tiramos a média deste valor para obter hMi. Estaquantidade é também chamada de valor esperado do observável.Classicamente, se cada exemplar do nosso sistema tem uma probabilidade

Pi de que o observável M forneça o valor mi, esta média pode ser calculadacomo

hMi =Xi

Pimi

somado para todos os valore mi possíveis do observável M . No caso de m seruma variável contínua, temos

hMi =ZmP (m) dm

onde P (m) dm é a probabilidade do sistema ter o valor medido entre m em+ dm.O próximo postulado da MQ a�rma que, se o sistema está no estado j i, o

valor esperado do observável M é dado por

hMi = h j M j i : (58)

Esta expressão está diretamente relacionada a noção clássica de média. SendoM um observável, podemos escrever:

j i =Xi

ci j ii

ondeM j ii = mi j ii

Substituindo em (58) temos

h j M j i =

24Xj

h j j �cj

35 M "Xi

ci j ii#=Xj

Xi

�cjci h j j M j ii

=Xj

Xi

�cjci h j jmi j ii =Xj

Xi

mi�cjci�ij

=Xi

jcij2mi =Xi

Pimi ;

onde usamos que jcij2 é a probabilidade de se obter o valor mi numa medida deM .Um ponto importante deste postulado está no fato de geralmente, em exper-

iências, não estamos tratando apenas com uma entidade, mas sim uma coleçãodestas entidades. Por exemplo, uma corrente de elétrons, um feixe de laser(vários fótons), ou um feixe de partículas. Assim, o que nossos aparelhos reg-istram pode não ser o valor possível do observável, mas sim uma média destes

104

valores. Com isso, o valor esperado de um observável quântico está diretamenterelacionado com o limite clássico no valor deste observável. Ou seja, se temosum feixe de partículas (e.g., elétron) no estado

j i = c1 j 1i+ c2 j 2i

ondeH j ii = Ei j ii

são autoestados da energia, se medirmos a energia do feixe (não de um únicoelétron) nosso aparelho clássico mostrará o valor

E = hHi = h j H j i = E1 jc1j2 + E2 jc2j2 :

O ponto descrito acima é apenas um exemplo de uma característica maisgeral da teoria quântica de, sob certas circunstâncias, o valor esperado repro-duz os mesmo resultados da teoria clássica. Por exemplo, para um grandenúmero de partículas, ou para altas energias. Este é o chamado Princípioda Correspondência. Este princípio, que na velha MQ foi usado apenas paratestar certas teorias e estabelecer um link entre as previsões da teoria e os fenô-menos observados em laboratório, será de importância crucial no processo dequantização de sistemas com in�nitos graus de liberdade.

8 Quantização canônica

O ponto, obviamente crucial, que ainda não foi respondido é: como encontrar ooperador M que corresponde à quantidade clássica M . Um procedimento qual-quer que permite associar quantidades clássicas a operadores (ou quantidadesquânticas) é chamado de quantização.O procedimento mais geral e e�ciente de quantização foi proposto por Dirac.

Este processo parte da descrição hamiltoniana do sistema clássico e, por isso,é chamado de quantização canônica. Este processo está relacionado com aseguinte conseqüência do Princípio da correspondência:

Remark 36 A dinâmica da médias dos operadores (e.g., h j M j i) deve cor-responder evolução temporal da respectiva quantidade clássica M (t).

De outra forma, a pergunta a ser respondida pelo processo de quantizaçãoé como agem os operadores. Isto é, H j i = j?i. Para responder esta pergunta,voltamos à mecânica clássica. Na mecânica clássica, um elemento crucial parase descrever a dinâmica dos sistemas são os parênteses de Poisson

ff; gg = @f

@x

@g

@p� @f

@p

@g

@x:

Dirac mostrou que, para se respeitar a condição acima (o princípio da corre-spondência), basta exigir que para dois observáveis f e g tenhamos

ff; gg �! � i~

hf ; gi;hf ; gi= f g � gf : (59)

105

Em outras palavras, se os operadores f e g respeitarem a relações acima,

chamada relações canônica de comutação, o princípio da correspondência estágarantido. Por incrível que pareça, isto é tudo que precisamos!Diferente do processo de quantização de Sommerfeld, ou mesmo o de Schroedinger

(i.e., a equação de Schroedinger) este processo permite obter não apenas certascaracterísticas do sistema (e.g., posição e energia), mas como descrever quantica-mente praticamente qualquer quantidade classicamente observável. Além disso,podemos com este método introduzir novas características no nosso sistema.

8.1 Evolução temporal

Uma das principais características de uma teoria (clássica ou quântica) é fazerprevisões. Ou seja, informar como as quantidades evoluem no tempo. Comovimos, tudo que ocorre em MQ é descrito pela ação de um operador. Isso nãoseria diferente com a dinâmica dos sistemas. Precisamos então determinar qualé o operador de evolução temporal na MQ.

Remark 37 Um ponto a se salientar é que, diferente dos demais observáveis,o tempo não é um operador em MQ. Esta quantidade é utilizada apenas paraparametrizar os estados do sistema.

Da mesma forma que a dinâmica dos sistemas eram descritos por trajetóriasno espaço de fase, em MQ esta dinâmica é dada pela mudança do vetor quedescreve o sistema em H. Ou seja, é uma trajetória no espaço de Hilbert.Assim, a dinâmica do sistema (sua evolução temporal) também é descrita porum operador. Ou seja, se um sistema está no estado j 0i no tempo t0 seu estadonum tempo posterior t será

j ti = U (t; t0) j 0i :

A primeira exigência sobre o operador U é que este seja unitário

U (t)U+ (t) = I ; para todo t ; (60)

onde I é o operador identidade em H. Dizemos que na MQ toda evolução éunitária.

Remark 38 Assim, a MQ lida apenas com sistemas conservativos e reversíveis.

O requerimento acima está relacionado com a interpretação probabilística(conservação da probabilidade)

h t j ti = h 0jU+ (t; t0)U (t; t0) j 0i = h 0 j 0i :

Além disso, exigimos que

U (t2; t0) = U (t2; t1)U (t1; t0) ; t2 = t1 = t0 e U (t0; t0) = I : (61)

106

Supondo que U é um operador contínuo com relação ao parâmetro t, podemosescrever para uma evolução in�nitesimal dt,

U (t+ dt; t) = 1 + T dt :

onde T = T (t) é um novo operador, que precisamos determinar, cuja forma éconhecida no instante t.A condição de U ser unitário (60)�

1 + T dt��1 + T dt

�+= 1 ;

implica que T é anti-unitário (até ordem de (dt)2),

T+ = �T :

Da lei de composição (61) temos

U (t+ dt; t0) = U (t+ dt; t)U (t; t0) =�1 + T dt

�U (t; t0)

U (t+ dt; t0)� U (t; t0)dt

= TU (t; t0) =)dU

dt= TU : (62)

Tudo que precisamos agora é achar T . Para isso, mais uma vez, invocamos oprincípio da correspondência e a relação (59). Ou seja, estudamos a evoluçãotemporal da média de um observável qualquer A (que é uma função em R2 enão e um vetor em H). Pelo postulado dos valores médios temos

h (t)j A j (t)i = h 0jU+AU j 0i ;

e a evolução temporal deste valor é dada por

d

dth 0jU+AU j 0i = h 0j _U+AU + U+A _U j 0i

= h 0j�TU�+

AU + U+A�TU�j 0i :

Usando a anti-initariedade de T

d

dth 0jU+AU j 0i = h 0j

��U+T AU + U+ATU

�j 0i

= �h 0jU+T AU � U+ATU j 0i= �h 0j TU+AU � U+AUT j 0i

= �h 0j�T A (t)� A (t) T

�j 0i

= h 0j�hA (t) ; T

i�j 0i :

ondeA (t) = U+AU

107

(A (t) é um operador na representação de Heisenberg). Ou seja, o valor médiode qualquer operador A evolui no tempo como

d

dtA (t) =

hA (t) ; T

i: (63)

Agora, na mecânica clássica sabemos que a evolução temporal de uma funçãoA (t) no espaço de fase pode ser escrita como

dA

dt= fA;Hg :

Assim, usando (63) e (62), invocando novamente a relação (59), temos

dA

dt= fA;Hg ! � i

~

hA; H

i=hA; T

i=) T = � i

~H ;

com isso

dU

dt= TU =) dU

dt= � i

~HU : (64)

Diferente do que ocorre para funções ordinárias a solução da equação difer-encial acima para um operador não é, em geral, uma simples exponencial. Poisa identi�cação

ea = limN!1

�1� a

N

�N=

1Xn=0

an

n!;

depende de uma reorganização dos elementos da somatória que, por sua vez,depende da comutação destes elementos. Entretanto, para o caso geral, podemoster h

H (t1) ; H (t2)i6= 0 :

Por exemplo, num sistema com dois níveis de energia, pode ocorrer que

H (t1) = �3 =

�1 00 �1

�; H (t2) = �1 =

�0 11 0

�:

com isso,hH (t1) ; H (t2)

i=

�1 00 �1

��0 11 0

���0 11 0

��1 00 �1

�=

�0 2�2 0

�No futuro veremos alguns exemplos físicos deste caso.Podemos escrever a solução formal do nosso problema (64) na forma

U (t; t0) = 1�i

~

Z t

t0

H (�)U (�; t0) d� ; (65)

108

pois, com isso,

dU (t; t0)

dt=

d

dt

�1� i

~

Z t

t0

H (�)U (�; t0) d�

�= � d

dt

i

~

Z t

t0

H (�)U (�; t0) d�

Usando o teorema fundamental do cálculo

@

@b

Z b

a

f (x) dx = f (b) ;

temos

� d

dt

Z t

t0

H (�)U (�; t0) d� = �i

~H (t)U (t; t0)

e, com isso,dU (t; t0)

dt= � i

~H (t)U (t; t0) :

A expressão (65) é uma solução do nosso problema. Entretanto, dizemos queesta solução é formal porque ela não nos dá um resultado que possa ser efetiva-mente aplicado nos vetores de H, uma vez que estamos escrevendo o operadorU em função deste mesmo operador. Entretanto podemos obter uma expressãomelhor iterando esta de�nição:

U (t; t0) = 1�i

~

Z t

0

H (�)U (�; t0) d�

= 1� i

~

Z t

t0

H (�)

�1� i

~

Z �

t0

H (�1)U (�1; t0) d�1

�d�

= 1� i

~

Z t

t0

H (�)

�1� i

~

Z �

t0

H (�1)

�1� i

~

Z �1

t0

H (�2)U (�2; t0) d�2

�d�1

�d�

...

Podemos agora abrir o produto e reorganizar os temos na ordem

U (t; t0) = 1 +

�� i~

�Z t

t0

H (�) d� +

�� i~

�2 Z t

t0

Z �

t0

H (�) H (�1) d�1 d�

...

+

�� i~

�n Z t

t0

Z �

t0

:::

Z �n�1

t0

H (�) H (�1) :::H (�n�1) d�n�1:::d�1 d�

...

Onde, pela expressão original, �ca claro que na expressão acima t0 � �n�1::: ��2 � �1 � � � t.

109

Assim, nosso operador temporal pode ser calculado como

U (t; t0) =

1Xn=0

�� i~

�n Z t

t0

Z �

t0

:::

Z �n�1

t0

H (�) H (�1) :::H (�n�1) d�n�1:::d�1 d�

(66)A expressão acima pode ser colocada numa forma mais simples mudando

todos os integrandos para o mesmo limite. Suponha que o hamiltoniano comuteem tempos diferentes. Com isso é fácil ver queZ t

t0

Z �

t0

H (�) H (� 0) d� 0 d� =1

2

Z t

t0

Z t

t0

H (�) H (�1) d�1 d� ; (H comuta)

Pois se antes a região de integração era um triângulo agora é um quadrado (i.e.,estamos contando a área 2 vezes e o integrando envolve o produto do mesmooperador).De forma geral temosZ t

t0

Z �

t0

:::

Z �n�1

t0

H (�) H (�1) :::H (�n�1) d�n�1:::d�1 d�

=1

n!

Z t

t0

Z t

t0

:::

Z t

t0

H (�) H (�1) :::H (�n�1) d�n�1:::d�1 d� (H comuta)

Entretanto a restrição natural de ordenamento temporal presente na sérieoriginal através dos limites de integração não existe mais. Assim, para o casoem que o hamiltoniano não comuta em instantes diferentes (i.e., quando estaordem é importante) precisamos explicitar que a ordem temporal t0 � �1 ��2::: � �n�1 � � � t deve ser mantida. Para fazer isso usamos o símbolo T ,

110

chamado de operador de ordenamento temporalZ t

t0

Z �

t0

:::

Z �n�1

t0

H (�) H (�1) :::H (�n�1) d�n�1:::d�1 d�

=1

n!

Z t

t0

Z t

t0

:::

Z t

t0

ThH (�) H (�1) :::H (�n�1)

id�n�1:::d�1 d�

Esta simbologia indica que (assim como acontece no lado esquerdo da expressão)os termos dentro do sinal de integral devem ser colocados em ordem crescentedo tempo.Com isso, nosso operador de evolução temporal pode ser escrito como

U (t; t0) = T exp�� i~

Z t

t0

H (�) d�

��

1Xn=0

1

n!

�� i~

�n Z t

t0

Z t

t0

:::

Z t

t0

ThH (�) H (�1) :::H (�n�1)

id�n�1:::d�1 d�

(67)

Obviamente tanto a expressão (66) quanto (67) podem ser usadas para sedeterminar a evolução temporal do sistema.O cálculo da série acima é, em geral, um problema extremamente compli-

cado que, na verdade, não pode ser resolvido na maior parte dos casos. Mas,felizmente, nem todos os problemas são tão complicados assim.Para o caso mais simples em que o hamiltoniano comuta em diferentes in-

stantes hH (t1) ; H (t2)

i= 0 ;

podemos esquecer completamente o ordenamento temporal e simplesmente re-organizar a série e escrever

T exp�� i~

Z t

t0

H (�) d�

�! exp

�� i~

Z t

t0

H (�) d�

�;

ou seja, usando (67) sem o operador T ,

exp

�� i~

Z t

t0

H (�) d�

�=1

n!

Z t

t0

Z t

t0

:::

Z t

t0

H (�) :H (�1) ::H (�n�1) d�n�1:::d�1 d� :

=1Xn=0

1

n!

�� i~

�n Z t

t0

H (�) d�

Z t

t0

H (�1) d�1:::

Z t

t0

H (�n�1) d�n�1

=1Xn=0

1

n!

�� i~

�n �Z t

t0

H (�) d�

�n;

ou seja, neste caso

U (t) = exp

�� i~

Z t

0

H (�) d�

�=

1Xn=0

�� i~

�n �Z t

0

H (�) d�

�n: (68)

111

Além disso, para o caso ainda mais simples onde o hamiltoniano não de-pende do tempo temos

U (t) = exp

�� i~

Z t

0

H d�

�= exp

�� i~H

Z t

0

d�

�= exp

�� i~Ht

�=

1Xn=0

�� i~t

�nHn :

O caso mais complicado onde o hamiltoniano não comuta para diferentesinstantes geralmente não pode ser resolvido exatamente e exige o auxílio detécnicas aproximativas (e.g., teoria da perturbação). Assim, nesta primeiraparte do curso vamos trabalhar apenas com o caso onde o hamiltoniano comutapara diferentes instantes do tempo.Da expressão (68) vemos porque é tão conveniente expandir as soluções em

autovetores do Hamiltonio (estados de energia bem de�nido). Pois a evoluçãode um dado estado j 0i

j ti = exp�� i~Ht

�j 0i

envolve a exponencial de um operador. Uma quantidade, em geral, extrema-mente difícil de se calcular (quando possível!). Agora se j ni são os autovetoresde H com autovalores �n, sempre podemos escrever

H j ni = En j ni =) j 0i =Xn

cn j ni ;

com isso, para o caso de H independente do tempo,

j ti =Xn

exp

�� i~H t

�cn j ni =

Xn

cn (t) j ni ;

cn (t) = cn exp

�� i~En t

�:

Onde a expressão acima envolve apenas números (não mais operadores).(Unitáriedade dos coe�cientes)A unitáriedade do operador de evolução temporal garante que para qualquer

observável A, se

j 0i =Xn

an j�ni ; A j�ni = an j�ni ;

então Xn

jan (t)j2 =Xn

janj2 = 1 ;

apesar de, em geral, jan (t)j2 6= janj2.Assim, expandindo a nossa função na base de autovetores do hamiltoniano

podemos introduzir toda a evolução temporal do sistema nos coe�cientes daexpanção.

112

8.2 Resumo

As regras do processo de quantização canônica, ou os postulados acima, podemser resumidos como:

1. O estado de um sistema físico é completamente descrito por um vetor(normalizado) no espaço de Hilbert

j i 2 H : (69)

E vetores que di�ram apenas por uma fase representam o mesmo estadofísico. Sabendo-se agora qual vetor representa o sistema, sabemos todasas características físicas deste sistema;

2. A todo o observável esta relacionado um operador hermitiano;

3. Uma medida do observável M pode fornecer apenas autovalores desteoperador e, logo após uma medida em que se obteve o valor mn o sistemaestará no estado n, auto-estado de M com autovalor mn;

4. A dinâmica da médias destes operadores

hMi � h j M j i ;

corresponde evolução temporal da respectiva quantidade clássica M (t);

5. A evolução temporal de um sistema no estado inicial j 0i é dado por (nocaso de H (t) comutativo)

j ti = U (t) j 0i ; U (t) = exp�� i~

Z t

0

H dt

�:

8.3 Realização do espaço de Hilbert

Toda a descrição acima é bastante abstrata e, para calcularmos alguma coisa,precisamos escolher um espaço de Hilbert especí�co para trabalhar, ou, comose diz, realizar o nosso espaço de Hilbert.Vamos então aplicar tudo que foi visto acima num sistema físico real e veri-

�car como o processo de quantização pode ser efetivamente implementado. Paraisso vamos começar tratando sistemas com graus �nitos de liberdade.Uma espira por onde passa uma corrente induz um campo magnético que

pode ser descrito pelo chamado momento magnético do sistema. Classicamente,um sistema com momento magnético � imerso num campo magnético B possuiuma energia potencial

U = �� �B

Que dá origem a uma forçaF = r (� �B)

113

Para B = Bz, temos

F = r (�zB) = �z@B

@z;

O momento magnético na presença de um campo magnético gera tambémum torque

� = ��B :

Entretanto, como mostrado nos trabalhos de Einstein e de-Hass, o momentomagnético não se curva em direção do campo, mas apenas passa a precessionarnesta direção. Assim, quando um sistema com momento magnético � é colocadonum campo magnético, ele se desloca na direção de variação do campo, semvariar a projeção do momento na direção do campo. Ou ainda, mantendo��B constante. Além disso, qualquer variação nesta projeção alteraria a energiaU do sistema e esta energia teria de vir do campo.Concluindo: o momento magnético não se alinha com o campo, mas o

sistema como um todo se desloca na direção da variação do campo.Pelo comportamento de algumas partículas num campo magnético, sabemos

experimentalmente que estas possuem um momento magnético. Um dispositivopara medir este momento magnético seria fazer passar um feixe destas partículaspor um campo variável na direção z. Este é o chamado experimento de Stern-Gerlach.O feixe é produzido termicamente, de sorte que seus constituintes possuem

todos os valores possíveis de momento magnético. Classicamente, se um talfeixe passar pelo experimento acima, esperamos que ele sofra uma força

Fz = �z@B

@z;

que depende da projeção de � na direção do campo. Assim, classicamenteesperamos que as partículas sejam de�etidas continuamente dede o valor �z = 0até um valor máximo �z = j�j. Entretanto, quando o experimento foi realizadonos idos de 1922 não foi isso que se observou.Ao passar pelo aparato o feixe se dividiu em duas componentes com valor

��B~2:

Assim, fazendo

�z = �BSz ; Sz = �~2

temos que o momento magnético �z é proporcional ao spin Sz e este podeassumir apenas os valores discretos �~=2.Os constituintes dos átomos, bem como combinações destes constituintes

possuem está característica. O próprio experimento foi realizado com átomosde prata que dos seus 47 elétrons 46 estão emparelhados e anulam seus spins.Sobrando apenas o spin do elétron da camada mais externa. Além disso, omomento magnético de todos os constituintes vale

� =gs2m

S ;

114

de sorte que podemos ignorar a in�uência do momento magnético do núcleo.Sendo o átomo neutro, apenas o spin do último elétron in�uência no comporta-mento de todo o átomo.Partículas com esta característica são chamada de partículas de spin 1

2 (pró-tons, neutrons, elétrons etc).Assim, no que se refere ao spin na direção z, partículas de spin 1

2 podemapresentar apenas dois valores possíveis deste observável. Sendo o spinum observável, e pelos postulados colocados anteriormente, sabemos que estesvalores são os autovalores do operador de spin. Chamemos seus auto-vetores de

Sz j�i = �~2j�i :

Sabemos também que estes autovetores formam uma base do nosso espaço.Assim, se queremos estudar apenas o spin de um partícula de spin 1

2 (e.g.,um elétron), podemos trabalhar com um espaço de Hilbert de duas dimensões.Como vimos, neste espaço vetores são matrizes coluna de dois elementos e op-eradores matrizes 2� 2.Observe que se estamos estudando um elétron, estamos ignorando completa-

mente qualquer outra característica desta partículas, como posição e momento.Queremos saber apenas como o spin deste elétron se comporta num campomagnético.Uma vez escolhida a base fj+i ; j�ig, temos também uma forma matricial

para os nossos operadores. Lembre-se que, dada uma base fjeiig nosso operadornesta base atua como

Sz =Xmn

Smnz jemi henj ;

ou seja Smnz é a representação matricial do nosso operador na base jeii. Multi-plicando a expressão acima por jeii e hej j temos

hej j Sz jeii =Xmn

Smnz hej jemi hen jeii

=Xmn

Smnz �jm�ni

= Sjiz

Ou seja, as componentes matriciais do nosso operador pode ser cálculado como

Sjiz = hej j Sz jeii ;

Para o nosso caso, onde je1i = j+i e je2i = j�i temos�S11z S21zS12z S22z

�=

�h+j Sz j+i h�j Sz j+ih+j Sz j�i h�j Sz j�i

�=

� ~2 h+ j+i

~2 h� j+i

~2 h+ j�i �

~2 h� j�i

�=~2

�1 00 �1

115

Ou seja

Sz =~2

�1 00 �1

�:

Podemos ver explicitamente que, como supúnhamos,

S+z =~2

�1 00 �1

�= Sz :

Algumas características gerais podem ser tiradas deste exemplo: Sempre queescolhemos trabalhar na base de autovetores de um operador, a forma matricialdeste operador (nesta base) é diagonal. Com a diagonal formada pelos seusautovalores.Uma vez de posse da forma matricial do nosso operador, podemos determinar

a forma dos nossos autovetores

Sz j+i =~2j+i ) ~

2

�1 00 �1

��ab

�=~2

�ab

�b = �b) b = 0) j+i =

�a0

�Normalizando nosso vetor e �xando (arbitrariamente) a fase global, temos:

j+i =�10

�:

Da mesma forma, podemos determinar:

j�i =�01

�:

Onde, por serem autovetores de um operador hermitiano com autovalores dis-tintos

h+ j�i = 0 :

Exercise 39 Use os resultados acima para veri�car a resolução da identidade.Ou seja, usando as formas matriciais acima mostre que:X

n

jeni henj = j+i h+j+ j�i h�j =�1 00 1

�:

Outra forma de escrever o operador Sz é

Sz =~2(j+i h+j � j�i h�j)

Pois, com isso:

Sz j+i =~2(j+i h+j � j�i h�j) j+i = ~

2(j+i h+ j+i � j�i h� j+i) = ~

2j+i ;

Sz j�i =~2(j+i h+j � j�i h�j) j�i = ~

2(j+i h+ j�i � j�i h� j�i) = �~

2j+i :

116

Classicamente o momento magnético é um vetor (i.e., tem 3 componentes).No nosso caso também devemos ter 3 operadores para o spin da nossa partícula.Os dois outros operadores, que podemos chamar de Sx e Sy são obtidos, obvi-amente, medindo o momento magnético nas demais direções. Ou seja, girandonosso SG nas direções x e y. Vamos tentar determinar a forma destes oper-adores.Mas nós queremos fazer isso trabalhando ainda mesma base de

antes. Ou seja, sabemos que uma medida do spin na direção x deve fornecertambém 2 valores (a�nal não há nada especial com a direção z). Assim devemoster

Sx jx�i = �~2jx�i

ondejx+i = a+1 j+i+ a+2 j�i : (70)

Uma vez escolhida a forma matricial de j�i temos a forma matricial de jx+i.Tudo que precisamos então e achar os coe�cientes a+i da expressão acima.Para isso usamos mais um dos nossos postulados. Sabemos que��a+1 ��2 = jh+ jx+ij2

é a probabilidade de estando a partícula na posição jx+i, numa medida de Szencontrarmos o valor +~=2. Além disso, pelo que vimos anteriormente, sabemosque ��a+1 ��2 = jh+ jx+ij2 = jhx+ j+ij2 :

Ou seja, está também é a probabilidade do sistema estar no estado j+i e, numamedida de Sx, encontramos o valor jx+i.

Remark 40 Neste caso, a igualdade acima re�ete a isotropia do espaço.

Problem 41 Como podemos medir experimentalmente esta probabilidade?

Tudo que precisamos fazer é preparar uma in�nidade de partículas, todasno estado j+i, realizamos uma medida de Sx e veri�car qual a proporção departículas apresenta o valor +~=2. Ou seja, precisamos estudar um problemade espalhamento.(Não podemos conhecer o estado, mas podemos preparar)Como dissemos antes, é impossível determinar o estado quântico de um sis-

temas. Entretanto, é possível conhecer este estado se nós mesmos o preparamos.

Problem 42 Como preparamos uma in�nidade de sistemas no esta j+i?

Para isso basta passarmos o feixe, inicialmente contendo todos os estadospossíveis, num aparato na direção z. Todas as partículas que sobem possuem ovalor de spin +~=2 e, pelos postulados da MQ, estarão no estado j+i. Assim,

117

se pegarmos este feixe e passarmos por um segundo SG orientado na direção x,tudo que precisamos fazer para determinar

��a+1 ��2 e medir a intensidade destefeixe.Realizado o experimento, veri�ca-se que o feixe se divide, novamente, em

dois feixes de igual intensidade. Ou seja, metade das partículas possuemSx = +~=2 e metade Sx = �~=2. Com este resultado, podemos a�rmar que

��a+1 ��2 = 1

2=��a+2 ��2 ) a+1 =

ei�1p2; a+2 =

ei�2p2; �1;2 2 R :

Assim, lembrando que uma fase global é irrelevante (primeiro postulado), sabe-mos que o estado (70) possui a forma:

jx+i =1p2j+i+ ei�xp

2j�i ; �+ 2 R : (71)

Lembre agora que a fase �x acima não é uma fase global e, conseqüentemente,possui signi�cado físico. Ou seja, não podemos escolher arbitrariamente estafase.Este resultado, completamente inesperado, mostra a característica men-

cionada anteriormente que, em MQ, a probabilidade não é uma ignorância dosistema, mas uma característica intrínseca ao sistema. Observe que o estadoacima é uma superposição de dois estados com spins na direção oposta. Mas,ao mesmo tempo, é um sistema bem determinado. Ou seja, todas as partículasque saíram do SG na direção +x estão no estado jx+i. Estes estados são todosiguais, pois foram preparados exatamente da mesma maneira. Entretanto, umamedida do spin na direção z deste estado fornece hora o valor +~=2 e hora ovalor +~=2.Dizemos que o sistema no estado jx+i acima não possui o valor de sz bem

de�nido e, apenas após a nossa medida, quando o sistema estará no estado j+i ouj�i, este valor foi �xado. Uma medida subseqüente do spin na mesma direçãofornecerá o mesmo valor, mas numa direção ortogonal voltará a apresentar oresultado estatístico. Esta estatística é inerente ao sistema (é o elétron que estáneste estado) não uma ignorância nossa sobre os efeitos do aparelho de medidano sistema.Com argumentos análogos aos anteriores podemos escrever

jx�i =1p2j+i+ ei�

0x

p2j�i ; �0x 2 R : (72)

Entretanto, temos também que respeitar a condição de ortogonalidade dos ve-

118

tores,

hx� jx+i = 1p2h+j+ e�i�

0x

p2h�j!�

1p2j+i+ ei�xp

2j�i�

=

1

2h+ j+i+ ei�x

2h+ j�i+ e�i�

0x

2h� j+i+ 1

2ei�xe�i�

0x h� j�i

!

=

�1

2+1

2ei�xe�i�

0x

�= 0

com isso,ei�xe�i�

0x = �1) e�i�

0x = �e�i�x ) ei�

0x = �ei�x

De sorte que

jx�i =1p2j+i � ei�xp

2j�i ; �+ 2 R : (73)

Da mesma forma que �zemos no caso de Sz, o operador Sx pode ser escritocomo

Sx =~2(jx+i hx+j � jx�i hx�j) (74)

pois, novamente,

Sx jx+i =~2(jx+i hx+j � jx�i hx�j) jx+i =

~2jx+i

Sx jx�i =~2(jx+i hx+j � jx�i hx�j) jx�i = �

~2jx�i

Além disso, como no caso anterior, a forma matricial do operador Sx na basefj+i ; j�ig é dada por:�

S11x S12xS21x S22x

�=

�h+j Sx j+i h+j Sx j�ih�j Sx j+i h�j Sx j�i

�Calculando explicitamente estes termos, usando (74), temos

h+j Sx j+i =~2h+j (jx+i hx+j � jx�i hx�j) j+i :

Usando (71) e (73) temos

jx+i hx+j =�1p2j+i+ ei�xp

2j�i��

1p2h+j+ e�i�xp

2h�j�

=1

2j+i h+j+ e�i�x

2j+i h�j+ ei�x

2j�i h+j+ 1

2j�i h�j

jx�i hx�j =�1p2j+i � ei�xp

2j�i��

1p2h+j � e�i�xp

2h�j�

=1

2j+i h+j � e�i�x

2j+i h�j � ei�x

2j�i h+j+ 1

2j�i h�j

119

Com isso

S11x = h+j Sx j+i =~2h+j (jx+i hx+j � jx�i hx�j) j+i

=~4h+j

�j+i h+j+ e�i�x j+i h�j+ ei�x j�i h+j+ j�i h�j

� j+i h+j+ e�i�x j+i h�j+ ei�x j�i h+j � j�i h�j�j+i

=~4(1� 1) = 0

Da mesma forma

S21x = h�j Sx j+i =~4

�ei�x + ei�x

�=~2ei�x ;

S22x = h�j Sx j�i = 0 ;

S12x = h+j Sx j�i = h�j Sx j+i =~2e�i�x :

Ou seja

Sx =~2

�0 e�i�x

ei�x 0

�:

Um procedimento completamente análogo pode ser desenvolvido para Sy.Ou seja:

1. Estudando o problema de espalhamento com o aparelho de SG orientadona direção y temos:

jy+i =1p2j+i+ ei�yp

2j�i ; �y 2 R ;

2. Pela ortogonalidade dos estados

jy�i =1p2j+i � ei�yp

2j�i

3. Escrevendo

Sy =~2(jy+i hy+j � jy�i hy�j)

temos

Sy =~2

�0 e�i�y

ei�y 0

�:

Obviamente a forma explicita de todas estas quantidades depende da de-terminação das fases �x e �y. Para isso existe ainda um experimento de espal-hamento a nossa disposição. Suponha que você orientou o SG na direção x,selecionou o feixe que foi na direção +x e passou este feixe por um segundo SGna direção y. Pelo que foi dito antes, e pela homogeneidade do espaço, você deve

120

imaginar que, mais uma vez, o feixe se dividiu em duas partes de intensidadesiguais nas direções +y e �y. Isso signi�ca que, estado a partícula no estadojx+i a probabilidade de encontrar esta partícula no estado jy+i ou jy�i vale

jhy� jx+ij2 =1

2:

Usando os resultados anteriores temos

hy� jx+i =�1p2h+j � e�i�yp

2h�j��

1p2j+i+ ei�xp

2j�i�

=1

2

�1� ei(�x��y)

�:

Com isso

jhy+ jx+ij2 =����12 �1� ei(�x��y)�

����2 = 1

2����1� ei(�x��y)����2 = 2Lembrando que

j1� ij2 = 11 + 12 = 2 ;temos

�x � �y = ��

2:

Isso é tudo que podemos �xar com nossos experimentos de espalhamento.Obviamente nosso problema apresenta uma fase que pode ser �xada arbitraria-mente, sem in�uenciar nos resultados experimentais. Assim, fazendo

�x = 0 =) �y =�

2

Temos a forma explicita de nossos vetores

jz+i = j+i =�10

�; jz�i = j�i =

�01

�;

jx�i =1p2[j+i � j�i] = 1p

2

�1�1

�;

jy�i =1p2[j+i � i j�i] = 1p

2

�1�i

�;

e dos nossos operadores

Sz =~2

�1 00 �1

�; Sx =

~2

�0 11 0

�; Sy =

~2

�0 �ii 0

�:

A notação acima pode ser escrita de forma mais compacta se introduzirmos anotação

�1 ��0 11 0

�; �2 �

�0 �ii 0

�; �3 �

�1 00 �1

121

com isso

Si =~2�i ; S1 � Sx ; S2 � Sy ; S3 � Sz

ou, numa notação vetorial,

S =~2�

com � = (�1; �2; �3). As três matrizes s acima são chamadas como matrizes dePauli.

Exercise 43 Veri�que as seguintes propriedades das matrizes de Pauli:

(�i)2= 1 ; �i = �+i ; [�i; �j ] = 2i

3Xk=1

"ijk�k ;

onde "ijk é o símbolo de Levi-Civita.

Um ponto a se observar nos resultados acima é a diferença de fase �x� �y =��=2. Ou seja, mesmo o sistema mais simples (2 níveis) não pode ser descritousando apenas coe�cientes reais. Neste exemplo �ca patente a necessidadede estendermos o corpo do nosso espaço vetorial para os complexos. Este pontojá havia sido observado por Schroedinger na sua formulação usando funções deonda. A utilização de quantidades complexas já era utilizada como um artifíciomatemático para tratar problemas de ondas (mecânicas ou eletromagnéticas).Mas esta técnica (fasores) apenas facilitava as manipulações algébricas e asquantidades físicas eram obtidas simplesmente ignorando a parte complexa dosresultados. Na MQ, porém, esta parte não pode ser ignorada e possui in�uênciadireta no comportamento das quantidades físicas.Assim, o operador associado ao momento magnético clássico das nossas

partículas de spin meio vale:

� = ~�S ; ~� =gs2m

:

Como vimos, a energia potencial de uma partícula de momento magnéticom sujeita a um campo magnético B vale:

U = � ��B

Se ignorarmos completamente o movimento da partícula (i.e., ignorarmos asua energia cinética), podemos escrever

E = U = ��B = H :

Onde H é o hamiltoniano clássico do sistema. Pelos resultados anteriores, sabe-mos que o operador associado a este hamiltoniano vale

H = � ��B ; � = ~�S =~2~��

122

com isso

H = �� ��B ; � =~2~� :

Para o caso do elétron

� = �B =e~2me

é o magneton de Bohr.Exemplo 1.Suponha então um elétron num campo magnético B constante na direção z

(não é mais um SG). Este elétron tem dois estados possíveis de energia

H = ��BB�3 ) H j�i = � (�)�BB j�i = ��BB j�iE+ = ��BB ; E� = +�BB

Suponha que o sistema é inicialmente preparado no estado jx+i, i.e., antesde iniciar o experimento, passamos o feixe por um SG e coletamos o feixe quefoi na direção +x. Com isso

j 0i = jx+i =1p2(j+i+ j�i) :

Problem 44 Qual a probabilidade de, após um tempo t, o spin deste elétronestar na direção �x?

A resposta para o nosso problema vale

jhx� j tij2 :

Para isso precisamos primeiro determinar o estado

j ti = U (t) j 0i ; U (t) = exp�i�B~B�3t

�Como vimos, a aplicação deste operador é simpli�cada pelo fato do nosso

estado inicial estar escrito na base de autovetores do hamiltoniano,

j ti = U (t) j 0i = exp�i�B~B�3t

�� 1p2(j+i+ j�i)

�=

1p2

�exp

�i�B~B�3t

�j+i+ exp

�i�B~B�3t

�j�i�

=1p2

�exp

�i�B~Bt�j+i+ exp

��i�B

~Bt�j�i�

=1p2(exp (i!t) j+i+ exp (�i!t) j�i)

com! =

�B~B

123

Podemos então cálcular

hx� j ti =�1p2(h+j � h�j)

��1p2(exp (i!t) j+i+ exp (�i!t) j�i)

�=(exp (i!t)� exp (i!t))

2= i sin!t

Com issojhx� j tij2 = sin2 !t ; ! =

�B~B :

Em especial, em t = 0, temos que a probabilidade é nula, pois sabemos quea partícula está no estado jx+i.

Problem 45 Suponha que você quer inverter o spin do elétron, por quantotempo você deve aplicar o campo?

Inverter o spin do elétron, inicialmente no estado jx+i, signi�ca que, se vocêpegar o elétron após a aplicação do campo e passar por um SG na direção x,você tem certeza que este elétron irá para a direção �x. Assim

jhx� j tij2 = 1) sin2 !t = 1) !t =�

2(1 + 2n)) t =

2!(1 + 2n) ; n 2 N ;

com isso

t =�~2B�B

(1 + 2n) :

Desta forma, dada um estado inicial qualquer, podemos manipular o spindo elétron e deixá-lo no estado que desejamos através da aplicação de camposmagnéticos.No caso geral, a forma mais conveniente de se aplicar o operador de evolução

é expandindo o estado inicial na base de autovetores da hamiltoniana. Entre-tanto, em alguns casos especí�cos, é possível encontrar uma forma matricialtambém para este operador. Por exemplo, no caso tratado acima temos

U (t) = exp�i�B~B�3t

�=

1Xn=0

�i�B~Bt�n

�n3

= 1 +�i�B~Bt��3 +

�i�B~Bt�2�23 +

�i�B~Bt�3�33 + :::

Note, entretanto, que

�23 =

�1 00 �1

��1 00 �1

�=

�1 00 1

�= I

Além disso�33 = �3�

23 = �3I

124

assim(�3)

2n= I ; (�3)

2n+1= �3

Podemos então dividir a nossa somatória em termos pares e impares

U (t) =1Xn=0

�i�B~Bt�2n

�2n3 +1Xn=0

�i�B~Bt�2n+1

�2n+13

=1Xn=0

�i�B~Bt�2n

+1Xn=0

�i�B~Bt�2n+1

�3

=1Xn=0

�i�B~Bt�2n

+ �3

1Xn=0

�i�B~Bt�2n+1

= cos�B~Bt+ i�3 sin

�B~Bt

=

�cos �B~ Bt+ i sin

�B~ Bt 0

0 cos �B~ Bt� i sin�B~ Bt

�=

�exp

�i�B~ Bt

�0

0 exp��i�B~ Bt

� � :

Assim, se quisermos aplicar este operador no estado inicial

jx+i =1p2

�11

�temos

U (t) jx+i =1p2

�exp

�i�B~ Bt

�0

0 exp��i�B~ Bt

� �� 11

�=

1p2

�exp

�i�B~ Bt

�exp

��i�B~ Bt

� �=

1p2

�exp

�i�B~Bt��

10

�+ exp

��i�B

~Bt��

01

��=

1p2

hexp

�i�B~Bt�j+i+ exp

��i�B

~Bt�j�ii

Que é o mesmo resultado obtido anteriormente.O resultado acima pode ser generalizado para qualquer operador A num

espaço de dimensão �nita

A2 = I ) exp�i!A

�= cos! + iA sin! :

Assim, dado um estado inicial qualquer, podemos decompor este estado emauto-estados do hamiltoniano e usar a expressão

j ti = c+ exp (i!t) j+i+ c� exp (�i!t) j�i

o que implica em encontrar os coe�cientes c�, ou usar diretamente este estado,sem fazer nenhuma decomposição, e multiplicar pela forma matricial de U acima.

125

Remark 46 Sempre que tivermos a sorte de encontrar esta forma matricial dooperador de evolução não precisamos decompor o estado inicial.

Ainda no mesmo campo

H = ��BB�3 ;

qual a probabilidade de um estado inicialmente preparado em j+i ser encontradoem j�i depois de um tempo t. Ou seja,

jh�jU (t) j+ij2 :

Lembrando de nosso hamiltoniano só depende de �3 e que os estados acimasão autoestados deste operador temos

h� j+i = h�j exp�i�B~B�3t

�j+i = exp

�i�B~Bt�h� j+i = 0 :

Remark 47 Isso é um caso geral. Sempre que nosso sistema estiver num autoestado do operador hamiltoniano ele permanecerá inde�nidamente neste estado.Por isso estes estados são chamados de estados estacionários.

Exempo 2:Uma partícula de spin 1

2 está sujeita a superposição de dois campos, demesma intensidade B, um na direção x e outro na direção y,

B = xB + yB

Neste caso o Hamiltoniano do sistema tem a forma

H = ��B = �B (�1 + �2) :

Ou seja, nosso operador de evolução tem a forma (68):

U (t) = exp

�� i~Ht

�= exp

��i�Bt

~(�1 + �2)

�= exp [�i!t (�1 + �2)]

! =�B

~

Problem 48 Será que podemos escrever

exp [�i!t (�1 + �2)]?= [�i!t�1] [�i!t�2] ?

126

A resposta é não! A igualdade

eA+B = eAeB

é válida apenas quando[A;B] = 0 :

Além disso, observe que

(�1 + �2)2= �1�1 + �1�2 + �2�1 + �2�2

= I + �1�2 � �1�2 + I= 2I 6= I

De sorte que não podemos usar a nossa decomposição em senos e cossenos.Entretanto, apesar de não ser proporcional a identidade, o resultado é propor-cional a identidade (i.e., se comporta como um número, não como um operador).Assim, podemos de�nir o seguinte operador

� =1p2(�1 + �2) =

1p2

�0 1� i

1 + i 0

�que satisfez

�2 =1

2(�1 + �2)

2=1

22I = I :

Em termos deste operador nosso operador de evolução se torna

U (t) = exp

��i!t

p2(�1 + �2)p

2

�=h�i!t

p2�i;

E podemos escrever

U (t) =h�i!t

p2�i= cos

�!tp2�� i�sin

�!tp2�

=

cos�!tp2�

� 1p2(i+ 1) sin

�!tp2�

1p2(1� i) sin

�!tp2�

cos�!tp2� !

Observe que a freqüência e oscilação do campo possui um fatorp2.

Como mencionado, nem sempre é possível encontrar uma forma matricialpara o operador de evolução. Entretanto, o método de expansão dos estadosem auto-estados do hamiltoniano sempre funciona. Vamos então aplicar estemétodo para resolver o problema anterior, i.e., com hamiltoniano

H = ��B = �B (�1 + �2) :

127

Para isso precisamos realizar uma mudança de base no nosso sistema e não maistrabalhar na base fj+i ; j�ig, mas sim na base fj +i ; j �ig de autovetores deH

H j �i = E� j �i ; H = �B

�0 1� i

1 + i 0

�:

Resolvendo o problema de autovalores temos:

j +i =1

2p2

� p2 (1� i)2

�; E+ = �B

p2

j �i =1

2p2

� p2 (i� 1)2

�; E� = �B

p2

Vamos calcular, por exemplo, a probabilidade de transição dos estados

j+i ! j�i

Para isso temos de escrever estes vetores na nova base:

j+i = c1 j +i+ c2 j �i

c1 = h + j+i =1

2p2

� p2 (1 + i) 2

�� 10

�=1

2(1 + i)

c2 = h � j+i =1

2p2

� p2 (�i� 1) 2

�� 10

�= �1

2(1 + i)

j+i = (1 + i)

2(j +i � j �i)

e

j�i = d1 j +i+ d2 j �i

d1 = h + j+i =1

2p2

� p2 (1 + i) 2

�� 01

�=

1p2

d2 = h � j+i =1

2p2

� p2 (�i� 1) 2

�� 01

�=

1p2

j�i = 1p2(j +i+ j �i)

Problem 49 Por que as probabilidades de encontrar a partícula com spin pracima é tão difernet da de encontrá-la com spin pra baixo?

Note que, apesar de parecerem diferentes, os coe�cientes

c1 =1

2(1 + i) =

1

2

�1 + ei

�2

�= ei

�4

�e�i

�4 + ei

�4

�2

= ei�4 cos

4=

1p2ei

�4 = d1e

i�4

128

diferem apenas por uma fase e, conseqüentemente, representam a mesma prob-abilidade. Ou seja, nos dois casos, a probabilidade de, estando a partícula noestado j�i, encontrá-la no estado j �i vale 1

2 .Concluindo as contas temos

h�jU (t) j+i =��d1 h +j+ �d2 h �j

�exp

�� i~Ht

�(c1 j +i+ c2 j �i)

=��d1 h +j+ �d2 h �j

��c1 exp

�� i~E+t

�j +i+ c2 exp

�� i~E�t

�j �i

�=

��d1c1 exp

�� i~E+t

�+ �d2c2 exp

�� i~E�t

��=

1

2p2(1 + i)

exp

�i�B

p2

~t

!� exp

i�Bp2

~t

!!

= � ip2(1 + i) sin

�Bp2

~t

!;

que representa a probabilidade

jh�jU (t) j+ij2 = sin2 �Bp2

~t

!:

Para estados no caso de estados genéricos dados cujas componentes sãodadas na base fj+i ; j�ig podemos obter suas componentes na base fj +i ; j �igatravés do procedimento de mudança de base estudado anteriormente. Pela ex-pressão

v0j =Xj

vie0j�� eii

sabemos que as quantidades he0ij eji é a de matriz de mudança da base fjeiigpara a base fje0iig. Assim, a matriz de mudança da base fj+i ; j�ig para a basefj +i ; j �ig vale

h �j �i =�h +j +i h +j �ih �j +i h �j �i

�=

�c1 d1c2 d2

��c1 d1c2 d2

��10

�e um estado inicial qualquer dados na base fj+i ; j�ig tem, na base fj +i ; j �iga forma

fj +i;j �ig�a0b0

�=

�c1 d1c2 d2

� fj+i;j�ig�c0v0

�:

Exemplo 3Uma partícula de spin 1

2 está sujeita a um campo magnético que circula noplano x; y

B (t) = xB cos!t+ yB sin!t :

129

Neste caso o Hamiltoniano do sistema tem a forma

H = H (t) = ��B = �B (�1 cos!t+ �2 sin!t)

Observe que, neste caso

H (0) = �B�1 ; H� �2!

�= �B�2 ;

com isso hH (0) ; H

� �2!

�i= 2i (�B)

2�3 6= 0 :

Ou seja, estamos tratando um dos casos complicados onde o hamiltonianonão comuta para diferentes instantes do tempo. Felizmente, neste caso (e nemimagine que isso é comum) o problema pode ser tratado exatamente. ObservequeZ t

t0

Z �

t0

H (�) H (� 0) d� 0 d� =

Z t

t0

Z �

t0

(�B (�1 cos!� + �2 sin!�)) (�B (�1 cos!�0 + �2 sin!�

0)) d� 0 d�

= (�B)2

�Z t

t0

Z �

t0

cos!� cos!� 0 d� 0 d�

+ �1�2

Z t

t0

Z �

t0

[cos!� sin!� 0 � sin!� cos!� 0] d� 0 d�

+

Z t

t0

Z �

t0

sin!� sin!� 0 d� 0 d�

�Ou seja, mesmo que as matrizes de Pauli não cumutem, estas são fatoradasem todas as integrais. Assim, todas as integrais envolvidas na expansão emsérie do operador de evolução envolvem apenas funções reais (não operadores)e, conseqüentemente, comutativas. Com isso, neste caso (e, mais uma vez,este é um caso muito especial) não precisamos levar em conta a ordenaçãotemporal. Conseqüentemente nossa exponencial toma a mesma forma para ocaso comutativo. Ou seja, nosso operador de evolução tem a forma (68)

U (t) = exp

�� i~

Z t

0

H (�) d�

�=

1Xn=0

�� i~

�n �Z t

0

H (�) d�

�n:

Mais explicitamente

U (t) = exp

�� i~

Z t

0

�B (�1 cos!� + �2 sin!�) d�

�= exp

��i�B

~

��1

Z t

0

cos!� d� + �2

Z t

0

sin!� d�

��= exp

��i�B~!

(�1 sin!t� �2 (cos!t� 1))�:

130

Remark 50 Observe que o termo �1 em (cos!t� 1) é indispensável para ter-mos

U (0) = exp

��i�B~!

(��2 (1� 1))�= I :

Entretanto, neste caso, fazendo

M = �1 sin!t� �2 (cos!t� 1)

temos

M2 = Ihsin2 !t+ (cos!t� 1)2

i= 2I [1� cos!t] 6= 1 :

Ou seja, novamente, não podemos usar a nossa expansão em senos e cossenos.Poderíamos então tentar um procedimento análogo ao anterior e de�nir

G =Mp

2 (1� cos!t)

com o que temos

G2 =M2

2 (1� cos!t) =2I [1� cos!t]2 (1� cos!t) = I :

Então escreveríamos U em função de G

U (t) = exp

��i�B~!p2 (1� cos!t)G

�:

e, depois, em termos de senos e cossenos

U (t)?= cos

��B

~!p2 (1� cos!t)

�� iG sin

��B

~!p2 (1� cos!t)

�:

Entretanto, este procedimento não é legítimo pelo fato deste novo operador Gnão estar de�nido em t = 0, ou seja, não podemos garantir que U (0) = I. Nempara qualquer outro instante t = 2n�=!. Ou seja, para continuar é necessárioveri�car que G tem um valor �nito em t=0. Para isso expandimos

G =�1 sin!t� �2 (cos!t� 1)p

2 (1� cos!t)'!t�1 + �2

�(!t)2

2

�r2�(!t)2

2

� =!t�1 + �2

�(!t)2

2

�!t

= �1 +1

2�2 (!t) = �1 :

131

De onde temos, G(0) < I e ainda G2(0) = I. Com isso podemos continuarusando

U (t) = cos

��B

~!p2 (1� cos!t)

�� iG sin

��B

~!p2 (1� cos!t)

�:

Usando a igualdade

cos!t = 2 cos2!t

2� 1

podemos escrever

p2 (1� cos!t) =

s2

�1�

�2 cos2

!t

2� 1��

= 2

s�1� cos2 !t

2

�= 2

rsin2

!t

2

= 2 sin!t

2

com isso,

U (t) = cos

��B

~!2 sin

!t

2

�� iG sin

��B

~!2 sin

!t

2

�= cos

��B

~!2 sin

!t

2

�� i�1 sin!t� �2 (cos!t� 1)

2 sin !t2sin

��B

~!2 sin

!t

2

Temos ainda o inconveniente de um termo divergente. Mas isso pode serresolvido observando que

�1 sin!t� (cos!t� 1)�2 = i

�0 e�i!t � 1

1� ei!t 0

�= 2 sin

�!2t�� 0 e�i

!2 t

ei!2 t 0

�com isso

U (t) = cos

��B

~!2 sin

!

2t

�� i�

0 e�i!2 t

ei!2 t 0

�sin

��B

~!2 sin

!t

2

�Outra forma de resolver este problema e usando direto

�1 sin!t� (cos!t� 1)�2 = 2 sin�!2t��

0 e�i!2 t

ei!2 t 0

�= 2 sin

�!2t�N (t) ;

N (t) =

�0 e�i

!2 t

ei!2 t 0

�;

132

e escrever

U (t) = exp

��i�B~!

(�1 sin!t� �2 (cos!t� 1))�

= exp

��i2�B

~!sin�!2t�N (t)

�Observando agora que

N2 = I ;

temos

U (t) = exp

��i2�B

~!sin�!2t�N (t)

�= cos

�2�B

~!sin�!2t��� iN sin

�2�B

~!sin�!2t��

Que, obviamente, concorda com o resultado anterior. Nesse último caso nãoprecisamos nos preocupar com divergências.Assim, ainda neste caso mais complicado, podemos encontrar uma forma

matricial para o nosso operador de evolução.Podemos agora responder perguntas do tipo: neste novo campo qual a prob-

abilidade de uma partícula inicialmente prepara no estado j+i ser encontradano estado j�i depois de um tempo t?

jh�jU (t) j+ij2 =?

Observe que agora j�i não é mais auto estado de H. Ou seja estes estadosnão são estacionários.Com o resultado acima calculamos:

h�jU j+i = h�j cos�2�B

~!sin�!2t��� iG sin

�2�B

~!sin�!2t��j+i

= �h�j iG j+i sin�2�B

~!sin�!2t��

:

Usando as formas matriciais

h�j iG j+i =�0 1

�� 0 e�i!2 t

ei!2 t 0

��10

�= e

12 it!

Temos

h�jU j+i = �e 12 it! sin�2�B

~!sin�!2t��

jh�jU j+ij2 = sin2�2�B

~!sin�!2t��

133

8.4 Rotações

Como vimos, a dinâmica dos sistemas em MQ pode ser descrita através dooperador de evolução temporal, o qual respeita a equação diferencial

i~dU

dt= HU :

Obviamente, ambos os lados desta equação representam operadores. O queimplica que, para qualquer vetor j 0i num instante inicial t = 0, temos

i~dU

dtj 0i = HU j 0i ) i~

d

dtj ti = H j ti ; j ti = U (t) j 0i :

Encontrar a dinâmica do sistema descrito pelo hamiltoniano H e tendo ascondições iniciais adequadas é encontrar uma coleção de vetores j ti, identi�-cados pelo parâmetro t, que respeite a equação diferencial acima. No que seguechamaremos esta coleção de vetores de �um vetor dependente do tempo�.Suponha então que você encontrou um vetor j ti que respeita a equação

acima. Isso implica que, dado um operador inversível (independente dotempo) M , o vetor

j�ti = M j ti ;respeitará a seguinte equação:

i~Md

dtj ti = MH j ti ) i~

d

dtM j ti = MHM�1M j ti ) i~

d

dtj�ti = MHM�1 j�ti ;

com isso

i~d

dtj�ti = H 0 j�ti ; H 0 = MHM�1 :

Com isso, conhecida a solução de uma equação diferencial podemos con-struir soluções para outras equações diferenciais (diferentes). Esse é um proced-imento matemático geral. No caso da MQ, gostaríamos que esta nova equaçãodiferencial também descreva algum sistemas físico (diferente do inicial). Ouseja, gostaríamos que j�ti fosse a evolução temporal de algum sistema físicodescrito pelo hamiltoniano H 0. Para isso, obviamente, H 0 deve ser tambémum hamiltoniano, ou seja, deve ser um operador hermitiano

H 0 = H 0+ ) MHM�1 =�MHM�1

�+=�M�1

�+HM+

Assim,M+ = M�1 ;

ou seja, M deve ser um operador unitário.Assim, dado um operador unitário qualquer, e a solução de um sistema

físico qualquer, podemos construir soluções de um novo sistema físico. Nesteprocesso temos a di�culdade em identi�car esta nova descrição quântica comalgum sistema clássico (ou mesmo se este existe). Além, é claro, de saber seeste sistema tem algum interesse.

134

Além disso, usando

U (t) =1Xn=0

�� i~t

�nHn = I +

�� i~t

�H +

�� i~t

�2HH + :::

temos

MU (t) M+ = MIM+ +

�� i~t

�MHM+ +

�� i~t

�2MHHM+ + :::

= I +

�� i~t

�MHM+ +

�� i~t

�2MH

�M+M

�HM+ + :::

= I +

�� i~t

�H 0 +

�� i~t

�2H 0H 0 + :::

=1Xn=0

�� i~t

�nH

0n = U 0 (t) :

Ou seja,U 0 (t) = MU (t) M+ ;

é o operador de evolução temporal para o sistema com hamiltoniano H 0.

Exercise 51 O resultado acima continua válido para o caso geral em que ohamiltoniano não comuta em diferentes instantes do tempo?

Por exemplo, suponha agora que você encontrou (como feito anteriormente)a solução do problema de uma partícula de spin 1=2 num campo magnético dadireção z. Neste caso,

H = ���3:B = ��B�1 00 �1

�:

E deseje encontrar a solução para o mesmo problema, mas com um campo (demesma intensidade) na direção x, ou seja, como o hamiltoniano

H 0 = ���1:B = ��B�0 11 0

�:

Fisicamente isso signi�ca, obviamente, que você girou de 90o o aparelho quegera o campo.Agora, usando as propriedades das matrizes � é fácil ver que"p

2

2(1� i�2)

#�3

"p2

2(1 + i�2)

#=1

2(�2i�2�3) = �1 :

Além disso,p2

2(1� i�2) =

p2

2� ip2

2�2

!= cos

4� i�2 sin

4= exp

��i�4�2

�= M :

135

Assim

H 0 = ���1:B = ��M�3M+:B = M (���3:B) M+ = MHM+

ondeM = exp

��i�4�2

�:

Assim, o operador (unitário) M acima representa uma rotação (no sentidoanti-horário) na direção do eixo y de um ângulo de 90o

Ry

��2

�= exp

��i�4�2

�:

Isso se aplica a qualquer dispositivo do nosso experimento. Por ex-emplo, se temos um SG na direção x, i.e., estamos medindo o spin na direçãox

Sx =~2�1

e fazemos

Ry

���2

�SxRy

��2

�=~2Ry

���2

��1Ry

��2

�=~2�3 = Sz ;

teremos um SG na direção z e passaremos a medir o spin na direção z.Da mesma forma, é possível mostrar que uma rotação de um ângulo qualquer

� no sentido anti-horário na direção do eixo y vale

Ry (�) = exp

��i�2�2

�:

Exercise 52 Mostre que se temos um campo na direção z e rodamos de umângulo �, os hamiltonianos obtidos estarão ligados pelo operador acima.

Mais ainda, repetindo todos estes argumentos para as direções x e z temosque

Rx (�) = exp

��i�2�1

�; Rz (�) = exp

��i�2�3

�) Ri (�) = exp

��i�2�i

�:

Ou seja, de forma geral,

Rn (�) = exp

��i�2n:�

�= cos

2� in:� sin �

2;

é o operador de rotação na direção do vetor normal n de um ângulo � no sentidoanti-horário.

Exercise 53 Mostre que(n:�)

2= I :

136

Exemplo 1:Suponha que você resolveu o problema para um campo de intensidade �

p2B

na direção x,

H = �p2B�1 ) U (t) = exp

�� i~�p2B�1t

�= cos

�p2B

~t

!�i�1 sin

�p2B

~t

!e quer resolver o problema para um campo de mesma intensidade fazendo umângulo de 45o no plano x; y. Neste caso,

H 0 = �B (�1 + �2) :

Primeiramente veri�camos que

Rz

��4

�HRz

���4

�= exp

��i�8�3

�H exp

�i�

8�3

�= exp

�i�

8�3

��p2B�1 exp

��i�8�3

�= �p2B��1

hcos2

8� sin2 �

8

i� 2�2 sin

8cos

8

�Usando

cos�

8=1

2

qp2 + 2 ; sin

8=1

2

q2�p2

cos2�

8� sin2 �

8=

p2

2; sin

8cos

8=

p2

4

temos

Rz

��4

�HRz

���4

�= �p2B��1

hcos2

8� sin2 �

8

i� 2�2 sin

8cos

8

�= �B

p2

p2

2(�1 + �2)

= �B (�1 + �2)

que é o hamiltoniano cuja solução gostaríamos de encontrar. Ou seja, como erade se esperar, uma rotação de 45o levou o campo que estava no eixo x no campodesejado.Assim, a solução do nosso problema vale

U 0 (t) = Rz

��4

�U (t) Rz

���4

�= exp

��i�8�3

�"cos

�p2B

~t

!� i�1 sin

�p2B

~t

!#exp

�i�

8�3

�= cos

�p2B

~t

!� ih��1

�cos2

8� sin2 �

8

�+ 2�2 cos

8sin

8

�isin

�p2B

~t

!

= cos

�p2B

~t

!� ip2

2(�1 + �2) sin

�p2B

~t

!:

137

Que concorda com o resultado (??) obtido para o mesmo problema anteri-ormente.

Exercise 54 Uma partícula de spin 12 está sujeita ao campo

B = (0; By; Bz) :

Encontre a rotação R que leva este campo para a direção z

B0 = (0; 0; B0z) :

Em seguida encontre U 0 para B0 e use o resultado para encontrar a solução parao campo B. Resolva diretamente o problema para B e compare os resultados.

O procedimento do exercício acima pode ser usado para resolver o problemapara um campo estático numa direção arbitrária. Vemos assim que qualquerproblema de dois níveis independente do tempo possui solução exata.

8.5 Espinores

Observe que o ângulo presente no operador de rotação é o ângulo (no espaçofísico) que giramos nosso experimento.Além disso, como vimos anteriormente, é possível orientar o spin da partícula

numa direção qualquer através da aplicação de campos magnéticos. Ou seja, seuma partícula é preparada no estado j+i e desejamos girar seu spin de 90o nadireção y, de sorte que este �que na direção +x basta aplicar o campo

B = By ) H = ��B�2 ) U (t) = exp

�i

~�B�2t

�para termos

jhx+jU (t) j+ij2 = 1 :

Calculando explicitamente

hx+j exp�i

~�B�2t

�j+i = hx+j

hcos

~Bt+ i�2 sin

~Btij+i

= hx+jhcos

~Bt j+i+ i�2 j+i sin

~Bti

=hcos

~Bt hx+ j+i+ ii hx+ j�i sin

~Bti

=

�1p2cos

~Bt� 1p

2sin

~Bt

�=

1p2

hcos

~Bt� sin �

~Bti

=1p2

hcos

~Bt� sin �

~Bti

138

temos

jhx+jU (t) j+ij2 =1

2

h1� 2 cos �

~Bt sin

~Bti=1

2

h1� sin

�2�

~Bt�i= 1

sin�2�

~Bt�= �1) 2

~Bt = ��

2) t = � �~

4B�:

Assim, para levarmos o spin de +z para a direção +x basta aplicar o operador

U (T ) = exp

�i

~�B�2T

�= exp

��i�2

4

�= Ry

��4

�;

que nada mais é que uma rotação de 90o no eixo y. Ou seja, se o spin estavana direção +z (o que signi�ca que, numa medida de Sz obteremos +h=2 comcerteza), depois de virado 90o ele foi pra direção +x (o que signi�ca que, numamedida de Sx obteremos +h=2 com certeza). O que concorda bastante com avisão clássica de momento angular.

Remark 55 Aplicar o operador Rn (�) num estado j i gira o spin deste estadode um ângulo � na direção n.

Problem 56 O que acontece quando você gira de 360o o spin de uma partícula?

Pelo que foi dito acima, o resultado será o vetor

j 0i = Rn (2�) j i = exp��i2�

2n:�

�j i = exp (�i�n:�) j i

= (cos� � i (n:�) sin�) j i= � j i

Remark 57 Ou seja, você não vai obtermos o mesmo estado, mas sim com umsinal invertido!

Lembre-se que, em problemas de mecânica, temos uma de�nição mais re-strita para o conceito de vetores. Vetores são quantidades que, por uma rotaçãodo sistema de coordenadas, se transformam como as componentes das coorde-nadas (veja, por exemplo, o livro do Marion de Mecânica). Em especial, poruma rotação de 360o todos os vetores voltam ao mesmo estado. Vemosentão que os nossos estados para as partículas de spin 1

2 não se comportamcomo vetores (no sentido da lei de transformação). Quantidades que setransformam como os estados acima são chamados de espinores. Ou seja, pararetornar ao seu estado original um espinor precisa sofrer uma rotação de 720o.Assim, o momento magnético estudado aqui possui uma natureza diferente

do momento magnético estudado em mecânica (ou eletromagnetismo). En-quanto este último é um vetor, o primeiro é um espinor.

139

Como na mecânica clássica, este momento magnético pode ser associado aomomento angular do sistema

�C = �L ; �Q = �S :

Entretanto, enquanto L é um vetor S é um espinor. Ou seja, quando usamos asnotações

S =~2� ; H = �B� �B ;

estamos fazendo um abuso da notação vetorial.Recapitulando, se j i é o estado da partícula num certo estado de spin,

então, o estado j 0i obtido por uma rotação do spin de um ângulo � vale

j 0i = Rn (�) j i :

Observe também que,

Rn (0) = exp

��i02n:�

�= I :

Além disso, para rotações na mesma direção

Rn (�1) Rn (�2) = exp

��i�12n:�

�exp

��i�22n:�

�= exp

��i (�1 + �2)

2n:�

�= Rn (�1 + �2)

Ou seja, o operador de rotação compartilha todas as características do op-erador de evolução. Tudo que precisamos fazer e achar um hamiltoniano quenos dê o operador de evolução desejado. Lembrando agora que

H = ���B =) U (t) = exp

�i�

~B�

B

Bt

�= exp

�i�B

~(��n) t

�;

onde n é um vetor unitário na direção de B. Basta agora comparar

U (t) = exp

�i�B

~(��n) t

�= exp

��i�2n:�

�= Rn (�) :

Ou seja, a aplicação de um campo B, por um tempo t é equivalente a girar ospin da partícula de um ângulo

�� = 2�B~t ;

na direção do campo (o sinal de � indica que o giro é no sentido horário).Desta forma, através da aplicação de campos magnéticos, podemos manipulare produzir estados com qualquer valor desejado de spin.Como vimos acima, diferente de um vetor, por uma rotação de 360o um

espinor se transforma como

j i 360o

! �j i :

Entretanto, os dois estados acima diferem apenas por uma fase.

140

Problem 58 Será que esta fase tem algum signi�cado físico?

Em outras palavras, será que é possível detectar alguma diferença quandoum sistema físico é girado de 360o.?Como apresentado no primeiro postulado, uma fase global não possui nen-

hum signi�cado físico. Entretanto, a diferença de fase entre dois estados (quese comporta como uma fase local) pode ser medido. Pois, pelo comportamentoondulatório dos sistemas, a combinação de dois estados com uma defasagem de180o é completamente destrutiva. Lembre-se que a probabilidade é o móduloquadrado da soma das amplitudes.O experimento da �gura abaixo (proposto por J. Bernstein, Yakir Aharonov

e Leonard Susskind) utiliza um feixe de nêutrons que é dividido por um cristalA e, em seguida, por mais dois cristais B e C, e se recombinam num cristal D.Estes cristais (feitos com silício) dividem o feixe em dois feixes de intensi-

dades iguais. Assim, este se comporta exatamente como um experimento deduas fendas para o elétron. Ou seja, se jABi é o estado do nêutron quando elesobe após passar pelo cristal A e jACi o estado quando ele desce, ao passar pelocristal o nêutron estará num estado

1p2(jABi+ jACi) ;

onde a soma indica que estes dois estados estão em fase.Após passar pelo cristal o nêutron pode ter seguido qualquer um dos dois

caminhos (com a mesma probabilidade), de sorte que no pontoD as suas funçõesde onda em todas as trajetórias possíveis se interferem (ou seja, assim como noexperimento de duas fendas, ele interfere com ele mesmo).Mais ainda, podemos descrever o estado do nêutron quando chega em D

como1p2(jCDi+ jBDi)

O feixe no caminho BD passa por um campo que, quando ligado, gira o spindo nêutron de 360o. Se o campo está desligado os dois feixe são idênticos e suarecombinação é construtiva no ponto D (o experimento é ajustado para que issoaconteça)

P =

���� 1p2 (hCDj+ hBDj) 1p2 (jCDi+ jBDi)����2 = 1

Observe que, se a partícula foi numa direção ela certamente não foi na outra,hCD jBDi = 0. Entretanto, quando o campo é ligado, o estado do nêutron quechega em D passa a ser

1p2(jCDi � jBDi)

e a combinação em E é completamente destrutiva e nenhuma partícula édetectada

P =

���� 1p2 (hCDj � hBDj) 1p2 (jCDi+ jBDi)����2 = ����12 (1� 1)

����2 = 0 :141

Figure 11: Bernstein, Herbert J.; Phillips, Anthony V., Fiber Bundles andQuantum Theory, Scienti�c American, vol. 245, issue 1, pp. 122-137 (1981)

142

Assim, é possível detectar experimentalmente uma diferença num sistema giradode 360o. Nenhuma quantidade clássica apresenta esta característica.Este experimento foi realizado (entre outras vezes) em 1975 por Helmut

Rauch e Ulrich Bonse no Instituto Laue-Langevin em Genebra.A descrição acima deixa claro que o spin é um momento angular de natureza

completamente diferente do momento angular orbital. Assim, quando no futuroobtivermos um operador que represente o momento angular orbital clássico deum sistema, este terá um comportamento completamente diferente do descritopara o spin (em especial, ele se comportará com um vetor e não como umespinor). Com isso, o spin é uma característica (sem análogo clássico) que aspartículas possuem. E não uma característica gerada por algum efeito, comorotação ou qualquer coisa do gênero.

9 Ressonância

Vamos usar o resultado acima para resolver o seguinte problema (complicado!).Uma partícula de spin 1=2 está sujeita a um campo de intensidade B0z na direçãoz e um campo, de intensidade B0, que gira no plano x; y

B0 = � (B0 cos!t;B0 sin!t;B0z)

Com isso, o hamiltoniano do nosso sistema se torna

H 0 = H 0 (t) = � (B0�1 cos!t+B0�2 sin!t+B

0z)

Pelas razões discutidas antes, mesmohH (t) ; H (t0)

i6= 0, podemos escrever

U (t) = exp

�� i~

Z t

0

H (t) d�

�entretanto, a presença do termo Bzt inviabiliza a aplicação da técnica anterior.Tudo que precisamos fazer é �mudar nosso sistema de coordenada�, i.e., va-

mos observar este campo de um sistema que gira junto com o campo. Ou seja,um sistema que gira na direção do eixo z com velocidade angular !t. Nestecaso, temos apenas um campo estático no plano x; y de intensidade B e outro,também estático, na direção z de intensidade Bz. Este problema com campoindependente do tempo pode ser resolvido sem muitos problemas. Seguindo anomenclatura da seção anterior, vamos chamar de quantidades com linha aque-las que queremos resolver (o campo girante) e sem linha aquelas que sabemosresolver (o campo estático). Sabemos que nosso hamiltoniano H 0 se relacionacom H pela relação (??)

H 0 = MHM�1 � i~M dM�1

dt

!:

Problem 59 Mas qual o hamiltoniano H?

143

Sabemos que H representa um campo estático no plano x; y combinado comum campo estático na direção z. Além disso, podemos começar a girar o nossosistema no instante em que o campo girante aponta na direção do eixo x (issosigni�ca apenas escolher adequadamente a fase da nossa rotação). Com isso,podemos escrever

H = � (B�1 +Bz�3) :

Além disso, também pelo que foi apresentado antes, sabemos que o operadorresponsável pela rotação desejada é

Rz (!t+ �) = exp

��i (!t+ �)

2�3

�Onde � é apenas uma fase indicando quando começamos a girar. Escolher estafase signi�ca dizer em que direção do plano x; y estamos vendo o campo. Assim,se j 0i é a solução do problema com o campo girante, a solução j i com o campoestático é dada por

j i = Rz j 0i =) j 0i = R�1z j i :

Comparando com (??) vemos que, neste caso,

M (t) = R�1z (!t+ �)

Sabendo que o hamiltoniano H 0 com o campo girante se relaciona com ohamiltoniano H com o campo estático pela relação (??)

H 0 = MHM�1 � i~M dM�1

dt

!= R�1z HRz � i~R�1z

dRzdt

!

Com isso, temos

dRzdt

= �i!2�3 exp

��i (!t+ �)

2�3

�= �i!

2�3Rz

H 0 = RzHR�1z � i~Rz

�i!

2�3R

�1z

�= RzHR

�1z +

!~2�3

calculando

RzHR�1z = �

�BRz�1R

�1z +BzRz�3R

�1z

�= �

�BRz�1R

�1z +Bz�3

�onde

Rz�1R�1z =

�cos

(!t+ �)

2� i�3 sin

(!t+ �)

2

��1

�cos

(!t+ �)

2+ i�3 sin

(!t+ �)

2

�= �1

�cos2

(!t+ �)

2� sin2 (!t+ �)

2

�+ 2�2 cos

(!t+ �)

2sin

(!t+ �)

2

= �1 cos (!t+ �) + �2 sin (!t+ �)

144

Podemos agora acertar a nossa fase exigindo que em t = 0 o campo aponteapenas na direção x

Rz (0)�1R�1z (0) = �1 cos (�) + �2 sin (�) = �1 =) � = 0 ;

com isso temos

RzHR�1z = � [B�1 cos (!t) +B�2 sin (!t) +Bz�3]

Substituindo agora em H 0 temos

H 0 = RzHR�1z +

!

2�3 = �� [B�1 cos (!t) +B�2 sin (!t) +Bz�3] +

!~2�3

= �

�B�1 cos (!t) +B�2 sin (!t) +

�Bz +

!~2�

��3

�Ou seja, o nosso problema girado representa a aplicação do seguinte campodependente do tempo

B = ��B cos (!t) ; B sin (!t) ; Bz +

!~2�

�podemos identi�car com o campo desejado

B0 = � (B0 cos!t;B0 sin!t;B0z)

fazendo

B0 = B ; B0z = Bz +!

2�) Bz = B0z �

!~2�

onde lembramos que as quantidades conhecidas (i.e., os campos reais) são aque-las com linha.Tudo que precisamos fazer agora é encontrar a solução para

H = � (B�1 +Bz�3)) U (t) = exp

�� i~� (B�1 +Bz�3) t

�Usando

(B�1 +Bz�3)2= B2 +B2z

temos

U (t) = exp

� i~�pB2 +B2z

(B�1 +Bz�3)pB2 +B2z

t

!

= cos��~pB2 +B2z t

�� i (B�1 +Bz�3)p

B2 +B2zsin��~pB2 +B2z t

�= cos (t)� i (B�1 +Bz�3)p

B2 +B2zsin (t)

=�

~pB2 +B2z

145

Podemos agora responder qualquer pergunta sobre o comportamento do sistema.Suponha, por exemplo, que você preparou sistema inicialmente no estado

j+i, ou seja,j 0i = j+i

observe quej 00i = Rz (0) j 0i = j 0i ;

ou seja, a condição inicial vale tanto para o nosso sistema com e sem linha.

Problem 60 Ao aplicarmos o campo girante, qual a probabilidade de, depoisde um tempo T , o sistema ser encontrado no estado j�i?

Para isso basta calcular 0f j 0ti =

0f R

�1z (!t) j ti =

0f R

�1z (!t)U (t) j 0i

onde

h� R�1z (!t)U (t) j+i ="h� R�1z (!t) j+i cos (t)� i h�jR�1z (!t)

(B�1 +Bz�3)pB2 +B2z

j+i sin (t)#

=

"h� j+i e�i!2 t cos (t)� i

�h�jR�1z (!t)B j�i+ h�jR�1z (!t)Bz j+i

�pB2 +B2z

sin (t)

#

=

"�i�h� j�i ei!2 tB + h� j+i e�i!2 tBz

�pB2 +B2z

sin (t)

#

=

"�iei!2 t Bp

B2 +B2zsin (t)

#com isso

jh� Rz (!t)U (t) j+ij2 =B2

B2 +B2zsin2 (t) =

B02

B02 +�B0z � !

2�

�2 sin2 (t) =

~

sB02 +

�B0z �

!

2�

�2Do resultado acima vemos que a nossa probabilidade é máxima quando

B0z �!~2�

= 0) ! =2�B0z~

:

Esta é a freqüência de ressonância do sistema. Ou seja, apenas quando o campona direção z respeita esta relação com a freqüência de giro do campo no planox; y, temos a possibilidade de inversão de todos os spins do nosso sistema. Obvi-amente, para que esta inversão ocorra, o campo tem de ser aplicado exatamentepor um tempos

sin2 (Rt) = 1) Rt =�

2mod (�) =

~B0t) t =

�~2�B0

mod (�) ;

146

onde R é calculado na ressonância

R =� jB0j~

:

Observe que o nosso hamiltoniano tem a forma

H = � (B0�1 cos!t+B0�2 sin!t+B

0z�3) = �

�B0z B0 (cos!t� i sin!t)

B0 (cos!t+ i sin!t) �B0z

�=

= �

�B0z B0e�i!t

B0ei!t �B0z

�que, na forma de operadores, na base fj+i ; j�ig pode ser escrito como

H = ��B0z j+i h+j �B0z j�i h�j+B0e�i!t j+i h�j+B0ei!t j�i h+j

�ou seja, os elementos fora da diagonal são os responsáveis pela transição entrediferentes estados da nossa base. Quando B0 = 0 não existe transição e osestados j+i e j�i são estacionários. A presença do campo B0 promove estatransição e esta é máxima na freqüência de ressonância.Como dissemos, a descrição de uma partícula de spin 1=2 é apenas um caso

particular do caso geral de um sistema de dois níveis. Para um sistema geral dedois níveis podemos escrever

H = E1 j+i h+j+ E2 j�i h�j+ V12 j+i h�j+ V21 j�i h+j ;

ou ainda, para o caso de um sistema de dois níveis sujeito a um potencial girante(que pode ser um campo elétrico, magnético ou qualquer outra coisa)

H = E1 j+i h+j+ E2 j�i h�j+ V e�i!t j+i h�j+ V ei!t j�i h+j :

Quando o potencial é desligado V = 0 os estados com energia E1 e E2 sãoestacionários e quando este potencial é ligado, temos a transição entre os níveis.A transição é máxima na freqüência de ressonância. Para encontrar a freqüênciade ressonância neste caso, basta observar que, no caso do campo magnético adiferença de energia entre os níveis diagonais valia

E1 � E2 = � (B0z +B0z) = 2�B

0z

então, no caso geral temos

! =2�B0z~

=E1 � E2

~) ~! = E1 � E2 :

Se usarmos o modelo de que o campo eletromagnético é formado por fótonscom energia ~!, a ressonância ocorre quando a freqüência dos fótons do campogirante é igual a diferença de energia dos níveis do sistema.

147

Exercise 61 Mostre que,

H = M�1H 0M + i~

dM�1

dt

!M

= ���B0 f�1 cos (��) + �2 sin (��)g+

�B0z +

!~2�

��3

�onde

H 0 = H 0 (t) = �� (B0�1 cos!t+B0�2 sin!t+B0z�3)

M = Rz (!t� �) = exp��i (!t+ �)

2�3

�Os resultados acima possuem uma in�nidade de aplicação em física. Por

exemplo, uma molécula de amônia (NH3) num campo elétrico constante pos-sui dois níveis de energia que dependem da orientação do átomo de nitrogênio.Através de um experimento tipo SG (mas usando campo elétrico variável no es-paço e não campo magnético) é possível selecionar toras as moléculas no estadoj2i, i.e., com energia no estado fundamental. Se estas moléculas entram numcampo girante na freqüência de ressonância no tempo certo (calculado anteri-ormente) todas estarão no estado excitado. Ainda pela ação do campo estasmoléculas vão decair emitindo fótons de mesma energia que os absorvidos ante-riormente. Estes fótons irão se somar com o do campo aplicado e, durante algumtempo, teremos uma ampli�cação do campo. Desta forma podemos gerar pul-sos de campo ampli�cado. Este processo se chama Ampli�cation by StimulatedEmission of Radiassion. No caso das moléculas de amônia, como a freqüênciade ressonância esta no espectro de microondas: Microwave ASER, ou MASER.No caso de sistemas cuja freqüência de ressonância está no espectro do visível:Light ASER ou LASER.Para a próxima aplicação é importante analisar o comportamento da ampli-

tude máxima com relação à freqüência. Plotando a função

f (!) =V 2

V 2 +�(E1�E2)�~!

2

�2temos algo como a �gura abaixo.Controlando o potencial (ou campo) constante é possível estreitar a largura

do pico. Assim, sob condições experimentais adequadas este pico é tão estreitoque, mesmo na presença de uma série de sistemas (átomos, moléculas etc) difer-entes, é possível excitar apreciavelmente apenas um tipo de sistema especí�co.Com isso, outro exemplo de aplicação é quando você tem uma grande quanti-dade de um certo átomo que sabidamente estão no estado fundamental (e.g.,por equilíbrio térmico). Neste caso, se você sabe a diferença de energia entreo estado fundamental e o primeiro estado excitado, é possível excitar o sistemacom uma radiação na freqüência de ressonância e, quando o sistema decair, você

148

Figure 12: Figura retirada do Sakurai

pode medir a intensidade da radiação emitida e saber quantos átomos daqueletipo existem no sistema. Além disso, se o sistema é composto por vários áto-mos diferentes, apenas o elemento que você deseja medir irá responder a esteprocesso. Este é o mecanismo dos aparelhos médicos MRI (Magnetic resonanceimaging). Além do mecanismo de qualquer tipo de análise com ressonânciamagnética (e.g., MRN).Este mesmo processo é usado para excitar certas moléculas, como a de água

no forno de microondas e uma in�nidade de aplicações.Um detalhe na teoria desenvolvida acima é a di�culdade de se produzir

campos girantes com freqüências altas o su�ciente. Por isso, no lugar de umcampo girante é utilizado um campo linear do tipo

B = (B cos (!t) ; 0; Bz) :

Este problema não pode ser resolvido pelo método anterior, mas deve ser ata-cado por métodos aproximativos. Entretanto, o fato de um campo linearmentepolarizado ser a superposição de dois campos circulares em direções opostas,faz com que os resultados sejam idênticos aos obtidos acima. Voltaremos a esteproblema quando estudarmos métodos aproximativos.

10 Observáveis compatíveis

Uma questão crucial em MQ é quando uma medida perturba o sistema, ouainda, quando um observável tem um valor bem de�nido. Como vimos, para

149

que a medida de uma quantidade A não perturbe o sistema, este deve estarnum auto-estado de A. Assim, A não irá perturbar um sistema que esteja numauto-estado

A j�i = a j�i :De outra forma, a medida do observável A num estado genérico

j i =X

cn j�ni ; A j�ni = an j�ni ;

fará com que, após a medida, o sistema colapse num dos auto-estados j�ni deA.Suponha agora que, depois de efetuada uma medida de A desejamos efetuar

uma medida de outro observável B. Isso só será possível, sem perturbar osistema, se o vetor obtido após a aplicação de A em j ai também for umautovetor de B, ou seja, se

B�A j�i

�= b0A j�i = b0a j�i = b j�i ; b = b0a ;

ou seja, j ai tem de ser simultaneamente autovetor dos dois operadores A eB,

A j�i = a j�i ; B j�i = b j�i :Mas, se isso é verdade, temos

AB j�i = ab j�i ;BA j�i = ba j�i = ab j�i ;

ou ainda, hAB � BA

ij�i = 0

Para qualquer auto-vetor simultâneo de A e B.A quantidade acima é o comutador entre os operadores A e Bh

A; Bi= AB � BA :

Além disso, se todo o autovetor de A for também autovetor de B temoshA; B

ij�ni = 0 ; A j�ni = �n j�ni

e sabemos que qualquer vetor pode ser escrito como

j i =Xn

cn j�ni

temos que hA; B

ij i =

hA; B

iXn

cn j�ni =Xn

cn

hA; B

ij�ni = 0

150

Ou seja, sehA; B

i= 0 para qualquer vetor j i do nosso espaço, então A e B

tem uma base de auto-vetores em comum. Mais ainda, podemos efetuarmedidas de um dos operadores sem alterar o valor do outro.Ou ainda, os dois observáveis podem ser medidos simultaneamente. Quandoh

A; Bi= 0

dizemos que A e B comutam, ou ainda, que estes observáveis são compatíveis.

Remark 62 Apenas observáveis compatíveis podem ser medidos simultanea-mente em MQ.

Os resultados acima nos dizem quando devemos esperar uma incerteza rela-cionada a medida de dois observáveis quaisquer.Por exemplo: Um exemplo é o caso do spin da partícula.Como vimos, os operadores de spin nas direções x; y; z são dados por:

Si =~2�i ; �1 =

�0 11 0

�; �2 =

�0 �ii 0

�; �3 =

�1 00 �1

�:

Vamos então à descrição de uma série de medidas do spin de uma partícula.Suponha que você alinhou o aparato de SG na direção z, ou seja, efetuou umamedida de S3 e obteve o valor +1 (a partícula subiu). Com isso, pelos postuladosvistos, sabemos que a partícula, após a medida, está num auto-estado de S3 comvalor +1:

jz+i =�10

�:

Suponha agora que, depois desta medida, você alinha o aparato da direçãox efetua uma nova medida.Após esta segunda medida o sistema irá colapsar num dos autovetores de S1

jx+i =1p2

�11

�=

1p2(j+i+ j�i) ; jx�i =

1p2

�1�1

�:

Exercise 63 Veri�que que estes vetores são autovetores de S1 com auto valor+1 e �1.

A questão é a seguinte: você sabe que o seu sistema está no estado jz+i (poisvocê mediu o spin na direção z) e que saber, por exemplo, a probabilidade de,numa medida do spin na direção x obter o valor +1. Pelos postulados vistosanteriormente, sabemos que a probabilidade P (x+) de encontrar o sistema noestado jx+i, sabendo que ele está no estado jz+i, vale

P (x+) = jhx+ jz+ij2 =����� 1 0

� 1p2

�11

�����2 = 1

2

Da mesma formaP (x�) = jhx� jz+ij2 =

1

2

151

ou seja, você tem uma incerteza total na medida do spin na direção x.Agora, se você efetuou a medida na direção x (do estado jz+i) e obteve o

valor +1 (a partícula foi para a direita), você sabe que após a medida a partículaestá no estado

jx+i =1p2

�11

�=

1p2(j+i+ j�i) :

Se você �zer novamente uma medida do spin na direção z, a probabilidade deobter novamente +1 vale

P (z+) = jhz+ jx+ij2 =���� 1p2 � 1 1

�� 10

�����2 = 1

2

Da mesma forma P (z�) = 1=2. Ou seja, após a medida na direção x vocêperdeu toda a informação do spin na direção z.O ponto aqui é que a medida de um dos observáveis perturbou o valor do

outro. Ou seja, não podemos medir, simultaneamente, Sx e Sz.Isso já era de se esperar pelo resultado anterior, pois estes operadores não

comutam:hSx; Sz

i=

�~2

�0 11 0

�;~2

�1 00 �1

��=

�~2

�2 ��0 �22 0

��=~2

2

��0 �11 0

��= �i~

2

2

��0 �ii 0

��= �i~

2

2S2 6= 0 :

A caracterização de um certo sistema físico depende, em geral de uma série decaracterísticas e medidas. Por exemplo, a partícula pode ter spin Sz e momentoP e nomeamos seu estado como

jSz; P i ;

ou ainda, dois valores quaisquer dos observáveis A e B,

jA;Bi :

Quanto mais características damos a um estado físico melhor o especi�camos.Entretanto, dizer que o sistema possui as características A e B signi�ca que estascaracterísticas possam ser determinadas simultaneamente. Ou seja, pararotular os estados devemos escolher apenas observáveis compatíveis.Assim, não podemos caracterizar o sistema num estado do tipo

jSz; Sxi :

Diferente da MC onde podemos fazer cada vez mais medidas no nosso sistema e,destarte, melhor caracterizá-lo, na MQ a caracterização do sistema está restritoa compatibilidade dos observáveis. Quando temos um conjunto de observáveiscompatíveis que são capazes de caracterizar completamente um sistema físico,dizemos que temos um conjunto completo de observáveis.

152

10.1 Relações de incerteza

Uma quantidade clássica muito usada para caracterizar a incerteza de umamedida A é o desvio quadrado médio

�2A =A2�� hAi2

Pelos postulados da MQ sabemos que, o valor médio de um observável A numestado vale

hAi = h j A j i ;

e a versão quântica para o desvio padrão pode ser escrita como

�2A ( ) = h j A2 j i � h j A j i2

se �zemosA = A� h j A j i

podemos escrever�2A ( ) = h j A2 j i

Exercise 64 Veri�que a a�rmação acima.

Considere agora dois observáveis A e B.Um resultado conhecido como desigualdade de Schwarz

h� j�i h� j�i � jh� j�ij2 ;

nos diz que, para qualquer operador hermitiano A e qualquer vetor j i (nãonecessariamente normalizado),

h j A2 j i h j B2 j i ����h j A B j i���2

com isso temos

�2A ( )�2B ( ) = h j A2 j i h j B2 j i �

���h j A B j i���2 (75)

Além disso, apesar de serem hermitianos, o produto AB nem sempre o será.Com isso a quantidade

h j A B j i

será, em geral, complexa���h j A B j i���2 = hRe�h j A B j i�i2+hIm�h j A B j i�i2 � hIm�h j A B j i�i2(76)

Podemos agora calcular

Im�h j A B j i

�=1

2i

�h j A B j i � h j A B j i

�153

Mas,

h j A B j i = h j�A B

�+j i = h j B+ A

+ j i = h j B A j i

onde, na última igualdade, usamos a hermiticidade de A e B. Com isso

Im�h j A B j i

�=1

2i

�h j A B j i � h j B A j i

�=1

2ih j�A B � B A

�j i

=1

2ih jhA ; B

ij i

usando hA ; B

i=hA� h j A j i ; B � h j B j i

i=hA; B

itemos

Im�h j A B j i

�=1

2ih jhA; B

ij i (77)

Usando (75), (76), (77) temos

�2A ( )�2B ( ) �

���h j A B j i���2 � hIm�h j A B j i�i2 = ���� 12i h j hA; Bi j i����2 :

Com isso�A ( )�B ( ) �

1

2

���h j hA; Bi j i���ou seja, o produto da incerteza de qualquer medida é proporcional ao comutadordos operadores correspondentes.

11 Sistemas de várias partículas

Em MQ a descrição de um sistema com mais de uma entidade se dá atravésdo produto tensorial dos espaços de cada sistema. Então, usando a notaçãoanterior, se j 1i 2 H1 representa uma entidade do sistema (e.g., uma partícula)e j 2i 2 H2 uma segunda entidade (e.g., uma segunda partícula), o estadoquântico do sistema como um todo será:

ji = j 1i j 2i � j 1 2i ; ji 2 H = H1 H2 :

Todos os operadores também serão escritos desta forma

A =Xi

Ai Bi ; Ai 2 H1 ; Bi 2 H2

A ji =Xi

Ai Bi j 1i j 2i =Xi

�Ai j 1i

��Bi j 2i

154

Suponha, por exemplo, que você possui duas partículas de spin 12 . Primeiro,

obviamente, precisamos escolher um observável para caracterizar as partículas.Podemos usar, por exemplo, o spin na direção z para caracterizar a primeirapartícula e na direção x para caracterizar a segunda. Com isso, a forma geralde um vetor de estado do nosso sistema será

ji = j 1i j 2i = (a+ j+i+ a� j�i) (b+ jx+i+ b� jx�i)= a+b+ j+; x+i+ a+b� j+; x�i+ a�b+ j�; x+i+ b�a� j�; x�i

Onde ja�b�j2 é a probabilidade de encontrar a primeira participa no estado j�ie a segunda no estado jx�i.Suponha que as duas partículas estão distantes e você passou a primeira por

um SG na direção z e veri�cou que ela subiu (i.e., está no estado j+i) com issoo estado �nal do seu sistema será

jf i = b+ j+; x+i+ b� j+; x�i :

Vamos imaginar agora que as partículas estão juntas e vamos realizar exper-imento com ambas nos mesmos dispositivos. Neste caso, é interessante usarmoso mesmo observável para caracterizar ambas as partículas. Vamos então usarSz para as duas partículas. Neste caso, um estado geral do nosso sistema vale

ji = a+b+ j+;+i+ a+b� j+;�i+ a�b+ j�;+i+ b�a� j�;�i

Onde agora ja�b�j2 é a probabilidade de encontrar a primeira participa noestado j�i e a segunda no estado j�i. O conjunto de vetores acima forma umabase para o nosso espaço. Observe que agora nossos vetores são matrizes colunade 4 elementos. Na base canônica, usando o produto de Kronecker podemosescrever

j+;+i =�10

��10

�=

0BB@1000

1CCA :

Suponha agora que estas duas partículas passam por um campo magnéticoB.

Problem 65 Qual o hamiltoniano do sistema?

Neste caso, nós precisamos saber se as partículas interagem entre si ou não.Ou seja, se o estado de spin de uma partícula in�uencia no estado da outra.Supondo que as partículas não interagem, o hamiltoniano pode ser escrito como

H = �B I + I �B :

Para o caso em que os campos são diferentes em cada partícula, i.e., apartícula 1 está sujeita ao campo B1 e a 2 a um campo B2 temos:

H = �B1 I + I �B2 :

155

Para o caso mais geral de partículas interagentes o hamiltoniano tem a forma

H = �B1 I + I �B2 +3X

ij=1

Vij�i �j :

Exemplo:Duas partículas não interagente de spin 1

2 estão sujeitas a um campo deintensidade B na direção z. Se o sistema foi preparado inicialmente com ambasno estado j+i, qual a probabilidade de, depois de um tempo t, ambas seremencontradas no estado jx+i?O operador de evolução do sistema será

U (t) = exp

�� i~Ht

�; H = �3B I + I �3B

U (t) = exp

�� iB~(�3 I + I �3) t

�= exp

�� iB~(�3 I) t

�exp

�� iB~(I �3) t

�observe agora que

(�3 I)2 = (�3�3 II) = I I = I

onde I é a identidade 4� 4. Com isso

exp

�� iB~(�3 I) t

�= cos

�B

~t

�� i�3 I sin

�B

~t

Para responder nossa pergunta calculamos

hx+x+jU (t) j++i = hx+x+j exp�� iB~(�3 I) t

�exp

�� iB~(I �3) t

�j++i

= exp

��2 iB

~t

�hx+x+ j++i

= exp

��2 iB

~t

�hx+ j+i hx+ j+i = exp

��2 iB

~t

�1p2

1p2

= exp

��2 iB

~t

�1

2

ou seja

jhx+x+jU (t) j++ij2 =1

4:

O que já era de se esperar, pois os estados j++i são estacionários e a probabil-idade de cada um deles ser encontrado no estado jx+i vale 1=2.

156

Suponha que no exemplo acima a primeira partícula esteja sujeita ao campoB1 = B1z e a segunda ao campo B2 = B2x,

H = �3B1 I + I �1B2

lembrando que [�1; �3] 6= 0 será que podemos escrever

exp

�� i~(B1�3 I + I B2�1) t

�= exp

�� iB1~(�3 I) t

�exp

�� iB2~(I �1) t

�?

A resposta é sim, pois

[�3 I; I �1] = (�3 I) (I �1)� (I �1) (�3 I)= (�3 �1)� (�3 �1) = 0 :

De forma geral, se o sistema 1 está sujeito ao hamiltoniano H1, o sistema 2ao hamiltoniano H2 é os sistema não interagem:

U (t) = exp

�� i~

�H1 I + I H2

�t

�= exp

�� i~H1 It

�exp

�� i~I H2t

�:

Remark 66 Como era de se esperar, sistemas sem interação evoluem indepen-dentemente, cada um com seu hamiltoniano.

Como ocorre então na MQ a descrição da interação de duas partículas?Suponha agora que as partículas interajam entre si. Então esta interação

será descrita por um operador na forma

A =Xi

Ai Ai

Ou seja, um operador que age, simultaneamente, nos dois espaços (e, conse-qüentemente, nas duas partículas). O hamiltoniano total será

H = H1 I + I H2 +Xi

Ai Ai

Onde os primeiro dois termos descrevem a interação de cada uma das partículascom o meio e o último termo a interação de uma partícula com a outra.

11.1 Interação de Heisenberg

Vamos estudar com um pouco mais de detalhes o caso de duas partículas de spin12 que interagem entre si. Em primeiro lugar este hamiloniano é um operadoragindo no EH dos vetores de dimensão 4. Ou seja, é uma matriz 4 � 4. Umabase para este espaço pode ser construída com 16 matrizes LI. Lembrando que

157

as matrizes �i mais a identidade formam uma base para as matrizes 2 � 2,podemos formar com estas matrizes a seguinte base para o espaço das matrizes4� 4

I = I � I ; �i = I � �i ; �i = �i � I ; ij = �i � �jOu seja, qualquer operador de interação (ou não) pode ser escrito na forma

M = �I +3Xi=1

�iI � �i +3Xi=1

i�i � I +3X

i;j=1

!ij�i � �j

Vamos olhar o primeiro termo. Chamando de H 0 todos os demais termos, ooperador de evolução temporal para o sistema pode ser escrito como

U (t) = exp

�� i~

��I + H 0

�t

�= exp

�� i~�It

�exp

�� i~H 0t

�= I exp

�� i~�t

�exp

�� i~H 0t

�Ou seja, quando aplicado em qualquer vetor

h�jU j�i = h�j exp�� i~�t

�exp

�� i~H 0t

�j�i = exp

�� i~�t

�h�j exp

�� i~H 0t

�j�i

ou seja

jh�jU j�ij2 =����h�j exp�� i~H 0t

�j�i����2

Assim, este termo não in�uência nas probabilidades e, conseqüentemente,na física do sistema. Fisicamente este termo está relacionado apenas com umaescolha no zero da energia do sistema, o que, em geral, é arbitrário. Com isso,podemos fazer � = 0.Vamos agora analisar o segundo e o terceiro termo

3Xi=1

�iI � �i ;3Xi=1

i�i � I

Como já vimos estes termos descrevem operações que agem em cada um dossistemas separadamente e não representam uma interação. Ou seja, podemos,em geral incorporar estes termos na hamiltoniana de cada sistema independen-temente:

H 01 = H1 +

3Xi=1

i�i

H 02 = H1 +

3Xi=1

�i�i

158

O tratamento matemático destes termos é o mesmo analisado anteriormentepara sistemas sem interação. Por isso nós não vamos voltar nossa atenção paraeles. Observe que não estamos fazendo �i = �i = 0. Pode ocorre que apresença de um sistema faça o outro �sentir�o campo aplicado de forma difer-ente. Mas, em muitos casos, isso pode ser descrito como um campo gerado pelaprópria partícula e descrito como um campo B0 efetivo. Por exemplo, no casodo momento elétrico e partículas carregadas este seria o campo elétrico que umapartícula cria na posição da outra. O importante é que, uma vez conhecido estecampo ele pode ser tratado como um termo de campo externo e não como umainteração.Com tudo isso o termo que realmente importa para nossa interação é o

produto tensorial das matrizes e nosso hamiltoniano pode ser escrito como:

H = �B1 I + I �B2 +3X

ij=1

!ij�i �j :

Os valores de !ij (no caso geral !ij = !ij (t)) devem ser determinadas exper-imentalmente analisando a in�uência que um sistema tem sobre o outro. Nesteaspecto o exemplo de duas partículas de spin 1

2 é o melhor e o pior exemplopossível.Ele é um exemplo ruim porque a interação que o spin de uma partícula exerce

sobre a outra não é proveniente de nenhuma força conhecida na natureza (i.e.,não de natureza gravitacional, eletrofraca, forte). Mesmo assim estas quan-tidades se in�uenciam, no sentido que o fato do spin de uma partícula estarnum certo valor pode diminuir a probabilidade do spin da outra partícula estarno mesmo valor. Este é o chamado princípio da exclusão e será visto quandoestudarmos estatísticas quânticas. O ponto é que, por exemplo, quando umapartícula (e.g., um elétron num ponto quântico) é colocado no estado fundamen-tal, necessariamente a outra irá para o estado excitado. Mesmo que nenhumaenergia seja trocada entre as partículas. Por isso esta é chamada interaçãode troca. Mas o fato desta interação não ser de nenhuma natureza de forçasconhecidas, faz com ela não possa ser medida diretamente por nenhum equipa-mento conhecido. Tudo que podemos fazer e estudar o comportamento de umapartícula na presença da outra e ver se houve alguma alteração em relação apartícula sozinha. Com tudo isso é fácil ver que é extremamente difícil deter-minar !ij e, em geral, esta quantidade depende não apenas das partículas emquestão, mas das características do sistema como um tudo (se os elétrons estãonum átomo ou num quantum dot). Ao mesmo tempo o caso de dois spins éum exemplo bom porque deixa explícito o fato que ao analisar a interação entresistema não basta levar em conta os campos produzidos pelas partículas.Felizmente é possível fazer uma aproximação que funciona bem na maioria

dos casos. Devido a simetria do espaço é de esperar que esta interação nãodependa da orientação espacial do sistema (veja que isso não é verdade se umcampo quebrar esta simetria, por isso dizemos que é uma aproximação). Assim,

159

o operador M procurado deve comutar com as rotaçõeshRn; M

i= 0 :

É possível mostrar (exercício) que o seguinte operador possui esta característica

M = V (�1 �1 + �2 �2 + �3 �3)

= V3Xi=1

�i �i :

Esta é a chama interação de Heisenberg e é usada para modelar grande partedos sistemas onde a interação de spin é relevante.Assim a hamiltoniana para o sistema de dois spins que interagem pela inter-

ação de Heisenberg pode ser escrito como

H = �B1 I + I �B2 + V3X

ij=1

�i �i

E o operador de evolução do sistema (para o caso independente do tempo)

U (t) = exp

0@� i~

24�B1 I + I �B2 + V 3Xij=1

�i �i

35 t1A

Observe que agora, no caso geral, nosso hamiltoniano não pode mais ser divididoem produtos.Por exemplo, supondo que a primeira partícula está sujeita a um campo na

direção x a segunda esta livre temos:

U (t) = exp

0@� i~

24�1B I + V 3Xij=1

�i �i

35 t1A

Podemos calcular

[�1 I; �1 �1 + �2 �2 + �3 �3] = [�1 I; �2 �2 + �3 �3]= [�1 I; �3 �3] + [�1 I; �2 �2]= [�1; �3] �3 + [�1; �2] �2= �i�2 �3 + i�3 �26= 0 :

Assim, mesmo para o caso mais simples de campos independentes do temponão podemos, em geral, encontrar uma forma matricial para o operador deevolução. Assim, no caso geral, precisamos construir explicitamente a matriz4� 4 H, encontrar seus auto-vetores e expandir o estado inicial na base destesauto-vetores.Vemos assim a grande di�culdade introduzida quando os sistemas interagem.

Entretanto, para alguns casos especiais este problema pode ser resolvido exata-mente (exercícios).

160

11.2 Dois spins acoplados

Quando estudamos o caso de partículas de spin 12 , vimos que estas podem ser

caracterizadas pelo valor da projeção, do spin numa certa direção (e.g., Sz) e ovalor do módulo do spin

S2 = S2x + S2y + S

2z = S:S

pois hSi; S

2i= 0 :

Naquele momento, como tínhamos apenas um valor para o módulo, este oper-ador não mereceu muita atenção. Entretanto, quando temos sistemas acopladosisso muda bastante.Usando a forma explicita dos operadores temos

S2 =~2

4�21 +

~2

4�22 +

~2

4�23 =

3

4~2I =

3

4~2

de onde vemos diretamente a comutação deste operador com todos os demais,uma vez que ele é proporcional a identidade.Além disso, um operador que será importante no que segue é o chamado

operador de levantamento �+ (abaixamento ��) que levanta (abaixa) de o spinda nossa partícula de spin 1=2,

�+ = j+i h�j ; �� = j�i h+j ;

onde

�+ j�i = j+i h�j �i = j+i ;�+ j+i = j+i h�j +i = 0 ;�� j+i = j�i h+j +i = j�i ;�� j�i = j�i h+j �i = 0 :

Lembrando agora a forma explícita dos operador de spin

Sz =~2(j+i h+j � j�i h�j) ;

Sx =~2(jx+i hx+j � jx�i hx�j) ;

Sy =~2(jy+i hy+j � jy�i hy�j)

usando

161

jx+i =1p2[j+i+ j�i] ; jx�i =

1p2[j+i � j�i]

jx+i hx+j =1p2(j+i+ j�i) 1p

2(h+j+ h�j) = 1

2(j+i h+j+ j+i h�j+ j�i h+j+ j�i h�j)

jx�i hx�j =1

2(j+i h+j � j+i h�j � j�i h+j+ j�i h�j)

jx+i hx+j � jx�i hx�j =1

2[2 j+i h�j+ 2 j�i h+j] = j+i h�j+ j�i h+j

temos

Sx =~2(j+i h�j+ j�i h+j) :

Da mesma forma, usando

jy�i =1p2[j+i � i j�i] ;

temos

Sy = i~2(j�i h+j � j+i h�j) :

Com isso

Sx + iSy = ~ j+i h�j = ~�+ � S+ ;

Sx � iSy = ~ j�i h+j = ~�+ � S� :

Das expressões acima é fácil ver quehSz; S�

i= �~S�

Exercise 67 Veri�que.

Para entender o signi�cado de S� suponha que você tem um auto-estado jside Sz

Sz jsi = s jsi(obviamente s = �~=2 e jsi = j�i). Vamos ver o que acontece com o a projeçãodo momento ângular deste estado quando aplicamos o operador S�

Sz

�S� jsi

�=�S�Sz � ~S�

�jsi =

�S�s� ~S�

�jsi = (s� ~) S� jsi

Ou seja, o estado S� jsi é também um auto-vetor de Sz com o autovalor au-mentado (diminuindo) de uma unidade de ~ (lembre que S+ j+i = 0).Além disso, é fácil ver que h

S2; S�

i= 0 ;

ou seja, este operador não muda o valor da norma do momento angular de spin.

162

Exercise 68 Usando a base canônica de Sz construa a forma matricial de S�.

Vamos agora estudar o momento angular total de um sistema de duas partícu-las de spin 1

2 . Como vimos, uma base para o espaço de Hilbert deste sistemaé

j++i ; j+�i ; j�+i ; j��i

Esta base é formada pelos auto-vetores do operador de projeção de spin total

Jz = Sz � I + I � Sz = S1z + S2z ;

que por sua vez é formada pela base de autovetores de S1z e S2z.Por exemplo

Jz j+�i = (Sz � I + I � Sz) j+�i = (I � I � I � I) j+�i = 0

Ou seja, o estado j+�i tem projeção de momento angular igual a zero (o queera de se esperar uma vez que as partículas possuem spins opostos). Da mesmaforma

Jz j++i =�~2+~2

�j++i = ~ j++i

Jz j��i = �~ j��i

Ou seja, este sistema pode ter valores de Sz igual a (~; 0;�~). Se o sistema écomposto de duas partículas separadas isso signi�ca que a soma dps momentosangulares de cada uma terá estes valores.Por outro lado, se o sistema é formadopor duas partículas ligadas (por exemplo, um núcleo de deutério) ao passar porum SG um feixe destas partículas se dividiriam em 3 feixes com estes valores despin.Da mesma forma que antes podemos de�nir um operador de módulo do

momento angular total:

J2 =�S1 + S2

�2= S21 + S

22 + 2S1S2

Usando os operadores

S1� = S1x � S1y = Sx � I � Sy � I ;S2� = S2x � S2y = I � Sx � I � Sy ;

podemos escrever

2S1S2 = 2S1zS2z + S1+S2� + S1�S2+

e, consequentemente,

J2 =�S1 + S2

�2= S21 + S

22 + 2S1zS2z + S1+S2� + S1�S2+

163

observe que, apesar de S1;2� não ser hermitiano, J2 é.Por exemplo

J2 j++i =�S21 + S

22 + 2S1zS2z + S1+S2� + S1�S2+

�j++i

=�S21 + S

22

�j++i+

�2S1zS2z j++i+ S1+S2� j++i

�+ S1�S2+ j++i

=�S21 + S

22

�j++i+ 2S1zS2z j++i

=

�3

4~2 +

3

4~2�j++i+ 2~

2

~2j++i

= 2~2 j++i

ou seja, o estado j++i é um autovetor do operador de módulo do momentoangular com auto-valor 2~2 (o mesmo é válido para o estado j��i).Vamos agora calcular

J2 j+�i =�S21 + S

22 + 2S1zS2z

�j+�i+ S1+S2� j+�i+ S1�S2+ j+�i

= ~2 (j+�i+ j�+i)

Ou seja, o estado j+�i não é auto estado do operador J2. Sendo este operadorhermitiano seus auto-vetores formam uma base. Temos então duas escolhasdiferentes de base para o nosso espaço (ambas obviamente caracterizam com-pletamente o sistema): podemos trabalhar na base original de autovetores deS1z e S2z (o que explicita a individualidade das partículas) ou podemos tra-balhar numa base com autovetores de Jz e J2 (que trata o sistema como umaúnica entidade de momento angular J). A utilização de uma, ou outra, baseobviamente depende da conveniência.Vamos então montar a base de autovetoes de Jz e J2. Como vimos antes,

dois destes autovetores nós já conhecemos

Jz j++i = ~ j++i ; Jz j��i = �~ j��iJ2 j++i = 2~2 j++i ; J2 j��i = 2~2 j��i

Podemos então renomear estes estados com os valores de Jz e J 2. Paraisso, por conveniência (�cará claro no futuro) vamos escrever estes autovetorese autovalores como

Jz jjz; ji = ~jz jjz; jiJ2 jjz; ji = ~j (j + 1) jjz; ji

com isso

j++i = jjz = 1; j = 1i = j1; 1ij��i = jjz = �1; j = 1i = j�1; 1i

164

Para construir os demais autovetores você pode construir a forma matri-cial destes operadores e usar o procedimento usual. Note, entretanto, que osoperadores

J� = S1� + S2� = (S1x � iS1y) + (S1x � iS1y)= (Sx � I � iSy � I) + (I � Sx � iI � Sy)

respeitam a seguinte regra de comutaçãohJz; J�

i= �~J� ;h

J2; J�

i= 0

Exercise 69 Veri�que.

Assim, da mesma forma que antes, quando aplicado num auto estado de Jzcom auto-valor jz

JzJ� jjz; ji =�J�Jz � ~J�

�jjz; ji = (jz � ~) J� jjz; ji

temos um autovetor com valor diminuído de uma unidade.Um ponto importante a se lembrar aqui é que os autovalores de um

operador não mudam com a escolha da base. Assim, mesmo na novabase, nossos autovalores continuam sendo (~; 0;�~). Com isso, para obtermoso autovetor com autovalor de jz igua a zero

jjz = 0; j = 1i = j0; 1i ;

basta aplicarmos J� no estado com autovalor igual a ~ (ou J+ no estado comautovalor igual a �~)

j0; 1i = J� j1; 1i = J� j++i

=�S1� + S2�

�j++i = j�+i+ j+�i

Obviamente este estado deve ser normalizado

j0; 1i = 1p2(j�+i+ j+�i)

Se aplicarmos S� novamente neste vetor obteremos j�1; 1i = j��i. Ou seja,este processo não nos dá mais nenhum resultado.Entretanto sabemos que nosso espaço tem dimensão 4 e, conseqüentemente,

devemos ter 4 vetores de base. Para encontrar podemos construir o estado (nabase antiga)

jjz; ji = a j++i+ b j��i+ c j+�i+ d j�+i

165

e exigir que ele seja ortogonal a todos os outros três vetores obtidos

h++ jjz; ji = 0) a = 0

h�� jjz; ji = 0) b = 0

h0; 1 jjz; ji = 0)1p2(h�+j+ h+�j) (c j+�i+ d j�+i) =

1p2(c+ d) = 0) c = �d

jjz; ji =1p2(j+�i � j�+i)

Problem 70 Quais os valores de jz e j?

Para isso basta calcular

Jz jjz; ji =1p2

�S1z + S2z

�(j+�i � j�+i)

=1p2

�S1z j+�i+ S2z j+�i � S1z j�+i � S2z j�+i

�=

1p2

�~2j+�i � ~

2j+�i+ ~

2j�+i � ~

2j�+i

�= 0

J2 j0; ji =�S21 + S

22 + 2S1zS2z + S1+S2� + S1�S2+

� 1p2(j+�i � j�+i)

�S21 + S

22 + 2S1zS2z

� 1p2(j+�i � j�+i) = 1p

2

��S21 + S

22 + 2S1zS2z

�j+�i �

�S21 + S

22 + 2S1zS2z

�j�+i

�=

1p2

��3

4~2 +

3

4~2 � 2~

2

4

�j+�i �

�3

4~2 +

3

4~2 � 2~

2

4

�j�+i

�=

1p2~2 (j+�i � j�+i) = ~2 1p

2j0; ji

(S1+S2� + S1�S2+)1p2(j+�i � j�+i) = � 1p

2~2 (j+�i � j�+i)

= �~2 1p2j0; ji

J2 j0; ji = ~2 1p2j0; ji � ~2 1p

2j0; ji = 0

Ou seja, nosso estado tem módulo do momento angular igual a zero:

jjz = 0; j = 0i = j0; 0i =1p2(j+�i � j�+i)

166

Estes quatro estados formam uma base do nosso espaço.A base Jz,J2 é muito conveniente quando queremos tratar o sistema como um

único sistema. O que é especialmente útil quando as partículas tratadas formamum estado ligado, o que pode ser considerado como uma única partícula. Emespecial, os resultados acima mostram que, apesar do feixe destas partículas sedividir em 3, no feixe não de�etido existem dois tipos diferentes de estado(ou de partículas).

j0; 1i ; j0; 0i :Estes estados, possuem características físicas completamente diferentes. En-quanto um feixe de partículas no primeiro estado, quando passadas por umSG orientado perpendicularmente se dividirão em outros 3 feixes, um feixe compartículas no segundo continuarão sempre passando direto pelo aparelho. Emoutras palavras, partículas no segundo estado se comportam como partículassem spin.Outra vantagem da base j, jz é que o momento angular total do sistema é

uma quantidade conservada, enquanto o momento angular de cada constituintenão. Por isso é muito conveniente trabalhar nesta base. Isso exige, é claro,que escrevamos o hamiltoniano não na base que estamos usando até agora, masnesta nova base. Fora a diferença da base o procedimento para o tratamento deproblemas é o mesmo discutido anteriormente.Assim quando formamos uma nova partícula pela ligação de outras duas

podemos formar dois conjuntos diferentes de estados. Os

j1; 1i = j++i

j0; 1i = 1p2(j+�i+ j�+i)

j�1; 1i = j��i

todos com módulo do momento angular iglau a 1. Por serem 3 estes são chama-dos estados tripleto. E o estado

j0; 0i = 1p2(j+�i � j�+i)

que possui módulo de momento angular igual a zero. Por ser apenas um este échamado estado singleto.Observe que por aplicação de campos (magnéticos ou elétricos) podemos mu-

dar a projeção do spin das partículas, mas sem alterar o módulo desta quanti-dade (por isso falamos em �girar�). Assim se nosso sistema formar uma partículade um tipo ele permanecerá com este mesmo tipo. Além disso, também por car-acterísticas relacionadas a estatística quântica (mais precisamente a resultadosda TQC) combinações de partículas formam sempre novas partículas com omesmo valor de j. Por exemplo, a combinação de um próton e um nêutron(deutério) tem spin 1, já uma partícula alfa (núcleo de hélio, formado por 4partículas de spin 1/2) tem spin 0.Voltaremos à teoria geral da soma de momento angular quando estudarmos

o momento angular orbital.

167

12 Realização de espaços de dimensão in�nita

Como vimos, todo espaço de Hilbert de dimensão �nita pode ser representadopor matrizes. Vejamos agora como tratar os casos de problemas que envolvamdimensões in�nitas. Neste caso, uma das opções é usar o espaço das funções dequadrado integrável L2 discutido na seção 6.4.Anteriormente estudamos sistemas físicos onde o valor dos observáveis (com-

patíveis) usados para rotular nossos estados, possui apenas um número �nito depossibilidade (e.g., o spin da partícula). Entretanto certos observáveis, como omomento de uma partícula que se move, não possui esta limitação. Obviamente,para tal sistema a representação (e a álgebra) matricial se torna inadequada.Entretanto, como vimos anteriormente na seção 6.4, neste caso podemos her-dar os resultados do cálculo diferencial (assim como no caso de dimensão �nitaherdamos a álgebra matricial) se realizarmos o nosso espaço de Hilbert como asfunções de quadrado integrável L2(a; b). Ou seja, dada uma função f : C ! Ccom um (ou mais) parâmetro real t 2 [a; b], podemos indicar o vetor correspon-dente como

jfi

cujas componentes são todos os valores de f(t). Esta função pertence ao nossoespaço de Hilbert se

hf jfi =Z b

a

jf (t)j2 dt <1 :

12.1 O operador de multiplicação

Dentre os operadores que agem no espaço L2[a; b], um muito importante é ooperador de multiplicação pelo parâmetro livre Q. Quando age num estado

Q jfi = jgi

este operador fornece o estado jgi que é o vetor em L2 com componentes

g (t) � tf(f) :

A norma deste novo vetor vale

hg jgi =Z b

a

t2 jf (t)j2 dt

a qual, como t 2 [a; b], também possui um valor �nito e, conseqüentemente,pertence a L2[a; b].Um análogo deste operador no caso das seqüências seria o operador Q que

agindo no vetor jai com componentes ai daria a seqüência jbi com componentesiai.O operador de multiplicação acima é auto-adjunto (para intervalo [a; b]

�nito).

168

Exercise 71 Veri�que a a�rmação acima. Ou seja, encontre Q+ tal queZ b

a

�f (x)hQg (x)

idx =

Z b

a

hQ+f (x)

ig (x) dx ;

veri�que que Q é simétrico (Q = Q+) em seguida mostre que

D�Q�= D

�Q+�:

Lembre que, para todo operador simétrico, D(Q) � D(Q+). Assim, para mostrarque os domínios são iguais, basta mostrar que D(Q+) � D(Q).

Agora, um ponto extremamente importante sobre o operador de multipli-cação acima e:

Remark 72 O operador de multiplicação pelo parâmetro livre não possuinenhum auto-vetor.

Pela de�nição de auto-vetor, sabemos que se jfi é um auto-vetor de Q, entãoexiste uma constante � 2 R (pois Q é simétrico) tal que

Q jfi = � jfi =)�Q� �

�jfi = 0 :

Multiplicando a expressão acima por�Q� �

�jfi, usando que Q é simétrico e,

conseqüentemente, � 2 R temos:

hf j�Q� �

��Q� �

�jfi = 0)

Z b

a

h�Qf (x)� �f (x)

�i h�Qf (x)� �f (x)

�idx =

=

Z b

a

[(xf (x)� �f (x))] [(xf (x)� �f (x))] dx

=

Z b

a

[(x� �)] �f (x) [(x� �)] f (x) dx

=

Z b

a

(x� �)2 jf (x)j2 dx = 0

Lembrando que � é uma constante, a única solução da equação acima é f(x) = 0.Ou seja, Q não possui nenhum autovetor.Assim, o operador de multiplicação pelo parâmetro livre é auto-adjunto, mas

não possui nenhum auto-vetor (conseqüentemente, nenhum auto-valor). Comisso, apesar deste operador poder ser associado a um observável clássico (já queé auto-adjunto) não devemos esperar que isso ocorra, porque nenhuma medidadesta quantidade poderia ser feita.

169

12.2 O operador de posição

Como vimos nos exemplos com espaço de dimensão �nita, todo processo de me-dida é (basicamente) um processo de �ltragem. Assim, se desejamos determinara posição de uma partícula, tudo que precisamos fazer é colocar um colimadore, caso a partícula passe por ele, sabemos que ela está (pelo menos logo apósa medida) dentro de um intervalo �x. Mais ainda, se temos uma placa comvários furos, que podemos nomear de xi, onde esta é a coordenada do centrodo furo e 2dx é a espessura, podemos dizer que: se numa medida da posiçãoobtivemos o valor xi, sabemos que a partícula está no intervalo xi+dx e xi�dx.Seguindo também o procedimento das seções anteriores, isso nos permite especi-�car este estado com o valor medido. Ou seja, jxii é o estado do nosso sistemaquando sabemos que ele está na posição xi+dx e xi�dx. Mais ainda, sedo estaquantidade um observável (uma medida) quanticamente a ela está associada umoperador auto-adjunto

x jxii = xi jxii :Ademais, sabemos que a coleção de todos os vetores (contáveis) fjxiig formamuma base do nosso espaço. Ou seja, todo vetor pode ser escrito como

jfi =Xi

ai jxii

para vetores devidamente normalizados

ai = hxi jfi

e jaij2 é a probabilidade de encontra a partícula no intervalo xi � dx.O que queremos fazer agora é melhorar a precisão da nossa medida de

posição, fazendo a espessura do colimado dx cada vez menor. Ou seja, queremostomar o limite dx ! 0. A tomada direta deste limite possui (no mínimo) doisproblemas tecno-conceituais:

1. Neste limite, como a partícula pode estar no estado x 2 [a; b], devemoster um conjunto contínuo de autovetores jxi correspondente a estes auto-valores. Entretanto, sabemos que nosso espaço de Hilbert possui uma basecontável (vimos isso pela série de Fourier da seção 6.4) e toda base deveter o mesmo tamanho (no caso in�nito, como vimos na seção 6.4,a mesmacardinalidade). Assim, este conjunto contínuo de vetores obrigatoriamentedeve possuir mais elemento que qualquer base. Ou seja, não é uma base enão pode ser ortonormalizada.

2. Voltemos a decomposição de um vetor jfi na base fjxiig e calculemos oproduto deste vetor com um vetor jgi qualquer

hg x jfi =Xi

ai hg x j�ii =Xi

aixi hg j�ii

=Xi

aixi hg j�ii =Xi

xi�biai

170

onde bi = hxi jgi são as componentes de jgi na base fjxiig. Podemos agoraescolher uma representação matricial (in�nita) para os nossos vetores debase fjxiig. Em especial, podemos escolher a representação canônica (33)para estas matrizes. Tomemos agora o limite dx ! 0, neste caso a nossadecomposição se torna

jfi =Xi

ai jxii !Z b

a

a (x) jxi dx ; a (x) = hx jfi

Com isso

hg x jfi =Z b

a

x�b (x) a (x) dx ;

onde b (x) = hx jgi são as componentes de jgi na base fjxig. Lembrandoque f(x) são as componentes do vetor jfi e e que a(x) são as compo-nentes deste mesmo vetor jfi na base fjxig. Se escolher a representaçãocanônica sabemos que as componentes do vetor na base são iguais ascomponentes do vetor (veja a expressão (33))

a (x) = f (x) ; b (x) = g (x) ; (78)

e a expressão acima se torna

hg x jfi =Z b

a

x�g (x) f (x) dx =

Z b

a

�g (x) [xf (x)] dx =

Z b

a

�g (x)hQf (x)

idx ;

onde Q é o operador de multiplicação pelo parâmetro livre. Ou seja,no caso limite dx ! 0 o operador de posição é igual ao operador demultiplicação por uma constante. E, como vimos na seção anterior, ooperador Q não possui nenhum autovetor. Conseqüente, neste limitea posição não é um observável.

Os dois pontos acima mostram o problema na tomada do limite acima.Suponha agora que façamos dx muito pequeno, mas de forma a garantir quex 6= Q. Ou seja, nossa somatória não se torna uma integral. Podemos agoranos perguntar:

Problem 73 Qual o erro que cometemos ao usar Q no lugar de x.

Ou seja, para dois vetores quais que jfi e jgi do nosso espaço, quanto vale adiferença

hg x jfi � hg Q jfi =Xi

xi�biai �Z b

a

x�g (x) f (x) dx

onde, de (78),ai = f (xi) ; bi = f (xi) :

171

Para responder esta pergunta, observe que (para funções contínuas por partes),podemos quebrar a integral em cada uma das regiões xi,Z b

a

x�g (x) f (x) dx =Xi

Z xi+dx

xi�dxx�g (x) f (x) dx :

Com isso,

hg x jfi � hg Q jfi =Xi

"xi�g (xi) f (xi)�

Z xi+dx

xi�dxx�g (x) f (x) dx

#

A determinação do erro acima depende apenas do comportamento das nos-sas funções no intervalo [xi � dx; xi + dx]. Se as funções consideradas nãoforem todas as funções de H, mas apenas aquelas cuja variação no intervalo[xi � dx; xi + dx] seja pequeno, podemos fazerZ xi+dx

xi�dxx�g (x) f (x) dx = xi�g (xi) f (xi)

lembrando que xi é o ponto médio do intervalo. De outra forma, a aproximaçãoacima se torna melhor quanto menor o intervalo dx (ou seja, quanto menor dx,mais funções podemos incluir no nosso espaço), esta é uma conseqüência doteorema do valor médio.Agora vale lembrar que em MQ nem sempre podemos tomar os limites dos

observáveis. Este foi o ponto chave na hipótese de Planck. Ou seja, substituindoa integral pela somatória, Planck resolveu o problema da catástrofe do ultra-violeta. O fato de não podermos usar a integral (i.e., não podemos tomar olimite) para calcular a radiação do corpo negro está no fato de termos umaprecisão máxima que as nossas medidas estão sujeitas.O fato de, para a radiação do corpo negro, a média de energia hEi

hEi =PnEn exp

�� EnKT

�Pn exp

�� EnKT

� 6=R10E exp

�� EKT

�dER1

0exp

�� EKT

�dE

ondeEn = h�n

não está no fato não podemos fazer En � En+1 ! 0. Pois não existe nenhumarestrição na freqüência � do oscilados. Ou seja, devemos considerar o fato deEn �En+1 poder ser tão pequeno quanto se queira, mas não podemos tomar olimite desta quantidade tendendo a zero (pois, se pudéssemos, a integral acimaseria igual a somatória). Este problema está diretamente ligado ao conceito deum conjunto denso em matemática. Qualquer número real pode ser aproximado,com a precisão que se queira, por um número racional. Mas um racional nãoé igual a um irracional. Como os reais são formados por todos estes números,dizemos que o conjunto dos racionais é denso nos reais. Observe que, apesarde podemos fazer a aproximação com a precisão que se queira, o conjunto dos

172

reais é completamente diferente do dos racionais, em especial a cardinalidade émaior. Assim, no exemplo acima da energia, nós podemos fazer a diferença deenergia tão pequena quanto se desejar, isso signi�ca que este espectro discretoé tão próximo quanto se queira de um conjunto contínuo, mas ele nunca seráigual a este conjunto. É sempre neste sentido que devemos entender o termo�espectro contínuo de energia�que aparece nos livros de MQ.Resumindo, no caso da energia nós não podemos substituir a somatória por

uma integral. Mas e no caso do operador de posição? Podemos substituirx por Q? O fato de não podermos substituir a somatória por uma integralno caso da energia, está relacionado com o fato de que a energia do osciladordepende do conhecimento simultâneo de sua posição (energia potencial) e do seumomento (energia cinética). Como vimos na seção 1.7, existe um limite na áreamínima do espaço de fase (o que está relacionado com a incerteza momento-posição). Isso nos impede de tomarmos o limite desta área como um ponto e,conseqüentemente, fazermos a somatória virar uma integral.E no caso do operador de posição, existe alguma relação de incerteza que

nos impeça de tomar este limite? Neste caso, tudo que queremos medir é aposição. Entretanto, para medirmos a posição na direção x precisamos teralguma informação da partícula na direção y e z. Pois, de outra forma, nãosaberemos se a partícula não passou pelo colimador porque foi bloqueada, ousimplesmente porque ainda não chegou ao furo. Assim, uma conjectura doautor destas notas, é que podermos ou não tomar o limite depende do fato damedida das coordenadas em direções diferentes comutarem, ou não. Segundo osprícipios da MQ esta comutação deve ser proporcional aos parênteses de Poisson(veja (59))

fx; yg = fx; zg = 0 ;e, conseqüentemente, comutam. Assim, o limite pode ser tomado. Entre-tanto, existem teoria atuais que especulam sobre a geometria do universo poderser não comutativa. Se isso for verdade devemos ter

[x; y] = i� ;

com � uma nova constante universal. Obviamente, o fato de nunca termos detec-tado esta não-comutação garante que este �, se existir, é muito pequeno (muitomenor mesmo, nas unidades adequadas, que a constante de Planck). Assim, se ageometria do universo for não-comutativa, a MQ não é mais uma teoria correta,mas uma aproximação correta até, provavelmente, ordem de (�=h)2 (assim comoa mecânica clássica é correta até ordem de (v=c)2 em relação à relativística).Entretanto, como nosso objetivo aqui é fazer MQ (usual) vamos admitir que

podemos substituir a somatória pela integral, ou, o que é equivalente, usar Q nolugar de x. Mas é sempre bom lembrar que estes dois operadores são diferentes:um é um observável, o outro não. Esta aproximação signi�ca dizer que

x jxi = Q jxi = x jxi ;

mesmo para x 6= xi. Observe que estes dois operadores são iguais quando atuamnos auto-vetores de jxii, mas, estes auto-vetores formam um conjunto discreto.

173

Desta forma Q é uma extensão contínua do operador x e o conjunto discreto xié denso no intervalo [a; b].Assim, no que segue, vamos de�nir

x jxi � x jxi ; x 2 [a; b] : (79)

E qualquer vetor do nosso espaço pode ser decomposto como

jfi =Z b

a

dx a (x) jxi ; a (x) = hx jfi

e a quantidade ja (x)j2 é a probabilidade da partícula ser encontrada o intervalox� dx. Usando a igualdade (78),

a (x) = f (x)) jfi =Z b

a

dx f (x) jxi ; f (x) = hx jfi

e jf (x)j2 é a probabilidade da partícula ser encontrada o intervalo x� dx.Observe ainda que

hg jfi =Z b

a

dx �g (x) f (x) =

Z b

a

dx hg jxi hx jfi = hgj"Z b

a

dx jxi hxj#jfi

ou seja, o operador Z b

a

dx jxi hxj = I ;

é a resolução da identidade do nosso espaço.

12.3 O operador de momento

Como sabemos da nossa experiência em mecânica clássica, o estado (clássico) deum sistema é completamente determinado pela sua posição e o seu momento.Assim, se quisermos estender a descrição clássica para quântica, precisamosencontrar um operador p que esteja relacionado com o observável de momento.Ou seja, os autovalores de p são os possíveis valores que o momento da partículapode assumir.Para encontrar este operador, tudo que precisamos é a regra de quantização

de Dirac (59)

fx; pg �! � i~[x; p]) [x; p] = i~ ; (80)

ou seja, precisamos construir p tal que este respeite a álgebra acima.Para realizar a álgebra acima, precisamos �xar a forma de um dos operadores

(x ou p) e determinar a forma do outro. Fixando a forma do operador x comoem (79) (mas esta é apenas uma escolha possível), a álgebra (80) pode serconcretamente realizada escolhendo

p � �p = �i~ ddx: (81)

174

Onde usamos o chapéu invertido para lembrar que p não é mais um operadornum espaço abstrato, mas sim a realização deste operador em algum espaçoconcreto. Ou seja, enquanto p é um operador qualquer que respeita (80), �p éespeci�camente um operador diferencial (81) agindo no espaço das funções dequadrado integrável.Para ver que (81) realiza a álgebra (80) basta calcular

hxj xp� px j i = hxj xp j i � hxj px j i = �xi~ ddxhxj j i+ i~ d

dx[x hxj j i]

= �i~�xd

dx (x)� d

dx[x (x)]

�= �i~

�xd

dx� (x)� xd

dx

�hxj [x; p] j i = i~ (x) :

Neste nosso espaço concreto, a equação (62) para o operador de evolução tem-poral pode ser escrita como

dU

dt= � i

~HU =) hxj dU

dtj 0i = �

i

~hxj HU j 0i

hxj ddtU j 0i =

d

dthxjU j 0i = �

i

~hxj HU j 0i

d

dthx j ti = �

i

~�H hx j ti

i~d

dt (x; t) = �H (x; t) ;

(x; t) = hxjU (t) j 0i ; �H = H

�x � x; p � �i~ d

dx

�:

Esta é a equação de Schrödinger.Para o caso de uma partícula de massa m sujeita a um potencial V (x)

sabemos da mecânica clássica que

H (x; p) =p2

2m+ V (x)

Assim, o operador correspondente deste problema na MQ vale

�H = � ~2

2m

d2

dx2+ V (x) :

Os estados estacionários desta partícula são os autovetores deste operador e,numa medida da energia desta partícula, podemos obter apenas um de seusauto-valores.

12.4 O problema do ordenamento

Um dos problemas que surge no processo de quantização acima (e, de umacerta forma, em todos os processos de quantização), é o chamado problema do

175

ordenamento. Dado um observável clássico que envolva o produto (o momentoangular é um exemplo)

xp ;

quanticamente podemos associar a este observável os operadores

M = xp ; M 0 = px

onde

M 0 = px = �i~ ddxx = �i~ � i~x d

dx = �i~ + xp

= M � i~ =�M � i~

ou aindaM 0 = M � i~

Ou seja, os dois operadores acima dizem respeito a mesma quantidade clássicaxp. Assim, para um observável clássico pode estar relacionado mais de umoperador quântico.Um ponto a se observar é que, assim como no exemplo acima, no problema

de ordenamento os operadores sempre diferem por uma quantidade proporcionala ~n. Lembrando que uma das formas de tomarmos o limite clássico do nossosistema é fazer ~! 0, vemos que os dois operadores M e M 0 possuem o mesmolimite clássico. Assim, teorias quânticas que di�ram por um problemade ordenamento possuem o mesmo limite clássico. Ou de outra forma,para o mesmo sistema clássico podemos ter várias teorias quânticasdiferentes. Entretanto, apesar de todas terem o mesmo limite clássico, estasteorias podem gerar resultados puramente quânticos (e.g., supercondutividade)bastante diferentes.No caso especí�co acima, xp, o problemas do ordenamento pode ser resolvido

usando os postulados da MQ. Observe que

(xp)+= p+x+ = px 6= xp ;

ou seja, apesar de x e p serem hermitianos, o operador xp não é hermitiano.Assim, se existe o observável xp o operador a ele associado deve ser hermitiano(não deve ser nem M nem M 0). Com isso, podemos construir um operadorhermitiano através de uma combinação simétrica dos operadores

M =1

2(xp+ px)) M+ =

1

2(xp+ px)

+=1

2

�p+x+ + x+p+

�como x e p são hermitianos

M+ =1

2

�p+x+ + x+p+

�=1

2(px+ xp) = M :

Uma prescrição, chamado ordenamento de Weyl, é usar sempre a ordenaçãosimétrica dos operadores. Entretanto, nem sempre esta opção é única possível.

176

Por exemplo, no caso p2x temos

M = xpx

M 0 =1

2

�p2x+ xp2

�M 00 =

1

2

�p2x+ pxp+ xp2

�todos hermitianos. Usar a prescrição de Weyl é escolher o último operador.Entretanto, apenas uma medida extremamente precisa de efeitos puramentequânticos pode nos dizer quais destes é o operador correto.

12.5 Partícula na caixa

Vamos usar as idéias da seção anterior para quantizar o sistema unidimensionalde uma partícula de massa m num intervalo (uma partícula numa caixa). Umavez que, dentro do intervalo (caixa), a partícula está livre, vamos começar anal-isando uma partícula livre, cuja energia é puramente cinética e o Hamiltonianovale

H =1

2mp2 :

A descrição quântica, no H abstrato, se dá pelo operador Hamiltoniano

H =1

2mp2 :

E no nosso espaço concreto em L2:

�H = � ~2

2m

d2

dx2:

Dizer que a partícula está na caixa signi�ca dizer que esta pode ser encon-trado apenas dentro de um certo intervalo [a; b]. Ou, de outra forma, que elanão pode ser encontrada fora deste intervalo. Quanticamente isso signi�ca que

(x) = 0 ; a > x > b :

Pela continuidade da função devemos ter (lembre que �H exige que as nossasfunções sejam, pelo menos, duas vezes diferenciáveis)

(a) = (b) = 0 :

(Condições físicas impõe condições de fronteira)Desta forma as condições físicas do nosso sistema informam como devemos imporas condições de fronteira do problema. Na verdade, só agora temos realmenteespeci�cado o operador �H, pois conhecemos, não só a sua forma, mas tambémseu domínio. Este é o espaço de Hilbert do nosso problema.

177

Exercise 74 Veri�que que o operador �H acima é hermitiano. Qual o domíniodo adjunto �H+.

Como em todo problema de MQ, estamos interessados em estudar a evoluçãodo sistema. Isso, obviamente, é equivalente a encontrar o operador de evoluçãoque, por sua vez, é equivalente a resolver a equação de Schroedinger (dependentedo tempo)

i~d

dt (x; t) = �H (x; t) :

Entretanto, para sistemas com graus �nitos, vimos que é possível evitar otrabalho (as vezes impossível) de obter uma forma explicita para o operadorde evolução, se trabalharmos na base de auto vetores de H e decompormostodos os nossos vetores nesta base. Da mesma forma, podemos agora evitaro trabalho (di�cílimo) de resolver a equação de Schroedinger dependente dotempo, se encontrarmos os autovetores de H e decompormos nossos vetoresnestes estados. Neste caso, para qualquer vetor j i temos

j i =Xn

an j ni ;

ou, multiplicando por jxi

hx j i =Xn

an hx j ni ) (x) =Xn

an n (x)

onde�H n (x) = En n (x) :

Observe que os estados j ni tem energia bem de�nida e tomamos o produtointerno deste vetor com jxi. Não estamos falando de um estado que seja, si-multaneamente, autovetor de x e H, ou seja, que tenha posição e energia bemde�nida. Isso não é possível uma vez que estes observáveis não são compatíveis.Assim, nosso problema é encontrar soluções para a equação de Schroedinger

independente do tempo

�H = E =) ~2

2m� = �E :

Onde E (autovalores de �H) são as possíveis energia que o sistema pode assumir.

Problem 75 Quantas soluções a equação acima possui?

Observe que, para um valor �xo de E, por ser uma equação de segunda ordema equação acima possui apenas duas soluções linearmente independentes(sempre). A solução geral da equação dependerá de duas constantes que serão�xadas pelas condições iniciais do problema. Entretanto, não é neste sentidoque queremos �encontrar as soluções da equação acima�. Queremos encon-trar todos os valores de E para que a equação acima tenha solução e

178

respeite as condições de contorno. Ou seja, nosso problema não é apenaso problema de resolver uma equação diferencial. Na verdade, no tratamento deproblemas quânticos, acreditamos que as soluções das equações diferenciais jásão conhecidas.Como mencionado acima, para um valor �xo de E a equação acima possui

duas soluções LI

eikx ; e�ikx ; k2 =2m

~2E ;

de sorte que uma solução geral pode ser escrita como uma combinação lineardestas soluções

(x) =�Aeikx +Be�ikx

�; k2 =

2m

~2E:

Problem 76 Quais os valores possíveis de E?

Observe que, por ser hermitiano, E 2 R. Entretanto, nada impede que esteassuma qualquer valor real e, em especial, valores negativos. Neste caso (E < 0)temos

�H = � jEj =) ~2

2m� = jEj =) (x) =

�Aekx +Be�kx

�; k2 =

2m

~2jEj ;

Entretanto, para ser solução do nosso problema, a função não deve apenasser solução da ES, mas pertencer ao nosso espaço de Hilbert, ou seja, pertencerao domínio de �H. Com isso:

(a) = (b) = 0) Aeka +Be�ka = Aekb +Be�kb = 0 :

Para o caso especial a = 0; b = 1

A+B = 0) A = �B ;

Aek �Ae�k = 0) A�ek � e�k

�= 0) A = 0 :

E, para o caso geral, é fácil ver que não existem A e B diferentes de zero querespeitem as condições de fronteira (para k = 0, = A � A = 0). Assim, osestados com E < 0 são descartados por não pertencerem ao nosso espaçode Hilbert. Ou ainda, o fato de H ser hermitiano implica que o sistemasó pode ter energias positivas. Este resultado é completamente compatívelcom a física clássica. Porém, como veremos a seguir, os demais resultados sãobastante distintos dos esperados classicamente.

Problem 77 Como determinamos as constantes A,B e k da solução geralacima?

179

Como vimos nos exemplos anteriores, em geral, as constantes A e B (naverdade, apenas uma delas) serão �xadas pelo processo de normalização. Resta-nos então �xar k. Esta constante está relacionada com as condições de contornodo problema. Para facilitar as contas, no que segue façamos a = �L e b = L,

D�H�=��; �0 2 L2 (�L;L) ; � (�L) = � (L) = 0; a:c:

:

Assim, exigindo que a partícula esteja con�nada no intervalo de �L até L

(L) = (�L) = 0 ;

temos

(L) = 0 =) AeikL +Be�ikL = 0 =) AeikL = �Be�ikL

A (cos kL+ i sin kL) = �B (cos kL� i sin kL) : (82)

Podemos satisfazer esta igualdade de duas formas, a primeira fazendo

sin kL = 0 =) kL = n� ; n 2 N�

observe que n = 0 não é um autovetor. Além disso, o caso n < 0 corresponde asmesma funções com sinal trocado e, consequentemente, são as mesmas funções(lembre que a normalização possui uma arbitrariedade na fase e osautovalores dependem de n2). Com a escolha acima, temos,

A (cos kL) = �B (cos kL)) A = �B :

Podemos também satisfazer a igualdade (82) fazendo

cos kL = 0 =) kL = �

�n+

1

2

�; n 2 N ;

(observe que agora n = 0 é um autovetor), com isso

A (i sin kL) = �B (�i sin kL)) A = B :

Assim, o nosso problema possui dois tipos (conjuntos) de soluções esta-cionárias

�n (x) = N� sin�k�n x

�; k�n =

Ln) E�n =

~2

2m

�n�L

�2;

+n (x) = N+ cos�k+n x

�; k+n =

L

�n+

1

2

�) E+n =

~2

2m

��

L

�n+

1

2

��2:

(83)

Exercise 78 Obtenha as constantes de normalização N+ e N�.

Problem 79 Por que precisamos apenas de uma das condições de contorno?

180

Pela simetria do problema estes estados automaticamente satisfazem a condição (�L). Mas, no caso geral, precisamos aplicar ambas as condições de fronteira.Remark 80 Observe como a limitação da partícula no intervalo tornou osníveis de energia discretos. Este é o fenômeno por trás da maioria das pecu-liaridades do comportamento quântico dos sistemas, em especial, dos chamadospontos quânticos (QD).

As soluções acima mostram que o con�namento da partícula num intervalotornou os níveis de energia discretos. Ou seja, numa medida da energia dapartícula con�nada numa caixa de tamanho 2L, podemos obter apenas os valoresE�n e E+n . Isso é, obviamente, um comportamento completamente diferente doesperado classicamente, onde a partícula pode ter qualquer valor de energia.Além disso, o menor valor possível da energia para a partícula na caixa vale(observe que E�0 = 0 implica

�0 (x) = 0 e a partícula não está mais na caixa)

E+0 =~2

2m

h �2L

i2:

Ou seja, este é o menor valor de energia cinética que a partícula pode ter. Maisainda, se esta partícula interagir com alguma coisa (e.g., fótons) ela só poderáabsorver e emitir energias que sejam proporcionais a diferença entre dois níveis

�En�!n =��E+n � E�m��

Esta é a chamada energia de transição de n para m.Suponha que você prendeu um elétron numa caixa e baixou a temperatura

do sistema de forma a garantir que este elétron está no estado fundamental E+0(é mais natural imaginarmos que temos vários elétrons não interagentes nestacaixa). Primeiramente veja que existe uma energia do sistema que vocênão pode retirar, ou seja, esta energia não se dissipa em forma de calor.Em segundo lugar, se você tentar aquecer o sistema, por exemplo o iluminandocom um laser, se este laser tiver uma energia menor que �E0�!1 o sistemanão irá interagir com seu laser (ou seja, ele será transparente). Se você foraumentando a freqüência deste laser, quando a sua energia chegar a E�1 �E+0 osistema passa a absorver o laser (se torna opaco) e os elétrons passam para umnível de energia mais alto. Na prática, se a temperatura for baixa o su�ciente,o sistema irá emitir estes fótons tornando-se reluzente na cor do laser. Este�salto�de um nível de energia para o outro, sem que o sistema possa existir emníveis intermediários (o que classicamente é um contínuo) é chamado de saltoquântico. Este efeito de absorção de apenas alguns comprimentos de onda podeser observado em pontos quânticos. Este é também o mecanismo porque oselétrons em torno do núcleo só absorvem e emitem radiações com determinadafreqüência (e.g., a série de Balmer).O fato de nosso operador ser auto-adjunto signi�ca que suas autofunções

formam uma base (agora ortonormal) do espaço. Assim, qualquer funçãodo nosso espaço pode ser escrita como

(x) =1pL

1Xn=0

c+n cos

��

L

�n+

1

2

�x

�+

1pL

1Xn=1

c�n sinh�Lnxi:

181

Onde o módulo quadrado de cada coe�ciente c�n = h �n j i representa a prob-abilidade de, numa medida da energia, a partícula ser encontrada com energiaE�n . Assim, o fato de qualquer estado poder ser expandido na decomposiçãoacima, tem o signi�cado físico de que todo sistema pode ser encontrado (comuma certa probabilidade) em algum valor de energia.Usando a notação de Dirac temos a base composta pelos dois pares de funções

fje+n i ; je�n ig com componentes

e+n (x) =1pLcos

��

L

�n+

1

2

�x

�; e�n (x) =

1pLsinh�Lnxi:

Exercise 81 Veri�que que esta base é ortonormale�n�� e+m� = 0 ; e+n �� e+m� = e�n �� e�m� = �nm :

Com isso

j i =1Xn=0

c+n��e+n �+ 1X

n=1

c�n��e�n �

e as componentes c�n são a projeção de na base fje+n i ; je�n ig

c+n =e+n�� i = 1p

L

Z L

�Lcos

��

L

�n+

1

2

�x

� (x) dx

c�n =e�n�� i = 1p

L

Z L

�Lsinh�Lnxi (x) dx

A decomposição acima é a conhecida série de Fourier da função (x).Agora, dada uma condição inicial j 0i qualquer fazer a decomposição

j 0i =Xn

�c+n�� +n �+ c�n �� �n �� :

Lembrando que estes estados j �n i têm energia bem de�nida (são auto-estadosdo operador Hamiltoniano), podemos determinar a evolução temporal de j 0ifazendo

j ti = U (t) j 0i = exp�� i~Ht

�j 0i = exp

�� i~Ht

�Xn

�c+n�� +n �+ c�n �� �n ��

=Xn

�c+n exp

�� i~E+n t

� �� +n �+ c�n exp�� i~E�n t� �� �n �� :

Ou, projetando no espaço x,

hx j ti =Xn

�c+n exp

�� i~E+n t

�hx�� +n �+ c�n exp�� i~E�n t

�hx�� �n ��

(x; t) =Xn

�c+n exp

�� i~E+n t

� +n (x) + c

�n exp

�� i~E�n t

� �n (x)

�:

182

Aqui é interessante ver como a realização do nosso espaço depende muito dequal parte do sistema nos interessa. De forma geral,

�E ��~L

�2:

Assim, se no exemplo acima a distância L for muito pequena, os níveis deenergia vão estar tão espaçados que para sofrer uma transição de nível precis-aríamos fornecer uma quantidade muito grande de energia. Podemos garantirassim que o sistema não sofra nenhuma transição indesejada (e.g., térmica) e asúnicas transições possíveis são aquelas que nós provocamos. Neste caso, apenasalguns níveis de energia são relevantes e podemos tratar o sistema como umproblema de n níveis. Ao fazemos isso nosso sistema passa a ter um número�nito de estados e passa a ser descrito por uma matriz. É por isso que umQD pode ser tratado como um sistema de dois níveis da mesma forma como noexemplo de uma partícula de spin 1

2 .Além disso, se o tamanho da caixa vai para in�nito (partícula livre) a difer-

ença dos níveis de energia vão a zero e, conseqüentemente, a partícula podeassumir �qualquer�(mas sempre contável) valor de energia.

12.6 O momento da partícula

Vamos agora estudar os possíveis valores que o momento de uma partículanuma caixa pode assumir. Neste caso, precisamos encontrar os autovalores dooperador

p = �i~ ddx

; p = ~k ) d

dx = �ik

Mais uma vez, para um valor �xo de k, esta equação possui apenas uma soluçãoe a solução geral pode ser escrita como

(x) = A exp (�ikx) :Entretanto, as nossas condições de fronteira exigem que

(L) = A exp (�ikL) = A (cos (kL) + i sin (kL)) = 0 :

Cuja única solução é A = 0. Ou seja, o operador de momento não temauto-vetores.

Problem 82 Mas se o operador p é hermitiano ele não deveria ser um ob-servável?

Apesar de ser hermitiano este operador não é autoadjunto. Assim, o mo-mento de uma partícula numa caixa não é um observável.

Exercise 83 Veri�que que o operador

p = �i~ ddx

;

D�H�=��; �0 2 L2 (�L;L) ; � (�L) = � (L) = 0; a:c:

;

não é auto-adjunto.

183

Entretanto, podemos tornar nosso operador p auto-adjunto se mudarmosas nossas condições de fronteira. Como vimos anteriormente na seção ??, esteoperador se trona auto-adjunto se adotarmos condições periódicas de contorno

(�L) = ei� (L) :

Exercise 84 Veri�que que o operador

p = �i~ ddx

;

D�H�=��; �0 2 L2 (�L;L) ; � (�L) = ei�� (L) ; a:c:

;

é auto-adjunto.

Neste caso as nossas soluções se tornam

exp (ikL) = ei� exp (�ikL) = exp (�i (kL� �))cos (kL) + i sin (kL) = cos (kL� �)� i sin (kL� �)

Para cada valor diferente de � temos um conjunto diferente de soluções. Porexemplo, pada � = 0

cos (kL) + i sin (kL) = cos (kL)� i sin (kL) ;

logosin (kL) = 0) kL = n� ) kn =

n�

L:

Para � = �

cos (kL) + i sin (kL) = cos�kL� �

2

�� i sin

�kL� �

2

�= cos kL cos

��2

�+ sin kL sin

2� i�sin kL cos

2� sin �

2cos kL

�= sin kL+ i cos kL

ou seja

sin kL = cos (kL)) kn =�

L

�1

4+ n

�:

Ou seja, neste caso o momento da nossa partícula é um observável e podeassumir apenas os valores acima. E seus auto-estados são

�=0 (x) = A cos (knx) ; kn =n�

L;

�=� (x) = A exp (�iknx) ; kn =�

L

�1

4+ n

�;

onde A é determinado por normalização.O ponto é que a condição de fronteira (L) = (�L) = 0 signi�ca (�sica-

mente) que a partícula não pode penetrar na parede e, como esta partícula

184

não pode desaparecer, ela tem de ser re�etida. Assim, para esta condiçãode fronteira temos a visão clássica de uma partícula indo e voltando na caixa.Tal partícula tem seu momento mudando constantemente e, certamente, nãoestá num auto-estado do momento. Já para a condição periódica de fronteira �=0 (L) = �=0 (�L) é como se, ao chegar no ponto x = L a partícula rea-parecesse no ponto x = �L (ou vice-versa). O melhor modelo clássico paraisso não seria uma partícula numa caixa, mas sim presa num anel. Neste caso,obviamente, a partícula pode �girar� sempre numa determinada direção e terum momento bem de�nido.Assim, a escolha das condições de fronteira para um problema depende do

sistema físico em consideração. Mas os resultados matemáticos nos dizem muitacoisa. Por exemplo, as autofunções de p são da forma

e (x) = N exp (ikx) ;

e, para estas funções, não conseguimos �xar a condição de fronteira

(L) = (�L) = 0 :

O que nos diz que o momento não é uma quantidade bem de�nida da nossapartícula numa caixa. Neste caso a interpretação é óbvia, mas, em casos maiscomplicados, a incapacidade de �xar certas condições de fronteira, ou algumaoutra peculiaridade matemática, pode nos dar uma in�nidade de informaçõesfísicas novas sobre o sistema.

Problem 85 Será que outros valores de � representam outras condições físicaspossíveis?

Os valores com � = �, por exemplo, estão relacionadas com outras carac-terísticas puramente quânticas que são resultados da estatística quântica. Maisprecisamente, está relacionada com a descrição de férmions.A escolha de diferentes � é chamado de escolha da extensão auto-adjunta

da teoria. A relação geral entre as diferentes escolhas (diferente MQ) e oscorrespondentes análogos clássicos destas teorias são um objeto atual de estudoem MQ.Assim como o problema do ordenamento, todas as extensões auto-adjuntas

possuem o mesmo limite clássico. Vemos apenas alguns exemplos (presentesem todos os processos de quantização) de que a uma teoria clássica temos umain�nidade de teorias quânticas associadas. A determinação de qual destas teoriasé a correta, depende de uma interpretação correta das imposições matemáticas(e.g., partícula na caixa ou no anel), medidas de fenômenos quânticos (e.g.,níveis de energia), estudo das simetrias do problema (e.g., férmions e bósons)ect.Na análise do problema de uma partícula numa caixa pudemos acentuar:

1. Entender como as características quânticas da discretização dos níveis deenergia estão relacionadas com o con�namento espacial dos sistemas.

185

2. Veri�car que o espectro pontual de energia tende a um contínuo parasistemas livres (estados não ligados).

3. A relação entre o problema com in�nitos graus de liberdade e com umnúmero �nito de graus de liberdade para con�namentos em regiões muitoestreita (e.g., QD),

4. Veri�car algumas minudências matemáticas referente a sistemas com in-�nitos graus de liberdade (continuidade, extensões auto-adjuntas etc.)

5. Veri�car como as imposições matemáticas (e.g., condições de fronteira)estão relacionadas com as características físicas do sistema.

12.6.1 Sistemas com vários graus de liberdade

A descrição quântica de dois observáveis compatíveis pode ser feita exatamentecomo no caso do sistema de várias partículas, ou seja, através do produto ten-sorial dos autoestado de cada um destes operadores. Seria como se tivéssemosduas cópias do sistema e, em uma olhamos para um observável e, na outra, parao segundo.

Remark 86 Usualmente um observável escolhido para caracterizar o sistemaé a energia, associada ao operador Hamiltoniano, H. Assim, os demais ob-serváveis escolhidos devem ser compatíveis com H, o que signi�ca que tambémque estas quantidades não variam com o tempo (lembrando que o operador deevolução temporal é a exponencial do Hamiltoniano).

Por exemplo, imagine um sistema bidimensional. Este sistema possui mo-mento em duas direções. Pelas regras de comutação canônica sabemos que[px; py] = 0. Então, se o sistema se encontrar num estado com momento bemde�nido nas duas direções, i.e., num estado ji que seja simultaneamente au-tovetor de px e py, (px + py) ji = (kx + ky) ji, este estado é descrito pelovetor

ji = jkx kyi = jkxi jkyi ;px jkxi = kx jkxi ; py jkyi = ky jkyi :

Destarte, podemos resolver separadamente cada parte do problema e construir oestado �nal pelas regras de produto tensorial que já conhecemos. Para obtermosa representação de funções do estado acima fazemos

hx; y ji = (x; y) = hx; y jkx kyi = hx jkxi hy jkyi = kx (x) ky (y) :

Os estados acima sempre serão auto-estados de px e py, mas se estes estadosterão energia bem de�nida, depende apenas do operador Hamiltoniano. Parao caso em que este depende de x ou de y os estados acima não serão soluçõesda ES independente do tempo. Neste caso, devemos decompor estes estadosnestas soluções. Para o caso em que os operadores em questão comutam como Hamiltoniano o processo acima é o conhecido procedimento de separação devariáveis usado em equações diferenciais parciais.

186

12.7 O oscilador harmônico

São incontáveis os sistemas e aplicações em física que podem ser modeladospelo problema do oscilador harmônico (OH). Uma das razões para isso é queum potencial V (x) qualquer (dado por uma função analítica) sempre pode serexpandido em sua série de Taylor

V (x) = V0 +dV

dx

����x0

x+1

2

d2V

dx2

����x0

x2 +1

3!

d3V

dx3

����x0

x3 + ::::

Além disso, em muitos problemas em física estamos interessados no comporta-mento do sistema perto da condição de equilíbrio. Nesta condição

dV

dx

����x0

= 0

e nosso potencial se torna

V (x) =1

2kx2 +O

�x3�

k =d2V

dx2

����x0

onde usamos que uma constante no potencial não altera o comportamento dosistema. Assim, próximo do equilíbrio, qualquer potencial pode ser aproximadopor um OH.A hamiltoniana clássica do OH é dada por

H =p2

2m+1

2m!2x :

Assim, para tratar o problema atual, vamos introduzir os seguintes oper-adores diferenciais lineares

�L � �H = � ~2

2m

d2

dx2+1

2m!2x2 ;

�p = �i~ ddx

D (�p) = D��H�=� ; 0; 00 2 L2; (�1)! 0; a:c:

aqui H é o operador hamiltoniano de um oscilador harmônico. A solução doproblema quântico se obtém pela solução da ES estacionária, i.e., através dasolução do problema de autovalores de H,

�H = E =) � ~2

2m

d2

dx2+1

2m!2x2 = E

Esta equação não é nada simples de se resolver.

187

Vamos então fazer uso de alguns artifícios. Lembrando a relação de comu-tação

[x; p] = i~ ; (84)

ou seja, sempre que aparecer o comutador entre x e p podemos sub-stituir por i~. Lembre que a quantidade acima é um operador enquanto aquantidade à direita da igualdade é um número.

Remark 87 Assim, esta igualdade só faz sentido quando ambos os lados atuamnuma função qualquer.

Vamos agora de�nir os seguintes operadores diferenciais

a =�p2

�x+

ip

m!

�; a+ =

�p2

�x� ip

m!

�x =

1

�p2

�a+ a+

�; p = i~

�p2

�a+ � a

�(85)

� =

rm!

~

Com estes novos operadores o Hamiltoniano pode ser escrito como (veri�que):

H =p2

2m+1

2m!2x2 =

1

2!~�aa+ + a+a

�: (86)

Exercise 88 Veri�que a igualdade acima.

As regras de comutação (84) implicam que (veri�que):

�a; a+

�=�2

2

��x+

ip

m!

�;

�x� ip

m!

��=�2

2

���x+

ip

m!

�; x

����x+

ip

m!

�;ip

m!

��=�2

2

�i

m![p; x]� i

m![x; p]

�= �i�

2

2

2

m![x; p]

= �im!~1

2

2

m!(i~)

= 1 ;

ou seja,[x; p] = i~ =)

�a; a+

�= 1 : (87)

com isso

H =1

2!~�aa+ + a+a

�= ~!

�a+a+

1

2

�:

188

Além disso, é fácil ver quehH; a

i= ~!

�a+; a

�a = �~!a (88)h

H; a+i= ~!a+

�a; a+

�= ~!a+ (89)

Suponha agora que n (x) é uma auto função qualquer de H, ou seja,

H n = En n

Agora uma característica muito mais do que importante dos oper-adores (85): Usando a regra de comutação (88) vemos que

Ha n =��~!a+ aH

� n = a (En � ~!) n

= ~!�En~!� 1�a n :

fazendoEn~!

= �n =) H n = ~!�n n

temosHa n = ~! (�n � 1) a n :

Ou seja, se n é autovetor de H com autovalor ~!�n, então a n é outroautovetor de H, mas com autovalor ~! (�n � 1) diminuindo de uma unidade.Simbolicamente podemos chamar este vetor de n�1;

a n � n�1 ; H n�1 = ~!�n�1 n�1 ; �n�1 � �n � 1 :

Da mesma forma, usando (89)

Ha+ n =�~!a+ + a+H

� n = a+ (~! + En) n

= a+~! (1 + �n) n= ~! (1 + �n) a+ n

Ou seja, se n é autovetor de H com autovalor ~!�n, então a+ n é outro au-tovetor de H, mas com autovalor ~! (�n + 1) acrescido de uma unidade. Sim-bolicamente podemos chamar este vetor de n+1;

a+ n � n+1 ; H n+1 = ~!�n+1 n+1 ; �n+1 � �n + 1 : (90)

Por isso estes operadores são chamados de operadores de criação a+ e aniquilaçãoa.

189

Vamos usar agora que a energia do sistema é uma quantidade positiva10

h j H j i � 0

num estado n qualquer

h nj H j ni = h nj ~!�n j ni = ~!�n h nj ni = ~!�n � 0 : (91)

(onde supusemos que n está normalizado).Se a energia é positiva deve haver um estado de energia fundamental, i.e.,

um estado cuja energia não possa ser reduzida. Podemos chamar este estadosimbolicamente de 0 com energia �0 � min (�n).Mas a existência do operador a garante que sempre podemos baixar a energia

do sistema. Ou seja, o vetor = a 0 teria uma energia �0 � 1 < �0, a menosque (x) = 0, ou seja,

a 0 = 0 :

Voltando agora para os nossos operadores originais (x; p) temos:

a 0 = 0 =)�p2

�x+

ip

m!

� 0 = 0

x 0 +~m!

d 0dx

= 0

fazendo

k =~m!

temosd 0dx

= �1kx 0 =)

1

0

d 0dx

=d

dxln 0 = �

x

k;

Fácil ver que a equação acima é bem mais fácil de resolver que a nossaequação original (??). Sua solução vale

ln 0 = �x2

2k+ C =) 0 (x) = N exp

��x

2

2k

�:

com N uma constante (normalização).

10 Isso pode ser visto observando que para qualquer autovetor normalizado n temos

h nj a+a j ni =Z b

a[ n (x)]

� �a+a n (x)� dx=

Z b

a[a n (x)]

� [a n (x)] dx

= ha n ja ni � 0 :

190

A exigência a 0 = 0, nos permite ainda determinar a energia deste estadofundamental. Partido da eq. (86)

H n = ~!�n n

~!�a+a+

1

2

� 0 = ~!�0 0

~!�a+ (a 0) +

1

2 0

�= ~!�0 0

~!1

2 0 = ~!�0 0

�0 =1

2

Então já temos o estado fundamentas e a sua energia (auto-valor).Observe que a descrição quântica do OH implica na existência de uma energia

mínima (o oscilador nunca para de oscilar).

Problem 89 Como construir os outros estados n?

Para isso, basta usar a propriedade (90)

a+ n = n+1 =) a+ 0 = 1 =)�p2

�x� ip

m!

� 0 = 1

E1 = ~! (�0 + 1) = ~!�1

2+ 1

�explicitamente

�p2

�x 0 �

~m!

d

dx 0

�= 1

1 (x) =�p2x

1 +

~~m!m!

! 0

1 (x) = 2�p2x 0 = N1

2�p2x exp

��x

2

2k

�com uma nova constante de normalização N1. Da mesma forma, podemos obtertodos os outros estados (não-normalizados) n

n =�a+�n 0

n (x) = N

��p2

�x� ~

m!

d

dx

��n 0 (x)

Com autovalor

En = ~!�n+

1

2

�:

191

12.7.1 Normalização

As funções n (x) não estão normalizadas, i.e., após a aplicação do operador a+

n vezes, precisamos calcular Nn. Isso pode ser simpli�cado supondo que, se né um vetor normalizado, queremos obter N e N+ para que

a n � N n�1a+ n � N+ n+1

a n e a+ n também já estejam normalizados.

H j ni = En j ni

~!�a+a+

1

2

�j ni = ~!

�n+

1

2

�j ni

a+a j ni = n j ni

multiplicando pelo dual de j ni temos

h nj a+a j ni = n h n j ni = n : (92)

Agora observe que, pela de�nição de adjunto

h j A j�i = h�j A+ j i

temos Z� �A��dx =

Z�� (A+ ) dx =

Z(A+ )� dx

ou seja, podemos calcular h j A j�i como o produto do dual de j i com A j�i,ou como o produto de j�i com o dual de A+ j i. Com isso

h nj a+a j ni =Z� n�a+ (a n)

�dx =

Z(a n) (a n) dx

se �zemosj�ni = a j ni

a expressão acima se tornaZ(�n) (�n) dx = h�n j�ni = j�nj2 = ja nj2

usando (92)

ja nj2 = n)���� a npn

����2 = 1ou seja, se quisermos um vetor normalizado não devemos de�nir a n = n�1,mas sim

a npn� n�1 ) a n =

pn n�1 :

192

Da mesma forma

h nj aa+ j ni = h nj 1 + a+a j ni = 1 + h nj a+a j ni = 1 + n =��N+

��2a+ n =

pn+ 1 n+1

Ou, fazendo m = n+ 1,a+ m�1 =

pm m

com isso

m =a+ m�1p

m=

a+pm

a+pm� 1

a+pm� 2

m�3

=a+pm

a+pm� 1

a+pm� 2

:::a+pm�m

m�m

=(a+)

m

pm!

0 :

Assim, a formula para a n-ésima autofunção do hamiltoniano do OH se torna

n (x) =N0pn!

��p2

�x� ~

m!

d

dx

��n 0 (x)

onde N0 é a normalização do estado 0 .As funções n assim construídas são chamadas de funções de Hermite.

Exercise 90 Use a integral gaussianaZ 1

�1e�x

2

dx =p�

e ache a normalização N0.

Exercise 91 Construa a função de Hermite 4 (x).

O fato do nosso operador ser auto-adjunto implica que a base formada pelasfunções de Hermite também são completas e qualquer função pode ser decom-posta como

(x) =1Xn=0

cn n (x) ; cn = h n j i :

Além disso, estas funções respeitam a seguinte relação de ortogonalidade

h n j mi = �nm :

Da mesma forma, a o conjunto de autofunções de outros operadores lineares(queaparecem muito em física) geram outros conjuntos de funções ortogonais:

193

1. O operador de momento

p = �i~ ddx

com condições periódicas de contorno, fornece as funções ortogonais

e (x) =1p2Lexp (iknx) ; kn =

n�

L

presentes na decomposição da série de Fourie. Este operador está rela-cionado com vários problemas em física, em especial com o problemaquântico de uma partícula numa caixa.

2. O operador

H = � ~2

2m

d2

dx2+1

2m!2x2

no espaço das funções L2 (�1;1) cujas autofunções são

n (x) =N0pn!

��p2

�x� ~

m!

d

dx

��n 0 (x)

conhecidas como funções de Hermite. Este problema está relacionado, emespecial, com a equação do oscilador harmônico.

Outros casos muito encontrados são:

1. Equação diferencial de Legendre

L =�1� x2

� d2

dx2� 2x d

dx+ n (n+ 1)

Cujas soluções são os polinômios de Legendre

Pn (x) = N1

2nn!

dn

dxn�x2 � 1

�n:

Esta equação esta relacionada, por exemplo, com o problema quântico doátomo de hidrogênio.

2. Equação diferencial generalizada de Legendre

L =�1� x2

� d2

dx2� 2x d

dx+

�l (l + 1)� m2

1� x2

�Cujas soluções são os polinômios generalizados de Legendre

Pml (x) = N (�1)m�1� x2

�m=2 dm

dxm(Pj) :

194

3. A equação de Laplace em coordenadas esféricas

L =2

r

@

@r+

@2

@r2+

1

r2 sin �

�cos �

@

@�+ sin �

@2

@�2

�+

1

r2 sin2 �

@2

@'2

cujas autofunções são os harmônicos esféricos

Y ml (�; ') = Neim'Pml (cos �)

Esta equação esta relacionada, por exemplo, também com o problemaquântico do átomo de hidrogênio.

Estas soluções são chamadas, de forma geral, como funções especiais.

13 Potenciais centrais

Até aqui tratamos praticamente todos os exemplo em 1D e argumentamos que aextensão destes resultados para 3D não envolvia nenhuma di�culdade conceitualmais profunda.Vamos agora considerar o momento angular orbital de um sistema, ou seja,

uma característica que exige que nosso sistema tenha mais de 1D. O momentoangular que vamos tratar aqui é chamado de momento angular orbital. Esterepresenta a quantização, nos moldes introduzidos anteriormente, do observávelclássico momento angular

L = x� p! L = �i~x�r :

Obviamente esta é apena a forma do operador e para realmente especi�cá-lo,precisamos do seu domínio.

Exercise 92 Se x e p são hermitianos, o operador acima é hermitiano?

Esta distinção é necessária porque em MQ temos ainda um outro tipo demomento angular, chamado spin, que representa uma característica interna daspartículas (a seguir veremos a diferença). Este último não representa a quanti-zação de nenhum observável clássico e, mais ainda, não possui nenhum análogoem MC.O operador de momento angular respeita a seguinte regra de comutação

hLj ; Lk

i= i~

3Xi=1

"ijkLi

e, conseqüentemente, não podemos esperar medir suas três componentessimultaneamente (não são compatíveis). Portanto escolhemos uma destascomponentes para caracterizar o sistema,usualmente Lz.

Exercise 93 Veri�que a regra de comutação acima.

195

Entretanto, apesar de não podemos medir simultaneamente as 3 compo-nentes do momento angular, podemos de�nir um operador relacionado com omódulo (ou o valor total do momento angular)

L2 = L21 + L22 + L

23 ;

(na verdade, a raiz quadrada do autovalor do operador acima). Este operadorcomuta com todas as componentes do momento angularh

L2; Li

i= 0 :

Exercise 94 Veri�que explicitamente quehL3; L

2i= 0.

Assim, podemos caracterizar (medir simultaneamente) tanto o momento an-gular numa dada direção (e.g., L3), quanto o seu módulo. Ou seja, podemosprocurar por autofunções simultâneas destes dois operadores. Vamos chamarestas autofunções de Km e, por conveniência, vamos escrever seus autovalorescomo

L2 Km = ~2K2 Km ;

L3 Km = ~m Km :

Os índices K;m caracterizam nosso estado físico. Índices que caracterizamum estado físico em MQ são chamados de números quânticos. Ou seja, dizer quenosso sistema esta no estado K;m signi�ca dizer que ele tem momento angularna direção z igual a ~m e o módulo do vetor momento angular vale ~K.

Remark 95 Qualquer outra tentativa para especi�car melhor o valor do vetorL irá destruir as informações obtidas anteriormente.

Uma visão clássica para o nosso sistema (que ajuda a desenvolver algunsraciocínios) é que, após uma medida de L3 e L2 o vetor momento angular estáprecessionando em torno do eixo z. Mas este imagem não deve ser levadatão à sério. O resultado mais preciso, mas que é difícil de visualizar, é que,após a medida de L3, nosso sistema está numa superposição de todos os valorespossíveis de Lx e Ly, compatíveis com o valor de L2.

13.1 Autovalores e autovetores do momento angular

Vamos agora discutir os possíveis valores dos autovalores e a forma dos autove-tores de L3 e L2. Estes operadores são, obviamente, operadores diferenciais ea obtenção destas quantidades representa a resolução do problema de autoval-ores para estas equações.Entretanto, no lugar de resolvermos diretamente estasequações, podemos usar um método completamente análogo ao desenvolvido

196

para resolver o problema do oscilador harmônico. Neste caso, introduzamos osoperadores

L+ = L1 + iL2 ;

L� = L1 � iL2 =�L+

�+:

Estes operadores fazem às vezes de a e a+ neste problema e obedecem asseguintes regras de comutaçãoh

L3; L+

i= ~L+h

L3; L�

i= �~L�

[L+; L�] = 2~L3hL2; L�

i= 0

Exercise 96 Veri�que as leis de comutação acima.

Observe que as leis de comutaçãohL3; L�

i= �~L� são exatamente as

mesmas que as leis de comutação (88) e (89)

a � a� ; a+ � a+ )hHOH ; a�

i= �~!a� ;

calculadas no caso do osculador harmônico. Isso faz com que L� aja em L3 deforma semelhante a a� em H do OH.Assim como �zemos no caso do OH, imagine que você encontrou um autove-

tor K;m do operador L3

L3 K;m = ~m K;m :

Usando as regras de comutaçãohL3; L�

i= �~L� é possível mostrar que

L3

�L+ K;m

�= ~ (m+ 1) L+ K;m

L3

�L� K;m

�= ~ (m� 1) L� K;m

Ou seja, o operador L+ (L�) permite construir um novo autovetor com o auto-valor aumentado (diminuído) de uma unidade. Por isso este operador é chamadode operador de levantamento (abaixamento).

Exercise 97 Veri�que as igualdades acima.

Uma vez que L2 comuta com L3, podemos esperar que o autovetor K;macima seja também autovetor de L2

L2 K;m = ~2K2 K;m : (93)

197

Além disso, comohL�; L

2i= 0 temos

L2 (L� K;m) = L�L2 K;m = L�~2K2 K;m = ~2K2 (L� K;m) ;

Ou seja, os autovetores construídos acima são também autovetores de L2 comoo mesmo autovalor. Assim, os operadores L� abaixam e levantam a projeçãodo momento angular no eixo z sem mudar o valor do módulo do vetor.

Fazer desenho

Assim como H do OH, o operador (quadrático) L2 é positivo de�nido, comisso, D

L2E K;m

� 0) K2 � 0 :

(isso é obviamente verdade porque L é hermitiano e K 2 R).Além disso, temosD

L2E K;m

=DL21

E K;m

+DL22

E K;m

+DL23

E K;m

=DL21

E K;m

+DL22

E K;m

+~2m2 ;

ou sejaK2 = m2 + C ; C > 0

ou aindajKj � jmj ) � jKj < m < jKj :

Que obviamente signi�ca apenas que o módulo de um vetor é maior ou igualqualquer uma de suas componentes.Entretanto, o fato de podermos sempre aumentar o valor da projeção com

o operador L+ (ou diminuir com L�) leva a uma contradição com a igualdadeacima (assim como no caso da energia mínima do OH). Por isso, se mmax � jKjé o maior valor possível para a projeção do momento angular na direção z,devemos exigir que

L+ K;mmax= 0 : (94)

Pela mesma razãoL� K;mmin

= 0 : (95)

O operador L2 pode ser escrito como

L2 = L21 + L22 + L

23

= L�L+ + L23 + ~L3

= L+L� + L23 � ~L3

Exercise 98 Veri�que as igualdades acima.

198

Usando a relação acima e (94) podemos escrever (93) como

L2 K;mmax= ~2K2 mmax

=�L�L+ + L

23 + ~L3

� mmax

=�L23 + ~L3

� mmax

=�~2m2

max + ~2mmax

� mmax

ou sejaK2 = mmax (mmax + 1)

Da mesma formaK2 = mmin (mmin � 1)

Com isso

mmax (mmax + 1) = mmin (mmin � 1)m2max +mmax = m2

min �mmin

que implicammax = �mmin

Ou seja, os valores possíveis de m variam de uma em uma unidade(porque L� os faz varia de uma unidade) e se distribuem simetricamenteem torno de 0.A simetria da distribuição acima, nos mostra que temos apenas duas possi-

bilidades para os valores de mmax

mmax = inteiro) m = f�mmax;�mmax + 1; ::; 0; ::;mmaxgmmax = semi-inteiro) m = f�mmax;�mmax + 1; ::;mmaxg

no segundo caso m 6= 0. Qualquer outro valor de mmax não teria a simetrianecessária para que mmax = �mmin.Por exemplo, para mmax = 5=3 teríamos

5

3;2

3;�13;�43;�73) mmin = �

4

36= mmax :

Os dois tipos de valores para mmax caracterizam os dois tipos diferentes demomento angular mencionados anteriormente. Para mmax um semi-inteiro, Lé um momento angular intrínseco, i.e., um spin (e.g., férmions tem spin 1=2).Como veremos mais pra frente, para o caso do momento angular orbital, nec-essariamente devemos ter mmax inteiro11 .Vamos chamar

l � mmax = �mmin

Ou seja, os valores de m variam de uma em uma unidade desde �l até l. Coma de�nição acima temos

K2 = mmax (mmax + 1) = l (l + 1)

11Não estamos a�rmando que mmax inteiro não pode ser um valor de spin, mas apenas queo momento angular orbital tem, obrigatoriamente, um valor inteiro de mmax.

199

Ou seja, os autovalores de L3 e L2 são

L2 l;m = ~2l (l + 1) l;m ; l =

�0; 1; 3:::12 ;

32 ; :::

L3 l;m = ~m l;m ; m = �l;�l + 1; :::; 0; :::; l

Para cada valor de m temos 2l + 1 valores de m.Para l inteiro, por razões que se tornarão claras futuramente, l é chamado de

número quântico orbital, enquanto m é chamado de número quântico azimutal(ou número quântico magnético).Vemos que o valor máximo da projeção l é sempre menor que o módulo

do vetor l (l + 1), ou seja, o vetor nunca está projetado inteiramenteno eixo z. Se isso fosse possível, teríamos um estado com L3 bem de�nidoe com L1 = L2 = 0, ou seja, haveria um estado em que conheceríamos as 3componentes do momento angular.Observe que a MQ nos diz que as partículas podem ter apenas valores inteiros

e semi-inteiros de l. Desta forma, temos 3 casos distintos:

1. o momento angular orbital, com l inteiro;

2. o momento angular intrínseco (spin) com l inteiro (e.g, o estado ligado deduas partículas de spin 1=2) e semi-inteiro. No que se refere ao spin,

(a) partículas com spin inteiro são chamados de bósons e

(b) partículas com spin semi-inteiro são chamados de férmions.

Da mesma forma como no caso do OH, temos agora uma equação diferencialmais simples pra resolver

L+ l;l = 0 :

Uma vez obtida esta solução, podemos construir as demais soluções baixando oauto-valor de m

l;l�1 = L� l;l

e assim até l;�l onde, obviamenteL� l;�l = 0 :Esta construção é válida tantono caso do spin quanto do momento angular orbital. Entretanto, no primeirocaso os operadores são matrizes e no segundo operadores diferenciais. O casocom matrizes foi tratado quando estudamos sistemas com graus �nitos de liber-dade (usando os operadores J�). Vamos agora nos ater no caso do momentoangular orbital.Para resolver explicitamente este problema, ou seja, encontrar a forma ex-

plicita das autofunções, o ideal é trabalhamos em coordenadas esféricas

x = r sin � cos� ; y = r sin � sin� ; z = r cos � ;

e suas inversas

r2 = x2 + y2 + z2 ; cos � =z

r; tan� =

y

x:

200

Nestas coordenadas temos

L� = L1 � iL2 = ~e�i��i cot �

@

@�� @

@�

�;

L2 =1

sin �

@

@�sin �

@

@�+

1

sin2 �

@2

@�2: (96)

Em especial, o operador L3 assume uma forma bem simples

L3 = �i~@

@�:

Observe que a coordenada r não participa dos nossos operadores.Assim, as funções procuradas obedecem a equação (fazendo Y ml � l;m)

L3Yml = imY ml ;

Y ml = Y ml (�; �)

fazendo uma separação de variáveis

Y ml (�; �) = �m (�)�ml (�)

temosL3Y

ml = imY ml ) �m (�) = N� exp (im�) :

Onde N� é, obviamente, a normalização (no parâmetro livre �).Lembrando que a o produto interno das nossas funções originais são dadas

por

hgj fi =Z Z Z

�g (x; y; z) f (x; y; z) dxdydz =

Z Z Z�g (x; y; z) f (x; y; z) dV

e que, em coordenadas esféricas, o elemento de volume de uma casca com raior é dado por12

dV = r2 sin �d�d�dr ;

temos que a área devido a variação das variáveis angulares (�; �) vale

d = sin �d�d� ;

Chamado de elemento de ângulo sólido. Assim, o produto interno das nossasfunções (e, conseqüentemente, a normalização) devem ser calculados como

hY j Y 0i =Z 2�

0

Z �

0

�Y (�; �)Y 0 (�; �) sin �d�d� :

Para a coordenada � podemos escrever

N� =1p2�) �m (�) =

1p2�exp (im�) :

12A quantidade que multiplica d�d�dr é o jacobiano da transformação.

201

No caso do momento angular orbital estamos (diferente do spin) efetivamentequantizando um sistema clássico que descreve um movimento circular. Ascaracterísticas físicas (clássicas) deste sistema exigem que o estado da partículano ponto (r; �; �) sejam os mesmos que nos pontos (r; � + 2�; �+ 2�) (pois sãoos mesmos pontos do espaço). Assim, a condição de unicidade da solução (queusamos em problemas de mecânica clássica) exige que

�m (�) = �m (�+ 2�)) eim2� = 1) m = 0; 1; 2; ::

Ou seja, m deve ser inteiro. Como a�rmamos para o caso do momentoangular orbital.Assim, nossas soluções têm a forma

Y ml (�; �) =1p2��ml (�) exp (im�) ; m 2 N :

Voltando agora para a nossa equação

L+Yll = 0) ~ei�

�i cot �

@

@�+

@

@�

�1p2��ll (�) exp (il�) = 0 ;

ou seja@

@��ll (�) = l cot ��ll (�)

observando que

d

d�sinl � = l sinl�1 � cos � = l sinl �

cos �

sin �= l cot � sinl �

temos a solução

�ll (�) = Nl sinl � ) Y ll (�; �) =

Nlp2�exp (il�) sinl �

onde Nl é uma normalização.

Exercise 99 Obtenha a constante de normalização Nl (lembre que � 2 [0; �]).

As demais soluções são obtidas pela aplicação do operador L�

Y l�ml (�; �) =�L�

�mY ll (�; �) = Nl�m

�~e�i�

�i cot �

@

@�� @

@�

��msinl �eil� ; m � 2l :

As funções Y l�ml assim construídas, e devidamente normalizadas, são chamadasde harmônicos esféricos. Com isso

L2Y ml = ~2l (l + 1)Y ml ; l 2 N:::L3Y

ml = ~mY ml ; m = �l;�l + 1; :::; 0; :::; l

hY ml j Y m0l0 i =Z 2�

0

Z �

0

�Y ml (�; �)Y m0l0 (�; �) sin �d�d� = �mm0

ll0

202

Se usarmos ainda a primeira expressão acima e forma diferencial de L2,temos que as nossas soluções obedecem também a equação:�

m2

sin2 �� 1

sin �

d

d�

�sin �

d

d�

���ml = ~2l (l + 1)�ml

fazendo

� � cos � ; �1 � � � 1� � ~2l (l + 1)

1

sin �

d

d�= � d

d�

�2 = cos2 � =�1� sin2 �

�1� �2 = sin2 �

temosd

d�

��1� �2

� d�mld�

�� m2

(1� �2)�ml + ��

ml = 0

Para m = 0 esta é a equação de Legendre, cujas soluções são os polinômios deLegendre

Pl (cos �) =1

2ll!

dl

d (cos �)l

�cos2 � � 1

�lpara o caso geral, as soluções são dadas pela formula de Rodrigues

Y ml (�; �) = Nl�mPml (cos �) e

im�

ondePml são os polinômios associados de Legendre

Pml (cos �) = (�1)m �1� cos2 �

�m=2 dm

d (cos �)mPl (cos �)

= (�1)m�1� cos2 �

�m=2 1

2ll!

dl+m

d (cos �)l+m

�cos2 � � 1

�lUsando as propriedades dos polinômios de Legendre a forma acima permitedeterminar as constantes de normalização

Nl�m =

�2l + 1

4�

(l �m)!(l +m)!

�1=2:

A vantagem da expressão acima é que as propriedades dos polinômios as-sociados de Legendre permitem resolver uma série de problemas envolvendo osharmônicos esféricos.

203

13.2 O átomo de hidrogênio

Recapitular principais resultados do átomo de Bohr-Sommerfeld.Como vimos, o modelo de Bohr-Sommerfeld do átomo de hidrogênio consiste

na quantização de duas variáveis clássicas: XE cada estado do elétron é determinado pelos números n e NT.I

p� d� = n�h ;

Ipr dr = nrh :

comnr 2 N ; n� 2 N� :

A energia de cada um destes estados é dado por

Enr;n� = �RHn2

; n = n� + nr :

Assim, para cada valor de n temos vários diferentes de n� e nr que resultamna mesma energia. Esta degenerescência explica a estrutura �na observada naslinhas espectrais do átomo de hidrogênio.Na notação usada em química um nível é nomeado pelo valor de n e nr, onde

os níveis com nr = 0 (maior n�) é chamado de s, o nível nr = 1 é chamado dep etc.

n = 1) n = 0; n� = 1 � 1sn = 2) nr = 0; n� = 2 � 2s; nr = 1; n� = 1 � 2pn = 3) nr = 0; n� = 3 � 3s; nr = 1; n� = 2 � 3p ; nr = 2; n� = 1 � 3d...

Vejamos agora como estes resultados podem ser obtidos na teoria de Schroedinger.Veremos, além disso, que esta teoria não só fornece os resultados anteriorescomo permite uma descrição mais �na dos níveis acima (e.g., a degenerescênciado nível 2p). Além disso, e o que é mais importante, a teoria de Schroedingerpermite re�nar a descrição do átomo de hidrogênio acrescentando outras car-acterísticas além da atração coulombiana. Por exemplo, o spin do elétron e donúcleo.Uma vez que a teoria de Schroedinger parte da quantização do hamiltoniano

clássico, precisamos primeiro montar este hamiltoniano.Partindo do hamiltoniano da partícula livre

H = � ~2

2mr2

e escrevendo o laplaciano em coordenadas esféricas temos

H =p2r2m

+L2

2mr2

204

com

pr =1

r

@

@rr

L2 =1

sin �

@

@�sin �

@

@�+

1

sin2 �

@2

@�2

onde L2 é o operador de momento angular introduzido anteriormente (96) e pr échamado de momento radial. Assim, para o caso de um potencial que dependaapenas da coordenada radial, i.e., um potencial central, temos que o operadorhamiltoniano se torna

H =p2r2m

+L2

2mr2+ V (r)

Para o caso de um sistema ligado de um próton e um elétron (i.e., um átomode hidrogênio) temos que o potencial do elétron devido ao próton vale

V (r) = �e2

r

com o que nosso hamiltoniano �ca

H =p2r2m

+L2

2mr2� e2

r

Remark 100 Lembre que, na verdade, sendo um sistema de dois corpos, deve-mos usar a massa reduzida

� =memp

me +mp' me ;

reveja o capítulo sobre o átomo de Bohr.

Assim, na teoria de Schroedinger, o problema dos estados estacionário (es-tados com energia de�nida) do átomo de hidrogênio, consiste em encontrar osautoestados do operador acima

H = � jEj :

Além disso, como estamos interessados em estados ligados, estamos interessadosno caso E < 0 (pois, como no problema usual do potencial acima, estamoscolocando o zero de energia no in�nito).O problema acima pode ser facilitado usando, novamente, uma separação de

variáveis. Entretanto, observe quehH; L2

i=hH; L3

i= 0 ;

ou seja, podemos procurar por autofunções simultâneas de H; L2 e L3 (ou ainda,podemos medir simultaneamente H; L2 e L3). Com isso, vamos procurar asnossas soluções na forma

= R (r)Y ml (�; �) :

205

Substituindo a solução na forma acima na ES temos:�� ~

2

2m

�1

r

d2

dr2r

�+~2l (l + 1)2mr2

� e2

r+ jEj

�R (r) = 0

Esta equação pode ser simpli�cada fazendo

u � rR

com o que ���d2

dr2r

�+l (l + 1)

r2� 2me

2

~2r+2m jEj~2

�u (r) = 0

que pode ser colocada numa forma ainda mais simples através das variáveis

� � 2�r ; ~2�2

2m= jEj ; � = RH

jEj

RH =~2

2ma20; a0 =

~2

me2

onde RH é a constante de Rydberg e a0 o raio de Bohr introduzidos na seçãosobre o átomo de Bohr. Nestas novas variáveis temos

d2u

d�2� l (l + 1)

�2u+

��

�� 14

�u = 0

Nosso trabalho se resume, obviamente, em resolver a equação diferencial acima.Assim como nos casos anterior existem técnicas especí�cas para encontrar asolução desta equação. Após a aplicação destas técnicas, as soluções do prob-lema acima podem ser escritos como:

un;l (�) =�

2�exp

���2

��l+1Fnl (�)

onde

Fnl (�) =n�l�1Xi=0

(�1)i [(n+ l)!]2 �ii! (n� l � 1� i)! (2l + 1 + i)! ; n 2 N

são os polinômios associados de Laguerre. Para que estas funções sejam dequadrado integrável, devemos ter13

n� l � 1 � 0) l � n� 1) l < n

Assim, a solução do problema do átomo de hidrogênio pode ser escrito como

n;l;m (r; �; �) = Rn;l (r)Yml (�; �) ;

Rn;l (r) =1

run;l (�) ; � � 2�r

un;l (�) = exp���2

��l+1Fnl (�) :

13Podemos de�nir os polinômios acima para valores negativos do fatorial usando a função�. Entretanto, � (�m)) =1 para m inteiro positivo.

206

com os autovalores

En = �RHn2

que são exatamente os mesmos obtidos pela quantização de Bohr.A solução da parte radial do problema (como era de se esperar) introduziu

o novo número quântico n nas nossas soluções. Chamado de número quânticoprincipal.

Remark 101 A energia depende apenas do número quântico principal.

As restrições acima impõeml < n :

e as restrições obtidas anteriormente

jmj < l :

Assim, para um dado valor de l temos 2l+1 estados com o mesmo valor de l e,para um dado valor de n temos n2 estados com a mesma energia.Na notação usada em química, os valores de n rotulam os chamados orbitais.

Os valores de l são chamados, em seqüência, s; p; d etc. E para cada um destesvalores, temos m = 2l + 1 estados distintos.

1s1

2s12p3

3s13p33d5

...

A descrição completa dos orbitais atômicos depende ainda de uma carac-terística negligenciada até aqui: o spin do elétron. Esta quantidade faz comque cada estado possa existir em dois estados distintos de spin. Ou seja, onúmero de estados de cada orbital é dobrado.

1s2

2s22p6

3s23p63d10

...

Além disso, a estrutura da distribuição eletrônica, bem como a estabilidade detoda a matéria conhecida, depende diretamente da in�uência do spin nestesníveis eletrônicos. Ou seja, é impossível compreender a distribuição eletrônica(em especial a tabela periódica) sem tomar em conta o spin do elétron.

207

13.2.1 Acoplamento spin-órbita

Podemos melhorar um pouco o nosso modelo se tomarmos em conta os efeitoscausados pelo spin dos elétron. Como sabemos, além de carga e massa o elétronpossui ainda outra característica intrínseca chamada spin. Esta quantidadeinterage apenas com campos magnéticos. Assim, se colocarmos nosso átomoimerso num campo magnético B, teremos de acrescentar ao hamiltoniano Ho

um termo da forma

H = Ho + �s:B ; s =~2�

s é o operador de spin. Este operados comuta com os introduzidos anteriormentehH; s

i=hs; L2

i=hs; Lz

i= 0 :

Assim, como vimos, nosso sistema adquire mais um grau de liberdade e, es-colhendo nossa base de spin nossas j�i na direção z, soluções passam a ter aforma

jn; l;mi j�i ; sz j�i =~2�3 j�i = �

~2j�i

jn; l;m;msi = jn; l;mi jmsi ; ms = �1

2sz jn; l;m;msi = ~ms jn; l;m;msi (97)

Assim, além dos números quânticos introduzidos anteriormente, temos agora onovo número quântico ms.O problema aqui é que uma carga em movimento num campo elétrico (devido

as transformações de Lorentz) enxerga um campo magnético (mais termos daordem de �2),

Beff = �� pmc

��E

EscrevendoE = �r'

surge no nosso Hamiltoniano um termo na forma

1

2�s:Beff = f (r)

�s � L

�; f (r) =

1

2

1

m2ec2

1

r

d'

dr

(o fator 1=2, chamado fator de Thomas, surge quando mudamos do referencialdo elétron, onde Beff foi calculado, para o referencial do centro de massa) e ohamiltoniano para o átomo de hidrogênio, tomando agora em conta o spin, tema forma

H = Ho + f (r) s � LObviamente, uma vez que o Hamiltoniano e, conseqüentemente, as equaçõesdiferenciais envolvidas são diferentes, as soluções anteriores não servem mais.Este novo problema é in�nitamente mais difícil de resolver. Entretanto,é possível mostrar que este novo termo envolve energias muito menores que

208

as energias envolvidas em Ho. Assim, o que efetivamente é feito, é se tratareste novo temo do Hamiltoniano como uma perturbação. Ou seja, utiliza-se asmesmas soluções obtidas para Ho e se estima as alterações destas quantidadesna presença do novo termo.Um problema ainda é que este novo termo no Hamiltoniano não mais comuta

nem Lz nem com sz. Portanto, estas quantidades não podem mais ser usadaspara rotular nossos soluções (existe agora relações de incerteza entre H; Lz; sz).Mais especi�camente, não podemos mais usar o número quântico m nem aprojeção do spin ms. Contudo, o Hamiltoniano acima pode ser escrito como

H = Ho +f (r)

2

�|2 � L2 � s2

�(98)

onde| = L+ s ;

hH; |

i= 0

é o momento angular total do sistema. Além disso, é fácil ver que jz comutacom H. Assim, no lugar de m (autovalores de Lz) usamos jz, os autovalores dooperador |z. Lembre-se que tínhamos dois números (m;ms) e agora só temosum (jz). Pela forma do Hamiltoniano (98) é fácil ver queh

H; |2i=�|z; |

2�= 0

podemos então usar os autovalores de |2 para rotular nossos estados quânticos.Observe que apesar de | comutar com H, não podemos usar outra componentede |, porque estas não comutam com |z.Assim, no lugar dos vetores (97) os estados quânticos para o átomo de

hidrogênio são rotulados como

jn; l; j; jzi

onde

H jn; l; j; jzi = En;? jn; l; j; jzi ;L2 jn; l; j; jzi = ~l (l + 1) jn; l; j; jzi ;J2 jn; l; j; jzi = ~j (j + 1) jn; l; j; jzi ;|z jn; l; j; jzi = ~jz jn; l; j; jzi : (99)

Observe que, para o novo Hamiltoniano, não existe nenhuma razão para sesupor que os auto-valores de H não dependam dos demais números quânticos.Mais uma vez: para construir efetivamente as funções de onda n;l;j;jz (r; �; �) =

hr; �; �j jn; l; j; jzi precisamos resolver a equação de Schroedinger. Mas o quefazemos é continuar usando as funções R (r) e Y ml (�; �), obtidas anteriormente,e tratamos o novo Hamiltoniano como uma perturbação do anterior.

209

14 Teoria das perturbações

Como vimos, o problema do átomo de hidrogênio (mesmo com um único elétron)tomando em conta os efeitos do spin, não pode ser resolvido exatamente (issoacontece com a maioria dos problemas em MQ). Vamos então ver como estetipo de problema pode ser atacado. A idéia é queremos encontrar os estadosestacionários (auto-funções) j ni para um Hamiltoniano na forma

H = H0 + �V ; H j ni = "n j ni ; � 2 R ; � << 1 : (100)

onde sabemos resolver o problema exatamente para H0, i.e., nós conhecemostodas as soluções

H0 j�mi = Em j�mi :

A suposição que fazemos aqui é que V é uma perturbação em H0, i.e., as en-ergias (auto-valores) do hamiltoniano H, apesar de ser diferente dos autovaloresde H0, não são muito diferentes j"n � Enj << 1. Isso pode ser garantido se�zemos o parâmetro � muito pequeno. Para � = 0, H = H0. Este parâmetrosurge naturalmente em cada problema especí�co. A idéia aqui (que é muitomais fácil de entender no espaço abstrato) é que o auto-vetor j ni de H, ape-sar de desconhecido, não é um vetor muito diferente de algum vetor de H0, quechamaremos de j�ni. Com isso, fazemos a seguinte aproximação para a projeçãode j ni em j�ni

h�n j ni = 1 : (101)

É conveniente escrever esta expressão usando o seguinte operador de projeção

Pn = j�ni h�nj

ou seja, quando opera em um vetor qualquer j�i, Pn j�i = h�nj j�i j�ni nos daa projeção de j�i em j�ni. Com isso, nossa aproximação (??) se torna

Pn j ni = j�ni h�nj j ni = j�ni (102)

ou ainda

j ni = j�ni+�I � Pn

�j ni

= j�ni+ Qn j ni ; Qn =�I � Pn

�: (103)

Se você não se sentir tão confortável no espaço abstrato, lembre-se que tudoisso pode ser traduzindo num espaço concreto. Por exemplo, usando funções deonda,

hxj Pn j ni = hxj j�ni h�nj j i = hxj j�niZh�nj jxi hxj j ni dx

= �n (x)

Z��n (x) n (x) dx

210

onde �n (x) é a solução da equação de Schrödinger com hamiltoniano H0. Ob-viamente, para efetuarmos o cálculo acima, precisamos antes encontrar n (x),que é o nosso objetivo adora.Voltando agora para a nossa notação abstrata em (100) temos�

�n � H0

�j ni = �V j ni =) �V j ni =

�"n � H0

�j ni

j ni = �1�

"n � H0

� V j nionde, até aqui,

�"n � H0

��1é apenas um símbolo para um operador que com

a seguinte propriedade

1�"n � H0

� �"n � H0

�= I

mas que nós ainda não conhecemos.Voltando agora para (103) temos

j ni = j�ni+ Qn j ni =) j ni = j�ni+ �Qn1�

"n � H0

� V j nij ni = j�ni+ �Mn j ni ; Mn = Qn

1�"n � H0

� VO grande truque agora é aplicar este processo recursivamente, ou seja, na ex-pressão acima (que possui j ni dos dois lados da igualdade) substituímos todaa igualdade no j ni do lado direito. Com isso

j ni = j�ni+ �Mn

�j�ni+ �Mn j ni

�= j�ni+ �Mn j�ni+ �2M2

n j ni (104)

Observe agora que o terceiro termo depende de �2 e sendo � muito pequeno,é obrigatoriamente muito menor que o segundo. Assim, uma primeira aproxi-mação para j ni, i.e., ignorando os termos da ordem de �2, vale��� (1)n E = j�ni+ �Qn 1�

"n � H0

� V j�nionde, mais uma vez, lembramos que conhecemos o vetor j�ni. Para efetuarmosa conta acima, precisamos ainda saber como age o operador

�E � H0

��1. Para

isso, basta usarmos a propriedadeXk

j�ki h�kj = I =)��� (1)n E = j�ni+X

k

�Qn1�

"n � H0

� j�ki h�kj V j�ni= j�ni+ �

Xk

Qn1

("n � Ek)j�kiVkn

211

onde sabemos calcular cada elemento da matriz Vkn

Vkn = h�kj V j�ni =Zh�kj jxi hxj V jx0i hx0j j�ni dx dx0

=

Z��k (x)V (x; x

0)�n (x0) dx dx0

Em particular, se V só depender de x, como é o vaso mais comum,

V (x; x0) = hxj V jx0i = V (x) � (x� x0)

Vkn =

Z��k (x)V (x)�n (x) dx

É importante notar que

Qn j�ki = j�ki =�I � Pn

�j�ki = (I � j�ni h�nj) j�ki

= (j�ki � �nk j�ni) =�0 ; n = kj�ki ; n 6= k

Com isso ��� (1)n E = j�ni+ �Xk 6=n

1

("n � Ek)j�kiVkn

Ou, projetando no espaço das funções de onda

(1)n (x) = �n (x) + �Xk 6=n

�k (x)

("n � Ek)Vkn (105)

Mas ainda resta um problema: quanto vale "n? Para resolver este problema,voltamos a nossa equação original (100) e fazemos o produto interno com j�ni,

h�nj�H0 + �V

�j ni = h�nj "n j ni

h�nj H0 j ni+ � h�nj V j ni = "n h�nj j ni

e usamos novamente (101), h�n j ni = 1,

"n = En + � h�nj V j ni"n � En � �n = � h�nj V j ni (106)

onde �n é a diferença entre a energia perturbada e não perturbada, que estamossupondo pequena (observe que é proporcional a �). Precisamos então calcular

1

"n � Ek= � 1

(Ek � En)��n= � 1

!nk ��n

= � 1

!nk

1�1� �n

!nk

� ; !nk = Ek � En :

212

Se supusermos que �n << !nk podemos expandir (1��n=!nk)�1 em série deTaylor em torno da origem

1�1� �n

!nk

� = 1Xn=0

��n!nk

�n= 1 +

�n!nk

+

��n!nk

�2+ :::

usando agora (106)

1�1� �n

!nk

� = 1 + � h�nj V j ni!nk

+ �2

h�nj V j ni

!nk

!2+O

��3�

1

"n � Ek= � 1

!nk

241 + � h�nj V j ni!nk

+ �2

h�nj V j ni

!nk

!2+O

��3�35 (107)

Precisamos agora lembrar que na nossa primeira aproximação (1)n (x) estamosinteressados apenas em termos da ordem de �, i.e., se mantivermos o segundoda expressão acima em (75) teremos um termo da ordem de �2. Então, paraobtermos a aproximação de ordem 1 (ignorar termos de �2) na função de onda,usamos a aproximação de ordem zero (ignorar temos de �) na energia. Assim,em primeira ordem em �, temos��� (1)n E = j�ni � �X

k 6=n

VknEk � En

j�ki

(1) (x) = �1 (x)� �Xk 6=n

VknEk � En

�k (x) (108)

O que signi�ca a expressão acima? Ela nos diz que o vetor perturbado j nié quase igual ao vetor não perturbado j�ni, mas com uma pequena componente(pois � << 1) na direção ortogonal. Além disso, a suposição �n << !nk nosdiz que a perturbação tem de ser muito menor que a diferença nos níveis deenergia do hamiltoniano não perturbado.Para se saber o valor da primeira aproximação na energia, quanto �V alterou

a energia do sistema, basta usar o resultado acima em (106)

�n = � h�nj V��� (1)n E = � h�nj V j�ni+O

��2�; (109)

ou seja, a primeira ordem de perturbação na energia é apenas a média de V .O poder do processo descrito acima é que ele pode ser repetido inde�nida-

mente para se obter as outras ordens de aproximação em �. Por exemplo, paraa segunda ordem de aproximação, voltamos para (104)

j ni = j�ni+ �Mn j�ni+ �2M2n j ni

=��� (1)n E+ �2M2

n j ni

213

usamos nossa primeira aproximação

j ni =��� (1)n E+ �2M2

n

��� (1)n E+ �4M4n�M

2n j ni

ignorando termos de ordem mais alta que �2,��� (2)n E = ��� (1)n E+ �2M2n

��� (1)n Eonde

��� (1)n E foi obtido no passo anterior. ExplicitamenteM2n

��� (1)n E = Qn1�

"n � H0

� V Qn 1�"n � H0

� V ��� (1)n E=Xk;j

Qn1

("n � Ek)j�ki h�kj V j�ji Qn

1

("n � Ej)h�j j V

=X

k 6=n;j 6=n

1

("n � Ek)j�ki h�kj V j�ji

1

("n � Ej)h�j j V

��� (1)n E :

Mas agora, para "n precisamos manter termos até a primeira ordem em �em

1

"n � Ek= � 1

!nk

"1 + �

h�nj V j ni!nk

#+O

��2�

= � 1

!nk

"1 + �

h�nj V j�ni

!nk+ � h�nj Mn j ni

!#+O

��2�

= � 1

!nk

"1 + �

h�nj V j�ni!nk

#+O

��2�

Então, para obtermos a aproximação de ordem 2 (ignorar termos de �3) nafunção de onda, usamos a aproximação de ordem 1 (ignorar termos de �2) naenergia. Isso é válido para qualquer ordem. Com isso��� (2)n E = ��� (1)n E+X

k 6=n;j 6=n

1

(En � Ek)1

(En � Ej)h�kj V j�ji

"1 + �

h�nj V j�ni(En � Ek)

#"1 + �

h�nj V j�ni(En � Ej)

#h�j j V

��� (1)n E j�kiEste procedimento pode ser aplicado inde�nidamente. Usualmente, em prob-

lemas práticos, a convergência deste método é bem rápida, sendo necessário ocálculo apenas da primeira e segunda ordem de perturbação.O procedimento descrito acima é utilizado em praticamente todos os modelos

de QFT. Em especial, o primeiro destes modelos a fornecer uma in�nidade deresultados consistentes com as experiências, a QED, é, basicamente, uma teoria

214

perturbativa. O procedimento é aplicado com tanta freqüência que um métodosistemático foi desenvolvido para se somar os termos das séries em QFT chamadode diagramas de Feynman.Obviamente, se a perturbação não é pequena, o método não pode ser usado.

Por exemplo, várias interações (e.g., quark-gluon) da QCD a baixas energias nãopodem ser tratadas com este procedimento. Esta é uma das razões destas teoriasnão fornecerem tantos resultados experimentáveis quanto a QED. Processosde transição de fase (e.g., supercondutividade e condensados) não podem serdescritos por este método, pois os novos vetores no espaço de Hilbert são muitodistintos dos originas (a imposição (102) não pode ser feita). Para todos estessistemas existem outros métodos aproximativos, como, por exemplo, os métodosvariacionais e a aproximação WKB e ainda métodos puramente numéricos comodensity functional theory.O procedimento descrito acima se torna consideravelmente mais complicado

quando a perturbação depende do tempo e quando o sistema possui de-generescências (neste caso, veja a divergência em (108)).

14.1 Acoplamento spin-órbita (continuação)

Voltando agora ao nosso átomo de hidrogênio com spin. Como vimos, a primeiraordem de correção para a energia é simplesmente a média do novo operadorHamiltoniano calculado nas funções não perturbadas (109). Com isso

E = h j H j i = h j Ho +f (r)

2

�|2 � L2 � s2

�j i

= h j Ho j i+1

2hf (r)i h j

�|2 � L2 � s2

�j i

Lembrando que j i são autovetores de Ho com autovalor En (soluções (??)) eque usando as regras (99) temos

En;l;j = En +

�j (j + 1)� l (l + 1)� 3

4

�~2

2hf (r)inlm (110)

Mais uma vez: este resultado é só uma aproximação que somente seráválida se o segundo termo for muito menor primeiro . Mas já em primeiraordem de aproximação vemos que os níveis de energia do novo Hamiltonianodependem, não só de n, mas de n; l e j. Ou seja, o termo spin-órbita quebrauma parte da degenerescência do sistema. Além disso, como estamos usandoainda as funções originais, as seguintes regras continuam válidas

n 2 N� ; l;m 2 N

l < n ; jmj 6 l =)����jz � 12

���� 6 l :

Para avaliar o valor de hf (r)i basta usar também os estados não perturbados

215

(??) e calcular as integrais, com isso

hf (r)inlm = ��Z�

~

�22

l (2l + 1) (l + 1)

Enn� hf (r)inl

onde � = e2=~c = 1=137 é a chamada constante de estrutura �na (este é o nossoparâmetro de perturbação � neste caso). Observe agora que

~2 hf (r)inlEn

/ �2 = 5; 33� 10�5 :

O que mostra que, efetivamente, o segundo termo de (110) é muito menor queo primeiro termo (se isso não fosse verdade teríamos de abandonar a nossateoria14). Com isso nossa expressão de energia se torna

En;l;j = � jEnj(1�

�j (j + 1)� 3

4� l (l + 1)

�(Z�)

2

l (2l + 1) (l + 1)

1

n

)

Para l = 0 temos j = 0 + 12 e a expressão acima se torna

j = 0 +1

2=) E

(0)n;l = � jEnj

ou seja, não há acoplamento spin-órbita neste caso (os orbitais s sãoesfericamente simétricos).Para o caso de um único elétron (esta conta deve ser refeita para mais

elétrons, pois para n elétrons temos n contribuições do spin), lembrando quej = l � 1=2, para um dado l > 0 temos

j = l +1

2=) E

(+)n;l = � jEnj

1� 1

(2l + 1) (l + 1)

(Z�)2

n

!

j = l � 12=) E

(�)n;l = � jEnj

1 +

1

l (2l + 1)

(Z�)2

n

!

Por exemplo, para n = 2, temos

1. Para l = 0 =) j = 1=2

E2;0; 12 = E(0)2;0 = � jE2j (1� 0) = � jE2j

2. Para l = 1 =) j = 1� 1=214Nem sempre temos esta sorte. Teorias onde os termos de aproximação sucessivas não

necessariamente diminuem são chamadas de "teorias não perturbativas".

216

E2;1; 12 = E+21 = � jE2j"1� 1

6

(Z�)2

n

#

En1 32 = E�21 = � jE2j"1 +

1

3

(Z�)2

n

#

As relações acima descrevem com grande precisão o espectro de emissão dosátomos hidrigenoides.Vamos então voltar para a nossa tabela periódica e tentar descrever a con-

�guração do átomo de lítio. Neste caso, temos 3 elétrons, os dois primeiroscompletam o orbital 2s. O terceiro certamente ocupará a Shell n = 2, mas comque valor de l? De acordo com as expressões acima nosso terceiro elétron tem asua disposição os estados:

E(0)2;0 = � jE2j

E+21 = � jE2j+ jE2j1

12(Z�)

2

E�21 = � jE2j � jE2j1

6(Z�)

2

Vemos então que o estado de menor energia é o E�21. Mas este estado teml = 1? Ou seja, a nossa teoria, apesar de descrever muito bem o espectro devários átomos e, inclusive várias de suas propriedades químicas, ainda não ésu�ciente para nos dar a regra n+ l de Madelung.

217