372
 Wilson Castro Ferreira Jr. Artur César Fassoni Análise Funcional : Princípios, Métodos e Fins Versão Preliminar Unicamp, 2014

Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

Embed Size (px)

DESCRIPTION

Notas de aulas do professor Wilson

Citation preview

Page 1: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 1/371

Wilson Castro Ferreira Jr.Artur César Fassoni

Análise Funcional : Princípios,Métodos e Fins

Versão Preliminar

Unicamp, 2014

Page 2: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 2/371

Page 3: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 3/371

Índice

1 Espaços Métricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1 Espaços Métricos : A Origem dos Conceitos de Convergência . . . . . 11.2 Linguagem e Conceitos Básicos de Espaços Métricos . . . . . . . . . . . . 12

1.3 Teoremas Fundamentais Clássicos no Contexto de Espaços Métricos 181.4 Construção Abstrata de Espaços Métricos . . . . . . . . . . . . . . . . . . . . . . 27

1.4.1 Espaços Quocientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271.4.2 Completamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

1.5 Produtos Cartesianos de Espaços Métricos. . . . . . . . . . . . . . . . . . . . . . 321.6 Apêndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

1.6.1 Teorema de Heine-Borel Tologicamente Correto . . . . . . . . . . 341.6.2 Os Teoremas Clássicos de Weierstrass e a Bipartição . . . . . . 351.6.3 Estranhos limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

2 Espaços Métricos Funcionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 392.1 Exemplos de Espaços Métricos Funcionais . . . . . . . . . . . . . . . . . . . . . 402.2 Aproximação Uniforme de Funções Contínuas . . . . . . . . . . . . . . . . . . 46

2.3 Teoria de Arzelá-Ascoli : Caracterização de Compactos em(C 0(K , M ), d ∞). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

2.4 Extensões da Teoria de Arzelá-Ascoli : Convergência uniformeem Compactos, Teoremas de Montel, Riesz e Kolmogorov . . . . . . . . 67

2.5 Apêndice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 722.5.1 Integral de Riemann Multidimensional . . . . . . . . . . . . . . . . . . 722.5.2 Weierstrass-Dirac Multidimensional . . . . . . . . . . . . . . . . . . . . 732.5.3 Teoria de Weierstrass-Dirac Diferencial . . . . . . . . . . . . . . . . . 742.5.4 Apêndice Topológico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 752.5.5 Exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

3 Equações em Espaços Métricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 773.1 Equações em Espaços Métricos : Considerações Gerais . . . . . . . . . . . 77

3.2 Funções compactas & outras notáveis . . . . . . . . . . . . . . . . . . . . . . . . . . 853.3 O Método iterativo de contrações Birkhoff-Banach-Cacciopoli. . . . . 93

Page 4: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 4/371

VI Índice

3.4 A dependência do ponto fixo com respeito a parâmetros . . . . . . . . . . 102

4 Espaços Vetoriais e Álgebras Normadas . . . . . . . . . . . . . . . . . . . . . . . . . . 1074.1 Espaços Vetoriais e Álgebras Funcionais . . . . . . . . . . . . . . . . . . . . . . . 107

4.2 Álgebras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1144.2.1 Métodos de Algebrização de Espaços Vetoriais (Definiçõesde Operações Produto) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

4.2.2 Outros Exemplos de Álgebras. . . . . . . . . . . . . . . . . . . . . . . . . . 1224.3 Métodos Gerais de Topologização de Espaços Vetoriais e Álgebras . 1284.4 Espaços Vetoriais e Álgebras Normadas . . . . . . . . . . . . . . . . . . . . . . . . 131

4.4.1 Normas de Minkowski - Espaços l p . . . . . . . . . . . . . . . . . . . . . 1354.4.2 Espaços vetoriais com topologias geradas por famílias de

normas ou semi-normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1404.4.3 Convergência Fraca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

4.5 Espaços com produto interno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1454.6 Geometria de espaços vetoriais normados . . . . . . . . . . . . . . . . . . . . . . 152

4.6.1 Equivalências e Isomorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . 152

4.6.2 Espaços Quocientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1604.6.3 Convexidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1624.6.4 Aproximação e convexidade estrita . . . . . . . . . . . . . . . . . . . . . 1654.6.5 O Teorema de Hahn-Banach-Helly e o Princípio das

Coordenadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1684.6.6 Aplicações do princípio de coordenadas de Helly . . . . . . . . . 174

4.7 Extensão de espaços vetoriais normados - Teorema docompletamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175

4.8 Apêndice : . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1784.8.1 Convexidade estrita em EVN . . . . . . . . . . . . . . . . . . . . . . . . . . 1784.8.2 Referências específicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

5 Espaços de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

5.1 Topologização de espaços vetoriais com um produto interno . . . . . . . 1835.2 Exemplos de espaços vetoriais com produto interno . . . . . . . . . . . . . . 1885.3 Geometria de espaços com produto interno : Teoria de F. Riesz . . . . 1935.4 Geometria de Pitágoras em dimensão infinita : bases ortonormais

e representação de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2105.4.1 Bases ortonormais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2105.4.2 Bases de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

5.5 Apêndice I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2305.5.1 Teoria de Lax-Milgram : Extensão da Teoria de Riesz para

Funcionais Quadráticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2305.5.2 O problema variacional para funcionais quadráticos . . . . . . . 236

5.6 Apêndice II : Espaços funcionais de Hilbert-Sobolev . . . . . . . . . . . . . 2425.7 Apêndice III . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

5.7.1 Anotações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245

Page 5: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 5/371

Índice VII

6 Operadores Lineares em Espaços Normados . . . . . . . . . . . . . . . . . . . . . . 2476.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2476.2 Propriedades e definições básicas de operadores lineares . . . . . . . . . . 2496.3 Exemplos de operadores lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252

6.4 Transformações integrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2576.4.1 Transformação integral de Fourier . . . . . . . . . . . . . . . . . . . . . . 2576.4.2 Transformação integral de Laplace. . . . . . . . . . . . . . . . . . . . . . 2646.4.3 Transformação de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2656.4.4 Operadores integrais de Fourier e pseudodiferenciais . . . . . . 2656.4.5 Outros operadores (transformações) integrais . . . . . . . . . . . . . 265

6.5 Equações lineares do segundo tipo, ou, Perturbações lineares daidentidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2676.5.1 Séries de Neumann-Peano : A gênese da análise operacional 267

6.6 Teoremas de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2806.6.1 O Princípio da Limitação Uniforme (Ressonância) de

Banach–Steinhaus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2816.6.2 Teoremas de Banach para a inversão de operadores lineares . 285

6.6.3 Espectro e resolvente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2916.7 Modos de convergência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2946.8 Cálculo operacional elementar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299

6.8.1 Princípio das coordenadas de Hahn-Banach-Helly . . . . . . . . . 3046.9 Apêndice I - Resultados Topológicos . . . . . . . . . . . . . . . . . . . . . . . . . . 3076.10 Apêndice II - Definição alternativa de integral via Teorema de

Hahn-Banach-Helly . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3086.11 Referências. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309

7 Operadores Compactos : Teorias de Riesz-Fredholm eHilbert-Schmidt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3137.1 Aspectos gerais : Teoria de Riesz-Fredholm . . . . . . . . . . . . . . . . . . . . 3137.2 Exemplos de operadores compactos . . . . . . . . . . . . . . . . . . . . . . . . . . . 316

7.3 Perturbação compacta da identidade : Teorema de Riesz-Fredholm . 3177.3.1 Exemplos e aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322

7.4 Teoria espectral de operadores compactos autoadjuntos(Hilbert-Schmidt) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3227.4.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3227.4.2 Aspectos algébricos do espectro de um operador simétrico

e Princípio de Rayleigh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3257.4.3 Teorema Espectral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3267.4.4 Tópicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 330

8 Análise Não-Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3318.1 Introdução : Inversão, perturbação, pontos fixos, estabilidade . . . . . . 3318.2 Teoremas de ponto fixo para operadores compactos . . . . . . . . . . . . . . 332

8.3 Teoremas de Ponto Fixo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335

Page 6: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 6/371

VIII Índice

8.4 Aproximação por linearização local : O Cálculo Diferencial emEspaços Normados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3408.4.1 Os conceitos de derivada : Newton-Cauchy, Fréchét e

Gateaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340

8.4.2 Propriedades operacionais da derivada de Fréchét . . . . . . . . . 3478.4.3 Teoremas Fundamentais do Cálculo de Fréchet . . . . . . . . . . . 3538.4.4 Métodos de Newton-Kantorovich . . . . . . . . . . . . . . . . . . . . . . . 358

8.5 Os Teoremas da Função Inversa e da Função Implícita : APerturbação Diferencial da Identidade . . . . . . . . . . . . . . . . . . . . . . . . . 362

Page 7: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 7/371

1

Espaços Métricos

1.1 Espaços Métricos : A Origem dos Conceitos de Convergência

“What is a Number that Man may Know it, and what is a Man that Hemay know what a Number is ?”

(W. S. McCulloch e W. Pitts, sec. K. Pribram, 1995)

Os números naturais são aceitos no mundo civilizado moderno sem barreiraspsicológicas mais sérias, pelo menos até que os resultados da Teoria dos Númeroscomecem a nos espantar ! Esta familiaridade com o conceito de número natural éresultado de um longo processo civilizatório que tem a sua origem óbvia na ne-cessidade de contagem e de ordenação de objetos concretos e já foi detectada nascivilizações mais antigas e primitivas. Conceitos rudimentares de número natural,restritos apenas aos primeiros dígitos, são encontrados ainda hoje em certas tribosindígenas e, de certa forma, até mesmo em algumas espécies animais (C. Gallistel,The Concept of Number , MIT Press ; O. Neuberger, The Sciences in the Antiquity,Dover).

Por outro lado, a idéia do “conjunto total” naturais N, como um objeto em sié muito mais sutil, pois envolve a idéia de “infinito”, e ocorreu, de maneira in-cipiente mas sistemática, somente na Filosofia e na Matemática grega, há aproxi-madamente poucos 3000 anos atrás. O conceito de algoritmo recursivo, que é ogerme da idéia de “infinito”, traz em si o conceito de um processo “infindável” e já pode ser explicitamente encontrado nos trabalhos de Euclides (265 a.C. - 325a.C.), embora, certamente, ele tenha recebido influências de antigos Babilônicos eEgípcios. Este conceito foi amplamente expandido nos escritos do famoso matemá-tico persa/iraquiano Al-Kwarizmi (780 a.C. - 850 a.C.), de onde, a propósito, vemo termo “algoritmo” e também o termo “álgebra” (A. P. Ershov, ed., Algorithms in Modern Mathematics and Computer Science, Springer LNCS 122, 1981). De qual-quer forma, o estabelecimento da idéia de infinito “ potencial” como um processo

algorítmico, significou um longo salto intelectual para o conhecimento humano. Aintrodução desses conceitos como parte formal da própria Matemática, todavia, teveum longo período de germinação e somente se estabeleceu muito mais tarde, entre

Page 8: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 8/371

2 1 Espaços Métricos

meados do século XIX e início do século XX, tendo como seu principal protagonistao matemático italiano Giuseppe Peano (1858-1932) (M. Segre, Peano’s Axioms intheir Historical Context , ArchHistExactSci 48 (3/4) 1994, 202-336). Uma constru-ção algorítmico-indutiva e, portanto, “ potencial”, dos números naturais foi enfati-

zada por Peano, onde cada e todo elemento de N pode ser construído utilizando-seuma quantidade finita de etapas que envolvem apenas operações aritméticas efetua-das a partir da base binária 0, 1.

Uma vez de posse dos números naturais, os números inteiros (relativos) e osracionais (frações) são imediatamente obtidos por intermédio de simples conceitosalgébricos finitos (classes de equivalência) que não exigem nenhum salto intelectualcomparável ao anterior.

Entretanto, o conceito de número real traz intrinsecamente a necessidade deprocessos infinitos semelhantes àquele empregado para a construção do conjuntode números naturais : cada número real é “ potencialmente construtível” e exige umprocesso infinito para descrevê-lo totalmente. A representação decimal corriqueira éapenas uma maneira convencional e sistemática de representação dos números reais(com óbvias motivações e origens fisiológicas), mas não é a única ; qualquer seqüên-

cia racional equivalente à decimal (no sentido da “aglutinação” de Cauchy) tambémé uma forma “exata” de determiná-lo. Caracterizado desta maneira, um número realé representado por uma classe de equivalência de seqüências de Cauchy de núme-ros racionais, que é o ingrediente “ concreto” para construí-lo (H. Thurston, The Number System, Dover ; G. Birkhoff e S. McLane, Algebra Moderna, Vicen-Vives).Com o conceito de número real já esclarecido por este processo, surge naturalmenteo conceito de limite, como um processo infinito e generalizado de construção denúmeros reais que não se prende a formas rígidas de expansão ou a um determi-nado algoritmo, mas abre um enorme leque de possibilidades para representá-los, eé exatamente nesta flexibilidade que reside a força do Cálculo.

O desenvolvimento da Análise em geral, e da Análise Funcional especifica-mente, desde os meados do século XIX, está baseado (e enraizado) nos conceitose técnicas que foram introduzidos para o estudo dos números reais. Por esta razão,

é historica (e culturalmente) interessante indicar as pontes existentes entre a Aná-lise Real, no seu sentido mais básico e a Análise Funcional. Este não é o local paraapresentarmos uma exposição histórica do desenvolvimento destes conceitos, mas aleitora interessada nesta linha terá amplas referências para seguir adiante.

O conceito fundamental em todo este desenvolvimento é o de convergência (elimite) que é, na verdade, um processo construtivo de objetos matemáticos por inter-médio de um algoritmo infinito enumerável. Assim, os números reais são construi-dos (definidos) por seqüências de Cauchy (“aglutinantes”) de números racionais, eportanto, podem ser considerados como uma extensão natural destes.

Esta técnica de ampliação de um conjunto baseada no conceito de seqüênciasequivalentes de elementos do conjunto base (chamado Método de Completamentode Cauchy) é um instrumento fundamental da Matemática e será empregado em todoo desenvolvimento da Análise Funcional para a construção de inúmeros objetosmatemáticos, tão concretos, (ou tão abstratos, como queiram) quanto os númerosreais.

Page 9: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 9/371

1.1 Espaços Métricos : A Origem dos Conceitos de Convergência 3

Em diversos livros de Análise Real, é comum atalhar esta construção históricae sistemática, mas trabalhosa, fazendo-se uso de uma definição axiomatizada depropriedades sintéticas dos números reais. Um conjunto de axiomas comumenteutilizado (mas não o único) para caracterizar a estrutura do conjunto números reais

R, e que enfatiza o conceito de convergência de Cauchy, é o seguinte (J. Dieudonné,Foundations of Modern Analysis, Academic Press, 1960)

i) R é um Corpo comutativo (isto é, dispõe das operações de soma e produtocom as propriedades usuais e os elementos notáveis, 0 e 1),

ii) dotado de Ordem completa compatível com as operações de soma e produtopor número positivo,

iii) Arquimediano (dados x e y = 0, existe um n ∈N tal que nx ≥ y ; este axiomaintroduz o conjunto N no contexto) e

iv) Completo (toda seqüência de Cauchy é convergente).

Neste conjunto de axiomas, o conceito de distância entre dois números reais, de-finido neste caso em termos da ordem, é o ingrediente básico para a introdução doconceito de “convergência” que comparece no axioma 4. A generalização de am-bos os conceitos para estruturas matemáticas apropriadas resultará nos dois pilaresbásicos da Análise Funcional.

Para extrairmos apenas o conceito de distância (e, portanto, de convergência) se-paradamente da estrutura algébrica peculiar que caracteriza os números reais, (corpoordenado arquimediano), definiremos axiomaticamente um objeto matemático cha-mado Espaço Métrico, isto é, um conjunto onde há uma maneira de se medir a“distância” entre dois elementos quaisquer dele. Com isto, poderemos tratar espe-cificamente da Teoria de Convergência independentemente de outras estruturas queeventualmente possam ocorrer no referido conjunto. A definição de Espaço Métricoreune os dois ingredientes básicos da Análise Funcional ; um conceito de conver-gência e uma noção geométrica, esta última ainda em uma forma muito simples.

Este objeto matemático abstrato foi introduzido pelo famoso matemático francêsMaurice Fréchet (1878-1973) na sua tese de doutoramento, escrita sob orientação

de Henri Lebesgue (1875-1941), em 1906. Estes dois nomes aparecerão com umacerta freqüência durante este curso.

Definição 1.1 (Espaços Métricos).Um conjunto não vazio M e uma função d : M × M →R+ são chamados de Espaço Métrico, e denotados por ( M ,d ) , se :

i) d ( x, y) ≥ 0, ∀ x, y ∈ M (Positiva).ii) d ( x, y) = 0 ⇔ x = y (Positiva Definida, separação dos pontos).iii) d ( x, y) = d ( y, x),∀ x, y ∈ M (Simétrica).iv) d ( x, y) ≤ d ( x, z) + d ( z, y),∀ x, y, z ∈ M (Triangularidade).

Observação 1.2. i) Um Espaço Métrico é uma dupla (conjunto e distância) e amodificação de qualquer um dos dois ingredientes dará origem a um novoEspaço Métrico, o que aliás, acontecerá com muita freqüência. Até que nosacostumemos com esta idéia, iremos sempre explicitar a métrica junto com oconjunto quando isto não for óbvio. Entretanto, progressivamente, esta atitude

Page 10: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 10/371

4 1 Espaços Métricos

será reservada somente aos casos onde não estiver absolutamente claro do quese trata. Em muitas situações, a métrica a ser usada é tão óbvia do contextosubjacente, que, para evitar pedantismos, o espaço métrico será designado so-mente pelo conjunto de seus elementos.

ii) No estudo específico de Espaços Métricos, estamos nos abstendo de consi-derar quaisquer outras estruturas que os conjuntos bases por acaso tenham ;apenas a estrutura métrica de convergência é assumida. Isto nos garante umaenorme generalidade de tratamento, mas obviamente nosso interesse não ter-mina aí. Em próximos capítulos, veremos que os principais e mais importantesexemplos de Espaços Métricos dispoem ainda de uma estrutura algébrica na-tural de espaços vetoriais (tal como o Rn), ou de álgebras (tal como o R2 ≈C,números complexos consideração, permitem a obtenção de um número muitomaior de resultados. Neste capítulo, estaremos exclusivamente interessadosno estudo “puro” do conceito de convergência, independentemente de outrasconsiderações.

Considerando que a definição de espaço métrico visa abstrair a noção de conver-

gência do contexto dos números reais, é natural que se verifique imediatamente se Ré de fato um espaço métrico com a distância definida na forma usual. Como exercí-cio informal, faça esta verificação e inclua também os Rn, n > 1, com a distânciaeuclideana

d ( x, y) =

∑1≤k ≤n

| xk − yk |2 1

2

,

sem se esquecer de interpretar geometricamente cada um dos axiomas (a triangula-ridade neste último caso é resultado da importante desigualdade de Cauchy utilizadaem Geometria Analítica ou Álgebra Linear).

Assim, como umaconseqüência natural, definiremos agora o conceito de conver-gência em espaços métricos com base na função distância.

Definição 1.3 (Convergência em Espaços Métricos).i) Dizemos que uma seqüência ( xn)n∈N ⊂ M converge para um ponto x ∈ M se

limn→∞

d ( xn, x) = 0.

Neste caso, escrevemos limn→∞ xn = x, e também xn → x.ii) Dizemos que uma seqüência ( xn)n∈N ⊂ M é de Cauchy, se

limn,m→∞

d ( xm, xn) = 0.

Observação 1.4. Os limites de distâncias da definição de convergência se referem aseqüências de números reais e, portanto, são perfeitamente definidos no contexto doCálculo Clássico.

Exercício - Unicidade do Limite :

Page 11: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 11/371

1.1 Espaços Métricos : A Origem dos Conceitos de Convergência 5

1.1. Mostre que se o limite de uma seqüência existe, ele deve ser único.

O conceito de convergência é a razão final para a definição das estruturas de

espaços métricos. Portanto, como acabamos de ver pela definição (e isto se tornaráprogressivamente mais claro com os exemplos que surgirão), a convergência de umaseqüência só terá sentido se estiver estabelecido (explicita ou implicitamente) emque métrica ela se dá. Ou seja, a escolha da métrica determina quais seqüênciasserão convergentes, os seus limites, e quais não serão.

Por outro lado, um mesmo conceito de convergência pode ser descrito por di-versas estruturas métricas. Isto significa que podemos ter duas métricas numerica-mente diferentes em um mesmo conjunto mas que determinam as mesmas situaçõesde convergência. A possibilidade de descrever um mesmo processo de convergênciapor meio de múltiplas métricas é uma flexibilidade conceitual que será de grandeutilidade em diversas circunstâncias.

É interessante observar que a própria reta pode ser “metrificada” de várias ma-neiras distintas que, ainda assim, caracterizam as mesmas seqüências convergentes

(e respectivos limites) que aquelas determinadas pela métrica usual, d ( x, y) = | x− y|.Os exercícios abaixo ilustram esta possibilidade com exemplos que no futuro nosfarão apreciar a importância desta flexibilidade.

Exercícios - Variedade de Métricas :

1.2. Considere uma função real f :R+ →R+ tal que :

i) f ( x) ≥ 0, e f ( x) = 0 ⇐⇒ x = 0 ( positiva definida).

ii) f (a) ≤ f (a + b) ≤ f (a) + f (b), ∀a,b ∈ R+ (não decrescente e sub-aditiva).

Mostre que

a) f ( x) = C x1 + x

, C > 0,

b) f ( x) = ln(1 + x), ec) f ( x) =

√ x

satisfazem estas propriedades.

1.3. Mostre que

a) d ( x, y) = f (| x− y|) é uma métrica emR quando f é uma função como no exercí-cio 1.2.

b) se ( M , d ) for um espaço métrico e ϕ : S ←→ M uma função bijetora, então po-demos definir uma métrica d ϕ no conjunto S (que podemos dizer que é induzidapor ( M , d ) e ϕ ), da seguinte forma :

d ϕ ( x, y) = d (ϕ ( x),ϕ ( y)) .

Page 12: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 12/371

6 1 Espaços Métricos

Observe que a utilização da função f ( x) = C x1+ x nos leva a uma métrica que faz

da reta real um espaço métrico limitado, ou seja, todos os pontos estão a uma dis-tância finita da origem, o que, a princípio, é um contrasenso. Entretanto, lembre-sede que o papel da métrica não é descrever geometrias rígidas, mas convergências, e

estas são determinadas a pequenas distâncias, ou seja, a modificação apenas dos va-lores para “grandes” distâncias em uma métrica não afeta o processo de convergên-cia que se dá apenas “no frigir final dos ovos” ! Observe ainda que para x próximode zero, o gráfico das funções f ( x) do exercícios 1.2, a) e b) acima, se comportamcomo uma reta que passa pela origem, ou seja, como uma proporção. Nestes casos,há uma certa proporcionalidade local entre as taxas de convergência das duas mé-tricas e delas com a canônica. O mesmo não se dá entre a métrica do exercício 1.2c)e as outras

Definição 1.5 (Equivalência (Uniforme) entre Métricas). Duas métricas d 1 e d 2 são ditas (uniformemente) equivalentes quando existiremduas constantes positivas α > 0 e β > 0 tais que α d 1( x, y) ≤ d 2( x, y) ≤ β d 1( x, y) ,

∀ x, y (ou, que α ≤ d 2( x, y)d 1( x, y) ≤ β para quaisquer x = y).

Na literatura matemática diz-se, neste caso, que as duas métricas são “equiva-lentes”. Este termo na sua forma simples e usual não é muito feliz porque se opapel das métricas é caracterizar convergências, duas métricas deveriam ser “equi-valentes” se cumprissem o seus objetivos da mesma forma, ou seja, se caracteri-zassem as mesmas convergências e respectivos limites. Certamente, se forem uni- formemente equivalentes, elas determinarão as mesmas convergências (Exercício1.4). Entretanto, a exigência de que α e β sejam constantes e as desigualdades umrequisito muito forte para isso, não há necessidade de tanto! Para entender esta ob-servação, basta analisar a relação entre a métrica canônica (usual) d ( x, y) e a métricad 0( x, y) = f (| x− y|), para f (ξ ) = ξ1+ξ : elas discriminam exatamente as mesmas se-qüências convergentes, mas não são uniformemente equivalentes (Exercício 1.4b)).Em particular, para que caracterizem as mesmas seqüências convergentes, bastaria

que a desigualdade α d 1( x, y) ≤ d 2( x, y) ≤ β d 1( x, y) fosse válida apenas localmente,ou seja, para “pequenas distâncias”, embora nem mesmo isso de fato seja necessá-rio, como se poderá ver no Exercício 1.5.

Um conceito mais apropriado no que diz respeito estritamente à convergência,sem preocupações métricas, é o da equivalência topológica :

Definição 1.6 (Equivalência Topológica entre Métricas). Diremos que duas métricas são topologicamente equivalentes se qualquer seqüên-cia que convirja pelo critério de uma delas, também convirja pelo critério da outra,e para o mesmo limite.

Exercícios :

1.4. Mostre quea) se duas métricas são uniformemente equivalentes, então os seus Espaços Métri-cos ou são simultaneamente limitados, ou não o são !

Page 13: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 13/371

1.1 Espaços Métricos : A Origem dos Conceitos de Convergência 7

b) se duas métricas são uniformemente equivalentes, então elas são topologica-mente equivalentes.

1.5. a) Mostre que a métrica usual da reta real é topologicamente equivalente àmétrica d r ( x, y) = | x−

y|, mas que elas não são métricas uniformemente equi-

valentes. Sugestão : Observe que√ | x|

| x| → ∞ quando x → 0, e√

| x|| x| → 0 quando x → ∞.

b) Um exemplo histórico, e geometricamente importante, das vantagens prove-nientes de uma multiplicidade de metrificações, é fornecido pelo Exercício1.3b), intermédio da projeção estereográfica de Riemann, que identifica a es-fera unitária (menos seu polo norte) e o plano R2. Moste que nesta metrificaçãohá seqüências de Cauchy no plano que não convergem e determine quais sãoelas!

Mais tarde veremos que o completamento do plano nesta métrica nos levará àintrodução do ponto ∞. Para uma discussão de notável clareza sobre a projeção este-

reográfica no plano complexo consulte o primeiro capítulo do clássico : L. Ahlfors,Complex Analysis, McGraw-Hill, 1957. É interessante observar neste exemplo deforte apelo geométrico, como as duas métricas caracterizam o mesmo conjunto deseqüências convergentes, mas também que não pode haver equivalência (uniforme)entre as duas métricas uma vez que as taxas de convergência se tornam progressi-vamente mais díspares conforme o ponto limite (no plano) esteja mais distante daorigem. Medite sobre isto enquanto fizer um esboço geométrico da situação.

A esta altura passaremos a caracterizar algumas dentre as propriedades funda-mentais de convergência que são inerentes à reta real e defini-las como conceitos(“desejáveis”, talvez, mas nem sempre alcançáveis) para os Espaços Métricos emgeral.

Definição 1.7 (Princípio de Cauchy).

Um espaço métrico ( M ,d ) é dito completo se todas as seqüências de Cauchy em M têm limite em M (atente para o final da frase, “em M ”.)

Este conceito poderia ser metaforicamente descrito da seguinte maneira : “Umespaço métrico completo não tem buracos, isto é, toda seqüência aglutinanteconverge necessariamente para um determinado ponto”. É claro que esta é uma daspropriedades mais básicas da reta real, tanto que ela comparece como um dos axio-mas no sistema acima apresentado. Observe, todavia, que esta não é uma proprie-dade dos números racionais com a métrica usual, embora eles satisfaçam a todos osoutros axiomas (a propósito, isto mostra que este axioma é independente dos ou-tros, ou seja, que apresenta informação que não pode ser deduzida do restante dosaxiomas).

O Princípio de Cauchy para a reta real foi formulado pelo prolífico matemático

francês Augustin-Louis Cauchy (1789-1857) em suas famosas notas para um cursode Cálculo ( !) que ele lecionava aos estudantes de engenharia na famosa école Po-lytechnique de Paris (“Cours d ’Analyse”). Isto, até que seus alunos se rebelaram

Page 14: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 14/371

8 1 Espaços Métricos

contra a sua “didática” ! Estes livros, que tiveram ampla circulação mundial (eu-ropéia), tornando-se um marco da literatura matemática e estabeleceram os funda-mentos rigorosos da análise moderna (Judith V. Grabiner, The Origins of Cauchy’s Rigorous Calculus, Dover 2005).

É interessante observar que os analistas, principalmente, dos séculos XVIII eXIX, encaravam os números reais “experimentalmente”, ou, “fenomenologicamen-te”, tal como os Físicos encaram seus objetos de estudo, baseando-se em “ Princí- pios”, ou “leis”. Para eles, a reta real era tida como um objeto físico a ser tes-tada, cujas propriedades seriam regulamentadas por “ leis” descobertas a partir detestes e generalização. O método axiomático, que pode eliminar completamente estaconfusão, já havia sido introduzido por Euclides há séculos ( !), mas somente voltoua ser efetivamente incorporado à Matemática muito mais tarde e, em grande partepor obra de David Hilbert. Dentre muitas outras “leis”, ou “Princípios”, “descober-tos” pelos matemáticos (místicos e filósofos) do século XIX, o seguinte Princípiode Bolzano tem um significado especial para os nossos propósitos : “Qualquer se-qüência limitada de números reais tem pelo menos um ponto de acumulação ”. Este“ princípio” foi formulado inicialmente pelo padre e matemático tcheco Bernhard J.

P. Bolzano (1781-1848) em um livro publicado em Praga em 1817, onde ele tambémse antecipa a A. L. Cauchy por uns 4 anos, ao estabelecer pela primeira vez a defi-nição moderna de continuidade (M.Kline, ... ?). A demonstração deste “ Princípio”em textos clássicos de Análise Real parte dos axiomas acima elencados e utilizainicialmente uma estratégia algorítmica de bipartição chamada método de “encan-toamento do leão”, terminando com a aplicação do (axioma) Princípio de Cauchypara o golpe final de misericórdia (veja o Apêndice (seção 1.6) e, principalmente R.Courant, Cálculo Diferencial e Integral, vol. I , Editora Globo, Porto Alegre, 1965).É importante observar que, se os números reais são axiomatizados pelo sistemaapresentado acima (que escolhe o princípio de Cauchy como axioma), o princípiode Bolzano será um TEOREMA. Entretanto, se o escolhermos como um axioma,(no caso, chamado de Princípio de Bolzano-Weierstrass), em lugar do Princípio deCauchy, poderemos demonstrar este último como TEOREMA. Isto mostra que, no

contexto específico dos números reais, eles são conceitos equivalentes.Weierstrass, que desenvolveu a análise real na sua forma mais rigorosa ao seu

tempo, teve o seu nome associado a um outro “princípio” (”Todo conjunto superior-mente limitado na reta admite supremo”), diferente, mas facilmente demonstrávelcomo equivalente ao de Bolzano no contexto da análise real. Entretanto, esta formu-lação de Weierstrass faz uso do conceito peculiar de ordem dos números reais, o quea torna inadequada para generalizações para espaços métricos gerais, ao contrarioda formulação de Bolzano que utiliza apenas o conceito de distância. Esta é a razãoporque este último é utilizado nas abstrações enquanto que a superior autoridadematemática de Weierstrass é a razão porque seu nome está forçosamente associadoa ambos.

Um ponto de acumulação não é necessariamente um limite da seqüência, masé sempre possivel extrair dela uma subseqüência que converge para este ponto.(Mostre isto como exercício de recordação). Observe que uma seqüência pode tervários (até infinitos) pontos de acumulação.

Page 15: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 15/371

1.1 Espaços Métricos : A Origem dos Conceitos de Convergência 9

Retornaremos então à formulação original do Princípio de Bolzano-Weierstrassque será mais interessante para os nossos futuros propósitos, já que utiliza ape-nas o conceito de proximidade e não de ordem : “ Qualquer seqüência de númerosreais contida em um conjunto limitado e fechado tem ponto de acumulação neste

conjunto”. Como as conseqüências do Princípio de Bolzano-Weierstrass em Aná-lise Clássica são extremamente importantes, o nosso ponto de vista será no sentidode enfatizar os subconjuntos que satisfazem esta propriedade, atribuindo-lhes umnome sonoro e notável. Na reta real eles são simplesmente os fechados e limitados.O Princípio de Bolzano-Weierstrass poderia ser metaforicamente enunciado como :“Conjuntos limitados e fechados na reta não têm espaço suficiente para isolarmostodos seus elementos de um conjunto infinito”, razão porque o termo “compacto” é justificado para nomeá-los.

Assim, em um Espaço Métrico geral M , os seus subconjuntos para os quais valeo Princípio de Bolzano-Weierstrass serão denominados de “compactos” e cumpremum papel de extrema importância no estudo de processos de convergência.

Definição 1.8 (Conjuntos compactos, Princípio de Bolzano-Weierstrass).

Dizemos que um conjunto K ⊂ M é compacto se todas as seqüências xnn∈ N ⊂ K tem pelo menos um ponto de acumulação no conjunto K. Em particular, dizemosque um espaço métrico é compacto se todas as seqüência de seus elementos têm pelo menos um ponto de acumulação, neste espaço, claro.

Os conceitos de COMPLETUDE (Cauchy) e de COMPACIDADE (Bolzano-Weierstrass) são os dois pilares fundamentais do Cálculo Clássico (onde estão pre-sentes por serem inerentes à estrutura métrica natural dos números reais) e, a partirdos quais, demonstram-se os principais resultados do Cálculo. Já no contexto abs-trato de espaços métricos, a sua validade pode ou não ocorrer, mas os casos posi-tivos, isto é, Espaços Completos e/ou Compactos, desempenharão um papel funda-mental no desenvolvimento da Análise Funcional.

A seguir apresentaremos alguns exemplos de espaços métricos que, pela suadiversidade, mostrarão a versatilidade desta estrutura.

Exercícios - Exemplos de Espaços Métricos :

Mostre que, de fato, os exemplos abaixo são o que se diz deles (Espaços Métricos)começando por verificar em cada caso que a definição é “boa”, ou seja , que adistância entre dois elementos quaisquer do conjunto em questão pode de fato sercalculada.

1.6. M = Rn, d 1( x, y) = ∑1≤k ≤n | xk − yk |, denominada métrica d 1, ou métrica dotaxista.

Observação 1.9. Observe que o conjunto Rn pode ser interpretado, em particu-lar, como um conjunto de funções de valores reais e definidas no conjunto finito

1, 2,.....n

.

1.7. M = Rn, d α 1( x, y) = ∑1≤k ≤nω k | xk − yk |, onde (ω k ) é uma n−upla de númerosreais positivos, chamada ponderação. Medite sobre o seu significado geométrico.

Page 16: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 16/371

10 1 Espaços Métricos

1.8. M = Rn, d 2( x, y) =∑1≤k ≤n | xk − yk |2

12 , (métrica d 2 usual, dita Euclideana).

1.9. M = Rn, d p( x, y) =

∑1≤k ≤n | xk − yk | p

1 p , (métrica d p, onde p ≥ 1).

1.10. M = Rn, d ∞( x, y) = max1≤k ≤n| xk − yk |. Mostre o motivo pelo qual é razoáveldenominar esta métrica de d ∞ comparando-a com as d p anteriores.

1.11. M = Rn, d ∞( x, y) = max1≤k ≤nω k | xk − yk |, ω k > 0.

1.12. M = C 0 ([0,1],Rn) = conjunto das funções contínuas definidas em [0,1] comvalores em Rn, d ∞( f ,g) = max x∈[0,1]|| f ( x) −g( x)||.Observação 1.10. A notação d ∞ para os dois exemplos distintos acima têm sua razãode ser (medite sobre isto!), e não devem ser motivos de confusão, uma vez que sereferem a diferentes conjuntos. O mesmo vale para os exemplos abaixo.

1.13. M = C 0 ([0,1],Rn) = conjunto das funções contínuas definidas em [0,1] comvalores em Rn, d 1( f , g) = [0,1]

|| f ( x)

−g( x)

||dx.

1.14. M = C 0 ([0,1],Rn) = conjunto das funções contínuas definidas em [0,1] comvalores em Rn, d 1ω ( f , g) =

[0,1] || f ( x)−g( x)||ω ( x) dx, ondeω é uma função contí-

nua positiva definida em [0, 1], isto é, ω ( x) > 0,∀ x ∈ [0,1], chamada ponderação, oufunção de peso.

1.15. M = P N (C) = conjunto dos polinômios de coeficientes complexos de grau≤ N , d ( p, q) = ∑0≤k ≤ N | p( xk )−q( xk )| , onde x0 < x1 < ... < x N ∈R estão fixos

1.16. M = C k ([0, 1],Rn) = conjunto das funções definidas e com derivadas contí-nuas até pelo menos a ordem k (k ≥ 1) em [0, 1],

d k ,∞( f , g) = ∑0≤ j≤k

d ∞( f ( j), g( j)) = ∑0≤ j≤k

max[0,1]|| f ( j)( x) −g( j)( x)||.

1.17. M = C k ([0, 1],Rn) = conjunto das funções definidas e com derivadas contí-nuas até pelo menos a ordem k (k ≥ 1) em [0, 1],

d k ,1( f , g) = ∑0≤ j≤k

[0,1]

|| f ( j)( x) −g( j)( x)||dx.

1.18. M = C k ([0, 1],Rn) = conjunto das funções definidas e com derivadas contí-nuas até pelo menos a ordem k (k ≥ 1) em [0, 1],

d k ,2( f , g) = ∑0

≤ j

≤k

[0,1]

|| f ( j)( x) −g( j)( x)||2dx

12

.

Page 17: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 17/371

1.1 Espaços Métricos : A Origem dos Conceitos de Convergência 11

1.19. M = C 0ω ([0,∞],R) = conjunto das funções contínuas definidas em [0,∞] comvalores em R cuja integral de Riemann imprópria

[0,∞] | f ( x)|e− xdx é finita,

d 1( f , g) = [0,∞] | f ( x)

−g( x)

|e− xdx, ω ( x) = e− x.

Se f λ ( x) = xλ , λ ∈ R+, mostre que f ∈ M e calcule d ω ( f 0, f 2).

Observação 1.11. Vários exemplos acima podem ser reconsiderados substituindo-se R por C= Conjunto dos Números Complexos.

1.20. M = S 1(C) = conjunto das funções z : N→ C, i.e., seqüências de númeroscomplexos z = ( zn), que são absolutamente somáveis :∑1≤k | zk | < ∞,

d ( x, y) = ∑1≤k

| xk − yk |.

1.21. M = S 1ω (C) = conjunto das funções z : N → Cn, i.e., seqüências de ve-

tores complexos z = ( zk ), que são absolutamente ω -somáveis : ∑1≤k ω ( zk ) < ∞,d ω ( x, y) =∑1≤k ω ( zk ), onde ω é uma função tal como as definidas pelos Exercí-cios 1.2a), 1.2b), 1.2c) e 1.3.

1.22. M = S 2(C) = conjunto das funções z : N→ C, i.e., seqüências de númeroscomplexos z = ( zn), que são quadrado somáveis, isto é, ∑1≤k | zk |2 < ∞, d ( x, y) =∑1≤k | xk − yk |2

12 .

1.23. M = S B(C) = conjunto das funções z : N→ C limitadas, d ( x, y) = ∑1≤k 2−k

| xk − yk |.1.24. M = B( A,Rn) = conjunto das funções limitadas definidas em um conjunto nãovazio A com valores em Rn, d ∞( f , g) = maxa∈ A | f (a)− g(a) |.Observação 1.12. Observe que dizer : “ f e g estão próximas segundo a métrica d ∞”é equivalente a dizer que estão uniformemente próximas, ou seja, que os valores|| f (a) −g(a) || são simultaneamente pequenos para todos os a ∈ A.

1.25. Mostre que no espaço(do exercício 1.22) M = S 2(C),com d ( x, y) =∑1≤k | xk − yk |2

12 ,

um conjunto limitado e fechado (como a bola unitária fechada) não necessariamenteé compacto, ao contrário do que ocorre em Rn, pois a seqüência ek 1≤k (ondeek j) = δ k j

não admite subseqüência com limite. (δ k j = 0 se k = j e δ kk = 1,

∀k , j ∈N, é o famoso delta de Kronecker !). Ora, isto significa que em espaços dedimensão infinita, como neste caso, “há muito espaço para o leão se esconder !”.

Page 18: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 18/371

12 1 Espaços Métricos

1.2 Linguagem e Conceitos Básicos de Espaços Métricos

sec. Jacques Monod : “Em ciência há aqueles que dão valor à idéiase aqueles que dão valor à forma e muita luta ocorre entre eles, enquanto

vivos. Sinto muito pelos últimos, porque apesar de seu enorme esforço,somente os primeiros serão lembrados após um futuro próximo”.

sec. V. Braitenberg : “Focalize-se no ‘software’, isto é, nas idéias, utilizeo ‘hardware’, a forma, lembrando-se sempre que este passa e se vai, apenaso primeiro permanece”.

Enunciaremos abaixo algumas definições em Espaços Métricos que já devemser conhecidas das leitoras cada uma tomará mais ou menos tempo para se familia-rizar com a linguagem dependendo de sua experiência anterior. De qualquer forma,uma boa familiaridade com os conceitos e definições abaixo não poderá ser adiada já que usaremos os mesmos intensiva e continuamente e sem maiores explicaçõesem tudo que se segue. Por outro lado, é importante e necessário alertar às leitoras

que a linguagem e o formalismo matemático são apenas um meio e não um fimem si mesmos, e que seu conhecimento não traz substância matemática, emboraseja indispensável para adquirí-la. Este alerta se justifica pelo frequente equívocoem se dedicar um excessivo esforço e tempo nas firulas de linguagem matemática,isto é, no formalismo, em detrimento das idéias que são, afinal, a sua substância“concreta". Nas definições a seguir, ( M ,d ) é um espaço métrico.

- Uma Bola Aberta de raio r e centro em x é o conjunto denotado por B( x,r ) edefinido naturalmente por B( x,r ) = y ∈ M : d ( x, y) < r .

- Uma Bola Fechada de raio r e centro em x é o conjunto denotado por B( x, r ) edefinido naturalmente por B( x,r ) = y ∈ M : d ( x, y) ≤ r .

- Um subconjunto C de M é dito limitado se existir uma bola B( x,r ), tal que C ⊂

B( x,r ).- O conjunto dos pontos de aderência de um conjunto C ⊂ M é denotado por C ,chamado de fecho de C , e definido por C = x ∈ M : para todo r > 0, existe umelemento de C em B( x,r ). Observe que, mesmo se isolados, os próprios elementosde C são aderentes a ele, por esta definição.

- A fronteira de um conjunto A, que se denota por ∂ A, é definida como ∂ A = x ∈ M : ∀r > 0, B( x,r )∩ A = / 0, e B( x, r ) ∩ Ac = / 0.

- Dizemos que ξ é um ponto de acumulação de um conjunto C se para todo r > 0,existe um elemento y = ξ de C em B(ξ , r ), ou seja, se existe um número infinito depontos de C em B(ξ ,r ) (verifique).

- Um ponto ξ ∈ M é dito ponto de acumulação de uma sequencia ( xk ) ⊂ M se

para toda bola B(ξ ,r ), existe um número infinito de índices k cujos valores xk da se-quencia estão nesta bola, xk ∈ B(ξ ,r ). Observe a diferença simples, mas sutil, entre

Page 19: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 19/371

1.2 Linguagem e Conceitos Básicos de Espaços Métricos 13

os conceitos de ponto de aderência e de acumulação e entre pontos de acumulaçãode conjuntos e de sequencias.

- Um conjunto F é dito fechado se contem todos os seus pontos de aderência, istoé, se F = F .

- Um conjunto A é dito aberto se para todo x ∈ A, existe uma bola B( x, r ) ⊂ A.

Medite (e faça esboços figurativos) sobre as interpretações geométricas destesconceitos, o que lhe esclarecerá completamente a motivação do formalismo.

Exercícios - Linguagem e Conceitos Básicos

Mostre que :

1.26. Um conjunto F é fechado se e somente se contem todos os seus pontos deacumulação.

1.27. Uma bola aberta é um conjunto aberto e uma bola fechada é um conjuntofechado ( !).

1.28. O complementar de um conjunto fechado é aberto, isto é, se F for fechado,então F c = x; x /∈ F é aberto, e que o complementar de um conjunto aberto éfechado.

1.29. Todo ponto de aderênciaξ de um conjuntoC pode ser aproximado como limitede uma sequência de pontos de C , isto é, existe uma seqüência ( xk ) em C , tal qued ( xk ,ξ ) → 0.

1.30. Se K for um Espaço Métrico Compacto, então toda seqüência ( xn) ⊂ K admiteuma subseqüência convergente em K , isto é, existe uma subseqüência ( xn p ) e umelemento x ∈ K , tal que

xn p → x para p → ∞.

(Observe que, de acordo como o conceito de subseqüência, n p deve ser crescentecom p e n p →∞ quando p → ∞).

- Um conjunto A ⊂ M é dito denso em outro conjunto B ⊂ M , se B ⊂ A, ou seja,se B está no fecho de A, ou ainda, se todos os pontos de B podem ser aproximados por pontos de A. Em particular, um conjunto C ⊂ M é dito denso no espaço métrico M , se todos os pontos de M podem ser aproximados por pontos de C . Um exemploclaro disto é o conjunto dos números racionais, que é denso na reta real.

- Um espaço métrico é dito separável se existe um conjunto enumerável densonele. A reta real e os Rn são separáveis, por conta dos números racionais, que sãoenumeráveis, de acordo com Georg Cantor. A vasta maioria dos espaços que serãotratados neste curso será de espaços separáveis, uma propriedade, em geral, herdada

dos números reais, e indispensável para a definição algorítmica de diversos proces-sos. Uma notável exceção é o espaço (não-separável) de Bohr (Harald Bohr) dasfunções quase-periódicas, a ser apresentado oportunamente.

Page 20: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 20/371

14 1 Espaços Métricos

A noção de continuidade tem um papel fundamental na análise real clássica e aforma mais intuitiva de caracterizá-la em um curso inicial de Cálculo certamente se-ria tomar o injustamente “apagado” Teorema de Rolle (ou do “Valor Intermediário")como sua definição (“Se uma função f : R→ R for contínua, então para quaisquer

a ≤ b e y0 intermediário entre os valores da função, por exemplo, f (a) ≤ y0 ≤ f (b)(ou f (b) ≤ y0 ≤ f (a)), existe x0 intermediário, a ≤ x0 ≤ b, tal que f ( x0) = y0”).Esta definição não escandalizaria nem o menos intuitivo ou desavisado dos alu-

nos, ao contrário dos “ε ’s e δ ’s” de Cauchy, que não raro causam danos psicológi-cos irreparáveis, dos quais mesmo matemáticos maduros não conseguem se livrar!Infelizmente a caracterização de Rolle é fortemente dependente do conceito de or-dem dos números reais e, portanto, impossível de ser generalizada até mesmo parafunções de duas variáveis. Por outro lado, não há dúvidas que a caracterização de“continuidade" de Cauchy é expressa em uma forma conveniente para a generaliza-ção em situações em que a ordem dos números reais não está disponível. Mas, naverdade, a definição de Cauchy não traduz o conceito intuitivo de continuidade tãobem quanto Rolle, mas sim o conceito de “estabilidade". Como este termo (“estabi-lidade") não tinha ainda uso corrente na matemática dos séculos XVIII-XIX, pois,

somente se tornou “vulgar" depois da Mecanique Celeste de Poincaré (c. 1900),e a caracterização de Cauchy implicava na caracterização de Rolle, a “ patente dotermo" acabou ficando com o próprio Cauchy. Entretanto, observe que o conceitode “continuidade de Cauchy" é mais forte, ou seja, mais restritivo do que o de Rolle.Basta analisar a seguinte função Rolle-contínua mas que é Cauchy-descontínua : f ( x) = sen 1

x , x = 0, f (0) = 0 (verifique).Definiremos abaixo o conceito de continuidade de três maneiras equivalentes

mas distintas quanto aos seus pontos de vista. Iniciaremos na forma seqüêncial queé a mais apropriada sob o ponto de vista construtivo, e algorítmico, passando emseguida para a forma métrica, segundo Cauchy, que enfatiza a ideia de “estabili-dade" e, finalmente, apresentaremos a definição “topologicamente correta", que fazuso unicamente do conceito de conjunto aberto e independe de métricas. Convida-mos às leitoras que demonstrem esta equivalência como exercício.

Definição 1.13 (Continuidade - Definição Seqüêncial).

Uma função f entre dois espaços métricos (M 1,d 1) e (M 2, d 2) , f : M 1 → M 2 , é ditacontínua no ponto x ∈ M 1 se para toda seqüência xk → x, temos f ( xk ) → f ( x).Uma função f : M 1 → M 2 é dita (simplesmente) contínua, ou contínua em M 1 , se for contínua em todos os pontos de M 1.

Definição 1.14 (Continuidade - Definição Métrica de Cauchy, “ Estabilidade”).

Uma função f entre dois espaços métricos (M 1,d 1) e (M 2, d 2) , f : M 1 → M 2 , é ditacontínua no ponto x ∈ M 1 se ∀ε > 0 , ∃δ > 0 , tal que f ( B( x,δ )) ⊂ B( f ( x),ε ). Uma função f : M 1 → M 2 é dita (simplesmente) contínua, ou contínua em M 1 , se for contínua em todos os pontos de M 1.

Definição 1.15 (Continuidade - Definição Topologicamente Correta).

Page 21: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 21/371

1.2 Linguagem e Conceitos Básicos de Espaços Métricos 15

Uma função f : M 1 → M 2 é dita (simplesmente) contínua, ou contínua em M 1 ,se dado qualquer conjunto aberto U ⊂ M 2 , a sua imagem inversa pela função f , f −1(U ) = x ∈ M 1; f ( x) ∈ U , é aberta em M 1.

Exercícios

1.31. Mostre que as definições acima são equivalentes e interprete o conceito de“estabilidade" ou de “sensitividade" expressa na formulação de Cauchy.

1.32. Mostre que a função ϕ : M → R+, definida por ϕ ( x) = d ( x0, x), para um x0

fixo qualquer, é uma função contínua.

1.33. Mostre que todo conjunto compacto é limitado. Mostre que a implicação in-versa não é válida fazendo uso de um (contra) exemplo.

1.34. Mostre que todo conjunto compacto é fechado. Mostre que a implicação in-versa não é válida fazendo uso de um (contra) exemplo.

1.35. Mostre que todo espaço métrico compacto é completo, mas que a implicaçãoinversa não é válida fazendo uso de um (contra) exemplo.

1.36. Mostre que um subconjunto fechado de um conjunto compacto também écompacto.

Na definição seqüêncial de continuidade, não há qualquer menção sobre a ve-locidade de aproximação dos valores funcionais para o seu limite ( f ( xk ) → f ( x0)),em comparação com a aproximação dos valores da variável ( xk → x0). Esta relaçãopode variar muito dependendo do ponto x0 em questão. Veja por exemplo o casoda função f : R+ → R, f ( x) = 1

x , cujos valores f ( x) se aproximam “rapidamente"de valores f ( x0) = 1

x0

, para pontos x0 ≈ 0, enquanto apresentam uma progressiva“lerdeza" na aproximação quando x0 ≈∞. Obviamente, tratando-se da aproximaçãode funções contínuas para seus valores, esta questão está imediatamente conectada à“variabilidade" da função nas imediações do ponto limite, e, se houver, ao valor desua derivada. O estudo quantitativo e funcional da “velocidade de aproximação" defunções para seus limites (finitos ou infinitos) é o tema central da chamada AnáliseAssintótica (N. de Bruijn, Asymptotic Analysis, Dover ; R. Courant, “Cálculo"), quetem uma importância central no estudo do comportamento de modelos matemáticos,e em Matemática, em geral. Este assunto será tratado com exemplos mais adiante.

Entretanto, no momento estaremos interessados em distinguir qualitativamenteaquelas situações em que esta “velocidade de aproximação" não tenha discrepân-cias extremadas ao longo do espaço, ou seja, que apresente uma uniformidade nestesentido. O conceito de continuidade uniforme será apresentado na definição a se-

guir por intermé dio de uma linguagem mais "topológica", que, neste caso, é maisconveniente.

Page 22: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 22/371

16 1 Espaços Métricos

Definição 1.16 (Continuidade Uniforme).Uma função f : M 1 → M 2 é dita uniformemente contínua em M 1 , se ∀ε > 0 , ∃δ ε >0 , tal que f ( B( x,δ ε )) ⊂ B( f ( x),ε ) , ∀ x ∈ M 1.

Se a caracterização seqüencial de continuidade é dada pelo critério de transfor-mar seqüências convergentes em seqüências convergentes, a caracterização seqüen-cial de continuidade uniforme é, parcialmente, dada pelo seguinte :

Teorema 1.17 (Caracterização seqüêncial de continuidade uniforme).Se a função f : M 1 → M 2 for uniformemente contínua, então ela leva seqüências deCauchy em M 1 em seqüências de Cauchy em M 2.

Exercícios :

1.37. Demonstre o Teorema acima e mostre que não vale a volta. (Se M 1 for com-pleto, as seqüencias de Cauchy e as convergentes são as mesmas e, neste caso, bastaque f seja contínua para que leve seqüências de Cauchy em seqüências de Cauchy !).

1.38. Mostre que a função (Operação Funcional)

Φ : M = C 0 ([0,1],R) , d ∞

→ S =

f ∈ C 1 ([0, 1],R) ; f (0) = 0

,d ∞

definida pela integral

Φ ( f )( x) =

x 0

f (s)ds

é contínua, uniformemente contínua, tem uma inversa Φ −1 : S → M que, todavia,não é contínua. Observação : Este exercício é fundamental e deve ser estudado comdetalhes.

Observações : As caracterizações topologicamente corretas, cuja linguagem se ba-seia somente nas propriedades dos conjuntos abertos, ampliam a generalização e aabstração do conceito de convergência para um contexto que prescinde completa-mente da existência de uma métrica. Esta abordagem, embora tenha significado im-portante no desenvolvimento moderno da Matemática, o seu impacto nas aplicaçõesse faz quase que somente por intermédio da linguagem, em vários casos, de fato, amais conveniente, mas muito pouco pelos seus resultados específicos.

A estrutura de espaço métrico permite que tratemos do conceito de convergên-cia de uma maneira muito próxima à utilizada no estudo dos números reais ; isto é,basicamente por meio de seqüências, que são processos enumeráveis e algoritmizá-veis. Entretanto, observou-se que seria possível estender o conceito de convergên-

cia e continuidade para contextos em que o processo de convergencia poderia serrealizado de maneira eventualmente não-enumerável, algo um pouco fora de umamentalidade algoritmico-construtiva da Matemática Aplicada e Construtiva.

Page 23: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 23/371

1.2 Linguagem e Conceitos Básicos de Espaços Métricos 17

Estas estruturas mais gerais (introduzidas também por Fréchet) são denomina-das de Topológicas e fazem uso apenas do conceito de conjunto aberto. Não nosdeteremos em definí-las aqui em todas as situações, mas em oportunidades conve-nientes apresentaremos a versão topológica apropriada. Esta atitude tem por finali-

dade mostrar uma ponte entre a duas abordagens e permitir que as técnicas da Topo-logia fiquem também disponíveis para o caso em que se mostrarem úteis. Entretanto,procuraremos sempre que razoável optar por abordagens seqüênciais, enumeráveise algorítmicas.

É importante observar que em espaços topológicos, o conceito de convergên-cia é caracterizado por intermédio de conjuntos abertos genéricos e o sistema deverificação de convergência pode constar de uma família não enumerável destes,ao contrário dos espaços métricos em que basta utilizar a “ base ” enumerável B( x, 1

n ), n ∈N para cada ponto x. Portanto, definições seqüênciais em espaçostopológicos podem descrever conceitos distintos daqueles expressos por meio deuma família não-numerável de abertos. Por exemplo, o conceito de ponto aderentede um conjunto em um espaço topológico, se definido seqüencialmente pode serdiferente do conceito definido por meio da base de abertos. O mesmo acontece com

o conceito de compacidade. Mas estas distinções não serão importantes para o quese segue uma vez que trataremos apenas de espaços métricos.

Uma excelente referência para o estudo da Topologia, naquilo que interessa àAnálise, escrito por um dos principais matemáticos do século XX, e também umgrande professor (um acoplamento mais comum do que o sugerido por figuras me-nos importantes), é a referência

A. N. Kolmogorov e S. V. Fomin, Elementos de la Teoria de Funciones ydel Analisis Funcional, ed. MIR, 1972.

(Há uma tradução em inglês com o título “ Introduction to Real Analysis” em ediçãobrochura e barata pela editora Dover).

O desenvolvimento inicial da Análise Funcional via conceitos topológicos devemuito à escola matemática polonesa, grande parte dela eliminada durante a II Guerra

Mundial, a começar por S. Banach, e a sua disseminação pós II Guerra à escolaBourbakista, que exerceu muita influência no Brasil. Uma abordagem nitidamentetopológica é encontrada por exemplo no texto de Brézis, excelente dentro de seuspróprios termos :

H. Brézis, Analyse Fonctionelle , Masson, 1987.

Surpreendentemente, o mesmo acontece em um famoso e também excelente textoque se diz escrito especificamente para os físicos,

M. Reed e B. Simon, Methods of Mathematical Physics, vol. I - Functional Analysis, Academic Press, 1972,

por razões que eles lá devem saber quais são.

Page 24: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 24/371

18 1 Espaços Métricos

1.3 Teoremas Fundamentais Clássicos no Contexto de EspaçosMétricos

A força do conceito de compacidade será inicialmente verificada através dos

próximos resultados. Sem dúvida, um dos principais destes é o Teorema de Weiers-trass sobre pontos de máximo, que teve um extraordinário significado e um curiosopapel na história da Análise Funcional.

A existência de pontos de máximo e mínimo para uma função contínua foi co-nectada, logo no princípio do desenvolvimento da Análise Real, ao conceito deconjunto fechado e limitado para o domínio da função ; o teorema clássico deBolzano-Weierstrass. Por outro lado, o princípio variacional de Dirichlet (na ver-dade formulado por seu professor G. F. B. Riemann), que determinava a soluçãodo fundamental problema de fronteira para a equação de Laplace, se baseava naexistencia de um ponto de mínimo para uma função (operação funcional ) definidaem um conjunto de funções. A impossibilidade geral de assumir a existencia destemínimo fora do contexto real foi o tema de “violentos” artigos de ninguem maisdo que o próprio K. M. Weierstrass, uma figura autoritária que desestimulava o de-

bate naqueles de corações mais fracos. Com isto, o princípio de Dirichlet somentefoi levado a sério nesta época por aqueles que se encontravam fora da influênciade Weierstrass, essecialmente os matemáticos aplicados, físicos e engenheiros, quecontinuaram a usá-lo sem maiores ansiedades. A reabilitação do princípio de Diri-chlet como o método fundamental para o estudo teórico e a resolu ção numérica deequações diferenciais parciais muito mais gerais do que a de Laplace, foi um dosgrandes feitos de David Hillbert, e um dos principais pretextos para a invenção e odesenvolvimento da moderna Análise Funcional.

É interessante observar que K. M. Weierstrass (1815-1897) foi professor emBerlim e não fazia parte da importante genealogia matemática alemã de Göttingenque se inicia com ninguem menos do que Carl F. Gauss, e passa por Georg Riemann,Felix Klein, David Hilbert, Hermann Weyl e Richard Courant, Eberhard Schmidtdentre muitos outros notáveis.

O conhecimento da história deste período revolucionário da Matemática, e es-pecialmente da Análise, é indispensável para um entendimento lúcido das interco-nexões, motivações e finalidades das teorias desenvolvidas a partir daí. Para isto, asreferencias abaixo são recomendadas como um bom começo :

M. Kline, Mathematical Thought from Ancient to Modern Times, OxfordU.P., 1970.

C. Reid, Hilbert , Springer-Verlag.

C. Reid, Richard Courant , Springer-Verlag.

J. Dieudonné, A History of Functional Analysis , North-Holland, 1980.

Nos enunciados abaixo, iniciaremos a reinterpretação de resultados “clássicos"

na linguagem de espaços métricos, que é a abordagem apropriada e característica daAnálise Funcional. O primeiro deles indica claramente a importância do conceitode compacidade, que foi introduzido de olho neste resultado que será crucial na

Page 25: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 25/371

1.3 Teoremas Fundamentais Clássicos no Contexto de Espaços Métricos 19

demonstração de existência de soluções de problemas chamados variacionais, ouseja, aqueles cujas soluções são caracterizadas como mínimos de uma função.

Teorema 1.18 (Uma função contínua leva compactos em compactos (Weiers-trass)).Se f : M 1 → M 2 for uma função contínua entre dois espaços métricos ( M 1,d 1) e( M 2, d 2) , e K ⊂ M 1 , um conjunto compacto , então, a imagem de K por f , f (K ) ,será um conjunto compacto em M 2.

Prova. Seja yn = f ( xn) uma seqüência de pontos em f (K ). Como K é com-pacto, existe uma subseqüência xn p e um elemento x ∈ K , tal que xn p → x (ex.1.30). Mas então, como f é contínua, a correspondente subseqüência yn p é tal que yn p = f ( xn p ) → f ( x) = y, onde obviamente y ∈ f (K ).

Teorema 1.19 (Teorema de Weierstrass - Realização de máximo para funçõescontínuas reais em compactos).

Se f : M → R for uma função contínua entre um espaço métrico ( M , d ) e a retareal R , e K ⊂ M for um conjunto compacto, então, existirão pontos xm e x M em K,tais que f ( xm) ≤ f ( x) ≤ f ( x M ) , para todo x ∈ K , isto é, existirão pontos xm e x M ,que realizam de fato, respectivamente, o mínimo e o máximo da função f em K.

Prova. Uma demonstração auto-suficiente, que faz uso do “método do leão" do Cál-culo, é a seguinte. Como f (K ) é limitado, tome β um número tal que y ≤ β , paratodo y ∈ f (K ). Construa agora recursivamente a seguinte sequencia de números( faça um esboço geométrico) : y0 , qualquer em f (K ) e α 0 o ponto intermediárioentre y0 e β . Se f (K ) ∩ [α 0,β ] = / 0, tome y1 = y0, caso contrário escolha um ele-mento y1 ∈ f (K ) ∩ [α 0,β ] = / 0. Prossiga recursivamente construindo yn+1 a partirde yn desta maneira.Observe agora que a sequencia yn é não decrescente, isto é, yn+1

≥ yn e que não há nenhum elemento de f (K ) maior do que yn + 2−n(β

− y0).

Como f (K ) é compacto, existe uma subsequencia yn p que converge para um ponto y ∈ f (K ). Convença-se agora de que este é o valor máximo de f . Para o mínimo, oargumento é análogo, ou usa-se a função − f no argumento acima.

Este teorema pode ser generalizado para funções cujos valores não são numé-ricos ; neste caso, a imagem exibe as características generalizadas de um conjuntolimitado e fechado da reta, isto é, a compacidade.

Há situações de algum interesse em que a existência de pontos de máximo podeser garantida (separadamente da existencia de mínimo), se observarmos que na de-monstração do Teorema de Weierstrass, mantida a compacidade, basta uma condi-ção de semi-continuidade superior (respectivamente, inferioruma mesma conclusão.Este conceito é antigo e também foi introduzido por Maurice Fréchet e René Baire

em 1899 (v. Apêndice).O enunciado do Teorema de Weierstrass, na verdade, é uma caracterização decompacidade, ou seja :

Page 26: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 26/371

20 1 Espaços Métricos

Teorema 1.20 (Caracterização de Compacidade de um conjunto pelas suasFunções).Se um espaço métrico ( M ,d ) é tal que todas as funções contínuas f : M → R , f ∈ C 0( M ,R) , atingem máximo em M, então M é necessariamente compacto.

Prova. Suponha, por absurdo, que exista uma seqüência xk ⊂ M que não admitaum ponto de acumulação. De partida podemos considerar que estes elementos sãotodos distintos pois, se infinitos índices registrassem um mesmo elemento, entãohaveria, obviamente, um ponto de acumulação da seqüência. Não havendo ponto deacumulação, tomemos para cada elemento xn da seqüência, uma bola B( xn,r n) quenão contenha nenhum outro elemento da seqüência, exceto o seu próprio centro,e consideremos a função : ϕ n : M → R, cujos valores são definidos da seguintemaneira (faça um esboço geométrico) :

ϕ n ( x) = n r n

3 − d ( x, xn)

, para x ∈ B( xn, r n3 ), e

ϕ n( x) = 0 para d ( x, xn) r n3 .

Observe, ou verifique, que estas funções são contínuas e que duas delas não são

coicidentemente diferentes de zero em nenhum ponto. Portanto, podemos definir afunção

ϕ n : M →R, ϕ ( x) = ∑k 1ϕ n( x),

que é então contínua e obviamente ilimitada, o que contradiz a hipótese.

Este resultado é importante no sentido de nos garantir que todas as afirmaçõessobre compactos podem, de uma forma ou de outra, ser traduzidas em termos dasfunções reais contínuas definidas sobre ele. A substituição de propriedades topoló-gicas de conjuntos por determinadas famílias de funções caracterizadas por elas, éuma modificação radical de ponto de vista e tipifica uma estratégia sutil da Matemá-

tica com inúmeras aplicações teóricas.O próximo teorema é conhecido pelo nome de Teorema de Heine-Borel, de-vido a Heinrich Heine (1821-1881) que o utilizou inicialmente como um “ princípio fenomenológico" no contexto dos números reais, e tem importantes aplicações nocontexto mais geral. O nome do (mais importante) matemático francês Émile Borel(...-...) possivelmente foi agregado ao de Heine, por uma questão de autoridade ; asaber !

Teorema 1.21 (Teorema de Heine - Continuidade em Compato ≡ ContinuidadeUniforme).Se f : K → M 2 for uma função contínua entre dois espaços métricos (K ,d 1) e( M 2, d 2) , sendo K compacto , então, f será uniformemente contínua.

Prova. Considere a função definida da seguinte forma :ω ( x) = supr : f ( B( x,r )) ⊂ B ( f ( x),ε ) para um ε > 0 fixo e x ∈ K , e medite sobre o interesse em analisá-la comrespeito à continuidade de f . Convença-se de que, sendo f contínua, então ω está

Page 27: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 27/371

1.3 Teoremas Fundamentais Clássicos no Contexto de Espaços Métricos 21

bem definida em K e é contínua. Então, de acordo com o Teorema de Weierstrass,ω atinge mínimo em K . Seja m0 este mínimo que, sendo atingido em um ponto,digamos xm , deverá ser positivo, m0 = ω ( xm) > 0. Ora, mas então f ( B( x, 1

2 m0)) ⊂ B( f ( x),ε ) para todos os x ∈ K , o que exprime exatamente a tese do Teorema de

Heine-Borel.

A demonstração mais tradicional deste teorema seria por argmento de absurdo,mas consideramos que a forma apresentada é mais útil e mais esclarecedora.

O conceito de aproximação uniforme já foi abordado na definição do espaçométrico definido pelo conjunto de funções limitadas e com a métrica uniforme :( B( A, M ), d ∞). Em um contexto geral podemos também falar de convergência uni-forme.

Definição 1.22 (Convergência uniforme). Dizemos que uma sequencia de funções ( f n) entre dois espaços métricos M 1 e M 2 , f n : M 1 → M 2 , converge uniformemente para uma função ϕ : M 1 → M 2 , se para

qualquer ε > 0 , existe um N ε tal que d ( f n( x),ϕ ( x)) < ε para todo n > N ε e todo x ∈ M 1.

A convergência uniforme é importante na construção de funções contínuas pormeio de processos infinitos e um dos teoremas fundamentais do Cálculo de umavariável real afirma que “ se uma função for limite uniforme de uma sequência de funções contínuas, então esta função limite será contínua”. Este resultado pode serliteralmente transferido (assim como sua demonstração) para o contexto de espaçosmétricos :

Teorema 1.23 (O limite uniforme de funções contínuas é uma função contínua).Se a seqüência de funções f n contínuas entre dois espaços métricos M 1 e M 2 , f n : M 1 → M 2 converge uniformemente para uma outra função ϕ : M 1 → M 2 , então esta função limite será contínua.

Prova. Repita argumentos do Cálculo, que são semelhantes àqueles empregados nademonstração do Teorema abaixo.

O limite apenas ponto a ponto, pode construir coisas horrorosas a partir de fun-ções muito bem comportadas (v. Apêndice).

Um caso, não tão feio, é o limite pontual da seqüência f n( x) = xn, quandoconsideradas no intervalo fechado [0,1]. O conceito e alguns resultados clássicosde convergência uniforme podem ser reinterpretadas de maneira conveniente nocontexto de espaços métricos de funções. É o que faremos em seguida.

Teorema 1.24 (Completude de espaços de funções com métrica uniforme).

O espaço métrico F = B( A, M ) = “conjunto das funções limitadas definidas em umconjunto não vazio A qualquer , com valores no espaço métrico ( M , d )”, com amétrica d ∞( f , g) = maxa∈Ad ( f (a), g(a)) , será completo se M for completo.

Page 28: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 28/371

22 1 Espaços Métricos

Prova. Seja (ϕ n) uma seqüência de Cauchy em (F ,d ∞). Então, para cada x ∈ A, asequencia em M dada por ϕ n( x) é de Cauchy pois,

d ( ϕ n( x),ϕ m( x) ) ≤ d ∞(ϕ n,ϕ m) = maxa∈Ad (ϕ n(a),ϕ m(a)).

Como M é completo, concluimos que para cada b ∈ A, a sequência ϕ n(b) convergeem M , e com muita razão definiremos uma função ϕ : A → M , ponto a ponto, comoϕ ( x) = limϕ n( x) ; a candidata natural para ser o limite da sequencia (ϕ n) ⊂ B( A, M ).Devemos mostrar que ϕ ∈ B( A, M ) e, depois, que, de fato, ϕ n → ϕ na métricad ∞, isto é, que lim d ∞(ϕ n,ϕ ) = 0. Mostraremos ambos por meio de uma trian-gularização. Seja ε > 0 e, com base na condição de Cauchy, tomemos nε talque para n,m > nε tenhamos d ∞(ϕ n,ϕ m) < ε . Então, para qualquer x ∈ A temos,d (ϕ ( x),ϕ n( x)) ≤ d (ϕ ( x),ϕ m( x) ) +d (ϕ m( x),ϕ n( x)) ≤ d ( ϕ ( x),ϕ m( x)) +ε . Comoesta desigualdade vale para todos m,n > nε , podemos levá-la ao limite com m → ∞

e fixando n > nε , de onde tiramos que d ( ϕ ( x),ϕ n( x)) ≤ ε , o que é válido para qual-quer x ∈ A e n > nε . Isto significa que ϕ é limitada e é limite de ϕ n na métrica d ∞.

O Teorema de Cálculo acima mencionado, sobre limite uniforme de funçõescontínuas, pode ser enunciado neste contexto como :

Teorema 1.25. Se ( M 1, d 1) e ( M 2, d 2) forem espaços métricos, então C 0 B( M 1, M 2) = funções f : M 1 → M 2 contínuas e limitadas , é um subconjunto fechado do espaçométrico ( B( M 1, M 2), d ∞).

Prova. Suponha então que ϕ n ∈ C 0 B( M 1, M 2) e que ϕ n → ϕ , onde ϕ ∈ B( M 1, M 2).Seja agora x0 ∈ M 1 e ε > 0. Existe então um nε tal que se n ≥ nε , d ∞(ϕ n,ϕ ) < ε .Como ϕ nε é contínua, existe uma bola, digamos B( x0,δ ), tal que ϕ nε ( B( x0,δ )) ⊂ B(ϕ nε ( x0),ε ). Então, para todo x ∈ B( x0,δ ), temos

d (ϕ n( x),ϕ n( x0)) < d (ϕ n( x),ϕ nε ( x))+d (ϕ nε ( x),ϕ nε ( x0))+ d (ϕ nε ( x0),ϕ n( x)) ≤ 3ε .

Fazendo agora n → ∞ nesta desigualdade, obtemos no limite d (ϕ ( x),ϕ ( x0)) < 3ε .Portanto, ϕ ( B( x0,δ )) ⊂ B(ϕ ( x0), 3ε ), o que demonstra o teorema.

Se o espaço métrico de saída for compacto, então, de acordo com o teorema deWeierstrass, todas as funções contínuas são limitadas. O teorema abaixo exprimeeste fato em uma forma apropriada para a Análise Funcional, onde ele desempenhaum papel central.

Teorema 1.26 (Funções contínuas em espaços compactos com métrica uni-forme).Se (K ,d ) for um espaço métrico compacto e ( M ,d 0) , outro espaço métrico, então oconjunto C 0(K , M ) = funções contínuas f : K → M é um subconjunto fechado de( B(K , M ),d ∞).

Exercício :

Page 29: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 29/371

1.3 Teoremas Fundamentais Clássicos no Contexto de Espaços Métricos 23

1.39. Demonstre o terorema acima.

A constatação de que uma seqüência de funções contínuas converge uniforme-

mente para uma outra função é, portanto, um fato notável que em muitas situaçõespode acarretar resultados interessantes. Um importante teorema da análise real queestabelece um critério suficiente para que a convergência pontual seja também uni-forme, é devido ao matemático italiano Ulisse Dini (1845-1918) que, no contextode espaços métricos toma a seguinte forma :

Teorema 1.27 (Teorema de Dini - Monotonicidade pontual em um compactoproduz uniformidade). .Seja K um espaço métrico compacto e ϕ n ∈ C 0(K ,R) uma seqüência de funçõescontínuas de valores reais, tais que :

a) ϕ n+1( x) ≤ ϕ n( x) , para todos os x ∈ K e todos os n, isto é, a seqüência é pontualmente não crescente ;

b) limn→∞ϕ n( x) = 0 , para todos os x ∈ K.Então o limite é uniforme, ou, em outras palavras, ϕ

n → 0 no espaço métricoC 0(K ,R), d ∞

Prova. Seja ε > 0 e consideremos os conjuntos E n = x ∈ K ;ϕ n( x) ≥ ε . Gos-taríamos de provar que para algum n este conjunto será vazio pois E n+1 ⊂ E n.Suponha que não, e selecione para cada n natural um elemento xn ∈ E n, e em se-guida (pela compacidade de K ) tome uma subseqüência xn p → ξ ∈ K . Mas, comolimn→∞ϕ n(ξ ) = 0, existe um nε tal que 0 ≤ ϕ nε (ξ ) < 1

2ε . Por outro lado, sendoϕ nε contínua, existe uma bola B(ξ ,δ ) tal que | ϕ nε (ξ ) −ϕ n( x) |< 1

2ε para qualquer x ∈ B(ξ ,δ ). Assim, por triangulação, teremos que para todo x ∈ B(ξ ,δ ), ϕ nε ( x) < ε ,e pela monotonicidade, ϕ n( x) ≤ ϕ nε ( x) < ε para todos n ≥ nε . Ora, mas isto é im-possível uma vez que ξ é um ponto limite de xnP para os quais, ϕ n p ( xnP ) ≥ ε .

Exercícios :

1.40. Demonstre o teorema de Dini utilizando a negação formal de que a conver-gencia é uniforme. (isto é, usando os quantificadores ∀ e ∃).

1.41. Dê (contra) exemplos de que faltando apenas uma de cada vez das seguintescondições, o teorema é falso :

i) compacidade,ii) monotonicidade,iii) continuidade das funções.

Uma função contínua que terá uma grande importância no estudo de aproxima-

ção de funções por um subconjunto (em espaços métricos de funções) é a definidapela distância de um ponto a um subconjunto.

Page 30: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 30/371

24 1 Espaços Métricos

Definição 1.28. A distância de um ponto x em um espaço métrico M a um subcon- junto A de M é denotada e definida por :

d ( x, A) = inf d ( x, a);a ∈ A.

Analogamente se define distância entre conjuntos :

d ( A, B) = inf d (a, b); a ∈ A,b ∈ B.

Exercícios :

1.42. Mostre que a função distância de pontos a um conjunto fixo é contínua.

1.43. Mostre que se K for compacto, então para cada x0 ∈ M existe pelo menosum ξ ∈ K , tal que d ( x0,K ) = d ( x0,ξ ). Diz-se neste caso que ξ atinge ou realiza adistância ou então que ξ é uma (não necessariamente a única) melhor aproximaçãode x0 por meio de K .

1.44. Considere o espaço métrico ( B([0,1],R), d ∞) e o subconjunto das funçõespolinomiais de grau ≤ 2. Mostre que este conjunto é fechado mas não compacto.Mesmo assim, obtenha um polinomio de segundo grau que melhor aproxima a fun-ção f ( x) = e x no espaço métrico C 1([0,1],R), d 1 e no espaço ( B([0, 1],R),d ∞).

Um outro teorema que, apesar de abstrato neste contexto, será importante noestudo da dependência de soluções de equações gerais com respeito aos dados, édevido ao notável matemático russo Andrei Nikolaievich Tikhonov (1906-1993),famoso por ter iniciado várias teorias e métodos importantes da Matemática e suasaplicações.

Um dos problemas mais universais e fundamentais da Matemática são as equa-ções, que genericamente podem ser expressas na forma funcional da seguinte ma-neira : f ( x) = a, onde a variável x ∈ M é a incognita e a ∈ A é o parâmetro, ouum “dado" do problema (J.Kazdan, Solving equations, Am.Math.Monthly, ...). Sesempre houver solução e ela for única para todo a em um conjunto A, podemos

escrevê-la na forma de uma função x(a), x : A → M . Uma vez garantida a existênciae unicidade da solução, a próxima questão natural que surge se refere à estabilidade(“robustês", ou “sensitividade") da solução com respeito a perturbações do parâ-metro (ou “dado") a do problema, ou seja, sobre a continuidade da função inversa, x(a).

Equações funcionais, onde a incognita é uma função, são particularmente impor-tantes. Por exemplo, considere um típico problema de valores iniciais para equaçõesdiferenciais ordinárias lineares da forma : dx

dt = Ax(t ), x(0) = a, onde A é uma ma-triz real n × n e a incognita é uma função infinitamente diferenciável x : R→ Rn,ou seja, x ∈ M = C ∞(R,Rn). Podemos obviamente reformular este problema eescrevê-lo como uma equação funcional da seguinte maneira : Φ ( x) = a, onde

Φ ( x) = x(t ) −t

0 Ax(s)ds é uma função Φ : M → M e a ∈ A ⊂ M , o subespaço das

funções constantes.O teorema a seguir, embora não aplicável diretamente ao problema acima, nosdá uma simples mas importante resposta neste sentido.

Page 31: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 31/371

1.3 Teoremas Fundamentais Clássicos no Contexto de Espaços Métricos 25

Teorema 1.29 (Teorema de Tikhonov I - Estabilidade de soluções únicas paraequações em um compacto).Se f : K → M for uma função contínua e bijetora entre dois espaços métricos,sendo o domínio K compacto , então, f −1 , isto é, a sua inversa, será contínua em

M.Prova. Considere uma sequencia y N → y em M , e a sua pré-imagem x N = f −1( y N )em K . Devemos então provar que x N converge para x = f −1( y), ou seja, que ∀ε > 0,∃ N ε tal que, ∀ N > N ε , d ( x N , x) < ε . Suponhamos que isto não seja verdade, istoé, que : ∃ε 0 > 0 tal que ∀ N , ∃P N > N tal que d ( xP N , x) ≥ ε 0. Dado então o tal ε 0,construiremos recursivamente a seguinte subsequência : para o inteiro N = 1, toma-mos um inteiro P1 > 1 para o qual d ( xP1 , x) ≥ ε 0. Obtemos xP R+1 tomando um inteiroP R+1 > P R tal que d ( xP R+1 , x) ≥ ε 0. Esta nova sequencia ( xP R ) (no índice R), admiteuma subseqüência (em J ), xP R J

que converge para um ponto x ∈ K . Ora, mas a fun-ção f é contínua em x e, portanto, f ( xP R J

) → f ( x). Como f ( xP R J ) = yP R J

→ y, temos y = f ( x), e concluímos, pela injetividade de f , que x = x. Mas isto é impossível umavez que a subsequência xP R+1 foi construída fora da bola B( x,ε 0) e não poderia se

aproximar de x.

Observação 1.30. i) M será também compacto.ii) A demonstração topológica deste teorema é considerada imediata (pelos topólo-gos !). Como curiosidade : Seja U um aberto de K . Seu complementar K −U sendofechado, é um compacto em K . Como f é contínua, f (K −U ) é compacto e, por-tanto, fechado. Por conseqüência, o seu complementar é aberto, e, pela bijetividadede f , deve ser exatamente f (U ) = imagem inversa de U pela f −1. É claro que o“imediato” aqui depende da familiariade com os argumentos topológicos, mas esteé um bom exemplo da eventual conveniência da linguagem topológica. conjuntista.iii) Este teorema não chama tanta a atenção no caso de funções reais onde a compa-cidade é prescindível. Mostre que se f : I

→ J for contínua e bijetiva, então a inversa

será contínua, onde I é um intervalo da reta real R. No caso Rn, a coisa é bem maiscomplicada !

Os exercícios seguintes apontam para as limitações (contra-indicações) do usodeste teorema.

Exercício :

1.45. Considere

a) O Espaço Métrico M 1 = [0, 1) com a métrica usual dos reais, M 2 = S 1 = z ∈C; | z| = 1 =“Círculo unitário no plano complexo com a métrica usual" e a fun-ção ϕ : [0,1) → S 1, ϕ (t ) = exp(2π it ). Mostre que ϕ é contínua, bijetora, mas asua inversa não é contínua. Isto mostra que a compacidade do primeiro espaço noTeorema de Tikhonov é essencial ; e o espaço de chegada é compacto !

b) O Espaço Métrico M 1 = C 0[0,1], com a métrica d ∞, M 2 = g ∈ C 1[0,1], taisque g(0) = 0, também com a métrica d ∞, e a função será Φ : M 1 → M 2, onde

Page 32: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 32/371

26 1 Espaços Métricos

Φ ( f )(s) =s

0 f (ξ )d ξ . Mostre que Φ é contínua, bijetora mas a sua inversa, a deri-

vada, é notoriamente descontínua na métrica uniforme (sup).

Estes (contra) exemplos não estão aqui só para escândalo, eles são importantese voltarão em outras oportunidades e sob vários disfarces! Entenda-os bem. O pri-meiro exemplo tem uma “deficiência" de ordem geométrica em suas condições, en-quanto que o segundo tem uma “deficiência" de ordem analítica !

Em particular, concluímos que este espaço métrico,

C 0[0,1], d ∞

, não é com-pacto.

As funções bijetoras e bicontínuas são importantes pois, como vimos, nos ga-rantem que suas equações têm solução, única e, principalmente, estável com relaçãoa perturbações. Uma função desta classe de certa forma identifica (como em um es-pelho) os processos de convergência de dois espaços métricos e, com isso adquiri-mos a possibilidade de estudar um processo pela sua imagem no outro, talvez maisconveniente. Em Matemática (Bourbakista) este tipo de identificação é denominado

de morfismo.Definição 1.31 (Homemomorfismo Topológico).Uma função f bijetora e bicontínua entre dois espaços métricos (isto é, f e f −1

existem e são contínuas) é chamada de homeomorfismo topológico. Este tipo de função identifica não somente os conjuntos mas, também a Topologia, ou seja, iden-tifica as duas noções de convergência.

O teorema de Tikhonov mostra como pode ocorrer esta identificação. Aliás, nocontexto deste Teorema, mais do que as seqüências convergentes são identificadas,mas também as seqüências de Cauchy (porquê ?). Estas questões ocorrem com muitafreqüência quando os espaços métricos diferem apenas da métrica, ou seja, quandoo conjunto “ base”é o mesmo.

E, como perguntar pode constranger mas não ofende, a função identidade (tu

quoque, Brute ?) pode ser descontínua ? Veja o exercício abaixo.O que estamos querendo saber é simplesmente se as seqüências que convergem

e os seus limites são os mesmos com as duas métricas !

Exercícios :

1.46. Mostre que a função identidade entre os espaços métricos

C 1[0, 1],d ∞

eC 1[0, 1],d 1

é contínua em uma direção e descontínua na outra ( !).

1.47. Mostre, por outro lado e utilizando o Teorema de Tikhonov que, se a funçãoidentidade for contínua, e um dos dois espaços métricos, ( M ,δ 1) ou ( M ,δ 2), forcompacto, então as duas métricas serão topologicamente equivalentes.

Alguns espaços dispõem de uma estrutura apropriada para o uso de argumentosdeste tipo ainda que não sejam compactos, bastando para isso que sejam localmente

Page 33: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 33/371

1.4 Construção Abstrata de Espaços Métricos 27

compactos, isto é, que cada ponto tenha uma bola centrada compacta. OsRn são ostípicos localmente compactos porque qualquer bola fechada em Rn é um conjuntofechado e limitado, e portanto, compacto. Tanto, que parece ser uma propriedadeuniversal ; mas não é ! Aliás :

Exercício :

1.48. Mostre que a bola unitária fechada do espaço

C 1[0, 1],d ∞

não é compacta,usando o Teorema de Tikhonov e os exercícios anteriores.

1.4 Construção Abstrata de Espaços Métricos

Nos itens acima já apresentamos de passagem algumas maneiras de construirnovos espaços métricos. Alguns serão repetidos aqui.

O principal método a ser apresentado e que se constitui no argumento básico

para construção teórica de vários e importantes espaços métricos em Análise Fun-cional, será descrito pelo Teorema de Completamento que, na verdade é uma abstra-ção do método de construção dos números reais. Todas as construções, de algumamaneira, são realizadas por meio de conjuntos de funções, razão pela qual abor-damos logo no início destas notas alguns exemplos mais simples e gerais destes.Mais a frente, em outros capítulos, ampliaremos consideravelmente a variedade deexemplos de espaços funcionais.

1.4.1 Espaços Quocientes

Comecemos com um exemplosimples, mas representativo. Considere o conjuntodas funções escada definidas em [0,1] e com valores reais : E ([0,1],R) = f :[0,1]

→ R, tal que existe uma seqüência finita xi

∈[0,1], 0 = x1 < x2 < ... < xn = 1,

e f é constante em cada subintervalo ( xi, xi+1).Se estamos interessados no cálculo das integrais usuais destas funções, observa-

mos que os valores que elas tomam nas extremidades dos subintervalos não influemno resultado. Assim, para este propósito, duas destas funções que difiram apenasem um número finito de pontos de extremidades, podem ser consideradas comorepresentantes do mesmo objeto. Vejamos como tratar esta questão.

Observe que se definimos em E ([0,1],R) uma “medida de dessemelhança”∆1( f , g) =

[0,1] | f ( x) − g( x) | dx, é fácil concluir que ela satisfaz todas as condi-

ções para ser uma métrica, exceto a positividade definida, isto é, existem funçõesdistintas f = g tais que ∆1( f ,g) = 0.

Definição 1.32 (Pseudométrica).Se S for um conjunto e ∆ : S ×S → S uma função positiva, simétrica e que satisfaz a

condição de triangularização (isto é, todas as propriedades de uma métrica, exceto, possivelmente, a positividade definida) então ∆ é chamada de pseudo-métrica emS.

Page 34: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 34/371

28 1 Espaços Métricos

Lançaremos mão agora de um recurso abstrato muito comum em Matemáticaque é definir uma relação de equivalencia entre membros de um conjunto, isto é,uma relaçao que satisfaz às condições : reflexividade, transitividade e simetria : f ≈ g se ∆1( f ,g) = 0 (v. Birkhoff-McLane).

Exercício :

1.49. Verifique as afirmações acima, ou seja, que ∆1 é uma pseudo-métrica e que arelação f ≈ g se ∆1( f ,g) = 0 é, de fato, de equivalência.

Em seguida, consideramos o chamado Conjunto Quociente (E / ≈) formadopelas classes de equivalência. Cada elemento de (E / ≈) será um “ aglomerado” defunções escada que diferem umas das outras apenas pelos valores em um númerofinito de pontos.

Se g ∈ E , então chamamos de g ∈ (E / ≈) de classe (conjunto, aglutinado) detodas as funções escada f tais que ∆1( f , g) = 0, ou seja as funções equivalentes a g.Observe que uma classe de equivalência pode ser representada por qualquer um deseus membros, e esta é uma boa representação uma vez que cada elemento pertenceà apenas uma classe de equivalência.

Passamos então a considerar de agora em diante apenas o conjunto quociente(E / ≈) de classes de equivalência. Este tipo de argumento pode ser empregadoem qualquer conjunto em que esteja definida uma relação de equivalência mas, nomomento, estamos interessados especificamente apenas quando este tipo de equiva-lência é gerado por uma pseudo-métrica.

Deixemos agora o exemplo específico das funções escada e tratemos de um casoabstrato em que temos um conjunto S e uma pseudo-métrica.

Denotaremos o conjunto quociente por S /∆ = M . Neste conjunto quocientedefiniremos o que esperamos ser uma métrica para medir distâncias entre classes deequivalência, e, o mais natural seria da seguinte maneira : d (α ,β ) = ∆ ( f ,g), onde f ∈α e g ∈β . É claro que pode haver fortes suspeitas de que a definição acima, dada

em termos de dois representantes das respectivas classes de equivalência, talvezdependa desta escolha, o que a tornaria inconsistente. Mas isto será resolvido nopróximo Teorema-exercício.

Exercício - A definição de métrica em Conjunto Quociente é Consistente :

1.50. Mostre que se ∆ for uma pseudo-métrica em M , então no conjunto quociente M = ( M /∆) é possível definir uma métrica da seguinte forma : d (α ,β ) = ∆ ( f ,g),onde f ∈ α ∈ M e g ∈ β ∈ M . Observação : Comece por mostrar que a definição éconsistente.

Este procedimento será utilizado para a construção inicial do teorema de com-pletamento o qual passaremos a descrever como um exemplo de aplicação destatécnica. Sugiro fortemente que a(o) leitora(o) mantenha sempre em mente o métodode construção e representação decimal dos números reais como um modelo mentale “ concreto” dos argumentos abstratos que se seguirão.

Page 35: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 35/371

1.4 Construção Abstrata de Espaços Métricos 29

Considere um espaço métrico ( M , d ) e, neste, o conjunto de todas as seqüênciasde Cauchy, (não necessariamente convergentes, se M não for completo), denotadopor :

S [ M ] = x : N

→ M , tal que x(k ) = xk é uma seqüência de Cauchy,

isto é, limm,n→∞ d ( xn, xm) = 0.

Medite sobre o significado geométrico da seguinte afirmação :

Teorema 1.33 (Espaço Métrico das Sequências de Cauchy).Podemos definir uma pseudométrica em S [ M ] da seguinte forma :∆ ( x, y) = limk →∞ d ( xk , yk ) ,e definir uma métrica d correspondente no espaço quociente S /∆ = S [ M ].

Prova. Devemos verificar inicialmente que a definição de ∆ é realizável. Para isto,mostraremos que existe o limite da sequência de números reais r k = d ( xk , yk ), bas-tando para tanto mostrar que é uma seqüência de Cauchy de números reais. Usandoa triangularização apropriadamente,

r k − r n = d ( xk , yk )− d ( xn, yn)≤ d ( xk , xn) + d ( xn, yn) + d ( yn, yk ) −d ( xn, yn)= d ( xk , xn) + d ( yn, yk )

e da mesma forma r n − r k ≤ d ( xk , xn) +d ( yn, yk ). Portanto, | r n − r k |≤ d ( xk , xn) +d ( yn, yk ) de onde concluímos o desejado já que o lado direito tem limite nulo paran, k → ∞. O restante da demonstração será deixada como exercício.

Podemos agora usar o conceito de espaço quociente e definir inicialmente oconjunto de classes de equivalência de seqüências de Cauchy, S /∆ = S [ M ]. Observeque a cada g ∈ S [ M ] temos associada uma classe de seqüências de Cauchy g, e f ∈ g,se limd ( f (k ), g(k )) = 0.

Observe ainda que se, para cada z ∈ M tomarmos a seqüência de Cauchy(constante) xk = z, a sua classe de equivalência será formada exatamente por aque-las que convergem para z. Isto significa que os elementos originais de M podem serinterpretados como cidadãos de M e, mais, caso o espaço original seja completo, oque teremos com M será meramente o próprio M pois cada seqüência de Cauchyestará na classe de equivalência de seu limite.

Não sendo o espaço M completo, todavia, haverá classes de equivalência cujasseqüências de Cauchy não convergem. Portanto, podemos pensar em S [ M ] comouma extensão (“completamento" será o termo correto) do espaço M . Este procedi-mento é uma ferramenta básica da Matemática e teve a sua origem na construçãodos números reais a partir do conjunto de números racionais. Na construção dosnúmeros reais, convenciona-se que a representação de cada número real é feita atra-vés de uma seqüência especial chamada expansão decimal. Mas isto não é possível

de se fazer no caso abstrato e, portanto, o objeto matemático “ classe de equiva-lência”, por mais desconfortável que seja, deve ser trabalhado como tal. Veremos

Page 36: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 36/371

30 1 Espaços Métricos

mais adiante que uma das tarefas posteriores à construção de um espaço quociente“concreto”, é a caracterização das classes por meio de seus próprios elementos.

Usaremos agora esta construção inicial para concluírmos um programa deconstrução análogo ao dos números reais com o teorema de completamento.

1.4.2 Completamento

Teorema 1.34 (Completamento). Dado um espaço métrico ( M ,d ) , o espaço métrico das classes de equivalência desuas seqüências de Cauchy com a métrica induzida,

S [ M ]/∆ = S [ M ],d

, que de-

notaremos por (M , d ) :

i) é completo,

ii) M está isometricamente imerso em M, isto é, existe uma função injetivai : M → M, tal que d (i( x), i( y)) = d ( x, y) (esta imagem i( M ) ⊂ M será identi- ficada a M e denotada pelo mesmo símbolo),

iii) M é denso em M, e

iv) o completamento é único no sentido de que qualquer outro espaço métricocompleto M em que M está densamente e isometricamente imerso, será tam-bém isométrico a M.

Prova. i) Seja então uma seqüência de Cauchy α j em M . Tomemos respectivas se-qüencias representantes em M , f j ∈α j , isto é, f j = α j. Então, limi, j→∞ d (α i,α j) =limi, j→∞ (limk →∞ d ( f i(k ), f j(k ))) = 0. Observe os limites iterados! O nosso obje-tivo é construir uma seqüência de Cauchy g : N → N , tal que lim j→∞d ( f j ,g) =lim j→∞ (limk →∞d ( f j(k ),g(k ))) = 0. Utilizaremos para isto uma ideia devido aGeorg Cantor denominada “construção diagonal”, por motivos que se tornarão cla-ros em breve. Definiremos g(k ) = f k (nk ), onde nk é tomado de tal forma que paratodo m > nk , tenhamos d ( f k (m) , f k (nk )) < k −1, o que é possível uma vez que cada f k é uma seqüência de Cauchy (não é razoável agora a designação de “ método dia-

gonal”?).Dado agora um ε > 0, tomemos um J 0, tal que J −1

0 < ε e se i, j > J 0, tenhamosd (α i,α j) = limk →∞ d ( f i(k ), f j(k )) < ε . Mas então, sek , s > J 0, temos, (triangulando,inserindo um índice m à direita e fazendo m →∞),

d (g(k ), g(s)) = d ( f k (nk ), f s(ns))≤ d ( f k (nk ), f k (m)) + d ( f k (m), f s(m)) + d ( f s(m), f s(ns))≤ k −1 + s−1

(1.1)

e, portanto g ∈ S [ M ].Devemos mostrar agora que α j → g (na métrica d ). Seja ε > 0 e tomemos

J 0 tal que J −10 < ε e se m, j > J 0 tenhamos d (g(m), g( j)) ≤ ε . Tomamos então

k ( j) = n j(> J 0). Se agora k > k ( j) = n j temos que d ( f i(n j), f j(k )) ≤ j−1 ≤ J −10

e d (g(k ), f j(k )) ≤ d (g(k ), g( j)) + d ( f j(n j), f j(k )) ≤ ε + J −1

0 ≤ 2ε (observando queg( j)) = f j(n j)). Portanto, limk →∞ d (g(k ), f j(k )) ≤ 2ε se j ≥ J 0, o que nos leva àconclusão desejada. Enfim, ( M ,d ) é um espaço métrico completo.

Page 37: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 37/371

1.4 Construção Abstrata de Espaços Métricos 31

ii) Para cada elemento x ∈ M , tomemos a correspondência i( x) = classe de equiva-lência da seqüencia constante ( x, x,.......). É fácil verificar que i : M → M é de fatoinjetiva e isométrica (Exercício).

iii) Se f

∈S [ M ], dado um ε > 0, tomemos no , tal que se m > no , então d ( f (m)

, f (no)) ≤ ε . é fácil ver agora que i( f (no) ) dista no máximo ε de f ∈ M , ou seja, M é denso em M .

iv) Seja agora j : M → M uma outra imersão densa e isométrica em M completo.Dado x ∈ M , tomemos uma seqüência de Cauchy xk ∈ M , tal que i( xk ) → x. Mascomo j é isométrica, j( xk ) também é de Cauchy em M e portanto converge paraum x. Não é difícil demonstrar que a correspondencia entre x e x é uma isometria(verifique).

A continuidade uniforme nos possibilitará construir novas funções, (e tambémnovos espaços de funções), assim como estender operações funcionais original-mente definidas em conjuntos simples e reduzidos de funções, para conjuntos muitomais amplos e úteis que serão construídos por meio do Teorema de Completamento.

Este processo atingirá o seu clímax (neste curso !) com a definição de integrais defunções generalizadas (Lebesgue) a partir da integrais de Riemann para funções es-cada. Um dos argumentos básicos por meio do qual realizamos esta construção, (ooutro é o Teorema do Completamento !), será apresentado na forma do seguinte

Teorema 1.35 (Extensão de funções uniformemente contínuas ao fecho do domí-nio).

Considere um espaço métrico ( M ,d 0) , um subconjunto denso A ⊂ M e uma funçãouniformemente contínua f : A → S, onde (S ,d ) é um espaço métrico completo.Então, existe uma única extensão contínua de f, que denotaremos por f : M →S, isto é, f (a) = f (a) , ∀a ∈ A e f ∈ C 0( M , S ). E mais, esta função f é tambémuniformemente contínua.

Prova. Como f é uniformemente contínua, ela transforma seqüências de Cauchyde M em seqüências de Cauchy de S (v. Exercício a respeito). Seja y ∈ M tomamosuma seqüência an ∈ A tal que an → y (que existe pois A é denso em M ). Como an

é convergente em M , ela é de Cauchy e portanto, f (an) é de Cauchy e convergenteem S , digamos f (an) → u. Tomando agora outra seqüência bn ∈ A tal que tambémbn → y, digamos agora que f (an) → v. Consideremos a triangulação :

d (u,v) ≤ d (u, f (an) + d ( f (an), f (bn) + d ( f (bn), v).

Lembrando-nos da continuidade uniforme de f e fazendo o limite n → ∞ na tri-angulação, concluimos que d (u,v) = 0 e, daí que lim f (bn) = lim f (an). Portanto,desta maneira, é possível definir consistentemente os valores de f ( y) para todo y ∈ M f ( y) = lim f (an) onde an ∈ A é qualquer seqüência tal que an → y. Este mesmo

argumento mostra que o valor definido para f ( y) é o único possível para que f sejaextensão contínua de f .

Page 38: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 38/371

32 1 Espaços Métricos

Para mostrar que f é uniformemente contínua, consideremos dois pontos quaisquer x e y ∈ M e duas sequências an e bn ∈ A, tais que an → x e bn → y. Pela continui-dade uniforme de f em A, dado ε > 0, existe δ > 0 tal que se d 0(a, b) < δ entãod ( f (a), f (b)) < ε . Mas, se d 0( x, y) < δ , é claro que d 0(an,bn) < δ para n depois de

algum determinado n0. Considerando a triangulaçãod ( f ( x), f ( y)) ≤ d ( f ( x), f (an)) + d ( f (an), f (bn)) + d ( f (bn), f ( z))

e fazendo n →∞ acabaremos por obter que d ( f ( x), f ( y)) < ε .

Observação :Voltemos ao exemplo da metrificação Riemanniana do plano complexo por intermé-dio da projeção estereográfica. Como vimos, nesta métrica, o plano se torna limitadomas incompleto. Para completarmos este espaço métrico, verificamos, geometrica-mente, que basta incluir um ponto que, por motivos óbvios, chamaremos de infinito,∞, e que nesta identificação está associado ao pólo norte na esfera. Este ponto é aclasse de equivalência das seqüências de Cauchy que “divergem" para o infinito.

Todas as outras seqüências de Cauchy convergem para um ponto do plano. É fácilver que com isso, não apenas completamos, mas também compactificamos o plano,ou seja, adicionado com este novo ponto e dotado da métrica estereográfica Rie-manniana o plano se torna também compacto! Este processo de completamento échamado “compactificação" (v. L. Ahlfors, Complex Analysis, McGraw-Hill, 1966).

1.5 Produtos Cartesianos de Espaços Métricos

Suponha que tenhamos uma família finita de espaços métricos ( M i, d i). De-finimos o conjunto produto cartesiano dos conjuntos M i como sendo o conjuntode seqüências ( x1, x2,..., xk ) = x onde xi ∈ M i e o denotamos por ∏0≤i≤k M i = M 1

×...

× M k .

Há várias maneiras de metrificar o espaço produto por meio das métricas dosfatores e muitas delas são reminiscentes dos exemplos de métricas do Rn, por exem-plo :

d ∞( x, y) = max0≤i≤k

d i( xi, yi)

d 1( x, y) = ∑0≤i≤k

d i( xi, yi) e etc.

Em todos os casos, o que realmente nos interessa é definir um sentido de conver-gência que sintetize em uma só distância as convergências por (todas) coordenadas,isto é, que seja válida a equivalência :

limk →∞ x(k )i = xi (em M i) quando k → ∞, para todo 1≤ i ≤ n⇐⇒

x(k ) → x (em M = ∏i M i).

Page 39: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 39/371

1.5 Produtos Cartesianos de Espaços Métricos 33

O problema se torna mais sutil quando temos uma coleção enumerável de espa-ços métricos M i com i correndo em todo N. As experiências dos exemplos em Rn,são inaproveitáveis na forma citada acima, pois teríamos uma quantidade infinita determos para consideração.

A segunda questão se refere ao fato da necessidade (ou não !) de que a conver-gência coordenada a coordenada se dê uniformemente. Se isto não acontece, algu-mas propriedades dos espaços métricos fatores podem ser perdidas no produto.

Não tentaremos analisar situações genéricas, mas optaremos por estudar umaclasse de metrificação de produtos cartesianos de espaços métricos que é suficientepara os nossos propósitos. A topologização de produtos cartesianos, não enumerá-veis em geral, e constatação de que propriedades importantes dos fatores são her-dados pelo produto, é o tema de um famoso Teorema de Tikhonov, o mesmo A. N.Tikhonov citado anteriormente. Apresentaremos apenas uma versão especial desteteorema (o caso geral pode ser consultado em : M. Reed e B.Simon, Functional Analysis, vol. 1, Acad. Press, 1974).

A estratégia comumente utilizada para a resolução satisfatória desta questãoparte de uma remetrificação de cada M i, tornando-a limitada, mas retendo a mesma

estrutura de convergência, uma possibilidade anteriormente estudada. Utilizemos,por exemplo, uma das modificações

d 0( x, y) = d ( x, y)

1 + d ( x, y)

e definiremos uma métrica em Π i M i = M da seguinte maneira :

d ∏( x, y) = ∑0≤i<∞

12i

d i( xi, yi)

1 + d i( xi, yi)

.

Exercícios :

1.51. Mostre que d ∏( x, y) definida acima é, de fato, uma métrica no produto carte-siano M = ∏ M i.

1.52. Mostre a equivalência : “ x(k ) → x (na métrica d ∏ em M ) ⇐⇒ cada coordenada

x(k )i → xi (na métrica respectiva d i)".

Observação 1.36. Para mostrar a volta, dado ε > 0 , tome m0 tal que se n > m0,∑m>m0

2−k < ε . Agora, lidando com um número finito de índices, obtenha um k ε tal

que se k > k ε , d i( x(k )i , xi) < ε para todos os i, 0 ≤ i ≤ m0, e conclua o resultado.

Teorema 1.37 (Teorema de Tikhonov II - Espaços Métricos Produtos).

Se ( M i, d i) for uma família enumerável de espaços métricos e ( M = ∏i M i,d ∏) for o espaço métrico produto acima definido, então

Page 40: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 40/371

34 1 Espaços Métricos

i) x(k ) → x (na métrica d ∏ em M = ∏i M i) ⇐⇒ cada coordenada x(k )i → xi (na

respectiva métrica d i).

ii) Se todos os ( M i, d i) forem completos, então ( M ,d ∏) será completo.

ii) Se todos os ( M i, d i) forem compactos, então ( M ,d ∏) será compacto.

Prova. i) Exercício.

ii) Suponha que todos os ( M i, d i) sejam completos e considere x(k ) uma seqüência

de Cauchy em ( M ,d Π ). Então, como d j( x(k ) j , x(m)

j ) ≤ d ( x(k ), y(m)), temos quecada uma das seqüências coordenadas é de Cauchy, e portanto convergente.Usando o argumento para a estimativa sugerida no exercício acima, conclui-seque x(k ) converge para o elemento de M cujas coordenadas são os limites dasseqüências coordenadas.

ii) Suponha que todos os espaços métricos ( M i,d i) sejam compactos e considere x(k ) uma seqüência qualquer em M . Considere agora a sub-seqüência construída

recursivamente da seguinte maneira telescópica-diagonal : x(k )1 dispõe de uma

subsequência que converge para um dado x1

∈ M 1. Denomine os índices desta

na forma k j.A seqüencia x(k j), em j, pode ser tratada da mesma forma que a anteriortomando-se uma subseqüência em p do índice j tal que a segunda coordenadaconvirja para um elemento x2. Observe que a subsequência em p da primeira co-ordenada continua convergindo para o mesmo x1 uma vez que é sub-seqüênciade seqüência (em j) convergente.E assim progressivamente ad infinitum.Agora a diagonalização : Tomamos a sub-seqüência diagonal de índices queconvergirá para o elemento do espaço produto cujas coordenadas foram obtidassucessivamente como limites de sub-sequências das respectivas coordenadas.Este argumento é melhor compreendido por meio de um esquema em um qua-driculado que represente índices da seqüência na vertical e índices das coorde-

nadas na horizontal; experimente!

Este teorema terá aplicações na construção de diversos espaços métricos funcio-nais, tema do próximo capítulo.

1.6 Apêndice

1.6.1 Teorema de Heine-Borel Tologicamente Correto

A abordagem deste resultado por algumas tribos que preferem uma via mais“topologicamente correta" (conjuntista) faz uso do conceito de recobrimento, quetambém é útil em outros argumentos.

Definição 1.38. Uma familia de conjuntos Aλ , não necessariamente enumerável,se diz recobrimento de um conjunto B, se B ⊆ ∪ Aλ .

Page 41: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 41/371

1.6 Apêndice 35

Exercícios :

1.53. a) A uniformidade contínua de f em K pode ser expressa da seguinte maneira :

∀ε > 0,

∃δ ε > 0, tal que

∀ x, y

∈K com d ( x, y) < δ ε , temos d ( f ( x), f ( y)) < ε .

Escreva a negação formal desta afirmação com todo o cuidado lógico e suponha-a verdadeira como primeiro passo para uma demonstração do Teorema de Heine-Borel por absurdo. Tome então o ε 0 que supomos existir por absurdo. Agora,para os δ s tome 1

N e para cada um destes os seus respectivos x N e y N ∈ K , comd ( x N , y N ) < δ . Como K é compacto, existe uma subsequencia x N K e um limite delaem K , digamos x. Fazendo o mesmo com a sequência y N K , conclui-se o desejado.

b) Mostre que em um espaço métrico, K é um conjunto compacto se e somentese de todo recobrimento de K feito por uma família de bolas abertas Bλ , é possívelretirar uma subfamília finita Bλ 1 ,....., Bλ N

, que ainda é um recobrimento de K .Em tribos mais topologicamente corretas esta caracterização é tomada como defini-ção de conjunto compacto, em lugar da definição seqüêncial adotada aqui.

1.6.2 Os Teoremas Clássicos de Weierstrass e a Bipartição

Os teoremas clássicos de Bolzano Weierstrass da Análise Real podem ser de-monstrados com arumentos semelhantes utilizando a estratégia de bipartição, ou,encantoamento. Enfatizaremos esta conexão na apresentação abaixo.

Teorema 1.39 (Princípio de Bolzano).Qualquer seqüência limitada de números reais tem pelo menos um ponto de acumu-lação, e podemos escolher uma subseqüência dela que converge para este ponto.

Prova. Seja xn uma seqüência limitada, digamos contida no intervalo [a, b], b =

a + h. Façamos a seguinte operação algorítmica de bipartição :Tomemos no intervalo I 0 = [a,b] um termo da seqüência xn0 neste intervalo. Em se-guida o dividimos em duas partes disjuntas [a,a + h

2 ) e [a+ h2 ,a +h]. Pelo menos um

dos intervalos contêm uma quantidade infinita de termos da seqüência (entenda-se,uma quantidade infinita de índices cujos valores estão no referido intervalo). Es-colhemos este intervalo de comprimento h

2 , o designamos I 1, e tomemos nele umtermo da seqüência xn1 , com n1 > n0. Repetimos este processo e teremos intervalosencaixantes I k definidos para qualquer k , de comprimento h2−k que contem umaquantidade infinita de termos da seqüência e de onde tomamos um termo xnk apro-priadamente. Não é difícil concluir que a subseqüência xnk k é de Cauchy, poisseus elementos estão progressivamente escolhidos em intervalos de comprimentoh2−k , e portanto convergem para um número ξ que será obviamente um ponto deacumulação da seqüência original.

Page 42: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 42/371

36 1 Espaços Métricos

Teorema 1.40 (Teorema de Weierstrass - Convergência de Sequências Monotô-nicas).Se ( xn) for uma seqüência de números reais não decrescente e majorada superior-mente, isto é, xn ≤ xn+1 ≤ M, ∀n, então esta sequência converge para um ponto ξ ,

que é o menor de todos os majorantes M da seqüência.Prova. Consideremos o intervalo I 0 = [ x0, M ] (escrevendo h = M − x0 para simpli-ficar), definimos ξ0 = M e executamos nele uma bipartição tomando dois interva-los [ x0, x0 + h

2 ) e [ x0 + h2 , M ]. Se houver algum elemento da seqüência no segundo

intervalo escolhemos ξ1 = M (outra vez !), caso contrário tomemos ξ0 = x0 + h2 .

Repetimos o processo algoritmicamente e obtemos, obviamente, uma seqüência deCauchy ξk , monotônica não crescente em intervalos encaixantes que converge diga-mos para ξ e concluímos imediatamente que ξ ≤ξk , ∀k . Agora observe que todos osξk são majorantes de toda a sequência xn, ou seja xn ≤ ξk ,∀k ,n. Portanto, usando apropriedade de desigualdade no limite, temos xn ≤ ξ ,∀n. Mas pela própria maneirade serem escolhidos sempre existe algum elemento xnk que está a uma distância me-nor do que h

2k de ξk , de onde concluímos que para m > nk teremos

| xm

−ξ

|< h

2k o

que conclui o argumento.

Teorema 1.41 (Teorema de Weierstrass - Realização de Extremos por Funçãocontínua em conjunto fechado e limitado).Se f : K → R for uma função contínua definida em um conjunto de números reais K fechado e llimitado, então existem pontos m, M ∈ K que são respectivamente pontosde mínimo e máximo para f ( x) em K, ou seja, f (m) ≤ f ( x) ≤ f ( M ) , ∀ x ∈ K.

Prova. Argumentaremos apenas para o ponto de máximo, o que é suficiente. Pri-meiramente observemos que o conjunto de valores da função f (K ) é limitado, pois,caso contrário teríamos uma sequência xn ∈ K tal que f ( xk ) > k e, pelo Teoremade Bolzano (já escolhida a subsequencia), x

k → ξ

∈ K , o que caracteriza uma

descontinuidade infinita neste ponto, obviamente impossível. Construa algoritmi-camente uma sequencia xk tomando x0 um ponto qualquer e, considere o intervalo I 0 = [ f ( x0), M ] onde M é um majorante de f (K ). Efetue uma bipartição e escolhao intervalo à direita se nele houver alguma imagem de f , e tome x1 o valor querealiza esta imagem; caso contrário escolha o da esquerda e nele o x1. Repetindoargumentos anteriores concluimos rapidamente a demonstração.

Definição 1.42 (Semicontinuidade).Uma função de valores reais definida em um espaço métrico M, f : M → R, é ditasemicontínua superiormente - scs (semicontínua inferiormente - sci) em x ∈ M, se para todas as seqüências xn

→ x, temos que lim f ( xn)

≤ f ( x) (respectivamente,

lim f ( xn) ≥ f ( x)). Observação : limα n = sup dos pontos de acumulação da se-qüencia α n (e limα n = inf dos mesmos).

Page 43: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 43/371

1.6 Apêndice 37

Teorema 1.43 ((semi) Weierstrass).Se uma função de valores reais, definida em um espaço métrico K compacto, f : K → R , for semicontínua superiormente em todo o K, então f será limitadasuperiormente e terá pontos de máximo.

Prova. Se f não fosse limitada superiormente, teríamos uma sequencia xn ∈ K , talque f ( xn) > n ∈ N, de onde extrairíamos uma subseqüência xnk → x ∈ K , ondelim f ( xnk ) = ∞ o que é imposível pela definição de sc-superior. Para concluir o teo-rema basta repetir o argumento do Teorema (completo) de Weierstrass.

1.6.3 Estranhos limites

Considere a função “ parte inteira de um número real positivo x" = [ x] =

maxn ∈ N ; n ≤ x e a sequência de funções f n( x) = 12n ∑

0≤k ≤n

1 + (−1)[10n x]

.

Interprete estas funções, continuidade e descontinuidades, e analise seu limite pon-tual.

O exemplo acima repete um pouco da famosa seqüência de funções construídapor Weierstrass que produziu no final do século XIX uma função contínua que nãotem derivada em nenhum ponto, um resultado que causou "frisson" e escandalizouenormemente os mais impressionáveis da época (v. Riesz-Nagy, Functional Analy-sis).

Page 44: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 44/371

Page 45: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 45/371

2

Espaços Métricos Funcionais

A ideia de uma função como um objeto matemático “inteiro” e não como umamontoado de regras, símbolos, fórmulas e condições esparsas pode ter a sua ori-gem mais remota atribuída à histórica tese de doutoramento de Georg F. B. Riemann

(1826-1866) no ano de 1851 em Göttingen. A propósito, Riemann foi um orientadonão oficial de um relutante Carl Friedrich Gauss, que não suportava muito os alu-nos, mesmo que fosse um ‘Riemann’ ! Neste trabalho, ele introduziu o conceito defunção analítica como uma entidade “quase viva” dotada de estruturas tão pecu-liares que não podiam ser manipuladas ao bel prazer do matemático. Entretanto, talcomo aconteceu com várias de suas revolucionárias visões matemáticas que perma-neceram inconclusas devido à sua morte prematura e ainda precedida por muitasenfermidades, o desenvolvimento vigoroso deste conceito se fez esperar por déca-das (D. Laugwitz, Georg F. Bernhard Riemann, Birkhauser). Além disso, como jámencionado, uma das questões que mais influenciaram o desenvolvimento inicial daAnálise Funcional, foi a necessidade de se tornarem rigorosos, dentro dos critériosvigentes à época, os poderosos métodos de Matemática Aplicada gerados pelo in-tuitivo princípo de Dirichlet-Riemann para Equações Diferenciais Parciais. A críticadevastadora de Weierstrass contra a sua fundamentação fez desse Princípio um temamatemático quase intocável durante muito tempo até que o impetuoso David Hil-bert se dispusesse a enfrentá-las, a crítica e a autoridade do seu autor (A. S. Monna,título, Editora).

O estabelecimento definitivo e a plena forma operacional do conceito de fun-ções e daí, a consideração de conjuntos de funções como objetos matemáticos in-contestes, somente se firmou durante o fértil período que compreende duas décadasnotáveis para a Matemática, a final do século XIX e a inicial do século XX. Omarco crucial deste processo, sem dúvida, foi a invenção da teoria dos conjuntospor Georg Cantor (....)empenhada pelo “establishment” matemático, praticamentelevou o seu autor ao sanatório mental, tendo sido atenuada somente pelo endossoque lhe emprestou o já famoso Hilbert. Uma substancial parcela do desenvolvi-

mento pioneiro da Analise Funcional pode ser justamente creditada também à es-cola italiana de Análise em que pontificaram Guido Ascoli, C. Arzelà, Ulisse Dini,Giuseppe Peano, Vito Volterra, Renato Cacciopoli, assim como à escola polonesa,

Page 46: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 46/371

40 2 Espaços Métricos Funcionais

cuja rápida ascendência e queda se deu nas três décadas anteriores à IIa Guerra, esta,liderada por Stefan Banach, Hugo Steinhaus, Julius Schauder e outros, cujos nomesaparecerão com frequência em títulos de teoremas e definições de conceitos nestetexto. Pode-se dizer que a Análise Funcional teve o seu início exatamente com o

estabelecimento destes conceitos na literatura matemática enquanto que a introdu-ção do termo Análise Funcional é devida a Paul Lévy (...-1955), um extraordiná-rio probabilista-analista, ainda que “gauche” dentro da contemporânea matemáticafrancesa. A história da Matemática no que se refere a este período e a esta área éum dos capítulos mais interessantes de todo o desenvolvimento desta ciência e podeser consultada em M. Kline, Mathematical Thought from Ancient to Modern Times,Oxford United Press, 1974, para aspectos gerais e, dentre muitos, em J. Dieudonné,A. F. Monna, H. J. M. Bosbiografias escritas por Constance Reid, quanto a algunsde seus aspectos mais específicos.

Iniciaremos pela (re-)apresentação de alguns exemplos de espaços métricos fun-cionais.

2.1 Exemplos de Espaços Métricos Funcionais

Os símbolos à esquerda definem apenas os conjuntos ; as métricas têm que serespecificadas e podem eventualmente , mas não necessariamente, ser as indicadasabaixo. As notações utilizadas abaixo tendem a ser as mais comuns, mas não apre-sentam muita uniformidade na literatura matemáica e isto deve ser levado em consi-deração.

1. B( A, M ) = “Conjunto das funções definidas em um conjunto não vazio qualquer A, limitadas (“bounded”, em inglês), tomando valores em um espaço métrico M ”,Métrica uniforme d ∞.

2. C

0

B( M , S ) = “Conjunto das funções contínuas e limitadas entre os espaços mé-tricos ( M , d ) e (S ,δ )”,Métrica herdada de B( M ,S ), d ∞.

3. C 0K ( M ,Rn) = “Conjunto das funções contínuas f ∈ C 0( M ,Rn), tais que o su- porte de f (supp f = fecho dos pontos em que f ( x) não se anula = x, f ( x) = 0)está contido em ⊂ K , onde K é um conjunto compacto fixo”,Métrica herdada de B( M ,Rn), d ∞.

Observação 2.1.

i) A métrica dos Rn será sempre a Euclideana, a menos que o contrário sejaexplicitamente afirmado !

ii) Sendo f contínua, o conjunto dos pontos em que ela não se anula é aberto(imagem inversa do aberto Rn −0).

Page 47: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 47/371

2.1 Exemplos de Espaços Métricos Funcionais 41

4. C 00( M ,Rn) = “Conjunto das funções contínuas f ∈ C 0( M ,Rn), tais que supp f = x, f ( x) = 0 é um conjunto compacto”,Métrica herdada de B( M ,Rn), d ∞. Observe que

C 0

0( M ,Rn

) = K scompactosC

0

K ( M ,Rn

).

Particularmente importantes são os espaços C 00(Rm,Rn) que podem ser repre-sentados por

C 00(Rm,Rn) =

N ≥1

C 0 B N (Rm,Rn),

onde, naturalmente, B N = x; x ≤ N .

5. C k ([0,1],R) = “Conjunto das funções f : [0, 1] → R com derivadas contínuasaté pelo menos a ordem k ”,

Métrica d ∞, k (g, h) =m=k ∑

m=0d ∞(g(m),h(m)), onde g(m) significa a m-ésima derivada

de g e d ∞, como sempre, é a métrica uniforme.

6. C ∞([0, 1],R) = “Conjunto das funções contínuas f : [0, 1] → R que têm deriva-das contínuas de todas as ordens”, C ∞([0,1],R) =

0≤k C k ([0, 1],R).

Podemos, dentre outras, utilizar a métrica d ∗( f , g) =∞

∑m=0

12k

d ∞(g(m), f (m))

1+d ∞(g(m), f (m)), que

representa a convergencia uniforme da função e de todas as suas derivadas, umamétrica muito forte (restritiva). Observe que para todo k ≥ 0 as outras métri-cas d ∞, k definidas acima são mais fracas do que d ∗, isto é, qualquer sequenciaconvergente nesta ultima será convergente nas outras, o que escrevemos simbo-licamente na forma : d ∞,k d ∗( f ,g).

7. C 0(Rn,R) ;Métrica de convergencia uniforme em compactos :

d K ( f ,g) =∞

∑ N =0

12 N ∆

N ∞ (g, f )

1 +∆ N ∞ (g, f )

,

onde ∆ N ∞ é a pseudo-métrica ∆ N

∞ (g, f ) = sup x∈ B(0, N )

|g( x)− f ( x)|.

8. C ω (R,R) = “Conjunto das funções reais analíticas, isto é, aquelas que podemser representadas por séries de potências convergentes, f ( x) = ∑

0≤k ak xk ”.

Como se sabe da teoria de Weierstrass para séries de potências, C ω (R,R) ⊂C ∞(R,R), e, de fato, f ( x) = ∑

0≤k

f (k )(0)k ! xk . Métricas identicas às anteriores

d ∗( f ,g) e d K ( f , g) podem ser utilizadas.Observe que C ω (R,R) = C ∞(R,R), ou seja, há (e muitas !) funções que são

infinitamente e continuamente diferenciáveis, cujas séries de Taylor não repro-duzem a respectiva função, mesmo sendo convergentes, como veremos maisadiante.

Page 48: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 48/371

42 2 Espaços Métricos Funcionais

9. C ω (Ω ,C) = “Conjunto das funções analíticas complexas f : Ω →C, ondeΩ ⊂R2≈C é uma região do plano complexo, ou seja, um conjunto conexo e aberto”.Como se sabe da teoria de funções de variável complexa segundo Riemann eWeierstrass, uma função analítica é aquela que sempre pode ser localmente ca-

racterizada por uma série de potências, ou seja, para cada z0 ∈Ω , existe algumabola B( z0,r ) ⊂ Ω , onde função é representável por uma série convergente depotencias f ( z) = ∑

0≤k ak ( z − zk

0). Uma caracterização (“rival” e equivalente) se-

gundo Cauchy para estas funções é a existência da derivada complexa f ( z) emtodo o domínio Ω . Construções topológicas relativamente simples que serãoexplicadas com detalhes mais adiante mostram que podemos “esgotar ” umaregião do Rn como união de compactos K m encaixantes (K m ⊂ K m+1), ou seja,Ω =

0≤m K m e daí definir a “métrica daconvergência uniforme em compactos”

(que independe deste “esgotamento”), d K ( f , g) =∞

∑m=0

12k ∆ N ∞ (g, f )

1+∆ N ∞ (g, f )

, onde ∆ N ∞ é a

pseudo-métrica ∆ N ∞ (g, f ) = sup

x∈K N

|g( x) − f ( x)|.

10. P N (R,R) = “Conjunto dos polinômios reais de grau ≤ N ”,

P N (R,R) =

p( x) = ∑

0≤k ≤nak xk ; ak ∈R ∀k , n ≤ N

.

Se x0 < x1 < ....< x N são N pontos distintos, entãod ∗( p,q) = ∑0≤k ≤ N

| p( xk ) −q( xk )|é uma métrica neste espaço. A positividade definida da métrica vale graças aoTeorema Fundamental da Álgebra.

11. P(R,R) = “Conjunto dos polinômios reais”,

P(R,R) =

p( x) = ∑

0≤k ≤nak xk ; ak ∈R ∀k , n ∈N

.

Se xmm∈N for uma sequência de números reais com infinitos valores distintos,então d ( p,q) = ∑

0≤k

12k

| p( xk )−q( xk )|1+| p( xk )−q( xk )| é uma métrica neste espaço, assim como

d ( p,q) = ∑0≤k

| p(k ) −q(k )|e−k , e d ( p, q) =∞ 0| p( x)− q( x)|e−λ xdx, para λ > 0

(Observe que em todos estes casos e no exemplo anterior, a métrica é obtida deuma superposição de pseudométricas, uma técnica muito comum na definiçãode métricas).

12. (Funções Escada) E ([0,1], M ) = “Conjunto das funções escada f : [0, 1] → M ”,

E ([0, 1], M ) = f : [0, 1] → M ; f ( x) é constante em cada subintervalo aberto( xk , xk +1), 0 ≤ k ≤ n, onde 1 = x0 < x1 < ..... < xn+1 = 1,

com a métrica uniforme herdada de B([0,1], M ), d ∞.13. (Funções Reguladas) R ([0,1], M ) = “Conjunto da funções reguladas”,

Page 49: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 49/371

2.1 Exemplos de Espaços Métricos Funcionais 43

R ([0, 1], M ) = f : [0, 1] → M ; f ( x) admite limites finitos à esquerda e àdireita em cada ponto de [0,1], ainda que sejam diferentes,

métrica d ∞.

Exercícios - Funções Escada, Poligonais, Polinomiais e Reguladas :

2.1. Mostre que as afirmações do exemplos 3, 4, 5, 6, 7, 8, 9, 10 e 11 relativas àsmétricas são consistentes, isto é, fazem sentido!

2.2. Mostre que : E ([0, 1], M ) ⊂ R ([0,1], M ), e que C 0([0,1], M ) ⊂ R ([0, 1], M ) ⊂ B([0, 1], M ) (Bolzano-Weierstrass).

2.3. Mostre que C ([0,1], M ) ⊂ E ([0, 1], M )d ∞

, onde estamos considerando o fechocom a métrica d ∞, ou seja, mostre que toda função contínua no intervalo [0,1] podeser uniformemente aproximada por funções escada.

2.4. Considere P Lin([0, 1],R) = “Funções Contínuas e Lineares por partes, ou, Po-

ligonais”,P Lin([0,1],R) = f ∈ C 0([0, 1],R), tal que existam x0 = 0 < x1 < .... < xn = 1, e

f ( x) = f ( xk ) + f ( xk +1)− f ( xk )

xk +1− xk ( x− xk ), para xk ≤ x ≤ xk +1.

Mostre que P Lin([0,1],R)d ∞

= C 0([0, 1],R).

2.5. Mostre que se f ∈ P Lin([0, 1],R) então podemos escrevê-la na forma de Le-besgue : f ( x) = a + bx + ∑

1≤k ≤mak | x− xk |. Podemos dizer também que todas as fun-

ções descritas por expressões deste tipo seriam poligonais ?

2.6. Mostre que em C k ([0, 1],R), ∆m∞ (g,h) = d ∞(g(m),h(m)), é uma pseudométrica

para 1

≤m

≤k , onde g(m) significa a m-ésima derivada de g, e d ∞, como sempre, é a

métrica uniforme. Caracterize os respectivos espaços quocientes C k ([0,1],R)/∆m∞ .

2.7. Considere agora P(R,R) e a pseudométrica∆( p,q) = N ∑

m=0| p( xk ) −q( xk )|, onde

x0 < x1 < ..... < x N . Caracterize o espaço quociente P(R,R)/∆ .

2.8. Mostre que em P(R,R) as seguintes expressões são bem definidas e, de fato,são métricas :

d E ( p, q) =

∞ 0

| p( x)− q( x)|e−λ xdx, d G( p, q) =

∞ −∞

| p( x) −q( x)|e−λ x2dx,

λ > 0 (Exponencial e Gaussiana).

2.9. Mostre que em P N (R,R), se x0 < x1 < .... < x N forem N pontos distintos, entãoas métricas abaixo são equivalentes :

Page 50: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 50/371

44 2 Espaços Métricos Funcionais

a) d ∗( p, q) = ∑0≤k ≤ N

| p( xk ) −q( xk )|,b) d ∞( p,q) = ∑

0≤ x≤1| p( x) −q( x)|,

c) d 1( p, q) =

1

0 | p( x) −q( x)|dx,

d) d E ( p, q) =∞ 0| p( x) −q( x)|e−λ xdx, λ > 0,

e) d G( p, q) =∞

−∞| p( x) −q( x)|e−λ x2

dx, λ > 0.

As funções escada são definidas por regras finitas e explícitas, e são tambémextremamente simples com respeito a diversas operações, especialmente a integra-ção. Portanto, é comum, pois conveniente, que se defina e estude certas operaçõesfuncionais em E ([0,1], M ) como um primeiro passo, para depois então estende-lasa conjuntos mais amplos de funções aproximáveis por elementos de E ([0,1], M ) emtermos de uma métrica adequada. Este procedimento, que é fundamental em toda a

Análise Funcional, será exemplificado aqui em um contexto relativamente simplespara a definição da integral de Riemann de funções de variável real e valores em Rn.O espaço métrico que será aproximado por E ([0,1], M ) dependerá muito da mé-

trica utilizada; quanto mais “ fraca” a métrica (ou seja, quanto menos restritiva emais sequências ela admite como sendo de Cauchy), maior será o espaço comple-tado. Utilizaremos neste caso a métrica usual, d ∞, que é relativamente restritiva,pois, exige aproximação pontual e uniforme e, portanto, faz com que o espaço com-pletado seja igualmente mais restrito. Mais tarde, o mesmo procedimento será em-pregado com Rn sendo substituido por espaços vetoriais mais gerais, e também nautilização de métricas “mais fracas”, quando poderemos definir integrais em umsentido bem mais amplo, chamadas integrais de Lebesgue.

Pelo teorema do completamento, sabemos que existe um espaço métrico com-pleto, essencialmente único, em que E ([0, 1], M ) estará isometricamente imerso.

Como já foi visto anteriormente, se M for completo, então B([0,1], M ) tambémserá completo na métrica d ∞, e, portanto, como E ([0,1], M ) ⊂ B([0,1], M ), concluí-mos que o completamento de E ([0,1], M ) nesta métrica deverá ser um subespaçode B([0, 1], M ). Isto significa que neste caso particular , como em alguns preciososoutros, o teorema do completamento nos dará, não um espaço abstrato, mas umespaço de funções “concretas” previamente conhecido. A identificação “concreta”,também chamada “realização”, dos espaços obtidos abstratamente pelo teorema decompletamento é uma tarefa desejável, necessária, mas nem sempre muito simplescomo será neste exemplo, em que também poderemos decidir por intermédio decritérios intrínsecos e relativamente simples sobre a pertinência de uma função ao

espaço completado E ([0,1], M )d ∞

. Este tipo de critério é importante para identificar

uma função de E ([0, 1], M )d ∞

quando a encontramos fora do contexto do completa-

mento. Pelo exercício acima já sabemos que as funções contínuas estão dentre estas,mas veremos que este espaço é bem maior e o teorema a seguir estabelece o critériointrínseco e definitivo desta pertinência.

Page 51: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 51/371

2.1 Exemplos de Espaços Métricos Funcionais 45

Teorema 2.2 (Completamento Uniforme das Funções Escada≈ Funções Regu-ladas).

Se ( M ,d ) for um espaço métrico completo , então E ([0,1], M )d ∞

= R ([0, 1], M ).

Prova. Suponhamos que ϕ seja uma função aproximada uniformemente por fun-ções escada, isto é, ϕ ∈ E ([0,1], M )

d ∞, e tomemos x ∈ [0,1). Dado um ε > 0,

existe então uma h escada tal que d (h,ϕ ) = supd (h(ξ ),ϕ (ξ )), ξ ∈ [0, 1] < ε .Como h é escada, podemos supor que um de seus “patamares” inclui um subinter-valo do tipo ( x, x + δ ), onde h é constante. Portanto, concluimos por triangulaçãoque, se ζ ,η ∈ ( x, x + δ ), então d (ϕ (ζ ),ϕ (ξ )) ≤ 2ε . Agora, se uma sequência ξnse aproxima de x pela direita, eventualmente seus valores estarão no subintervalo( x, x +δ ) depois de um índice n0 em diante quando também satisfarão à desigual-dade d (ϕ ( xn),ϕ ( xm)) < 2ε , ou seja, ϕ ( xk ) será uma sequência de Cauchy em umespaço métrico completo M e portanto convergente.

O limite à esquerda é analogamente tratado. Enfim, ϕ ∈ R ([0,1], M ), ou seja,

provamos que E ([0, 1], M )d ∞ ⊂ R ([0,1], M ).

Suponhamos agora que ϕ seja uma função regulada, isto é, com limites lateraisem cada ponto de [0, 1], e seja ε > 0. Construímos agora uma função “marquise”definindo-a para cada ξ ∈ [0, 1] da seguinte maneira :

g(ξ ) = supδ > 0, tais que d (ϕ (α ),ϕ (β )) < ε , ∀α ,β ∈ [0,1]tais que α ,β ∈ (ξ −δ ,ξ ), ou α ,β ∈ (ξ ,ξ + δ ).

Observe a exclusão do ponto ξ , já que o valor da função neste ponto pode não ternada a ver com seus valores laterais, como acontece nas funções escada! A de-finição é consistente (faz sentido !) devido à existência do limite lateral. Pois, senão existisse nenhum δ > 0 com estas prerrogativas, poderíamos construir uma se-quencia xn para a qual, obviamente, falharia o critério de Cauchy para conver-gencia, escolhendo, para cada δ = 1

n , dois pontos laterais x2n, x2n+1 “rebeldes”(d (ϕ ( xn),ϕ ( xn+1))

≥ε ). Medite sobre o significado geométrico desta função e veri-

fique agora que, se |ξ −η | < ε , então g(ξ )−ε ≤ g(η) ≤ g(ξ )+ε , e, analogamente,g(η) − ε ≤ g(ξ ) ≤ g(η) +ε . Conclua que ela é bem definida, sempre positiva econtínua. Pelo Teorema de Weierstrass, g(ξ ) deve então atingir o mínimo δ 0 emalgum ponto ξ0 em [0,1] e, portanto, g(ξ0) = δ 0 > 0.

Convença-se finalmente de que é possível construir uma função escada h à umadistância uniforme de ϕ menor do que ε por meio da função g escolhendo pontosespaçados de 1

2δ 0, de 0 até 1.

Este é um teorema típico de estrutura em que critérios “intrínsecos” de funçõessão singularizados para determinar a sua pertinência a um conjunto que é original-mente definido por processos “globais”, como completamento, por exemplo.

Em seguida, mostraremos como esta construção pode ser empregada na defini-

ção da integral de Riemann para as funções reguladas, o que engloba todas as fun-ções contínuas e as contínuas por partes e, de fato, compreende toda a teoria clássica

Page 52: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 52/371

46 2 Espaços Métricos Funcionais

de integração. Para tanto, basta observar que a operação funcional I definida comoa integral “Arquimediana”

I : E ([0, 1],Rn)

→Rn, I ( f ) =

n

∑k =0

( xk +1

− xk ) f

xk + xk +1

2 é uniformemente contínua se considerarmos a métrica Euclideana emRn e a métricad ∞ em E ([0, 1],Rn).

Exercício :

2.10. Verifique se a definição de integral de funções escada é compatível com osentido usual de integral e se a afirmação do último parágrafo, sobre a extensão daoperação I , é justificada.

Definição 2.3. Funções Riemann-Integráveis≈ R ([0,1],Rn) Assim, pelo Teorema de Extensão para funções uniformemente contínuas, existeuma integral I : R ([0, 1],Rn)

→Rn , que é naturalmente definida como a Integral

de Riemann e estende o conceito da integral “Arquimediana”.

As propriedades usuais da Integral são obtidas imediatamente das propriedadesde I em E ([0,1],Rn) herdadas por conta da sua extensão uniformemente contínua.Considerando que as funções “ Riemann-integráveis” por este argumento são exata-mente as funções reguladas, é razoável também associar o símbolo R ao nome deRiemann.

A definição de Integral de Riemann para funções reais de múltiplas variáveistambém pode seguir um argumento semelhante variável a variável (integrais itera-das), embora algumas adaptações de natureza geométrica sejam necessárias. VejaApêndice.

O procedimento acima mostra tipicamente a maneira pela qual se pode definirconstrutivamente operações funcionais para funções “mais complicadas”. Este pro-

cedimento depende essencialmente, como pudemos ver, da possibilidade de aproxi-mar funções “complicadas” por funções “simples” onde a teoria é desenvolvidacomo um primeiro passo. A possibilidade e um importante método para algumasdestas aproximações é o assunto da próxima seção.

2.2 Aproximação Uniforme de Funções Contínuas

Os Teoremas que estudaremos a seguir são instrumentos importantes para aaproximação de funções contínuas, sendo, portanto, fundamentais nos vários pro-cessos construtivos de espaços funcionais e operações funcionais que abordaremosneste curso.

O resultado clássico deste tópico é atribuído mais uma vez a Karl Maria Weiers-trass, e afirma simplesmente que, “toda função contínua definida em um intervalo fechado e limitado pode ser uniformemente aproximada por funções polinomiais”.

Page 53: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 53/371

2.2 Aproximação Uniforme de Funções Contínuas 47

Embora as funções polinomiais não sejam graficamente tão simples quanto as fun-ções escada, por outro lado, elas são analiticamente elementares visto que são de-finidas algoritmicamente por uma sequência finita e fixa de operações aritméticasdos números reais. Além disso, e não menos importante, elas são infinitamente dife-

renciáveis (na verdade, analíticas), o que as tornam apropriadas para a definição dasoperações necessárias ao estudo de equações diferenciais. Existem diversas demons-trações do Teorema de Aproximação de Weierstrass, e todas elas nos ensinam algumaspecto interessante sobre este importante tema. Apresentaremos inicialmente umesboço de uma argumentação elementar devida a H. Lebesgue (1898) que é peculiarao contexto das funções a valores reais e pode ser encontrada em R. Courant, Cál-culo Diferencial e Integral, vol.1, Ed. Globo, Porto Alegre, 1958, como exercício !

Nesta seção, aproveitaremos também a oportunidade para desenvolver algumasidéias que, além de levarem à construção da aproximação polinomial, são úteis emum contexto bem mais amplo.

Na linguagem de espaços métricos temos :

Teorema 2.4 (Teorema de Weierstrass : Aproximação Uniforme de FunçõesContínuas por Polinômios).Se denotarmos por P([0, 1],R) o conjunto das funções polinomiais reais com domí-

nio em [0, 1] , então, P([0, 1],R) ⊂ C 0([0, 1],R) , mas, principalmente, P([0, 1],R)d ∞

= C 0([0,1]R) , ou seja, o conjunto das funções polinomiais é denso no espaço mé-trico

C 0([0,1],R), d ∞

.

Prova. (Argumento de Lebesgue) Em exercício anterior a continuidade uniforme deuma função f ∈ C 0([0, 1],R), foi utilizada na construção gráfica, muito simples, dasua aproximação por uma função escada. O mesmo pode ser feito para a obtençãode uma uma função poligonal (isto é, linear por partes e contínua) que aproximeuniformemente esta função f . Um exercício de geometria analítica nos mostra, poroutro lado, que uma função poligonal pode ser sempre escrita na forma

ρ( x) = α x +β + ∑0≤i≤n

ci| x− xi|

onde os pontos xi são as (possíveis) “quinas” da linha poligonal (Verifique). Por-tanto, para uma triangulação adequada, basta agora que saibamos aproximar a fun-ção módulo h( x) =| x | uniformemente por polinomios no intervalo [−1,1]. Para isto,escrevemos h( x) =

√ x2 e consideramos uma pequena perturbação positiva (ε ≥ 0),

hε ( x) =√

x2 +ε =

1− (1− x2 − ε ), que é uniformemente próxima de h( x) em[−1,1]. Como

1−ξ pode ser expandida em série de Taylor que a aproxima uni-

formemente em qualquer intervalo −δ ≤ ξ ≤ δ , com δ < 1, concluimos o teorema, já que podemos ter |(1− x2 − ε )| ≤ 1− ε = δ < 1, ∀ x ∈ [0, 1] .

A demonstração de Lebesgue, apesar de simples, não pode ser imediatamentegeneralizada uma vez que utiliza propriedades muito características dos números

Page 54: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 54/371

48 2 Espaços Métricos Funcionais

reais. Surpreendentemente, veremos que suas idéias básicas retornarão na demons-tração do teorema de aproximação de Stone, que é muito mais geral e abstrato. Emparte, isto se deve ao fato de que a função módulo, que é específica do domínio realpode ser reinterpretada como uma operação funcional muito mais geral definida

entre funções de valores reais como se pode ver pelo exercício abaixo :

Exercícios :

2.11. Considere as funções a valores reais F ( A,R) = f : A → R definidas emum domínio qualquer A. Definimos a operação ∨ =“Maximo” (analogamente ∧ =“Minimo”) entre duas funções da seguinte forma : ( f ∨g)( x) = max f ( x), g( x) ,(analogamente, ( f ∧g)( x) = min f ( x), g( x)). Também definimos f ∨ 0 = f +, e

− f ∨0 = f −. Mostre que | f | = ( f ∨0) − (− f ∨0) e que ( f ∨g) = | f −g|

2 + f +g2 .

2.12. Mostre que se f ,g ∈ C 0( M ,R) então, f ∨ g, e f ∧ g ∈ C 0( M ,R), onde M éespaço métrico.

A seguir, abordaremos um método de construção de aproximações para funçõesreais que tem conexões que vão bem além desta já importante finalidade. A es-tratégia básica deste método é gerar aproximações que fazem uso de funções compropriedades diferenciais muito melhores do que as da função aproximada, e, poreste motivo, o método é, às vezes, denominado de “regularizador ” (“mollifier ”, eminglês).

O método de regularização nos possibilitará uma abordagem consistente de di-versos teoremas “à moda de” Weierstrass com respeito a várias outras classes defunções aproximantes além das polinomiais e, além disso, com domínios em qual-quer Rn.

Para isto iniciaremos com o conceito de sequência de Dirac, uma designaçãoque decorre do emprego pioneiro e extraordinariamente bem sucedido que o físico

Paul A. M. Dirac (...-...) fez da chamada função (generalizada) delta de Dirac, δ . Apropósito, este foi apenas um detalhe do seu profundo trabalho na fundamentaçãoda Física Quântica na década de 1920, e uma dentre várias outras de suas idéiasoriginais relacionadas à Análise Funcional. A função generalizada de Dirac serátratada mais adiante dentro de um formalismo matemático desenvolvido a partir dadécada de 1930 que, a bem da verdade, nunca preocupou o seu inventor, cuja certezaabsoluta de sua “existência” e utilidade estava baseada em argumentos físicos queeram os que mais lhe convenciam.

Definição 2.5 (Sequências de Dirac). Dizemos que uma sequência de funções reais contínuas δ k : R→ R

i) As integrais de Riemann (impróprias)+∞

−∞

δ k ( x)dx existem e+∞

−∞

δ k ( x)dx = 1 , ∀k.

ii) δ k ( x) ≥ 0 , ∀ x ∈R , ∀k.

Page 55: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 55/371

2.2 Aproximação Uniforme de Funções Contínuas 49

iii) ∀ε > 0 , limk −→∞

ε −ε δ k ( x) dx = 1 (ou, equivalentemente, limk →∞

−ε −∞δ k ( x)dx = 0

e limk →∞

+ε δ k ( x)dx = 0).

Observação 2.6. i) As funções δ k ( x) são denominadas de Núcleos de Dirac.ii) Podemos utilizar núcleos de Dirac em um intervalo finito e a definição acima é

apropriadamente adaptada.

ii) Sequências de Dirac podem ser analogamente definidas com facilidade em Rn :δ k :Rn →R+,

Rn δ k ( x)dx = 1, ∀k , e limk →∞

x≤ε δ k ( x)dx = 1 (dx = dx1...dxn

é o elemento de volume em Rn).

Exemplos - Sequências de Dirac :

1. Núcleo Polinomial de Courant-Hilbert :

δ k ( x) = c−1k (1− x2)k ∈ P([−1, 1],R) = “Conjunto das funções Polinomiais reais

com domínio [−1, 1]” ⊂ C ∞

([−1,1],R), onde ck =

+1 −1(1− x2

)k

dx.Observe que ck → 0, para k →∞. Podemos também pensar nestes núcleos comodefinidos para toda a reta real R, estendendo δ k ( x) = 0, para | x |≥ 1, mas nestecaso, obviamente, elas deixam de ser polinomiais e, de fato, δ k ∈ C k −1(R,R),mas δ k /∈ C k (R,R) (Verifique !).

2. Núcleo de Gauss :

δ k ( x) = c−1k e−kx2 ∈ C ∞(R,R+), onde ck =

+∞ −∞

exp(−kx2)dx.

3. Núcleo de Féjer :

δ k ( x) = c−1k

sen( 12 kx)

sen( 12 x)

2

∈ C ∞ per ([−π ,π ],R).

4. Núcleos infinitamente diferenciáveis e com suporte compacto, isto é, δ k ∈C ∞0 (Rn,R+) :

Construção de uma sequência de Dirac δ k ∈C ∞0 (R,R+) : considere inicialmentea função ϕ definida por

ϕ ( x) =

0 , se x ≤ 0exp(− x−2) , se x > 0.

Então ϕ ∈ C ∞(R,R) (verifique isto, utilizando a definição de derivada parao cálculo de ϕ (0) e os métodos usuais para o resto). As funções δ k ( x) =c−1

k

ϕ ( x + 1

k )×ϕ ( 1k − x)

são tais que δ k ∈ C ∞0 (R,R) e supp ϕ = [− 1

k , 1k ]. Se

agora as constantes ck forem apropriadamente escolhidas, mostra-se que, defato, estas funções constituem uma sequência de Dirac. Analogamente, pode-mos utilizar as funções Φ ( x1,... xn) = ϕ (∑ x2

i ), e ck adequados, para construirnúcleos de Dirac ∆k ∈C ∞0 (Rn,R), que se anulam fora da bola de raio 1

k em Rn.

Page 56: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 56/371

50 2 Espaços Métricos Funcionais

5. Núcleos Infinitamente diferenciáveis com suporte compacto e constantes emvizinhanças da origem :

Utilizando a função ϕ construída acima, escrevemos ψ ( x) = ϕ (1 + x) ×ϕ (1 − x), observando que ψ ( x) = 0 se

| x

|≥ 1. Em seguida, definimos a Função

rampa :

φ ( x) = c−1 x

−∞ψ (ξ )d ξ ,

onde c =1

−1ψ (ξ )d ξ . Com φ , podemos construir uma sequência de Dirac em

C ∞0 (R,R) com funções constantes em intervalos (que se encurtam) e contêm aorigem no centro (v. Exercício abaixo).

6. Núcleos de Funções por Contração (ou Dilatação) :

Considere uma função contínua e não negativa qualquer ψ : R→ R+ cuja inte-

gral imprópria existe (isto é, existe o limite : lim A→∞

+ A

− A

ψ ( x)dx =+∞

−∞ψ ( x)dx < ∞)

e, de fato, já normalizada, suponhamos que+∞ −∞ψ ( x)dx = 1. Então, é fácil verifi-

car que as funções δ k ( x) = k ψ (kx) constituem uma sequência de Dirac. Observeque as funções δ k ( x), de certa forma, “contraem” o gráfico da função “dilatada”ψ ( x) cada vez mais em torno da origem, e esta é a razão dos termos utiliza-dos para designá-las. Obviamente, se a função ψ for diferenciável, ou analítica,ou de suporte compacto, ou constante em uma vizinhança da origem, o mesmorespectivamente acontecerá com as funções δ k da sequência de Dirac corres-pondente.

Exercícios :

2.13. Calcule ck para os núcleos Gaussianos δ k ( x) em Rn, onde x = ( x1..... xn), x2 =∑ x2

i , ou seja,δ k ( x) = c−1

k exp[−k (∑ x2i )].

2.14. Demonstre as afirmações acima a respeito da construção da sequênciade Diracinfinitamente diferenciável, de suporte compacto e constante em uma vizinhança daorigem.

2.15. Faça o mesmo para funções contraídas. Mostre que os núcleos anteriores são,de certa forma, desta classe geral.

Se os índices k das sequências acima admitem não apenas valores inteiros, mastambém valores reais positivos, podemos definir os Núcleos de Dirac como funçõesδ : R×R++ → R+, δ λ ( x) = δ ( x,λ ), com propriedades semelhantes para λ → ∞.

Por exemplo, o núcleo de Dirac gaussiano fica sendo G( x,λ ) = λ π exp(−λ x2).

Page 57: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 57/371

2.2 Aproximação Uniforme de Funções Contínuas 51

A característica fundamental das sequências e dos núcleos de Dirac é a sua pro-gressiva concentração de “massa” nas vizinhanças da origem e esta interpretaçãopode ser melhor apreciada por quem puder identificar o núcleo Gaussiano escrito na

forma G0( x, t ) = 14π t exp−

14t x

2

(fazendo λ = 1/4t ), como a solução fundamen-

tal da equação de difusão com t → 0 (ver W. C. Ferreira Jr., Notas de EDP, 2006,ou, L. Evans, Partial Differential Equations, AMS).

Pense em δ ( x) como uma distribuição de massa unitária na reta real R (ou umaponderação, ou, mesmo uma distribuição de probabilidade). Se agora interpretarmosuma função real e contínua f ( x) definida emR como que descrevendo a intensidadede uma propriedade característica dos indivíduos localizados em x, a média popula-cional desta propriedade segundo a distribuição δ ( x) será dada por

R

δ ( x) f ( x)dx = “média de f segundo a distribuição δ ”.

Para um exemplo simples e concreto, considere δ ( x) a distribuição de uma uni-dade de massa ao longo da reta e

f ( x) =

−C

(1 + x2)32

a força vertical resultante da atração Newtoniana que uma unidade de massa colo-cada na posição x exerce sobre uma massa fixa unitária na posição P = (0, 1) doplano (verifique a motivação física e geométrica para esta expressão). Assim, é fá-cil concluir que, mantendo a quantidade total de massa distribuída na reta, a forçavertical resultante exercida sobre P dependerá exclusivamente da distribuição “po-sicional” de massa sobre a reta, e pode ser calculada de acordo com a fórmula desuperposição :

R δ ( x) f ( x)dx = “Força vertical resultante exercida pela massa

distribuida ao longo da reta sobre o ponto P = (0, 1)”.

Exercício :

2.16. A propósito, calcule uma fórmula explícita para esta força resultante no casode uma distribuição gaussiana, ou seja, a integral :

−C

∞ −∞

π 2λ

12 exp

−λ x2

(1 + x2)32

dx.

Obviamente, se esta distribuição se concentrar quase exclusivamente em umapequena vizinhança em torno de um ponto x0, a intuição física nos leva a concluirque teremos uma força resultante total aproximadamente f ( x0), os outros valores

Page 58: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 58/371

52 2 Espaços Métricos Funcionais

(mesmo maiores) de f ( x) se tornarão progressivamente desprezíveis para este cál-culo tanto quanto mais concentrada estiver a massa em torno do ponto x0 a da po- pulação segundo a distribuição etária”

Analogamente, tomando f ( x) = x, para a distribuição etária, usualmente inter-

pretamos R

δ ( x) xdx = “idade média da população”.

Como as ponderações de Dirac δ k se concentram progressivamente em 0 quandok →∞, é razoável esperar que a média seja também progressivamente dominadapelos valores da função f nas vizinhanças da origem que, sendo contínua, significa,aproximando-se do valor f (0).

Observe que δ k ( x − x0) para k → ∞ é uma concentração “quase pontual” demassa em x0 e, portanto, devemos ter

f k ( x0) =

R

δ k (ξ − x0) f (ξ )d ξ ≈ f ( x0), quando k → ∞.

Já, sob o ponto de vista matemático, a operação f k ( x) = Rδ k (ξ − x) f (ξ )d ξ tem

características de um produto de funções (comutativo, associativo e distributivo) eé de fato chamada produto de convolução entre δ k e f e denotada funcionalmentepor f k = δ k f . Voltaremos a este assunto mais adiante. O Teorema abaixo confirmaalgumas de nossas suspeitas e argumentos intuitivos.

Teorema 2.7 (Convergência das Convoluções de Dirac I, ou, como aproximar aIdentidade).Seja δ k : R −→ R+ uma sequência de Dirac, δ k ∈ C 0(R,R+) , k ≥ 0 , e f : R→ Ruma função contínua e limitada. Então, as funções definidas por

f k ( x) = (δ k f ) ( x) = Rδ k (ξ − x) f (ξ )d ξ s

1. São contínuas e equilimitadas , ou seja, f k ∈C 0(R,R) e f k ∈ B M (R,R) =“espaçométrico das funções equilimitadas por M”.

2. A convergência f k → f é uniforme em compactos , isto é, para qualquer inter-

valo finito e fechado [− A, A] , temos limk →∞

max| x|≤ A

| f k ( x) − f ( x)|

= 0.

Prova. Inicialmente, observamos que as funções f k ( x) são bem definidas, isto é, asintegrais impróprias de convolução são calculáveis em virtude da limitação da fun-ção f e da integrabilidade das funções δ k . A equilimitação desta família de funçõestambém é resultado da estimativa

| f k ( x)| ≤ R

δ k (ξ − x) | f (ξ )|d ξ ≤ M R

δ k (ξ − x)d ξ = M ,

Page 59: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 59/371

2.2 Aproximação Uniforme de Funções Contínuas 53

onde | f ( x)| ≤ M , ∀ x ∈R.Para mostrarmos que as funções f k são contínuas, escrevemos

f k ( x + h) =

Rδ k (ξ − ( x + h)) f (ξ )d ξ =

Rδ k (η− x) f (η+ h)d η ,

η = ξ −h, e comparamos

| f k ( x + h) − f k ( x)| ≤ R

δ k (η− x) | f (η+ h) − f (η)|d η =

− N −∞

+

N − N

+

∞ N

≤ 2 M

− N −∞δ k (s)ds + max

|η|≤ N | f (η+ h) − f (η)| + 2 M

∞ N

δ k (s)ds

Agora, dado ε > 0, podemos encontrar um número L suficientemente grandepara que

− L −∞δ k (s)ds +

∞ L

δ k (s)ds < ε ,

já que as integrais impróprias destas funções positivas convergem, isto é,∞

−∞δ k (s)ds <

∞. Como f é uniformemente contínua no intervalo [− L, L], podemos (Heine-Borel)escolher ∆ > 0 tal que se |h| < ∆ , tenhamos

max|η|≤ L

| f (η+ h) − f (η)| < ε .

Assim, obtemos, finalmente

| f k ( x + h) − f k ( x)| < (4 M + 1)ε ,

o que prova o desejado.Analisemos então a convergência f k → f . Observemos inicialmente que f ( x) =

+∞ −∞δ k ( x−ξ ) f ( x)d ξ , de onde tiramos a comparação

f k ( x) − f ( x) =

+∞ −∞δ k ( x−ξ ) ( f (ξ ) − f ( x))d ξ .

Agora, tal como anteriormente, dado ε > 0 e um intervalo [− A, A], pela conti-nuidade de f ( x) e o teorema de Heine-Borel, podemos encontrar um ∆ > 0 tal que| f (ξ ) − f ( x)| < ε se |ξ − x| < ∆ , com ξ , x ∈ [− A, A].

Tomando−∆

−∞δ k (s)ds +

∞ ∆

δ k (s)ds < ε

Page 60: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 60/371

54 2 Espaços Métricos Funcionais

para k > N , obtemos as estimativas

| f k ( x) − f ( x) |≤ x−∆ −∞

δ k (ξ − x) | f (ξ )− f ( x) | d ξ

+

x+∆ x−∆δ k (ξ − x) | f (ξ ) − f ( x) | d ξ

+

∞ x+∆

δ k (ξ − x) | f (ξ ) − f ( x) | d ξ

≤ x−∆ −∞δ k (ξ − x)2 Md ξ +

x+∆ x−∆δ k (ξ − x) ε d ξ +

∞ x+∆

δ k (ξ − x)2 Md ξ

≤ (4 M + 1)ε

para k > N e ∀ x ∈ [− A, A], o que demonstra o resultado desejado e final.

Este teorema nos fornece assim diversas maneiras de construir aproximaçõesuniformes de funções contínuas na reta. Não é difícil estender os argumentos acimapara funções de valores reais tendo Rn por domínio, incluindo assim aproximaçõesde funções de várias variáveis. Diversas outra variações podem ser consideradas,algumas delas estão apresentadas no Apêndice a este capítulo.

Uma das interpretações mais úteis sob o ponto de vista funcional do teoremade convolução de Dirac, e possivelmente aquela preferida pelo seu idealizador (i.e.,P. A. M. Dirac), é o da Aproximação da Identidade. De fato, a decomposição e aaproximação da identidade, uma idéia aparentemente absurda e/ou insensata (paraos insensatos), foi um dos temas perseguidos com insistência por Dirac em muitodaquilo que produziu. Mais adiante, quando tratarmos de operadores em espaços deHilbert, novamente este tema voltará a ser abordado sob este mesmo ponto de vista,

e mais uma vez, em grande parte devido ao proprio Dirac. Entretanto, também emoutras circunstâncias teremos oportunidade de re-encontrá-lo sob vários outros dis-farces. No presente caso, esta idéia pode ser facilmente visualizada se interpretarmosa integral de convolução

f k ( x) = (δ k f ) ( x) =

R

δ k (ξ − x) f (ξ )d ξ

como uma operação funcional I n : C 0 B(R,R) → C 0 B(R,R),

I n [ f ] = δ n ∗ f ,

e o teorema de Dirac, nada mais diz que I n → I , onde I , naturalmente, é a operação

funcional identidade, e a convergenciaé pontual nos espaços métricos C 0 B(R,R), d 0∞,isto é, na métrica de convergência uniforme em compactos. Este assunto será melhorabordado quando tratarmos de operadores lineares em espaços vetoriais.

Page 61: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 61/371

2.2 Aproximação Uniforme de Funções Contínuas 55

Em particular, podemos demonstrar o teorema cássico de Weierstrass utilizandoa sequência de Dirac δ k ( x) = c−1

k (1− x2)k , como pede o exercício abaixo.

Exercício :

2.17. Demonstre o Teorema clássico de aproximação de Weierstrass com a sequên-cia δ k ( x) = c−1

k (1 − x2)k . Antes, estenda continuamente os núcleos de Dirac paratoda a reta, zerando-o fora do intervalo [−1,1], e o mesmo para com a função f ( x)a ser aproximada, ao seu bel prazer, desde que limitada e continuamente. Comisto pode-se utilizar o teorema acima e obter o resultado desejado como parte daconclusão do teorema. Um ponto central desta demonstração, no entanto, é a veri-ficação da condição iii), de que a massa de fato se concentra progressivamente naorigem. Para isto, não é necessário calcular ck , bastam as seguintes estimativas :

1 ε

(1− x2)k dx < (1− ε 2)k e

ck = 21

0(1− x2)k dx =

1

0[(1− x)(1 + x)]k dx ≥

1

0(1− x)k dx = 2

k +1 ,

(verifique estas estimativas e use-as onde necessário ; em caso de “agonia in extre-mis”, consulte Courant-Hilbert vol. 1).

A demonstração do teorema de aproximação de Weierstrass em Rn pode ser fa-cilmente obtida no caso em que o domínio da função for um cubo fechado da forma[−a,a]n ; basta repetir o método de regularização com as adaptações apropriadas e já mencionadas.

Entretanto, as funções em Rn frequentemente são definidas em domínios comgeometrias muito mais complexas, o que exige um preparo topológico técnico paraa aplicação dos argumentos (v. Apêndice).

O teorema de aproximação de Weierstrass-Dirac pode ser melhorado se escol-

hermos sequências de Dirac melhores e não tão gerais como as que foram conside-radas na demonstração acima. Afinal, o que temos à nossa disposição é exatamenteesta escolha, e nem sempre a função a ser aproximada! Por exemplo, se a função f for contínua mas não necessariamente limitada, podemos escolher uma sequênciade Dirac que tenha suporte compacto (como as que já foram construídas) e assima integral de convolução será sempre bem definida, já que, de fato, ela ocorre ape-nas em um intervalo finito. A demonstração é essencialmente a mesma do teoremaacima e a convergencia será uniforme em compactos.

Teorema 2.8 (Convergência das Convoluções de Dirac-Weierstrass II).Seja δ k :R−→R+ uma sequencia de Dirac,δ k ∈C 0K (R,R+) =“funções contínuascom suporte em um compacto K” , ∀k ≥ 0 e f : R −→ R , uma função contínua.Então, as funções definidas por

f k ( x) = (δ k f ) ( x) = R

δ k (ξ − x) f (ξ )d ξ ,

Page 62: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 62/371

56 2 Espaços Métricos Funcionais

1. são contínuas , ou seja f k ∈C 0(R,R) , e

2. a convergência f k → f é uniforme em compactos.

Prova. Exercício.

A sequência de Dirac com os núcleos de L. Fejér (1905) (um matemático hún-garo) nos leva à demonstração do Teorema de Weierstrass na seguinte versão :

Teorema 2.9 (Teorema de Weierstrass Trigonométrico). As funções polinomiais trigonométricas (funções na forma P(cos x,senx) , ondeP(λ 1,λ 2) é um polinômio de duas variáveis), definidas em todo o R são umconjunto denso no espaço métrico C 02π − per (R,R) =“Conjunto das funções contí-nuas f : R−→ R , 2π -periódicas”, métrica d ∞.

Prova. Basta demonstrar que os núcleos de Fejér de fato dão origem a uma sequên-cia de Dirac na reta e que as funções obtidas pela convolução destes núcleos com a

função f , isto é, f k ( x) =

−π f (ξ )δ

k (ξ

− x)d ξ , são polinomios trigonométricos.

Exercício :

2.18. Verifique estas duas afirmações. Sugestão : Consulte o capítulo sobre Sériesde Fourier em Kolmogorov-Fomin, ou analise as fórmulas para soma de séries geo-métricas com

S ( N ) = ∑0≤k ≤ N

eikx = exp (i( N + 1) x)−exp(ix)

exp(ix) 1 ,

e novamente para ∑S ( j), para mostrar que o núcleo de Féjer pode ser escrito como(a parte real) da soma de exponenciais complexas, e portanto, a convolução irá de

fato produzir polinomios trigonométricos. Para mostrar o quesito do limite da inte-gral utilize a estimativa sen( x) ≈ x, para x ≈ 0.

As funções contínuas periódicas na reta, C 02π − per (R,R), podem ser convenien-

temente interpretadas como funções contínuas definidas no círculo unitário S 1 pormeio da identificação usual, isto é, “enrolando a reta no círculo”.

Existem várias extensões do Teorema de Weierstrass, algumas gerais e abstratastal como a desenvolvida por M. H. Stone na década de 1930. Esta versão, cha-mada de Teorema de Stone-Weierstrass, e que engloba todas as versões acima, seráapresentada no próximo capítulo em um contexto bem mais geral, ainda que o ar-gumento básico seja apenas uma ligeira, mas esperta, modificação da demonstraçãode Lebesgue.

Uma abordagem construtiva e que é bem próxima à do método de regularizaçãofoi desenvolvida pelo matemático russo P. Korovkin nas décadas de 1950-60 e tam-bém será abordada futuramente. Outro matemático russo, S. Bernstein, apresentou

Page 63: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 63/371

2.2 Aproximação Uniforme de Funções Contínuas 57

em 1912 uma demonstração do Teorema de Weierstrass fazendo uso de um argu-mento probabilístico de grande originalidade, especialmente considerando-se que àépoca a teoria de probabilidade ainda não fazia parte da Matemática canônica. Estemétodo produz uma expressão “automática” e explícita para os polinomios aproxi-

mantes e admite uma interpretação probabilística baseada na desigualdade de Tche-bitchev. Os interessados podem consultar o artigo abaixo que reproduz o argumentooriginal de Bernstein :

K.M. Levasseur, A probabilistic proof of the Weierstrass aproximation theo-rem, Am. Math. Month., 91, 1984, 245-250.

É interessante observar que o mesmo método pode também ser reformulado pelometodo de regularização, onde as funções núcleos (de Bernstein !) são de fato distri-buições de probabilidade com uma progressiva concentração na origem. Por outrolado, a aproximação por meio dos núcleos Gaussianos também admite uma inter-pretação probabilística imediata. Além disto, também é natural encarar esta mesmaaproximação em termos de um processo difusivo, se lembrarmos que o núcleo deGauss é a solução fundamental da equação clássica de difusão e as aproximações f k

representam o estado do sistema no instante 1k (W. C. Ferreira Jr., EDP : Princí- pios, Métodos e Fins, Notas de MT-709-1997/2006, IMECC-Unicamp).

Enfim, o Teorema de Weierstrass tem ramificações notáveis em variedade e pro-fundidade tanto em Matemática como nas suas aplicações, e as suas consequênciasserão apreciadas ao longo de toda a Análise Funcional.

Exercícios : Aproximações de Dirac

2.19. Teorema : Completude dos espaços C k ([0,1],R) na métrica

d ∞,k (g, h) =m=k

∑m=0

d ∞(g(m),h(m)),

onde g(m) significa a m-ésima derivada de g e d ∞, como sempre, é a métrica uni-forme. Sugestão : Este importante resultado, pertence mesmo ao Cálculo e pode serencontrado nos bons livros do ramo, por exemplo, Courant 1.

Inicialmente, lembre-se do teorema para k = 0, em espaços geraisC 0(K , M ), d ∞

,

onde K , e M são espaços métricos, K compacto, e M completo. Agora, especificandopara funções reais, mostre que se f n ∈C 1 ([0, 1],R) e d ∞( f n, f ) → 0 e d ∞( f n, g) → 0,então f ∈ C 1 ([0, 1],R) e mais, f = g. Para verificar esta última parte, considere as

integrais x 0

f n(s)ds = f n( x) + f n(0) e, utilizando a desigualdade do valor intermediá-

rio, mostre que x 0

f n(s)ds d ∞→

x 0

g(s)ds, de onde vem o resultado. Para as derivadas

restantes, basta repetir o argumento.

2.20. Analise a completude dos espaços C k (R,R) na métrica da convergencia uni-forme em compactos.

Page 64: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 64/371

58 2 Espaços Métricos Funcionais

2.21. O mesmo para C ∞ (R,R) na métrica da convergencia uniforme em compactos.

2.22. Mostre que se a sequencia de Dirac for constituída de funções k -vezes conti-nuamente diferenciáveis (0 ≤ k ≤∞), então uma função f também k -vezes conti-nuamente diferenciável será aproximada, junto com suas derivadas, uniformementeem compactos pelas respectivas funções k -vezes continuamente diferenciáveis. Ou

seja, f (m)n ( x) =

∞ −∞δ n(s− x) f (m)(s)ds aproximarão uniformemente em compactos as

respectivas derivadas f (m)( x).Examine a convergência em termos de métricas d k

∞ (convergencia uniformeem compactos da função e de suas derivadas). Sugestão : Para analisar a deriva-

ção ”interna” (ou, paramétrica) de integrais impróprias, por exemplo d dx

+∞ −∞δ n(s −

x) f (s)ds, considere as integrais finitas d dx

+ L − Lδ n(s − x) f (s)ds, submeta-a à integra-

ção por partes (para transferir a derivada para a função f ) e utilize o resultado acimasobre convergencia uniforme de funções e derivadas em compactos.

Paraobter expressões das aproximantes, considere as funções∞

−∞−δ n(s− x) f (s)ds

obtidas pela diferenciação de f n( x) =∞

−∞δ n(s− x) f (s)ds, e escreva-as na forma

∞ −∞

[−δ n(s− x) f (s)ds] =∞

−∞∂ ∂ x [δ n(s− x) f (s)]ds =

∞ −∞∂ ∂ x [δ n(η) f (η+ x)]d η

=∞

−∞[δ n(η) f (η+ x)]d η =

∞ −∞

[δ n(s− x) f (s)]ds

→ f ( x).

2.23. Suponha que a sequencia de Dirac seja constituída de funções ∞-vezes conti-nuamente diferenciáveis com suportes compactos “encaixantes e estrangulantes”

(isto é, supδ k +1 ⊂ supδ k e ∩k supδ k = 0). Então a função contínua será aproxi-mada por funções∞-vezes continuamente diferenciáveis. Examine o tipo de conver-gência em termos de métricas d k

∞ (convergência uniforme em compactos da funçãoe de suas derivadas).

2.3 Teoria de Arzelá-Ascoli : Caracterização de Compactos em(C 0(K , M ), d ∞).

Como já vimos, os conjuntos compactos desempenham um papel central no es-tudo de problemas de convergência (Dini & Bolzano-Weierstrass), na análise de

soluções de equações (Tikhonov) e de problemas variacionais (Weierstrass). Consi-derando agora que os espaços métricos constituídos por funções contínuas com amétrica uniforme estão dentre os espaços mais importantes, é razoável indagar sobre

Page 65: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 65/371

2.3 Teoria de Arzelá-Ascoli : Caracterização de Compactos em (C 0(K , M ),d ∞). 59

as caracterizações analíticas, ou intrínsecas, dos seus subconjuntos compactos. Esteé exatamente o tema da teoria de Arzelà-Ascoli que passaremos a tratar.

Os espaços funcionais são em geral muito grandes e dimensionalmente espaço-sos quando comparados aos Rn e não se pode esperar que sejam compactos e nem

que seus subconjuntos compactos contenham um naco substancial dêles, uma vezque a noção intuitiva de compacidade é a falta de espaço para isolamento. Em umsubconjunto fechado e limitado doRn não há extensão (pois, limitado), não há saída(pois, fechado) e não há dimensão (pois, finita) onde os pontos de uma sequenciapoderiam se esconder . Já, em um conjunto mesmo limitado e fechado, mas em di-mensão infinita, sobram ainda as infinitas dimensões ! Por exemplo, considere, aesfera unitária com centro na função zero em ( B(N,R), d ∞), espaço das sequênciaslimitadas com métrica uniforme. Este conjunto não é compacto como se pode facil-mente ver pela sequência f n(k ) = δ nk , (ou seja, f n(k ) = 1 se n = k , e = 0, se n = k ),pois, d ∞( f n, f m) = 1 se n = m e, portanto, não há uma subsequência convergentepois não há subsequencias de Cauchy !

Exercício :

2.24. Construa uma sequência em C 0([0,1],R), d ∞ para mostrar que a bola unitá-

ria neste espaço também não pode ser compacta. Sugestão : Adapte a ideia anteriorao contexto.

As caracterizações de conjuntos compactos em espaços de funções formam umaárea técnica de análise importante pelas suas aplicações e variam de espaço para es-paço, como é natural. Nesta seção, trataremos especificamente do espaço de funçõescontínuas definidas em um espaço métrico compacto com valores em outro espaçométrico, isto é, C 0(K , M ), dotado com a métrica d ∞ que caracteriza a aproximaçãouniforme. Observe que, pelo teorema de Weierstrass, C 0(K , M ) ⊂ B(K , M ). Estateoria é atribuída à importante escola italiana de análise do início do século XX,

representada no caso por Guido Ascoli e Arzelà.O Teorema de Arzelà-Ascoli (e o seu correspondente para funções analíticas,devido ao francês Paul Montel) será o resultado principal de caracterização de com-pacidade em espaços funcionais para este curso, embora outros teoremas do tipovenham a ser mencionados em seções futuras.

Para descrevermos a Teoria de Arzelà-Ascoli introduziremos o conceito geralde oscilação de uma função, que tem uma utiidade que transcende esta aplicação, jápor si mesma muito importante.

Definição 2.10 (Oscilação de uma função em um conjunto e h-Oscilação).

1. Se f : M 1 → M 2 for uma função entre dois espaços métricos, definimos a oscila-ção de f em um conjunto A, ao número ou ao símbolo∞ , conforme determinado pela expressão

o A( f ) = supζ ,η∈ A

d (( f (ζ ), f (η)) .

Page 66: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 66/371

60 2 Espaços Métricos Funcionais

2. Se A for uma bola B( x,h) na vizinhança de x, a oscilação no conjunto A = B( x,h) ,

oh( f )( x) = o B( x,h)( f )( x) = supζ ,η

∈ B( x,h)

d (( f (ζ ), f (η)) ,

será denominada uma h-Oscilação de f no ponto x, e denotada por oh( f )( x).

Esta nomenclatura sugere bem a ideia da localidade do conceito e, na maior partedas vezes, estaremos mesmo interessados na oscilação de uma função nas vizinhan-ças de um ponto x. Em geral, a oscilação pode ser infinita, mas aqui nos interessaráapenas o caso de funções localmente limitadas, ou seja, aquelas que são limitadasem alguma bola em torno de cada ponto ; as funções contínuas em particular, masnão somente elas. Entretanto, observe que a h-Oscilação de uma função localmentelimitada pode ser infinita em alguns pontos, como, por exemplo f : (0, 1) → R, f ( x) = 1

x . Para aperfeiçoarmos ainda mais o ponto de vista de localidade no seusentido mais radical, isto é, de forma que dependa apenas do ponto x e não do ta-manho da vizinhança, consideremos antes algumas propriedades básicas e alguns

alertas sobre o conceito de oscilação :

Exercícios - Algumas propriedades e não-propriedades da h-Oscilação :

2.25. Demonstre o seguinte :

a) Se 0 < h1 < h2, então oh1 ( f )( x) ≤ oh2 ( f )( x).

b) Existe o limite finito limh→0 oh( f )( x), para qualquer ponto x e função f local-mente limitada.

2.26. Mostre que f : (0,∞) → R, f ( x) = 1 x é localmente limitada, mas determine os

pontos para os quais oh( f )( x) = ∞.

2.27. Sejam K = [ 12 ,2]

∪3 ⊂

R, a função identidade f : K →R, f ( z) = z, e h = 2.

Determine os seguintes limites laterais lim x↑1−oh f ( x) = 3

2 , e lim x↓1+

oh f ( x) = 2 ; conclua

que a função oh f ( x) não é contínua (o problema é a geometria do domínio !).

Apesar do aspecto negativo do exercício acima, podemos verificar que a opera-ção funcional oh preserva a continuidade da função f quando o domínio da funçãotem uma “geometria contínua”, por exemplo, no caso de bolas em Rn como com-prova o seguinte teorema :

Teorema 2.11 (Continuidade da h-oscilação de uma função contínua em Rn). A

operação funcional oh : C 0 B(0,r ), M

→ C 0( B(0,r ),R+) , é bem definida e contí-

nua considerando a métrica d ∞ (uniforme) em ambos os espaços.

Prova. Inicialmente mostremos que se f ∈C 0(K , M ), onde K = B(0, r ) ⊂Rn, então,de fato, oh( f ) ∈ C 0(K ,R+). Para isto consideremos um ponto x0 ∈ B(0, r ) e uma

Page 67: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 67/371

2.3 Teoria de Arzelá-Ascoli : Caracterização de Compactos em (C 0(K , M ),d ∞). 61

pequena perturbação x0 + δ , δ < h, deste ponto. Observemos que, pela pró- pria geometria das bolas de Rn, os pontos de B( x0 + δ , h) podem ser aproxima-dos a uma distância δ por pontos da bola B( x0, h). Considerando que a função f é uniformemente contínua em K = B(0, r ), é fácil ver que todos os valores de

d ( f (ξ ), f (η)) para ξ ,η ∈ B( x0 + δ , h) podem ser uniformemente estimados porvalores d ( f (α ), f (β )) com α ,β ∈ B( x0,h) por triangulação apropriada. Com istopodemos concluir pela continuidade da função oh( f ) em qualquer ponto x0 ∈Rn.

Para determinarmos a continuidade da operação funcional, utilizaremos as se-guintes triangulações para ξ ,η ∈ B( x,h) :

d ( f (ξ ), f (η)) ≤ d ( f (ξ ), g(ξ )) + d (g(ξ ),g(η)) + d (g(η), f (η))≤ 2d ∞( f , g) + oh(g)( x)

de onde, obtemos oh( f )( x) ≤ 2d ∞( f ,g) + oh(g)( x), e vice-versa, e, finalmente,|oh( f )( x) −oh(g)( x)| ≤ 2d ∞( f ,g), demonstrando assim o resultado desejado.

Observação 2.12. Para a demonstração do teorema acima utilizamos de forma cru-cial a “continuidade” e a geometria do domínio das funções, em Rn ; a demonstraçãonão se estende para domínios compactos gerais. Na verdade, este não é um defeitodo método mas da continuidade da geometria do domínio. Para constatarmos isto,utilizamos um exemplo simples já apresentado anteriormente, em que o domínio écompacto K = [ 1

2 ,2]∪3 ⊂R, h = 2, e os limites laterais em x = 1 da “inofensiva”função identidade : f : K →R, f ( z) = z são distintos!

Este exemplo nos indica uma maneira de analisar a “fractalidade” de umconjunto K por intermédio da determinação de quão pequenos devem ser os valoresde h > 0, para que as funções f ∈ C 0(K ,R) tenham sua continuidade preservadapela operação oh, ou, se nunca isto ocorrerá!

Estas observações nos levam a encarar a operação funcional oh como uma espé-

cie de “microscópio”, com uma lente de focalização regulada pelo parâmetro h > 0,através do qual podemos analisar as “irregularidades” nos domínios das funções edas próprias funções, em escalas cada vez menores.

A análise, ou um arremedo do cálculo diferencial, para funções definidas emdomínios “ fractalizados” (sejam subconjuntos do Rn ou qualquer outro habitat)onde não estão disponíveis vizinhanças contínuas internas para que os limites usuaissejam efetuados, pode, em alguns casos, apelar para este tipo de argumentação sub-stitutiva (v. notas de Stephen Semmes online : http ://front.math.ucdavis.edu/author/ S.Semmes, a respeito deste assunto e muito mais).

Exercício :

2.28. Determine o valor h0 > 0 a partir do qual (isto é, para 0 < h < h0) a funçãooh f é contínua para qualquer f ∈ C 0(K ,R), K = [ 12 , 2] ∪ 3, ou ainda, para que

oh ∈C 0C 0(K ,R),C 0(K ,R)

.

Page 68: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 68/371

62 2 Espaços Métricos Funcionais

Com isto, voltemos à caracterização da idéia de oscilação como um conceito lo-cal. Baseados em propriedades verificadas acima podemos então, consistentemente,enunciar a seguinte definição :

Definição 2.13 (Oscilação Local de uma Função oloc

( f )( x) = [ f ( x)] - Resíduo deoscilação).Para as funções f : M 1 → M 2 localmente limitadas entre dois espaços métricos,definiremos uma Operação Funcional oloc : Bloc ( M 1, M 2) → Bloc ( M 1,R+) chamadaoscilação local de f, a ser denotada por oloc ( f ) , (ou, às vezes por [ f ]), à nova função definida ponto a ponto por :

limh−→0

oh( f )( x) = oloc ( f )( x) = [ f ]( x).

Exercício :

2.29. Mostre que a definição acima é consistente.

O conceito de oscilação é fortemente ligado à definição de continuidade segundoCauchy pois enfatiza a idéia de estabilidade dos valores de f ( x) e o resultado abaixoé útil para entendermos melhor ambos os conceitos.

Teorema 2.14 (Continuidade ≈ Resíduo Nulo de Oscilação).Uma função f : M → S entre dois espaços métricos é contínua em um ponto x see somente se o)loc( f )( x) = [ f ]( x) = 0 , ou seja, quando não há resíduo local deoscilação.

Prova. Exercício.

Após obtermos uma certa familiaridade com o conceito geral de oscilação, vol-

temos à operação funcional h-Oscilação em vizinhanças finitas.

Definição 2.15 (h-Oscilação Máxima Oh : B(S , M ) → R+). Dados dois espaços métricos, S e M , e qualquer h > 0 , definiremos a seguinte ope-ração funcional com valores reais, Oh : B(S , M ) → R+ , da seguinte maneira :

Oh( f ) = supoh( f )( x), x ∈ S = sup x∈S

oh( f )( x)

que é o supremo das oscilações de f em vizinhanças B( x, h) em todo o S.

Este conceito é intimamente ligado ao conceito de continuidade uniforme, comose pode facilmente perceber, tal como a oscilação local foi relacionada à continui-dade. Observe que a oscilação máxima Oh é, em geral, distinta da oscilação total em

um conjunto, oS ( f )( x).

Exercício - Oscilação Máxima e Continuiade Uniforme :

Page 69: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 69/371

2.3 Teoria de Arzelá-Ascoli : Caracterização de Compactos em (C 0(K , M ),d ∞). 63

2.30. Mostre que a função Oh é bem definida em B(S , M ). Mostre ainda que f ∈ B(S , M ) é uniformemente contínua se e somente se limh→0 Oh( f ) = 0.

Teorema 2.16. Para cada f ∈ C 0

( B(0, r ), M ) , limh↓0 oh( f ) = 0 , onde o limite se dáno espaço métrico

C 0( B(0, r ), M ),d ∞

, e em particular temos limh↓0 Oh( f ) = 0.

Prova. Fixemos uma função f ∈ C 0( B(0, r ), M ) e consideremos a família de fun-ções contínuas oh( f ) : B(0, r ) → R+, oh( f )( x), para h > 0. Como f é contínua, te-mos que limh↓0 oh( f )( x) = 0, ∀ x ∈ B(0,r ), e o limite é (pontualmente) monotônico.Mas então, o Teorema de Dini nos assegura que o limite é uniforme em B(0,r ), ou

seja, limh↓0

sup x∈K

oh( f )( x)

= 0, e isto significa exatamente que limh↓0 oh( f ) = 0

em

C 0( B(0,r ), M )

, d ∞, ou, que limh↓0 Oh( f ) = 0.

Este resultado é muito específico, uma vez que se refere a conjuntos geome-tricamente restritos e em espaços muito peculiares, as bolas em Rn. Para o desen-volvimento da Teoria de Arzelà-Ascoli, analisaremos a operação “mais grosseira”Oh (h-Oscilação máxima), mas que, por outro lado, nos permite ampliar a classe dedomínios das funções em questão. O resultado abaixo é simples e crucial para estaTeoria.

Teorema 2.17 (Continuidade da Operação Funcional Oh).Consideremos o espaço métrico de funções limitadas com a métrica uniforme( B(S , M ),d ∞) onde S , M são espaços métricos. Então a operação funcional Oh : B(S , M ) → R é contínua. Em particular, Oh ∈C 0(C 0(K , M ),R) se K for compacto,sempre com a métrica uniforme.

Prova. Para isto, basta considerarmos (analogamente ao que foi feito na demons-tração da continuidade da operação oh) as triangulações para ξ ,η ∈ S , d (ξ ,η) < h :

d ( f (ξ ), f (η)) ≤ d ( f (ξ ), g(ξ )) + d (g(ξ ),g(η)) + d (g(η), f (η))≤ 2d ∞( f , g) + Oh(g),

de onde obtemos Oh( f ) ≤ 2d ∞( f ,g) + Oh(g), e vice-versa. Assim, finalmente, |Oh( f )−Oh(g) |≤ 2d ∞( f ,g), demonstrando o resultado desejado. ComoC 0(K , M ) ⊂ B(K , M ) se K for compacto, a afirmação final do teorema segue naturalmente.

Passaremos a abordar agora o cenário específico da Teoria de Arzelà-Ascoli.Consideremos um subconjunto compactoΣ de funções do espaço métrico

C 0(K , M ), d ∞

.

Uma caracterização (isto, é, uma condição necessária, ou, um indício) da compaci-dade de um subconjunto Σ ⊂ C 0(K , M ), d ∞

é resultado imediato da aplicação do

Teorema de Weierstrass : a função Oh atinge um máximo em Σ , ou seja, as oscila-ções máximas são limitadas para qualquer valor de h > 0.

Paraaperfeiçoarmos a descrição de subconjuntos compactos Σ ⊂C 0(K , M ), d ∞,a caracterização clássica de Arzelà-Ascoli introduz os dois conceitos fundamentaispara toda esta teoria :

Page 70: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 70/371

64 2 Espaços Métricos Funcionais

Definição 2.18 (Equilimitação e Equicontinuidade de um conjunto de funções). Dizemos que um conjunto C de funções definidas entre dois espaços métricos S e M é :

1. Equilimitado se existe uma bola B(m,r )

⊂ M tal que f (S )

⊂ B(m, r ) para toda

f ∈ C.2. Equicontínuo se ∀ε > 0 , existe δ > 0 tal que f ( B( x,δ )) ⊂ B( f ( x),ε ) para todo

x ∈ S e toda f ∈ C.

A tradução do conceito de equilimitação da linguagem de Cauchy em termos deoscilações esclarecerá o seu escopo e facilitará a sua utilização.

Exercício :

2.31. Mostre que Equicontinuidade de um conjunto de funções C definidas entredois espaços métricos S e M é equivalente ao limite uniforme limh↓0 Oh( f ) = 0 emC .

Com isto podemos apresentar o primeiro critério da teoria de Arzelà-Ascoli :

Teorema 2.19 (Teorema de Arzelá-Ascoli I : Condição necessária de compaci-dade em

C 0(K , M ),d ∞

).

Seja K um espaço métrico compacto e M um espaço métrico qualquer, e consi-deremos o espaço métrico funcional

C 0(K , M ), d ∞

. Se um conjunto de funções

Σ ⊂ C 0(K , M ) for compacto, então necessariamente Σ será

a) Equilimitado e

b) Equicontínuo, isto é, ∀ε > 0 , existe δ > 0 tal que Oδ ( f ) < ε para qualquer f ∈ Σ .

Prova. Como K e Σ são compactos, podemos utilizar o teorema de Weierstrass duasvezes e concluir que a função ∆ : C 0(K , M ) → R, ∆ ( f ) = sup x∈K

d ( f ( x),m), fixado

um m ∈ M qualquer, é bem definida, contínua e, portanto, limitada, ou seja, Σ éequilimitado.

Consideremos a h-família de funções Oh : C 0(K , M ) → B(K ,R+), d ∞, que sãocontínuas, monotonicamente decrescentes com h ↓ 0. Sendo f ∈ C 0(K , M ) uni-formemente contínuas no compacto K , pelo Teorema de Heine-Borel temos quelimh↓0 Oh( f ) = 0.

Portanto, se Σ for compacto, o Teorema de Dini nos assegura que o limitelimh↓0 Oh( f ) = 0 é uniforme em Σ . Mas isto significa exatamente a equicontinui-dade do conjunto Σ .

O teorema acima nos fornece condições necessárias de compacidade para sub-conjuntos Σ ⊂ C 0(K , M ),d ∞

, baseadas na aplicação do teorema de Weierstrass e

Page 71: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 71/371

2.3 Teoria de Arzelá-Ascoli : Caracterização de Compactos em (C 0(K , M ),d ∞). 65

de Dini para alguns funcionais reais (essencialmente oscilações) definidos neste es-paço. Mas, lembre-se que a caracterização de compacidade por intermédio de umafamília de funções contínuas (teorema recíproco de Weierstrass : “um conjunto é compacto se e somente se todas as funções contínuas são limitadas neste conjun-

to”) inclui todas as funções contínuas. Considerando que utilizamos apenas umaclasse reduzida de funções (funcionais) reais para teste no teorema acima (as osci-lações máximas Oh, h > 0), não é difícil suspeitar que elas sejam insuficientes paratal caracterização.

Por outro lado, atentamos para o fato de que todos os subconjuntos C ⊂ Σ sãoigualmente equicontínuos e equilimitados, e alguns destes podem não ser compac-tos, pois, apenas os subconjuntos fechados de compactos são compactos. Por estemotivo, para que possamos obter um critério necessário e suficiente, definiremos oconceito de pré-compacidade.

Definição 2.20 (Pre-compacidade). Dizemos que um conjunto P de um espaço métrico M é pré-compacto se o seu fechoP for compacto.

Observe que o Teorema de Arzelà-Ascoli I nos garante imediatamente que, seP for um conjunto pré-compacto e P ⊂ C 0(K , M ), então, ele será equicontínuo,pois, sendo P compacto, ele satisfaz à esta propriedade, e, portanto, com muitomais razão, o mesmo acontecerá com P ⊂ P. De certa forma, o conceito de pre-compacidade é tão útil quanto o conceito de compacidade sob o ponto de vista daobtenção de um ponto de acumulação, pois toda sequência em um pré-compactotem uma subsequência convergente no fecho do conjunto. Ainda, qualquer subcon- junto de um conjunto compacto é pré-compacto, pois o seu fecho é um subconjuntofechado de um compacto.

Exercício :

2.32. Demonstre as afirmações acima.

O Teorema completo de Arzelà-Ascoli apresentará uma condição necessária esuficiente para a pré-compacidade, mas é importante observar que, para isto, tantoo domínio quanto o contradomínio das funções neste caso, deverão se restringir aosespaços métricos compactos.

Teorema 2.21 (Teorema de Arzelá-Ascoli II : Condição necessária e suficientepara pré-compacidade em C 0(K 1,K 2), d ∞).Sejam K 1 e K 2 espaços métricos compactos e o espaço métrico funcional

C 0(K 1,K 2),d ∞

.

Então um subconjunto de funções P ⊂ C 0(K 1, K 2) é pré-compacto se e somente se for equicontínuo.

Page 72: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 72/371

66 2 Espaços Métricos Funcionais

Prova. (Necessidade) Se P for pré-compacto, então P é compacto e do Teorema (I)concluimos que P e, portanto, P, é equicontínuo (e além disto, equilimitado).

(Suficiência) Suponhamos que P seja equicontínuo e ( f n) ⊂ P. Devemos entãomostrar que existe uma função g ∈ C 0(K 1, K 2) (não necessariamente de P) e uma

subsequência ( f nk ) que converge para g (na métrica d ∞). A construção de g serápelo método telescópico-diagonal já utilizado. Mas, antes, é interessante ressaltaros argumentos principais da demonstração na forma de dois Lemas que guardamuma importância intrínseca.

Lema 2.22 (Feira Mexicana, ou, Compacto ≈ Separável). Dado um espaço métrico compacto K, existe um conjunto enumerável E = x1, x2,..., xn, ..denso em K , ou seja, todos os pontos de K podem ser aproximados por uma subse-quência de E. Neste caso diz-se que K é separável.

Prova. Para um raio r > 0 fixo, tomemos uma sequência de mexicanos ( xm) e seus“sombreros” B( xm, r ) recursivamente de tal maneira que xm+1 /

∈ ∪0≤

j≤

m B( x j, r ),

ou seja, escolhemos o próximo mexicano de tal maneira que não esteja à som-bra de nenhum dos sombreros ( B( x j, r )) de seus predecessores, enquanto hou-ver !detalhes).

Lema 2.23. Sejam K e M espaços métricos sendo, K compacto e M completo. Se( f n) ⊂ C 0(K , M ) for uma sequência equicontínua de funções que converge pontual-mente em um subconjunto enumerável E = ξk e denso em K, então, ( f n) convergeuniformemente, i.e., na métrica d ∞ , para uma função g ∈ C 0(K , M ).

Prova. Observe inicialmente que C 0(K , M ),d ∞ é completo em decorrência da com-pletitude de M . Dado um ε > 0, pela equicontinuidade da ( f n), existe um δ ε tal que

Oh( f n) ≤ ε , se h ≤ δ ε . Agora, dado o δ ε , existe um número finito mε de elemen-tos ξ1...ξmε tal que ∀ x ∈ K seja possível encontrar um ξi, com 0 ≤ i ≤ mε , tal qued ( x,ξi) < δ ε (princípio dos “sombreros”).

Como ( f n) converge pontualmente nos pontos da sequência (ξk ), existe um N ε tal que se n,k > N ε teremos d ( f n(ξi), f k (ξi)) < ε para todos os i tais que 0 ≤ i ≤ mε .Seja agora um x ∈ K qualquer. Tomando um dos ξi tal que d ( x,ξi) < h e triangu-lando, temos

d ( f n( x), f k ( x)) ≤ d ( f n( x), f n(ξi)) + d ( f n(ξi), f k (ξi)) + d ( f k (ξi), f k ( x))≤ Oh( f n) +ε + Oh( f k ) ≤ 3ε ,

de onde podemos concluir que, para dado ε > 0, existe um N ε (dependente apenasde ε ), tal que se n,k > N ε , então d ( f n( x), f k ( x)) ≤ 3ε , para todos os x ∈ K . Ou seja,a sequência de funções é de Cauchy e, portanto, converge em C 0(K , M ), d ∞. Demonstração final do Teorema de Arzelà-Ascoli II :

Page 73: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 73/371

2.4 Extensõesda Teoria de Arzelá-Ascoli : Convergênciauniformeem Compactos, Teoremas de Montel, Riesz e Kolmogor

Prova. Construiremos uma subsequência de ( f n) que converge pontualmente emum subconjunto enumerável e denso do domínio K 1. Como o espaço de chegada K 2é compacto, ele é também um espaço completo, e assim, pelo Lema 2.23 teremosprovado o Teorema.

Seja então (ξk ) um conjunto enumerável denso em K 1 garantido pelo Lema 2.22.Considere a sequência de elementos de K 2 da forma f n(ξ1) e daí, pela compacidadede K 2, escolha uma subsequência f n j (ξ1) convergente para um y1 ∈ K 2. Como passoseguinte, considere uma subsequencia de f n j (ξ2), digamos, f n j p

(ξ2) que convergepara um y2 ∈ K 2. Não deixe de observar que a sequência f n j p

(ξ1), sendo subsequên-cia de f n j (ξ1), também converge para y1.

Junto com este processo telescópico (ou encaixante), aplicamos o método diago-nal de Cantor nos índices das sub-sub...sequências para construir uma subsequênciade ( f n). Verificamos, após alguma meditação, que ela converge em todos os pontosdo conjunto denso (ξk ) à moda de uma cascata. Com isto, concluímos a demonstra-ção.

Se agora o espaço funcional considerado é do tipo C 0(K ,Rn

), onde K é umcompacto de Rm, então o Teorema Clássico de Arzelà-Ascoli pode ser enunciado daseguinte maneira :

Teorema 2.24 (Teorema de Arzelá-Ascoli III : O Original, desde 1889).Seja K ⊂ Rn , um conjunto compacto. Então, P ⊂ C 0(K , Rm) é um conjunto pré-compacto se, e somente se, for i) Equilimitado e ii) Equicontínuo.

Prova. (⇒) A necessidade é imediata pelo Teorema (I) e pelo Teorema acima, jáque K é compacto.

(⇐) A aplicação do Teorema II a este caso não é possível diretamente umavez que Rm não é compacto. Entretanto, como o conjunto P é equilimitado (aquié que entra esta condição no teorema clássico !), na verdade, podemos considerar

que P ⊂ C 0

(K , B(0, R)) para algum raio R > 0, e daí obtemos as condições para aaplicação da versão abstrata (II) do Teorema.

A Teoria de Arzelà-Ascoli assume variações importantes em contextos dife-rentes sendo uma delas particularmente interessante pelas suas amplas aplicaçõesem teoria de funções analíticas de variável complexa e equações diferenciais, o que justifica a apresentação do próximo tópico.

2.4 Extensões da Teoria de Arzelá-Ascoli : Convergênciauniforme em Compactos, Teoremas de Montel, Riesz eKolmogorov

Em diversas situações, o domínio das funções a serem estudadas não é um com-pacto mas uma região do Rn. Uma região Ω pode ser definida de várias maneiras,

Page 74: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 74/371

68 2 Espaços Métricos Funcionais

mas em todos os casos de interesse aqui será um subconjunto aberto do Rn, conexo(isto é, todo par de pontos do conjunto pode ser conectado por uma linha interna econtínua) e com uma fronteira lisa, isto é, parametrizável localmente por funções deC k

B(0, 1) ⊂Rn−1,Rn

, definidas na bola unitária de Rn−1 (por exemplo, se n = 2,

por curvas emR1

, se n = 3, por superfícies emR2

, e etc., e tão lisa quanto maior foro k de diferenciabilidade). Um exemplo importante desta situação ocorre na teoriaclássica de funções de variável complexa, onde n = 2 e para a qual é difícil encontraruma referência melhor do que : L. Ahlfors, Cop.

Nestes casos não é possível utilizar a métrica d ∞ porque nem todas as funçõescontínuas são limitadas nestes conjuntos. Entretanto, se K for um compacto qual-quer contido na região Ω , K ⊂ Ω , podemos definir a seguinte pseudo-métrica noconjunto C 0(Ω , M ) :

∆K (g,h) = sup x∈K

d (g( x), h( x)),

ou seja, ∆K é uma pseudo-métrica que descreve a convergência uniforme no com- pacto K (porque esta pseudo-métrica não é uma métrica ?).

Mas não estamos interessados em descrever a convergência somente em um de-

terminado compacto, mas em todos, daí, o conceito definido a seguir que já foiutilizado na teoria de aproximação de Dirac-Weierstrass.

Definição 2.25 (Convergência Uniforme em Compactos). Dizemos que (gn) ⊂C 0(Ω , M ) converge para h ∈C 0(Ω , M ) uniformemente em com- pactos se, fixado qualquer compacto K ⊂Ω , a sequência (gn) converge uniforme-mente para h em K.

Exercício :

2.33. Mostre que a sequência (gn) ∈ C 0((0, 1),R), gn( x) = xn, converge uniforme-mente em qualquer compacto K ⊂ (0, 1) para a função nula h = 0, embora não

uniformemente em (0,1).

Para descrevermos este conceito na linguagem de espaços métricos, faremos aconstrução de uma métrica por meio de argumentos muito semelhantes aos utiliza-dos na construção de espaços métricos como produtos cartesianos enumeráveis.

Lembremos inicialmente que os pontos com coordenadas racionais de Rn for-mam um conjunto enumerável, e todas as bolas com centros nestes pontos e raiosracionais também formam um conjunto enumerável. Em outras palavras, o Rn éum espaço separável, pois tem um subconjunto enumerável denso, e é também lo-calmente compacto, pois todos os seus pontos têm sistemas de vizinhanças pré-compactas. As construções abaixo podem ser repetidas em espaços mais gerais quesatisfaçam a estas duas condições, mas o nosso interesse no momento se restringiráaoRn. Pois bem, digamos que enumeramos dentre estas bolas fechadas, todas aque-las contidas em Ω na forma Bi( xi,r i), i ∈N e tomemos a sequência de conjuntos

Page 75: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 75/371

2.4 Extensõesda Teoria de Arzelá-Ascoli : Convergênciauniformeem Compactos, Teoremas de Montel, Riesz e Kolmogor

compactos K m definidos sucessivamente como K m = ∪0≤i≤m Bi, de onde conclui-mos que são encaixantes no seguinte sentido K m ⊂ K m+1 e esgotam o conjunto Ω no sentido de que ∪0≤mK m = Ω .

Exercício :2.34. Mostre que, de fato, K m é uma família encaixante de compactos, K m ⊂K m+1, e esgota o conjunto Ω , isto é, Ω = ∪0≤mK m e, mais ainda, que, dado umcompacto qualquer K ⊂Ω , existe um índice m0 tal que K ⊂ K m0 .

Consideremos agora

d 0(g,h) = ∑0≤m<∞

2−m ∆K m (g,h)

1 +∆K m (g,h).

Exercício :

2.35. Mostre que d 0 é de fato uma métrica em C 0(Ω ,Rn) e que convergência em d 0

é equivalente à convergência uniforme em compactos K ⊂Ω . Sugestão : para cadam0 fixo, e d 0(g,h) pequeno, temos que

∆K m0(g, h)

2≤ ∆K m0

(g, h)

1 +∆K m0(g, h)

≤ 2m0 d 0(g,h),

e convergência é “assunto para pequenas distâncias”. A volta, isto é, que convergên-cia uniforme em compactos implica em convergência em d 0, pode ser feita com omesmo argumento utilizado no estudo da métrica correspondente para produtos car-tesianos ; não se esqueça de “desprezar” o rabo da sequência para poder administrara cabeça.

Aproveitando os conceitos desenvolvidos nesta seção podemos definir ainda al-guns outros espaços métricos de funções reais que terão importância fundamentalna aplicação da Análise Funcional. Apresentaremos os exemplos apenas para fun-ções de uma variável real para simplificar a notação, mas ficará claro que o mesmopode ser feito para funções em Rn.

Consideremos o conjunto de funções C p ((0, 1),R) = “Conjunto das funções p-vezes continuamente diferenciáveis, para1 ≤ p ≤ ∞. Seja agora uma sequência deconjuntos compactos encaixantes K m que esgotam o domínio (0,1). Para cada K mdefinimos uma pseudo-métrica

∆( p)∞,K m (h,g) = sup

x

∈K m,0

≤n

≤ p| h(n)( x) −g(n)( x) |,

que descreve o máximo valor do módulo da diferença entre todas as derivadas deordem ≤ p de h e g no compacto K m.

Page 76: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 76/371

70 2 Espaços Métricos Funcionais

Com isto podemos definir convergência uniforme em compactos das funções ede todas as suas derivadas de ordem ≤ p por meio da métrica :

d ( p)∞ (g,h) = ∑

0≤m<∞

2−m ∆K m (g,h)

1 +∆K m (g,h)

.No espaço métrico

C 0(Ω ⊂Rn, M ), d 0

, o conceito de pré-compacidade tem

um outro nome, introduzido inicialmente para o estudo de funções analíticas :

Definição 2.26 (Famílias Normais).Um subconjunto de funções F ⊂ C 0(Ω ⊂ Rn, M ) é dita uma família normal de funções, se for um conjunto pré-compacto no espaço métrico

C 0(Ω ⊂Rn, M ),d 0

,

isto é, o espaço das funções contínuas com métrica de convergencia uniforme emcompactos.

Com esta linguagem, não é difícil estender a Teoria de Arzelà-Ascoli para estesespaços métricos, o que faremos, a título de exemplificação, apenas para a sua versãoclássica :

Teorema 2.27 (Teorema de Arzelá-Ascoli IV : Pré-compacidade em espaçoscom convergência uniforme em compactos).Um subconjunto F ⊂ C 0(Ω , Rm) , onde Ω ⊂ Rn é uma região, é pré-compacto noespaço métrico

C 0(Ω ,Rm), d 0

se, e somente se, F for i) equicontínuo e ii) equili-

mitado em cada compacto K ⊂Ω .Prova. Teorema de Arzelá-Ascoli clássico.

A Teoria de Arzelà-Ascoli ganha características peculiares e importantes quandotratamos de funções com muito mais estruturas como é o caso das funções analíticas.Neste caso, a fórmula integral de Cauchy nos garante que os valores de uma funçãoanalítica e de suas derivadas em toda uma região circundada por uma curva fechadasimples, são determinados e limitados pelos seus valores sobre esta curva. Portanto,se uma família de funções analíticas é equilimitada em um compacto formado poruma curva fechada simples e seu interior, ela será automaticamente equicontínuaneste compacto. Para isto, basta lembrarmos que f ( z1) = f ( zo) +

L

f (ξ )d ξ , para

qualquer curva interna L que ligue os dois pontos zo e z1, e a desigualdade do valorintermediário :

| f ( z1) − f ( zo) |≤ L

| f (ξ ) | d ξ .

Denotaremos o conjunto das funções holomórficas (complexas analíticas) de-finidas em uma região (aberto e conexo) Ω ⊂ C ≈ R2 por C ω (Ω ), que pode serconsiderado como um subconjunto de C 0(Ω ,C) ≈C 0(Ω ,R2) se interpretarmos osnúmeros complexos (variável e valor), por meio de suas duas componentes reais ;parte real e parte imaginária.

Um fato importante neste contexto é o

Page 77: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 77/371

2.4 Extensõesda Teoria de Arzelá-Ascoli : Convergênciauniformeem Compactos, Teoremas de Montel, Riesz e Kolmogor

Teorema 2.28. C ω (Ω ) é um subconjunto fechado do espaço métricoC 0(Ω ,R2), d 0

,

onde Ω ⊂R2 é uma região, isto é, um conjunto aberto e conexo.

Prova. Exercício. Sugestão : A afirmação “Limite uniforme de funções analíticas

é uma função analítica”, é um teorema clássico da teoria de funções de variávelcomplexa que pode ser facilmente demonstrado com a representação integral deCauchy.

E, finalmente, temos a versão da Teoria de Arzelà-Ascoli para funções analíticas,atribuída ao matemático francês Paul Montel :

Teorema 2.29 (Teorema de Montel : Arzelà-Ascoli Analítico V).Um conjunto F ⊂ C ω (Ω ) , é uma família normal de funções (isto é, F é pré-compacto em

C 0(Ω ,R2),d 0

), se e somente se, F for equilimitada em cada com-

pacto K ⊂Ω .Prova. A equilimitação de funções analíticas em regiões do plano resulta em equi-

continuidade pela teoria de Cauchy e assim, podemos aplicar a teoria clássica deArzelà-Ascoli para cada compacto K ⊂Ω .

Os espaços métricosC 0([0, 1],R),d p

,

d p(g, h) =

1 0

| g(s) −h(s) | p ds)

1 p

, p > 1,

e seus completamentos, especialmente para p = 1 e p = 2, são importantes parao desenvolvimento da Análise Funcional e, portanto, critérios de pré-compacidadenestes espaços são eventualmente úteis.

Há uma grande semelhança entre estes critérios e a Teoria de Arzelà-Ascoli, e

as demonstrações seguem argumentos também semelhantes (funções do tipo Oh),embora utilizem-se de técnicas mais complexas para sua implementação.

Citaremos, sem demonstração, dois teoremas principais da área para que a(o)leitora(or) possa apreciar estes comentários.

Teorema 2.30 (Teorema de Marcel Riesz (~1933)).Um conjunto P ⊂ C 0([0,1],R) é pré-compacto no espaço

C 0([0,1],R, d p)

se, e

somente se, for i) equilimitado, e ii) equicontínuo (no sentido de que a funçãoOh( f ) = d p( f h, f ) , onde f h( x) = f ( x + h) , tem limite limh↓0 Oh( f ) = 0 uniformeem P).

Teorema 2.31 (Teorema de A. N. Kolmogorov (~1934)).

Um conjunto P ⊂ C 0([0, 1],R) , é pré-compacto no espaço C 0([0,1],R), d p se, esomente se, for i) Equilimitado e, ii) Equicontínuo (no sentido de que, Oh( f ) =d p( f h, f ) tem limite uniforme limh↓0 Oh( f ) = 0 , em P, onde

Page 78: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 78/371

72 2 Espaços Métricos Funcionais

f h( x) = 1h

0≤|ξ |≤h

f (ξ + x)d ξ

é a média de Steklov).

É fácil notar como os enunciados acima seguem conceitos em paralelos perfei-tos ao enunciado clássico da Teoria de Arzelà-Ascoli, e pode-se suspeitar que asdemonstrações também empregarão técnicas inspiradas na mesma. Consulte paraisto a referencia abaixo, que além de ser clássica na literatura matemática, tem ori-gem de grande autoridade conferida pelo seu primeiro autor, em especial :

L. V. Kantorovich, G.P. Akilov, Functional Analysis in Normed Spaces,capítulo IX, Pergamon, 1964.

2.5 Apêndice

2.5.1 Integral de Riemann Multidimensional

Exercícios : Definição de Integral Iterada de Riemann em R2 por completa-mentos

2.36. Considere as funções escada (E [0, 1], M ),onde M =C 0([0,1],R), d ∞

. Mostre

que podemos considerar os elementos f ∈ E ([0, 1], M ) como funções de duas variá-veis reais e valores reais ϕ (t , x) onde para cada t ∈ [0,1], temos uma função contí-nua, ϕ t ∈ M = C 0([0,1],R) da variável x definida por ϕ t ( x) = ϕ (t , x). Interpretecuidadosamente este exemplo e a operação integral acima definida, agora para nestecaso.

2.37. Considere o espaço métrico de funções contínuas de duas variáveis, defini-

das no cubo unitário do plano : C 0([0, 1] × [0, 1],R),d ∞ e reinterprete este espaçocomo

C 0 ([0, 1], M ) , d ∞

, onde

M = C 0([0,1],R),d ∞

. Mostre que esta identifi-

cação natural, já mencionada em exercício anterior, é uma bijeção contínua. Comisto, defina um conceito de Integral de Riemann

[0,1]2ϕ ( x, y)dxdy. Obviamente, este

procedimento pode ser repetido para integrais de funções contínuas em qualquerhipercubo de Rn.

2.38. Considere agora o espaço métrico das funções contínuas definidas em um sub-conjunto compacto K ⊂R2 com a métrica uniforme,

C 0(K ,R),d ∞

. Sendo K com-

pacto, podemos supor que K ⊂ [− M , M ]2 para algum M suficientemente grande.Mostre que podemos identificar as funções ϕ ( x, y) deste espaço métrico a funçõesϕ y( x) de um subespaço das funções C 0([

− M , M ],E ), d ∞, − M

≤ y

≤ M , onde

(E = E ([− M , M ],R) ,d ∞). Com isto, defina a integral de Riemann K ϕ ( x, y)dxdy

para ϕ ∈C 0(K ,R).

Page 79: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 79/371

2.5 Apêndice 73

Naturalmente, um argumento mais próximo daquele empregado para a defini-ção de integrais de uma variável, pode também ser utilizado considerando funçõesescada com domínio em duas (ou mais) dimensões

E [0, 1]2;R= f : [0,1]

×[0,1]

→ R ; f constante em cada [ xk , xk +1]

×[ y j, y j+1],

para uma escolha x0 = 0 < x1 < ... < xn = 1, 0 = y0 < y1 < ..... < ym = 1.

com a métrica uniforme d ∞.Seguindo o mesmo procedimento acima, define-se a integral Arquimediana

como operação funcional neste espaço métrico, que pode ser estendida ao espaço

completado E ([0,1]2,R)d ∞

= R

[0,1]2,R

. Este espaço contêm as funções contí-nuas, em particular, e muito mais. Todavia, devido ao contexto geométrico, aqui nãoé tão fácil caracterizar as funções reguladas (ou “Riemann-Integráveis”) de maneiratão simples como no caso unidimensional. De qualquer forma, o fato de pertencer aeste espaço já é uma suficiente caracterização matemática !

2.5.2 Weierstrass-Dirac Multidimensional

Consideremos então como domínio um conjunto compacto K ⊂Rn para o qualconstruimos uma função contínua, definida em todo o Rn que possa “distingui-lo”da seguinte maneira : definimos∆( x) = 1

1+d ( x,K ) , contínua, observando que∆( x) = 1

se x ∈ K e ∆ (( x) < 1 , se x /∈ K .Se agora tomamos uma função “rampa” ψ r (ξ ) = 0, para ξ ≤ −r ,e ψ r (ξ ) = 1

para ξ ≥ 0, podemos construir uma função contínua χ r ( x) = ψ r (∆( x)), que “distin-gue” o conjunto K continuamente dentro de uma borda de distância r , isto é,

χ r ( x) ≥ 0, χ r ( x) = 1, se x ∈ K , χ r ( x) = 0, se d ( x, K ) > r .

Com isto podemos estender qualquer função h ∈C 0(K ,R) para qualquer conjuntoaberto que contenha K : basta tomar h( x) = h( x)

× χ

r ( x) = h( x), se x

∈ K , e

h( x) = χ r ( x), se x /∈ K .Considere agora uma função f ∈ C 00(Rn, R), com supp f ⊂ K , e K ⊂ (−a,a)n.

Se estendemos a função f para o (cubo) aberto (−a, a)n, podemos então efetuar aconvolução com δ k ( x) = c−n

k (1− x2)k , (onde x = ( x1,........ xn) e x2 =∑ x2i ), obtendo

funções aproximantes f k ( x) =a

−a f (ξ )δ k ( x−ξ )d ξ que são obviamente polinômios

em x1,..., xn e convergem uniformemente para a função f em K .O Teorema de Weierstrass também é válido para funções contínuas definidas em

compactos de Rn e com valores em Rm :

Exercício :

2.39. Considere um conjunto aberto U ⊂Rn limitado. Mostre que

Pol(U ,R) = funções polinomiais definidas emU e valores reais ⊂ B(U,R) = funções reais definidas em U e limitadas,

Page 80: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 80/371

74 2 Espaços Métricos Funcionais

e que C 00 (U ,R) ⊂ Pol(U ,R)d ∞

.

Teorema 2.32 (Teorema de Weierstrass em Rn).

Se K for um compacto de Rn , então Pol(K ,Rm)d ∞ = C 0(K ,Rm) , ou seja, qualquer função contínua definida em um compacto de Rn e com valores em Rm pode ser uniformemente aproximada por funções cujas coordenadas são funções polinomiaisde n variáveis.

Prova. Basta repetir o argumento acima coordenada a coordenada da função a seraproximada e construir uma função vetorial com os polinomios obtidos.

2.5.3 Teoria de Weierstrass-Dirac Diferencial

As sequências de Dirac podem produzir funções continuamente diferenciais f n = δ n

∗ f que aproximam uma função continuamente diferencial f na métrica

d k ,∞ (ou seja, uniformemente em compactos para todas as derivadas até ordem k )ou uma função contínua na métrica d 0,∞ = d ∞. O teorema abaixo exemplifica umadestas possibilidades :

Teorema 2.33 (Teorema de Weierstrass-Dirac Diferenciável).Suponha que f ∈ C 0 B(R,R) (funções contínuas e limitadas) e que f ( j) ∈ C 0 B(R,R) para 0 ≤ j ≤ k. Então se δ n ∈ C k (R,R+) for uma sequência de Dirac k vezes conti-nuamente diferenciável, f n = δ n ∗ f converge para f na métrica d 0k ,∞ (uniformementeem compactos para todas as derivadas até ordem k).

Prova. Inicialmente mostremos que as funções

f n( x) = δ n∗

f ( x) =

−∞ f (s)δ n(s

− x)ds

são, de fato, diferenciáveis. Para isto, consideremos as integrais finitas

f n, L( x) =

L − L

f (s)δ n(s− x)ds

que podem ser derivadas parametricamente (v. R. Courant, Cálculo Diferencial e Integral, vol. 1, Ed. Globo, P. Alegre 1958), de onde vem :

d dx

L −

L

f (s)δ n(s− x)ds = d dx

− x+ L −

x

− L

f (η+ x)δ n(η)d η

=− x+ L

− x− L

f /(η+ x)δ n(η)d η+ [ f (η+ x)δ n(η)]− x+ L− x− L .

Page 81: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 81/371

2.5 Apêndice 75

Assim, podemos verificar que os limites uniformes em compactos de f n, L( x) e f n, L( x) existem, de onde concluímos (v. Courant) que o limite da derivada é a deri-vada do limite, ou seja podemos derivar as integrais impróprias parametricamente;enfim, D f n( x) = δ n ∗ D f ( x).

O teorema de Dirac-Weierstrass I garante então a convergencia uniforme emcompactos de D f n( x) = δ n ∗ D f ( x) → D f assim como f n = δ n ∗ f → f . A conclusãodo teorema segue.

2.5.4 Apêndice Topológico

1-Teorema de Heine Borel - Caracterização topológica de Compacidade2-Teorema de Baire - Caracterização Topológica de Completude.3-Existência de “muitas ” Funções não diferenciáveis - Aplicação do Teorema

de Baire4-Teorema de M.Riesz - Versão infantil.5-Demonstrar o teorema clássico de Arzelà-Ascoli utilizando a caracterização

funcional (recíproca de Weierstrass) para compacidade, isto é, “se todas as funções

contínuas são limitadas, então o domínio é compacto”.

2.5.5 Exercícios

2.40. Mostre que o subconjunto C ∞0 ((0, 1),R), das funções infinitamente diferen-ciáveis e com suportes compactos, é denso no espaço métrico

C 0 ((0, 1),R) , d 0

(observe o intervalo aberto). Sugestão : dado ε > 0, segure o “rabo” da sequência damétrica e aproxime a função identicamente no último compacto da “cabeça” usandoas técnicas da regularização.

2.41. Considere C 0([0,1],R e P ⊂ C 1([0, 1],R), tal que, i) P e ii) P1 = f =derivada de f são equilimitados. Mostre que P ⊂ C 1([0,1],R) é pré-compacto.

Sugestão : use o teorema do valor médio. (Esta afirmação pode ser repetida para

funções com domínio em Rn e valores em Rm com pequenas adaptações).2.42. Com base nos argumentos do exercício anterior, enuncie e demonstre um

“Teorema de Arzelà-Ascoli ” em espaços

C p ((0, 1),R) , d ( p)∞

.

2.43. a) Mostre que a função d exp( x, y) = expmax( x, y)− expmin( x, y) é umamétrica em M = R∪−∞, usando as operações no ∞ da forma natural, “semmedo de ser feliz”.

b) Mostre que o espaço métrico ( M ,d exp) é compacto.

2.44. Usando a continuidade das funções média de Steklov e de Riesz obtenhacondições necessárias para pre-compacidade em L1.

2.45. Como relacionar o Teorema “C ω (Ω ) é um subconjunto fechado do espaço

métrico C 0(Ω ,R2), d 0” com o Teorema de Aproximação de Weierstrass em duasdimensões?

Page 82: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 82/371

Page 83: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 83/371

3

Equações em Espaços Métricos

3.1 Equações em Espaços Métricos : Considerações Gerais

As equações, em geral, têm se constituído historicamente no problema em tornodo qual quase toda a atividade da Matemática (Aplicada, ou não) se concentrou, e,certamente deverá continuar assim em um futuro perceptível. É por intermédio delasque são caracterizados os objetos matemáticos básicos que nos interessam, sejameles números, vetores, funções, ou elementos abstratos de alguma estrutura. Emparticular e, principalmente, as equações (diferenciais e integrais, por exemplo) sãoa forma mais comum e útil para a construção indireta de funções que representamum modelo de Matemática Aplicada.

No contexto de um espaço métrico, onde as únicas operações disponíveis paraa definição de uma equação são representadas por funções no próprio espaço, es-tamos diante de uma situação extremamente genérica para a formulação deste tipode problemas. É extraordinário que apesar deste contexto tão minimalista possamosdesenvolver idéias úteis e algumas das técnicas mais importantes para a solução e

análise de equações, com ênfase especial no famoso método iterativo para contra-ções e o consequente teorema do ponto fixo de Banach-Cacciopoli. Este será o temacentral do presente capítulo, que encerrará a primeira parte do texto como que fe-chando um círculo de ideias relativas aos espaços métricos.

A maior parte dos problemas em equações diferenciais (parciais e ordinárias) eintegrais é formulada como uma equação em um espaço funcional apropriado. Por-tanto, não é surpreendente que os métodos utilizados na resolução destas equaçõesestejam baseados em algumas poucas ideias que variam apenas pelas aparênciasque lhes emprestam os contextos eventuais, podendo assim ser unificadas atravésde uma formulação abstrata e geral, o que oferece uma extraordinária economia de pensamento. A bem da sensatez e da saúde da teoria, entretanto, não devemos per-der de vista a origem e a motivação para estas construções abastratas, o que faremosapresentando amiúde suas relações com diversos problemas da Matemática dentre

aqueles que têm demonstrado as mais férteis interfaces com aplicações exteriores.Comecemos com algumas considerações gerais sobre equações.

Page 84: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 84/371

78 3 Equações em Espaços Métricos

Observamos inicialmente que qualquer equação pode ser formulada como umaigualdade (que não é afirmativa e categórica como no caso de uma fórmula, masindagativa neste caso), e genericamente representada por uma expressão funcional :ϕ ( x) = y. Já que o símbolo matemático (=), neste caso, é uma pergunta, impõe-se

que explicitemos o que é conhecido e o que se deseja saber dentre os três símbolos,ϕ , x e y.Um dos exemplos mais elementares, antigos e importantes de equações ma-

temáticas são as equações polinomiais, ϕ λ ( x) = an xn + ∑0≤k ≤n−1

ak xk = 0, onde

y = 0 é fixo (mas pode variar se considerarmos a equação na forma equivalente xn + ∑

1≤k ≤n−1ak xk = −a0 = y), e a função ϕ λ ∈ Pn(C,C) é caracterizada no caso pelo

vetor de Cn, λ = (a0,...., an), que descreve o conjunto de polinômios, complexos,de grau n. Como aprendemos mais tarde (tanto na escola quanto na história), estasequações podem ser estudadas de maneira mais completa quando os ingredientestêm a liberdade de serem números complexos, ou seja, λ ∈Cn, ak ∈C e ϕ λ : C→C.No problema clássico, procuramos, ou desejamos, obter as soluções x = Φ (λ ) (naverdade, x = Φ (ϕ λ )) que N. H. Abel (18..-18...) mostrou serem impossíveis de se

expressar em termos elementares, em geral, mas que Gauss mostrou sempre existi-rem se considerarmos que a incógnita x pode ser um número complexo e admitirmosque Φ possa ser uma função multivalente (n-valente), que Riemann mais tarde tor-nou univalente com a invenção das superfícies de Riemann, ou seja, com a mudançado dominio. Veja, por exemplo o caso da solução de z2 + y = 0, em L. Ahlfors, Com- plex Analysis, A. Wesley, 1957, ou em R. Courant, Calculo Diferencial e Integral,vol. 2, Ed. Globo, 1958.

Voltemos ao caso geral. Se os ingredientes conhecidos são a função ϕ e o ele-mento x, o problema consistem em determinar y. Ora, mas então temos aí simples-mente um problema direto, que se resolve calculando a função no ponto x e, a menosda dificuldade operacional (i.e., computacional) que isto pode representar, na ver-dade, não há maior interesse neste caso para a presente abordagem. O problemageral que mais nos interessa aqui, são situações inversas. Por exemplo, se ϕ e y sãoconhecidos e o x (como no dito popular) representa “a questão”. Então, comparadocom o caso anterior, podemos dizer que este é o problema inverso, comumente tam-bém chamado de problema de reconstrução de x, dados y e ϕ . Neste caso, diremosque x é a incógnita, enquanto ϕ e y são os parâmetros (ou dados) do problema. Anomenclatura matemática, dependendo da área, às vezes encara ϕ como um parâ-metro constitutivo do problema, que teria um sentido mais “permanente” do que y,que é visto como um dado (eventual). Mas, de fato, ambos são parâmetros e sobo ponto de vista matemático, o objetivo é sempre estudar a possibilidade de obter x em termos dos “parâmetros” ϕ e y restritos a conjuntos interessantes. Veja, porexemplo, que nas equações clássicas polinomiais, o fixo é o y = 0, e o parâmetro éexatamente a função polinomial, representada pelos seus coeficientes.

Existe ainda uma terceira possibilidade, que é também classificada de problema

inverso, muito importante na formulação de modelos matemáticos, e que consisteem considerar dados x e y (na verdade, vários deles) e encarar ϕ como sendo aincógnita do problema ; neste caso diz-se que é um problema de identificação do

Page 85: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 85/371

3.1 Equações em Espaços Métricos : Considerações Gerais 79

modelo. Obviamente, nem sempre este problema terá solução, e muito menos so-lução única. Os exemplos clássicos e mais simples desta classe de problemas sãoa interpolação e a regressão linear. Se, como na equação polinomial, restringirmoso espaço onde buscar ϕ ao espaço de polinômios, e apresentarmos como dados do

problema o conjunto de números ( xk , yk )0≤k ≤n, onde xk são n+1 pontos distintos,obteremos exatamente um polinomio do espaço Pn(C,C) de grau ≤ n, mas multi-plos deles de grau > n. Por outro lado, se o espaço das soluções puder ser o (enorme)conjunto das funções contínuas, a multiplicidade das soluções é não apenas infinita,mas não-enumerável.

Em engenharia, principalmente, é comum dizer-se que os dados do problemasãoa entrada (“input”) e a incógnita a saída (“output”), uma nomenclatura sugestivaquando se pensa em uma “caixa preta”, mas que não utilizaremos aqui.

Voltemos mais uma vez ao cenário geral do problema estabelecido pela equaçãogenérica ϕ ( x) = y, onde x ∈ M 1 é a incógnita, e y ∈ M 2 ( M 1 e M 2 espaços métricos)e ϕ ∈Λ (Λ um subconjunto metrizado das funções f : M 1 → M 2) são os dados.Este problema envolve pelo menos as seguintes questões :

1. Sobre a existência de soluções,

2. Sobre a multiplicidade das soluções, em particular, a unicidade,

3. Sobre a estabilidade das soluções, isto é, sobre a continuidade de uma solução x com respeito aos parâmetros (dados) ϕ e y, e finalmente,

4. Sobre os métodos de construção das soluções.

Estas questões, tal como o prolema em si, são indagações muito genéricas, masmesmo assim oportunas e cruciais.

Em linguagem funcional, as duas primeiras questões podem ser re-escritas res-pectivamente nas seguintes formas equivalentes :

1. A existência de uma função inversa à direita (ϕ φ = id em M 2, φ ( y) = x, pois,ϕ (φ ( y)) = y), é equivalente à sobrejetividade da função ϕ , ou seja, a equaçãoϕ ( x) = y, x incognita, sempre tem solução.

2. A existência de uma função inversa à esquerda (ψ ϕ = i = identidade em M 1,ϕ ( x) = y, e daí ψ (ϕ ( x)) = x = ψ ( y)), é equivalente à injetividade da função ϕ ,ou seja, a equação ϕ ( x) = y, x incógnita, admite no máximo uma solução.

Portanto, a questão de existência e unicidade de soluções x para a equação y =ϕ ( x) equivale à existência de uma inversa ϕ −1 : M 2 → M 1.

Exercício :

3.1. Verifique com cuidado as três equivalências acima mencionadas.

A unicidade de soluções nem sempre é estudada de forma global, pois isto res-

tringe muito a questão ; frequentemente interessa saber apenas o aspecto local. For-malmente, a unicidade local de uma solução se define da seguinte maneira :

Page 86: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 86/371

80 3 Equações em Espaços Métricos

Definição 3.1 (Unicidade local da solução). Diz-se que uma solução x0 do problema y = ϕ ( x) é uma solução local se existe umavizinhança de x0 (uma bola B( x0,r ) , r > 0) onde este problema tem solução única : x = x0.

Uma exemplificação simples deste conceito é a própria equação de segundo grau z2 = 1 definida por ϕ :C→C, ϕ ( z) = z2, cuja solução apresenta uma multiplicidadeglobal igual a 2 ( z1 = i e z2 = −i) mas, obviamente, apresenta duas soluções locais.Na verdade, qualquer solução de equações polinomiais, como são em número finito,são soluções locais. Já, o problema linear Av− λ v = 0, definido pela função ϕ :R×Rn → Rn, ϕ (λ ,v) = Av−λ v, onde A é uma matriz simétrica n × n, tem umamultiplicidade não-enumerável de soluções (λ k , v) para alguns valores isolados deλ , e estas soluções não são locais em R×Rn. Por outro lado, a solução x0 = 0 paraa equação ϕ ( x) = 0, onde ϕ ∈ C 0(R,R), ϕ (0) = 0 e ϕ ( x) = x sen

1 x

se x = 0,

não tem unicidade local, enquanto que qualquer outra da forma xn = 12π n , é solução

localmente única (verifique).A multiplicidade (ou seja, a quantidade numérica) de soluções de uma determi-

nada equação é uma questão importante especialmente quando ela apresenta saltosbruscos (já que esta quantidade, em geral, apresenta valores inteiros) em resposta àvariação dos parâmetros constitutivos, ocorrendo, por exemplo, a perda de existên-cia (zero soluções !), a perda da unicidade (múltiplas soluções). Quando a multipici-dade de soluções de um problema (isto é, a cardinalidade do conjunto de soluções)varia em N∗ = N∪ ∞ = 0, 1, 2,...,∞, denominamos esta função de índice dasolução.

O estudo da variação da multiplicidade de soluções e suas consequências é umaárea de desenvolvimento contemporâneo da Matemática Aplicada com um enormeleque de ramificações importantes, envolvendo a teoria de bifurcação e aspectos das(famosas) teorias da catástrofe, caos, dentre outras que não serão tratadas especifi-camente neste texto (v. S. Strogatz, Nonlinear Dynamics, Addison-Wesley, 1994 ;Yu. Kuznetsov, Bifurcation Theory, Springer-Verlag ; e J. B. Keller, Perturbation

Methods, Notas LNCC, Rio, 1985).As questões sobre existência e unicidade (ou multiplicidade) de soluções não es-gotam a questão geral quando ela é tratada em conjuntos com estruturas de conver-gência, espaços métricos, por exemplo, como é do presente interesse. Na verdade,em Matemática, e especialmente em suas aplicações mais relevantes, a inversão purae simples de uma operação funcional tem poucas utilidades, em particular porque osdados paramétricos de um problema nunca são exatos em um modelo matemático.Portanto, é também necessário investigar questões sobre a variação das soluçõescom respeito aos dados do problema. Um resultado interessante, mas ainda longe doque realmente em geral se requer, foi dado pelo Teorema de Tikhonov do primeirocapítulo. A estabilidade de x com respeito à y ∈ M 2, fixado o parâmetro constitutivofucional ϕ , equivale à continuidade de ϕ −1, enquanto que a estabilidade com re-speito à ϕ , equivale à continuidade da operação inversão em um espaço de funções

Λ (espaço dos parâmetros constitutivos).Observe que sob o ponto de vista adotado acima, o foco da questão de esta-bilidade se desvia dos espaços M 1, onde se encontra a incógnita, e M 2, onde está

Page 87: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 87/371

3.1 Equações em Espaços Métricos : Considerações Gerais 81

o parâmetro y, e é ampliado para abranger também, e principalmente, o estudodas operações, em um espaço (admissível) Λ onde deve se situar a operação ϕ λ que determina a parte constitutiva da equação. Esta atitude de “coisificação” deprocedimentos matemáticos é uma característica típica que surgiu com a Matemá-

tica contemporânea, desde o fiinal do século XIX, e transformou, sucessivamente,conjuntos, funções, sistemas de equações (arranjos de coeficientes, matrizes) e ope-radores diferenciais em objetos matemáticos, tão legítimos reais e concretos quantoos números. Diz-se nestes casos que a abordagem é operacional, ou funcional, e aAnálise Funcional em grande parte se refere exatamente a questões relacionadas aestes objetos matemáticos.

O teorema de estabilidade de Tikhonov não pode ser estendido com respeito àperturbação do parâmetro constitutivo ϕ se este tiver a liberdade de variar em um es-paço tão grande e/ou tão livremente quanto em

C 0(K 1, K 2), d ∞

. Isto, porque uma

pequena perturbação em ϕ neste espaço de funções pode destruir completamentetanto a injetividade quanto a sobrejetividade. Em outras palavras, os subconjuntosdas funções inversíveis, B, e sobrejetoras, Σ de C 0(K 1, K 2) são grandes, mas não for-mam, em geral, conjuntos abertos no espaço C 0(K 1, K 2), d ∞ (v. exercício abaixo).

Exercícios :

3.2. Mostre que a função identidade id : [0,1] → [0,1] pode ser uniformementeaproximada por funções contínuas não sobrejetoras (mas injetoras) ϕ n = (1− 1

n ) id .

3.3. Mostre que a função identidade id : S 1 → S 1 (em que S 1 é o círculo unitáriono plano identificado ao intervalo [0, 2π ] por intermédio do mapeamento θ ↔ eiθ ,onde, claro, as extremidades do intervalo são identificadas) pode ser uniformementeaproximada por funções contínuas sobrejetoras mas não injetoras, ϕ n(θ ) = ei( n

n−1 )θ ,para [0, 2π ( n−1

n )], e ϕ n(θ ) = 1, para θ ∈ [2π ( n−1n ), 2π ]. Observe como a topologia

do domínio das funções é importante para este tipo de questão !

Frequentemente, a variação do parâmetro constitutivo funcional ϕ é descritapor intermédio de um parâmetro λ que percorre um espaço métrico, Λ , como porexemplo no caso das equações polinomiais apresentadas acima.

Assim, em geral, a variação constitutiva (funcional) da equação pode ser descritapor intermédio de uma função ϕ : M 1 ×Λ → M 2, onde Λ , M 1 e M 2 são espaçosmétricos, e Λ é o espaço do parâmetro constitutivo, λ ∈ Λ . Com isto, a equaçãopode ser escrita nas formas ϕ ( x,λ ) = y, ou, ϕ λ ( x) = y, e, a solução, se existir, podeser representada como uma função de duas variáveis x(λ , y), enfatizando assim oaspecto paramétrico constitutivo da variável λ ∈ Λ , que pode ser funcional, poisnada foi exigido do espaço Λ . A questão de estabilidade para uma solução se situaportanto neste espaço métricoΛ . A sua escolha (conjunto e métrica) é essencial paraa caracterização do que se quer descrever como “pequenas” variações de ϕ λ . Muitaliberdade para perturbação do parâmetro λ proporcionada ou pelo “tamanho” do

espaço métrico admissível de funções ϕ λ , ou pela “fraqueza” da métrica (isto é, pelapouca exigência na atribuição de convergência em Λ ), pode levar à instabilidade dasolução com respeito a variações dos parâmetros nestes espaços.

Page 88: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 88/371

82 3 Equações em Espaços Métricos

Quando a solução (única) de uma equação é instável com relação à variaçãode parâmetros em um determinado espaço métrico, diz-se que o problema é “malposto” (com relação a tal espaço, ou métrica). O estudo dos métodos para a escolhamatematicamente adequada e significativa de espaços de parâmetros (e soluções)

que “recupere” a estabilidade das soluções é uma área de grande importância naMatemática Aplicada contemporânea, denominada “regularização” de problemasmal-postos. Esta teoria foi iniciada por Andrei N. Tikhonov na década de 1940/50a partir de questões práticas de grande relevância e urgencia à época, e o seu livroainda é uma referencia importante para a assunto : A. N. Tikhonov, V. Arsénine, Mé-thodes de Résolution de Problèmes Mal Posés, Ed. MIR, 1976. Para uma referênciamais próxima no tempo e no espaço, consulte o excelente J. Baumeister, AntonioLeitão, Topics in Inverse Problems, 25o Col. Bras. Mat., IMPA, 2005, online, 200pg). Este tópico voltará a ser abordado em todas as situações em que tratarmos deequações funcionais, o que ocorrerá frequentemente daqui por diante.

A abordagem da questão construtiva (4.) é comumente feita, genericamente fa-lando, por intermédio de quatro tipos de procedimentos :

4a. Métodos Iterativos : Frequentemente, uma equação pode ser reformulada demaneira a ser interpretada como a busca de um ponto fixo para uma função comdomínio e valores em um mesmo espaço, ϕ : M → M , ou seja, onde a incó-gnita x ∈ M é caracterizada pela equação ϕ ( x) = x. Por exemplo, uma equaçãoalgébrica que indaga sobre as raízes de um polinômio, p( x) = ∑

0≤k ≤mak xk = 0,

pode ser simplesmente re-escrita na forma de um problema de ponto fixo daseguinte maneira quase trivial : p( x) + x = ϕ ( x) = x. É notável como que, parauma variedade enorme de problemas abstratos desta natureza, a composição su-cessiva ϕ n = ϕ .....ϕ da única operação disponível no contexto pode resultarem um algoritmo recursivo para a obtenção de sua solução. A aplicação desteprocedimento em situações onde mais estruturas estão disponíveis, e suas múl-tiplas generalizações, continuam sendo ainda fontes de importantes resultadosem matemática que envolvem nomes singulares como os métodos de “New-

ton”, Teorema de Birkhoff-Banach-Cacciopoli, Teorema KAM (Kolmogorov-Arnold-Moser) e etc.

4b. Métodos de perturbação : O procedimento geral destes métodos é substituir aequação original (“difícil”) ϕ ( x) = x por uma equação “aproximada” no sen-tido de que, ao invez de ϕ , toma-se uma operação ϕ ε próxima de ϕ (no espaçoadmissível S ), cuja equação correspondente ϕ ε ( x) = xε seja facilmente solú-vel. O resto consiste em “esperar” que a solução xε do problema aproximadoϕ ε ( x) = xε seja próxima da solução x do problema original ϕ ( x) = x. Isto, nãosignifica necessariamente que a inversão da função ϕ tenha que ser uma opera-ção contínua ou mesmo que possa ser efetuada, o que generaliza o alcance dométodo. Uma outra forma, oposta, de encarar este método é recolher de início asfunções ϕ 0 para as quais o problema tem soluções conhecidas e posteriormente

analisar as “proximidades” ϕ ε de ϕ 0 com o objetivo de descrever as suas solu-ções por meio das soluções do problema original, aumentando assim a classede problemas solúveis, nem que seja de forma aproximada. Estas soluções são

Page 89: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 89/371

3.1 Equações em Espaços Métricos : Considerações Gerais 83

obtidas por métodos iterativos e a aproximação em geral tem um caráter as-sintótico em um sentido que mais tarde será explanado. Embora esta últimaatitude pareça ser “derrotista”, ou “provisória”, na verdade tem um enorme al-cance dentro da Matemática Aplicada, especialmente relacionada aos chamados

métodos assintóticos, e tem a grande vantagem de produzir aproximações analí-ticas. A primeira abordagem é a que mais caracteriza os métodos numéricos ea segunda aqueles que são mais comumente denominados de perturbação, massem exclusividade em um e outro caso.

4c. Métodos homotópicos, ou de deformação, também podem ser classificadosneste item e consistem em deformar o problema por intermédio da variação deum parâmetro estrutural (constitutivo) até que o problema assuma uma formade “fácil”, ou conhecida, solução e, depois, procurar percorrer o caminho in-verso, recuperando o probema original e, paralelamente, deformando a soluçãoobtida.Veremos exemplos de todas estas situações durante o curso, mas nesta se-ção daremos uma ênfase especial ao método das contrações (ou de Banach-Cacciopoli), que é o protótipo dos métodos iterativos. (Para uma introduçãoelementar a estes assuntos, consulte R. C. Bassanezi e W. C. Ferreira Jr., Equa-ções Diferenciais, Harbra, 1988, cap. 5, ou, em nível mais avançado e menosrigor matemático, mas muito mais pródigo em idéias originais, J. B. Keller,Perturbation Methods, LNCC, Rio, 1985).

4d. Métodos Variacionais : O procedimento geral desta enorme e eficiente classede métodos é caracterizar a solução da equação como o ponto que realiza o mí-nimo para uma função com valores reais definidos no espaço métrico. Uma dasprincipais origens destes métodos, que são várias, está na idéia simples, masextremamente prolífica, inventada por Gauss para ajustar uma função às suasobservações astronômicas, um problema de identificação, que até hoje é ampla-mente utilizado sob vários disfarces, em particular como métodos dos mínimosquadrados (ou de quadrados mínimos), e desenvolvido por Tikhonov no estudo

de problemas mal postos. Esta mesma idéia, Gauss sugeriu que fosse empre-gada como método para a solução do problema de fronteira para o operadordiferencial parcial de Laplace, que veio a se chamar princípio de Dirichlet , nãopor denominação deste, mas pelo respeito e devoção que o seu aluno Riemannlhe devotava (mas esta é outra estória, j á anunciada em outro lugar e a ser de-senrolada mais tarde). Uma exemplificação deste método será apresentada naobtenção do ponto fixo para funções não expansivas.

Exercícios :

3.4. Analise, sob o ponto de vista acima, as questões de existência, local e global,unicidade, o índice das soluções dos problemas abaixo, definido como ind (λ ) =número de soluções v da equação para parâmetro λ , e estabilidade, para a equa-ção ϕ

b( x) = x2 + 2bx = y, onde ϕ

b : R

→ R é o parâmetro funcional no espaço

métrico S = (P2(R,R),d ∞) das funções polinomiais reais de segundo grau (b ∈ R),com a métrica d ∞( p,q) = max

| x|≤1| p( x) −q( x)|.

Page 90: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 90/371

84 3 Equações em Espaços Métricos

3.5. Analise quanto à unicidade, local e global, o índice das soluções dos problemasabaixo, definido como ind (λ )=número de soluções v da equação para parâmetro λ ,e estabilidade das soluções da equação algébrica para x ∈R+ : ϕ r ,q( x) = 0, onde

ϕ r ,q( x) = r 1

− xq−

11+ x2 , ϕ r ,q : R+

→R+. Sugestão : Não tente resolvê-la por

meio de fórmulas algébricas, provavelmente não terá sucesso, e se tiver, não se apro-veitará dele. Analise, qualitativamente, a variação das soluções como interseção dos

gráficos das retas y = r

1− xq

e da curva y = 1

1+ x2 . Considere como espaço de

parâmetros constitutivos o subconjunto de R2, S = (r , q); r > 0, q > 0.

3.6. O problema clássico que produz a variação do índice, ind (λ ), das soluçõesdos problemas abaixo é o problema de autovalores para matrizes. Considere, porexemplo, uma matriz quadrada real e simétrica S , e a equação definida pela fun-ção ϕ : S n−1 ×R→ Rn, ϕ (v,λ ) = Av−λ v = 0 , onde S n−1 =“Esfera unitária em Rn”= x ∈Rn; x = 1. Como se sabe da teoria de matrizes, esta equação somenteadmite soluções para alguns poucos valores “críticos” do parâmetro constitutivo λ (os autovalores da matriz), e neste caso, pode admitir uma solução v (autovetores)

ou, mais. Por outro lado, se considerarmos o problema em ϕ : R

n

×R → Rn

, oproblema terá multiplicidade infinita de soluções (não enumerável) para uma quan-tidade finita de valores “críticos” do parâmetro λ . Analise este tipo de problema sobo ponto de vista apresentado acima.

3.7. Problema de envergamento (“flambagem”) de Euler - Linearizado :Considere o problema clássico de valores laterais (fronteira) para a seguinte

equação diferencial ordinária :

d 2udx2 + qu = 0, u(0) = u(l) = 0,

onde q é constante (isto é, independe da variável x). Reformule o problema adi-mensionalizando a variável independente na forma ξ = x

l , considerando o es-

paço M = C ∞

([0, 1],R), e a equação funcional ϕ (v,λ ) = d 2

d ξ2 + λ v = 0, ondeϕ : M ×Λ → M , Λ = [0,∞) (interprete λ !). Analise este problema com relação àsquestões acima : existência de soluções, unicidade, local e global, multiplicidade eestabilidade.

3.8. Problema de envergamento de Euler - Não linear :Considere o problema clássico de valores laterais (i.e., de fronteira) para a se-

guinte equação diferencial ordinária, que representa o desvio da configuração hori-zontal de uma barra elástica descrito pelo ângulo de flexão u( x), quando submetidaà uma carga longitudinal e engastada nas extremidades :

d 2udx2 + q sen(u) = 0, u(0) = u(l) = 0,

onde q é constante (isto é, independe da variável x). Reformule o problema adi-mensionalizando a variável independente na forma ξ = xl , considerando o es-

paço M = C ∞ ([0,1],R), e a equação funcional ϕ (v,λ ) = d 2vd ξ 2

+ λ sen(v) = 0, onde

Page 91: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 91/371

3.2 Funções compactas & outras notáveis 85

ϕ : M ×Λ → M ,Λ = [0,∞). Analise este problema com relação às questões acima :existencia de soluções, unicidade, a variação do índice, ind (λ ), e estabilidade. Ob-servação e sugestão : O problema linearizado, como em várias situações, faz usoda aproximação sen u ≈ u para pequenos valores de u. Analise as soluções deste

problema pelo método potencial, que pode ser consultado em livros de EquaçõesDiferenciais Ordinárias, por exemplo, R. C. Bassanezi e W. C. Ferreira Jr., Equa-ções Diferenciais, Harbra 1988. Este problema é originário de uma questão clássicade elasticidade que procura determinar a carga máxima longitudinal que uma colunaretangular, ou lâmina„ suporta antes que ocorra o envergamento ou, flambagem. Afunção u( x) mede o ângulo de flexão da barra deformada de comprimento l, engas-tada nas extremidades, u(0) = u(l) = 0. Após um valor bem determinado para oparâmetro constitutivo, relacionado a esta carga e às propriedades elásticas do ma-terial, chamado ponto crítico de bifurcação, ocorre uma multiplicidade de soluções :a barra pode (precariamente por conta da sua instabilidade dinâmica) permanecerreta ou assumir uma dentre duas deformações envergadas (dinamicamente estáveis).Para uma explicação simplificada deste modelo matemático do qual originou a teo-ria matemática de bifurcação e muito mais, consulte a referencia acima ou, para

maiores detalhes, um dos excelentes L. A. Segel, Mathematics Applied to Conti-nuum Mechanics, Dover; B. Lautrup, Physics of the Continua, Inst. of Phys. Press.

Para outras considerações interessantes a respeito do assunto “equações” emgeral, sugerimos ao leitor que consulte o artigo de J. L. Kazdan : Solving Equations : An Elegant Legacy, Am. Math. Monthly, Jan. 1998, p. 1 (também disponível onlinena página do autor) que descreve alguns aspectos do desenvolvimento histórico devárias idéias, teorias e técnicas que resultaram do estudo de equações matemáticasnotáveis.

3.2 Funções compactas & outras notáveis

Para que as equações estudadas possam admitir algum tratamento matemáticointeressante, é necessário restringí-las aos casos em que as funções envolvidas dis-ponham de alguma estrutura, por pouco que ela seja. Nesta e na próxima seção nosocuparemos basicamente de funções compactas, lipschitzianas e contrativas, queserão agora definidas e analisadas quanto às suas propriedades elementares.

Definição 3.2. 1. Se M e E são espaços métricos, dizemos que f : M → E é uma função compacta se, para toda bola B( x, r ) ⊂ M, a sua imagem f ( B( x, r )) é pré-compacta em E (isto é, f ( B( x, r ) é compacto). Dizemos que a fução é lo-calmente compacta se, para qualquer ponto x, existir alguma bola B( x, r ) , talque a sua imagem f ( B( x, r )) é pré-compacta. Observe que não é exigido que a função seja contínua.

2. Dizemos que f é limitada em bolas, (ou, b-limitada), se toda bola de M é levadaem um conjunto limitado, ou seja, se f leva conjuntos limitados em conjuntoslimitados.

Page 92: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 92/371

86 3 Equações em Espaços Métricos

3. Dizemos que uma função ϕ : M → M , é lipschitziana se, ∀ x, y ∈ M, temosque d (ϕ ( x),ϕ ( y)) ≤ L d ( x, y) , onde L é uma constante positiva, chamada deconstante de Lipschitz.

4. Dizemos que uma função é não-expansiva se for lipschtziana com L = 1 , isto é,

se d (ϕ ( x),ϕ ( y)) ≤ d ( x, y) , ∀ x = y ∈ M, e uma contração se a desigualdade for estrita em todos os pontos : d (ϕ ( x),ϕ ( y)) < d ( x, y), ∀ x = y ∈ M.

5. Dizemos que ϕ : M → M é uma contração uniforme, ou uma α −contração sed (ϕ ( x),ϕ ( y)) ≤ α d ( x, y), ∀ x, y ∈ M com 0 ≤ α < 1.

As seguintes proposições tornam um pouco mais claras as interrelações entre osdiversos conceitos acima.

Exercícios :

3.9. Se ϕ : M → M for compacta e h : N → M for b-limitada, então, a composiçãoϕ h( x) = ϕ (h( x)) é compacta.

3.10. a) Se ϕ : M → M for compacta e h : M → N for contínua, então, a composição

hϕ ( x) = h(ϕ ( x)) é compacta.b) Se ϕ : M → M for contínua e h : M → N for compacta, então, a composiçãohϕ ( x) = h(ϕ ( x)) é localmente compacta, mas não necessariamente compacta.

3.11. Uma função pode ser contínua sem ser compacta (por exemplo, a identidadeem espaços onde a bola não é compacta), e pode ser compacta sem ser contínua.Dê um exemplo simples da última afirmação por meio de funções escada. Mostretambém que, para funções com domínio em Rn, a continuidade implica em compa-cidade da função.

3.12. Uma função pode ser limitada em bolas sem ser compacta (por exemplo, aidentidade tal como acima). Mas toda função compacta é limitada em bolas, diriaWeierstrass. Mostre que ele tem razão !

3.13. Uma função lipschtziana é contínua ; na verdade, uniformemente contínua elimitada em bolas.

3.14. Se denotarmos as funções lipchizianas de B( M , N ) que têm constantes de Lip-

chitz α ≤ m por Lm B ( M , N ), então, Lm

B ( M , N )d ∞

= Lm B ( M , N ), e, portanto, as fun-

ções não expansivas (que incluem as contrações), limitadas, também formam umconjunto fechado em ( B( M , N ),d ∞).

3.15. Mostre que f é b-limitada (limitada em bolas) se, e somente se, f leva conjun-tos limitados em conjuntos limitados. Mostre ainda que nem todas funções b-limitadas pertencem a B( M ,E ).

Vejamos agora algumas situações um pouco mais concretas e frequentes. A com-posição de funções e a integração são duas dentre as operações funcionais mais

frequentes e, portanto, é necessário conhecer suas propriedades, algumas das quaisserão demonstradas abaixo.

Page 93: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 93/371

3.2 Funções compactas & outras notáveis 87

Teorema 3.3 (Operação de Composição).Sejam o espaço métrico de funções M =

C 0(K ,Rn), d ∞

, onde K ⊂ Rm é um

compacto, e uma função F : K ×Rn → Rn , F ( x, y) , contínua nas duas variáveis.Considere a seguinte operação funcional Φ : M → M, definida pela composição

Φ [g]( x) = F ( x, g( x)). Então,1. Φ é bem definida,

2. contínua e

3. limitada em bolas.

4. Se ainda, F for limitada, então Φ também será limitada.

5. Se F for também continuamente diferenciável na segunda variável, isto é, seexistirem todas as derivadas parciais ∂ F k

∂ y j : K ×Rn →R , ∂ F k

∂ y j ( x, y) , como funções

contínuas, então, Φ será lipschitziana em qualquer conjunto G ⊂ M limitado.

Prova. 1. Como composição de funções contínuas, ϕ ( x) = F ( x, g( x)) é natural-mente contínua, concluímos queϕ

∈ M para cada g

∈ M , e, portanto, a definição

é consistente.2. Pelo teorema de Heine-Borel, F será uniformemente contínua quando restrita a

qualquer domínio do tipo K × B(0,r ) ⊂ Rm ×Rn, fixado qualquer r > 0.Seja então g ∈ M , e B(g,∆) ⊂ M . Pelo teorema de Weierstrass, g(K ) ⊂ B(0,r 1) ⊂Rn para algum raio r 1 e, portanto, se h ∈ B(g,∆ , temos h(K ) ⊂ B(0,r 1 +∆ ).Tomemos r > r 1 +∆ , e consideremos um ε > 0. Do que foi dito acima, existeum δ (< ∆) tal que, se x ∈ K , || y− z ||≤ δ , e y, z ∈ B(0, r ), teremos || F ( x, y) −F ( x, z) ||≤ ε , de onde vem que

d ∞ (Φ (g),Φ (h)) = sup x∈K

|| F ( x, g( x))−F ( x, h( x)) ||≤ ε , ∀h ∈ B(g,δ ),

ou seja, Φ é contínua.

3,4. Exercício. Mostre queΦ é limitada em bolas no caso geral, e que é limitada soba condição de que F seja limitada.

5. Escrevendo

F ( x, y0) −F ( x, z0) =

1 0

d ds

[F ( x, z0 + s( y0 − z0))]ds

=

1 0

∂ F ( x, z0 + s( y0 − z0))

∂ y ( y0 − z0)ds,

então, com base no teorema fundamental do Cálculo e na regra de derivaçãocomposta, concluímos que

F ( x, y0) −F ( x, z0) ≤ L y0 − z0 , se∂ F k

∂ y j( x, z0 + s( y0 − z0))

< L

Page 94: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 94/371

88 3 Equações em Espaços Métricos

para 0 ≤ s ≤ 1.Tomando agora G um subconjunto limitado em M , concluímos que G(K ) =g( x), g ∈ G, x ∈ K é um conjunto limitado em Rn (verifique) e, portanto,

podemos, pelo teorema de Heine-Borel, tomar ∂ F k ∂ y j

( x, y) < L para ( x, y)

∈K ×G(K ). Assim, temos que |Φ [u]( x) −Φ [v]( x)| = |F ( x, u( x))−Fx,v( x)| ≤ L|u( x)− v( x)| para u, v ∈ G(K ), de onde vem o resultado.

Diversas variações do teorema acima podem ser deduzidas e algumas são deinteresse em situações especiais, mas não tentaremos esmiuçar o assunto, já que aidéias básicas de todas elas estão expostas nas demonstrações apresentadas e a lei-tora poderá adapta-las convenientemente para cada contexto. Consideremos agorauma importante classe de operadores integrais não-lineares (denominação a ser jus-tificada no capítulo seguinte) que desempenham um papel central na teoria das equa-ções diferenciais ordinárias e parciais, além, naturalmente, da teoria das equaçõesintegrais e que também será utilizado diversas vezes no presente texto.

Teorema 3.4 (Operadores integrais não Lineares são compactos).Seja a função F :

[0

,1

] ×Rn

→ Rn contínua, limitada e o espaço métrico M

=C 0([0,1],Rn),d ∞. Então, a função (operação funcional)

Ψ : M → M , Ψ [h](t ) =

t 0

F (s, h(s))ds

obtida da composição da operação (composição de funções) Φ (como do teorema

anterior), com a operação integral I : M → M, I [g](t ) =t

0g(s)ds, Ψ = I Φ , é

contínua e compacta.

Prova. Já sabemos do teorema anterior queΦ é uma função contínua e limitada embolas. De acordo com um exercício anterior, basta agora mostrar que a função I écontínua e compacta. A demonstração da continuidade de I depende da desigualdade

do valor médio para integrais e será deixada como exercício para a leitora. Vejamosa compacidade.

Consideremos uma bola B(0,r ) ⊂ M , e a sua imagem pela I , I ( B(0, r )) = F . Éfácil ver que F é equilimitado, pois,

| h(t ) |=| I [g](t ) |=|t

0

g(s)ds |≤t

0

| g(s) | ds ≤ r

e, equicontínuo, pois, | h(t 1)−h(t 2) |≤t 2

t 1| g(s) | ds ≤ r | t 2 −t 1 |. A teoria de Arzelà-

Ascoli completa o argumento.

Exercícios :Analise as operações Φ : M → M abaixo quanto à consistência de sua definição,continuidade, limitação e compacidade.

Page 95: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 95/371

3.2 Funções compactas & outras notáveis 89

3.16. Φ [ f ]( x) =1

0k ( x,ξ ) f (ξ )d ξ , M =

C 0([0, 1],R),d ∞

, k ∈C 0 ([0,1], [0,1]). Neste

caso, Φ é lipschitziana e compacta.

3.17. a) Φ h[ f ]( x) = f ( x + h), M = C 0(R,R), d 0∞, h > 0. Este operador é deno-

minado operador deslocamento ("shift "), e também denotado por E h.b) No subconjunto das funções analíticas (isto é, aquelas infinitamente diferenciá-

veis cujas séries de Taylor as representam), C ω (R,R) ⊂ C 0(R,R), o "inocente"operador de deslocamento pode ser escrito como um operador diferencial de

ordem infinita ( !) : E h = ∑k 0

hk

k !d k

dxk .

c) Para intervalos finitos, interpretaremos o operador deslocamento à moda dePeano (i.e., truncado, tal como ele a usou na demonstração do teorema de exis-tência de soluções para equações diferenciais, apresentado logo abaixo) :Se M =

C 0([0,1],R),d 0∞

, h > 0, E h[ f ]( x) = f ( x+h), se x+h ≤ 1, e E h[ f ]( x) =

f (1), se x + h 1. Analogamente para o caso de h < 0.

3.18. Φ h[ f ]( x) = f ( x+h)

− f ( x)

h , M = C 1

(R,R), d 1,∞, h > 0 (Φ h = 1h (E h − I )).

3.19. Φ h[ f ]( x) =h

−h

f ( x+s)− f ( x)2h ds, M =

C 1(R,R), d 1,∞

, h > 0.

3.20. Transformação de Laplace :

Φ : M → S , Φ [ f ]( x) =∞ 0

e− xt f (t )dt , M =C 0 B(R+,R),d ∞

( funções contínuas li-

mitadas com a métrica da convergência uniforme), S =C 0 B(R+,R), d ∞

( fun-

ções contínuas limitadas com a métrica de convergência uniforme). Esta operaçãoé comumente denominada de transformação de Laplace e denotada também porL [ f ]( x).

3.21. Transformação de Fourier :

Φ : M → S , Φ [ f ]( x) = 1√ 2π

∞ 0

eixt f (t )dt , M = C 00(R,C ),d ∞ ( funções contínuas

de suporte compacto com valores complexos, com a métrica da convergência uni- forme), e S =

C 0 B(R,C), d ∞

( funções contínuas limitadas com a métrica de conver-

gência uniforme). Esta operação é comumente denominada de transformação deFourier e denotada também por F [ f ]( x).

3.22. Equação Integral de Abel :

Φ [ f ]( x) = x 0

12√ π

1√ x−ξ f (ξ )d ξ , M =

C 0(R+, R), d ∞

. Observe que a integral da

operação é imprópria, ou seja, é definida como um limite de integrais de Riemann,

Φ [ f ]( x) = lims

↑ x

s

01

2√ π

1√ x

−ξ

f (ξ )d ξ que existe, em decorrência do fato de que a sin-

gularidade 1√ x−ξ é integrável. A equação Φ [ f ] = g é chamada equação integral de

Abel (N. H. Abel) que a resolveu da seguinte maneira : f ( x) = d dx (Φ [g]( x)).

Page 96: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 96/371

90 3 Equações em Espaços Métricos

3.23. Derivada Fracionária :

Observe que a integral iterada n vezes de uma função f entre 0 e x pode ser escritana forma :

F n( x) = 1Γ (n)

x

0

( x− t )n−

1

f (t )dt ,

onde Γ (n) é a função Gama de Euler que pode ser definida para qualquer númerocomplexo z, desde que ℜ z > 0 (na verdade, até mais do que isso por continuaçãoanalítica no plano complexo) e tem o valor banal Γ (n) = (n − 1)! (Fatorial) paravalores inteiros positivos da variável. Como esta integral é uma inversa (à direita)da operação de derivação, é natural definir-se a notação F n = D−n f , onde D natu-ralmente representa a derivação. Por outro lado, é fácil ver que, com a observaçãoanterior, podemos definir a operação funcional

D−λ [ f ]( x) = 1Γ (λ )

x 0

( x− t )λ −1 f (t )dt

para qualquer valor fracionário (i.e., não inteiro) positivo de λ , em particular, para0 < λ < 1. Com isso, sobrepondo à nova operação D−λ a operação usual de deriva-ção Dn = d n

dxn para qualquer inteiro positivo, temos

Dα [ f ]( x) = Dn−λ [ f ]( x) = d n

dxn

1Γ (λ )

x 0

( x− t )λ −1 f (t )dt

o que define a derivada fracionária para qualquer número real α = n −λ . Mostreque, de fato Dα definida assim é linear, comutam entre si, Dα Dβ = Dβ Dα , e mais : Dα Dβ = Dα +β , que são as propriedades operacionais mais comuns da derivadausual. Mostre que Γ ( 1

2 ) =√ π , e, com base nas propriedades acima, resolva a equa-

ção integral de Abel :

f ( x) = d dxΦ [g]( x)

do exercício anterior na forma

g( x) = D− 12 [ f ]( x) =

1√ π

d dx

x 0

( x− t )− 12 f (t )dt ,

ou seja, Φ −1 = DΦ . Sugestão : Sobre o problema que originou a integral de Abel,sobre a função Gama de Euler e, sobre a derivada fracionária, inventada por J. L.Liouville, consulte o omnisciente texto : R. Courant, Calculo Diferencial e Integral,vol. 2, Ed. Globo, 1958, cap. IV, ou, para ser mais específico, R. Gorenflo, The Abel Integral Equation, Springer Lect. Notes Math.

Ainda como uma aplicação da Teoria de Arzelà-Ascoli, apresentaremos o im-portante teorema geral de existência de soluções para o problema de valores iniciais

Page 97: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 97/371

3.2 Funções compactas & outras notáveis 91

de equações diferenciais ordinárias que é devido à Giuseppe Peano (1858-1938). Oteorema de existência e unicidade de soluções para este problema foi demonstradopela primeira vez por A. L. Cauchy para f diferenciável em suas notas de aula entre1820 e 1830 e depois para f analítica em 1839. Entretanto, o teorema geral que ga-

rante existência para o caso geral onde F (t , x) é apenas contínua, somente foi obtidoao final do século XIX. Este teorema garante a existência mas não a continuidade, oque não acontece por deficiência da demonstração, mas das hipóteses. Para verificaristo resolva o exercício elementar de equações diferenciais ordinárias abaixo :

Exercício :

3.24. Considere o problema de Cauchy :

dxdt

= x12 , t ≥ 0

x(0) = 0

Mostre que existe uma quantidade infinita (não-enumerável) de soluções deste pro-

blema na forma : x(t ) = 0 para 0 ≤ t ≤ a, e x(t ) = 2(t −a)3 32

, para a ≤ t ≤ 1

Teorema 3.5 (Teorema de Peano : Existência de soluções para problemas deCauchy de equações diferenciais ordinárias).Considere uma função contínua e limitada F : [0,T ] ×Rn → Rn como sendo umcampo vetorial dependente do tempo, em Rn. Então, o problema de Cauchy :

dx(t )dt

= F (t , x(t ))

x(0) = a

tem pelo menos uma solução x ∈ C 1([0, T ],Rn) para qualquer valor inicial α ∈Rn.

Prova. Apresentaremos uma sutil argumentação que o próprio Peano inventou. Oprimeiro passo será transformar a operação diferencial em operação integral pormeio de um procedimento clássico : x(t ) será solução continuamente diferenciá-vel do problema se, e somente se, x(t ) for contínua e puder ser escrita na forma

x(t ) = a +t

0F (s, x(s))ds (verifique). Observe que, de acordo com o teorema acima,

a operação do lado direito da equação é uma função contínua e compacta no es-

paço M =C 0([0, T ],Rn),d ∞

, Φ : M → M , Φ ( f )(t ) = a +

t 0

F (s, f (s))ds, e x será

solução do problema se, e somente se, Φ ( x) = x, isto é, se x for ponto fixo de Φ em M . Construiremos em seguida uma sequência de funções de onde tiraremos uma

subsequência convergente para a solução.A N -ésima função desta sequência, x N (t ), será construída passo a passo comrespeito a sub-intervalos sucessivos de comprimento T

N da seguinte maneira :

Page 98: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 98/371

92 3 Equações em Espaços Métricos

x N (t ) = a +

t 0

F

(s,E − 1 N

[ x N ](s)

ds,

onde E −

1

N

é o operador de deslocamento (truncado). Em outras palavras, e maisexplicitamente :

i) x N (t ) = a, para −T N ≤ t ≤ 0,

ii) x N (t ) = a+

t 0

F

s, x N (s− 1

N )

ds = a+

t 0

F

s,E − 1 N

[ x N ](s)

ds,para0≤ t .

onde o cálculo de x N (t ) para 0 ≤ t ≤ T N , se faz usando os valores da mesma função

definidos em i), ou seja, no intervalo “atrasado” anterior. O cálculo de x N (t ) paraT

N ≤ t ≤ 2T N é feito com base nos valores obtidos anteriormente, e assim por diante.

Tomando m como a limitação para a função F , concluímos que o conjunto defunções x N é equilimitado, pois,

| x N (t )| ≤ a +

t 0

F (s, x N (s− 1 N ))ds≤ |a| + A,

e equicontínuo pois,| x N (t ) − x N (t +δ )| ≤ Aδ .

Daí, a teoria de Arzelà-Ascoli nos garante que x N é um conjunto pré-compactoem M =

C 0([0,T ],Rn), d ∞

, e portanto, podemos extrair uma uma subsequência

convergente, x N k → x ∈ M (convergência uniforme). Como x N (t ) é equicontínua,temos que x N ( s− 1

N ) → x N (t ), uniformemente, e sendo Φ uma operação contínua,vem daí que Φ ( x N k ) → Φ ( x), de onde, Φ ( x) = x , ou seja, x é ponto fixo de Φ euma solução desejada para o problema.

Observe que, de acordo com o exercício anterior ao teorema, a sequência x N pode ter uma quantidade não enumerável de pontos de acumulação, a escolha deuma subsequência simplesmente determina um deles como seu limite.

Exercícios :

3.25. Argumente operacionalmente para demonstrar o teorema de Peano, isto é,considere a definição de x N = I Φ E − 1

N = Λ N [ x N ] e analise a limitação, com-

pacidade e continuidade do operador composto Λ N para deduzir “elegantemente” aconclusão de Peano.Sugestão : Primeiro verifique que o conjunto de funções x N é limitado e, sendoimagem dele mesmo pelo operador compacto é pré-compacto ; tome uma subse-

quência convergente e, pela continuidade de Λ N conclua o desejado.Observe que a estratégia de Peano é na verdade um método de perturbação doproblema Φ x = x, ou seja, utilizamos a solução óbvia do problema de ponto fixo

Page 99: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 99/371

3.3 O Método iterativo de contrações Birkhoff-Banach-Cacciopoli 93

para o operador “ perturbado” x N = Λ N [ x N ] (isto é, esperando que, de alguma formaΛ N ≈ Φ e que a solução do problema aproximado, x N , ou uma subsequência dele,aproxime a solução do problema exato). No exercício abaixo veremos uma versãogeneralizada e abstrata desta idéia.

3.26. Teorema de Peano : Uma versão generalizada (abstrata)Sejam Φ : M → M e Φ n : M → M operações contínuas em um espaço métrico ondeΦ n é uma sequência de operadores uniformemente compactos (isto é, para qualquerconjunto limitado A existe um compacto K tal que ∪n0Φ n ( A) ⊂ K ) que convergeuniformemente em compactos para Φ . Então, se existirem soluções uniformementelimitadas de ponto fixo Φ n[ xn] = xn, existirá também uma subsequência xnk → ξ ,onde ξ é um ponto fixo para Φ , ou seja, resolve a equação Φ [ξ ] = ξ .Demonstre este resultado generalizado e aplique-o à demonstração do teorema clás-sico de Peano para a existência de soluções do problema de Cauchy para equaçõesdiferenciais ordinárias. Procure refazer esta versão, tornando-a mais "enxuta".Sugestão : Como A = xn é limitada e A ⊂ ∪n0Φ n ( A) ⊂ K , podemos considerara subsequência convergente xnk → ξ , restando apenas a conclusão do limite.

3.3 O Método iterativo de contraçõesBirkhoff-Banach-Cacciopoli

Na maioria dos problemas em que a equação ϕ ( x) = y é considerada, o es-paço métrico subjacente M tem uma estrutura adicional de grupo (por produto ousoma) que permite reformular a questão como um problema de ponto fixo (como,por exemplo, na forma ψ y( x) = ϕ ( x) − y + x = x) que tem a vantagem de padroni-zar uma grande classe de equações e permite ainda uma interpretação geométricanatural. Observe que a nova função ψ depende agora também de um parâmetro y

que passa assim a ser constitutivo. A interpretação geométrica deste problema pro-vem da representação da função ψ como uma deformação do espaço métrico M ea equação como a busca de um ponto de M que não é deslocado por ψ . Como emgeral a função que define a equação depende de vários outros dados estruturais oucontingenciais, podemos considerar todos estes casos por meio do estudo de pontosfixos ψ ( x,λ ) = x para funções

ψ : M ×Λ → M ( x,λ ) → ψ ( x,λ ).

O espaço métrico Λ em geral é diferente de M , e serve para descrever a variação dafunção admissível, ou de interesse para o problema em questão. Assim, o parâmetroestrutural ψ λ pode variar de acordo com um parâmetro específico λ em um espaço

métrico Λ .Se a equação de ponto fixo ψ ( x,λ ) = x dispuser de pelo uma solução xλ paracada λ fixo, então é possível definir uma função x(λ ) tal que ψ ( x(λ ),λ ) = x(λ )

Page 100: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 100/371

94 3 Equações em Espaços Métricos

para todos λ ∈Λ , onde x :Λ → M é uma função solução. O exemplo mais familiar esimples desta situação é dado pela solução de uma equação quadrática x2 +2bx+c =0, na formaψ ( x, b,c) = x2 +(2b+1) x+c = x, com λ = (b,c), e uma função solução x(b,c) = −b +

√ b2 − c).

Diversos exemplos mostrarão o acerto desta abordagem. mas inicialmente. tra-taremos da equação sem o envolvimento de parâmetros.O Teorema de Banach-Cacciopoli que estudaremos a seguir, é um dos resultados

mais interessantes e sintetizadores da Análise Funcional e garante não só a existên-cia mas a unicidade de pontos fixos para aplicações contrativas, ou seja, garante aexistência de uma função solução muito bem determinada x(λ ). Além disto, a suademonstração é simples e fornece um método construtivo para a a obtenção de x(λ ),que é, de fato, empregado na formulação de algoritmos computacionais eficientes.Todas estas características, raramente reunidas em um só teorema, o tornam umdos principais instrumentos matemáticos para o estudo de equações. A leitora queainda não encontrou (ou, infelizmente, não foi devidamente orientada a identificar)este método sob outras roupagens no Cálculo Diferencial e Numérico elementar(por exemplo, o método da secante, método de Newton, iteração de funções reais, e

etc.), pode consultar uma apresentação introdutória do assunto no capítulo 5 de R.Bassanezi, W. C. Ferreira Jr., Equações Diferenciais e Aplicações, Harbra, 1988.

O teorema abaixo foi utlizado em um contexto específico funcional pela pri-meira vez por George D. Birkhoff e Oliver D. Kellog em 1922, mas a sua forma maisabstrata e geral foi obtida pelo matemático polonês Stefan Banach (1892-1945) em1922 e independentemente pelo italiano Renato Cacciopoli (...-...) em 1931. Pode-mos considerá-lo como um dos principais teoremas da Análise, tanto no seu aspectoabstrato como construtivo.

Teorema 3.6 (Teorema de BCC : Ponto fixo para contrações uniformes (α -Contrações) ).Seja ( M , d ) um espaço métrico completo, e ϕ : M

→ M uma contração uniforme,

isto é,d (ϕ ( x),ϕ ( y)) ≤ α d ( x, y)

onde α é um número real não negativo e menor do que 1 ; 0 ≤ α < 1. Então,

1. A equação de ponto fixo ϕ ( x) = x tem uma única solução x ∈ M,

2. ∀ x0 ∈ M, a sequência definida recursivamente por xn+1 = ϕ ( xn) converge parao ponto fixo x, e

3. A taxa de convergência é exponencial, dada por d ( xk , x) ≤ α k

1−α d ( x1, x0).

Prova. Mostraremos que a sequência definida pela iteração da função ϕ a partir dequalquer x0 é de Cauchy e, portanto, converge em M . Para todo k ≥ 1 temos

d ( xk +1, xk ) = d (ϕ ( xk ),ϕ ( xk −1)) ≤ α d ( xk , xk −1).

Portanto, indutivamente temos

Page 101: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 101/371

3.3 O Método iterativo de contrações Birkhoff-Banach-Cacciopoli 95

d ( xk +1, xk ) ≤ α k d ( x1, x0) = α k d (ϕ ( x0), x0).

Mas então,

d ( xk +n, xk ) ≤m

−1

∑ j=0 d ( xk + j+1, xk + j) ≤m

−1

∑ j=0 α k

+ j

d ( x1, x0)

≤ α k d ( x1, x0)m−1∑

j=0α j ≤ α k

1−α d ( x1, x0).

Como 0 ≤ α < 1 , concluímos que a sequência é de fato de Cauchy e, sendo M completo, converge, xn → x. Fazendo um dos limites na desigualdade acima paran → ∞, concluímos também que d ( x, xk ) ≤ α k

1−α d ( x1, x0). Como ϕ é uma funçãocontínua, temos que limn→∞ϕ ( xn) = xn+1 = ϕ ( x) = x, ou seja, o limite da sequênciaé um ponto fixo para a função ϕ . Para provarmos que é unico, suponhamos queexista um outro ponto fixo x, de onde teríamos,

d ( x,

x) = d (ϕ ( x),ϕ (

x)) ≤ α d ( x,

x)

e, como 0 ≤ α < 1, concluímos necessariamente que d ( x, x) = 0, ou seja, x = x.

Exercícios :

Analise e verifique as observações abaixo :

3.27. O caso α = 0 é trivial mas pode perfeitamente fazer parte da hipótese.

3.28. A hipótese de que M seja completo pode ser de certa forma relaxada porque,sendo ϕ lipschitziana, ela é uniformemente contínua e pode ser estendida ao fechocompleto de M como uma contração.

Embora o teorema de Birkhoff-Banach-Cacciopoli esteja na literatura desdepelomenos a década de 1920, um interesse maior sobre o problema de ponto fixo ocorreude fato apenas no final da década de 1960, em parte pelo desenvolvimento da AnáliseNão Linear e suas aplicações à Economia Matemática. Nas três décadas seguintesocorreu uma “epidemia matemática” de teoremas de pontos fixos, uma verdadeiraavalanche de corolários do teorema BBC que procuravam relaxar algumas de suashipóteses compensando-as por outras, às vezes, de grande artificialidade. Dentreestes inúmeros resultados, alguns serão destacados aqui pela sua simplicidade eimportância para as aplicações que se seguem no texto. Nestas generalizações, acondição de contratibilidade é aquela que nos resta enfraquecer, e isto pode ser feitode várias maneiras. Por exemplo, podemos relaxá-la exigindo-se apenas que uma desuas iteradas seja uma contração, ou, permitindo que seja apenas uma contração não

uniforme (não expansiva). mas com domínio compacto, ou, que seja uma contraçãorestrita a um subconjunto fechado invariante e etc.

Page 102: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 102/371

96 3 Equações em Espaços Métricos

Corolà ario 3.7 (Existência e unicidade de ponto fixo para uma n−contraçãouniforme).Sejam ( M ,d ) um espaço métrico completo eϕ : M → M tal que para algum inteiro n,a n− esima iteração deϕ é uma contração, isto é,ϕ n =ϕ

ϕ n−1

é uma contração.

Então, as conclusões do teorema BBC valem para ϕ , ou seja,1. ϕ tem um único ponto fixo, ϕ ( x) = x,

2. x é o mesmo único ponto fixo de ϕ n garantido pelo teorema básico de Banach-Cacciopoli, e,

3. x pode ser obtido como limite de iterações de ϕ a partir de qualquer pontoinicial x0 , isto é, ∀ x0 ∈ M, x = limk →∞ϕ

k ( x0) , e a convergência se dá exponen-cialmente na ordem de α k .

Prova. Considere ψ = ϕ n e aplique à ψ o teorema básico de Banach-Cacciopoliobtendo x = limk →∞ψ

k ( x0) = limk →∞ϕ nk ( x0), onde ψ ( x) = x, ou, ϕ n( x) = x.

Mas então, ϕ (ϕ n( x)) = ϕ ( x), ou, ϕ n(ϕ ( x)) = ϕ ( x). Portanto, ϕ ( x) é tambémum ponto fixo para ψ . Como há apenas um ponto fixo para ψ , concluímos que,

necessariamente, ϕ ( x) = x.Por outro lado, se x for um outro ponto fixo de ϕ ,ϕ ( x) = x, e daí, ϕ n( x) =ψ ( x) = x, e, portanto, teremos x = x, pela unicidade do ponto fixo de ψ .

Finalmente, pelo teorema básico de Banach-Cacciopoli, todas as sequênciasconstruídas iterativamente com ψ = ϕ n a partir x0, x1,..., xn−1 convergem para oúnico ponto fixo de ψ , x. Mas então dado xk = ϕ

k ( x0) podemos escrever (usando oalgoritmo de Euclides k = np + r , com 0 ≤ r ≤ n − 1), xk = ψ

p( xr ) o que nos levaà conclusão de que a sequência iterativa produzida por ϕ converge também para x.Por este mesmo argumento obtem-se a taxa de convergência.

Nem sempre a função ϕ : M → M é uma contração em todo o espaco métrico,mas apenas localmente. Mas, observe que subconjuntos fechados de M são em par-

ticular espaços métricos completos (se M o for). Portanto, se existir um subcon- junto fechado F invariante (diz-se também, estável) pela ação de ϕ , isto é, tal queϕ (F ) ⊂ F , então podemos imediatamente garantir que existe um único ponto fixode ϕ em F . Para a aplicação deste argumento necessitamos encontrar um subcon- junto fechado de M invariante e, no qual, ϕ é uma contração. O corolário abaixo nosfornece esta saída para uma situação simples que ocorre com certa frequência.

Corolà ario 3.8 (Bola invariante para uma contração).Seja ( M ,d ) um espaço métrico completo, ϕ : M → M, e B(a,r ) uma bola tal que

1. ϕ é uma α −contração na bola fechada B(a, r ) , d (ϕ ( x,ϕ ( z)) < α d ( x, z) , com0 ≤ α < 1 , e

2. d (ϕ (a), a) < (1−α )r.

Então, as conclusões do teorema BBC valem para ϕ restrita à bola fechada B(a, r ) ,ou seja, a bola fechada B(a, r ) é invariante pela função ϕ onde ela tem um único ponto fixo.

Page 103: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 103/371

3.3 O Método iterativo de contrações Birkhoff-Banach-Cacciopoli 97

Prova. De acordo com as considerações anteriores, basta verificar a seguinte desi-gualdade para todo x ∈ B(a,r ) :

d (ϕ ( x),a) ≤ d (ϕ ( x),ϕ (a))+d (ϕ (a), a) ≤α d ( x,a)+(1−α )r ≤α r +(1−α )r ≤ r .

Na seção anterior mostramos a existência de pelo menos uma solução para pro-blemas de valores iniciais para equações diferenciais ordinárias do tipo

dxdt

(t ) = F (t , x(t ))

x(0) = a

chamados também de problemas de Cauchy, onde F : [0,T ] ×Rn → Rn era contí-nua e limitada e a ∈Rn. Frisamos entretanto, naquela oportunidade, que a unicidadenão poderia ser garantida sob condições tão amplas. Abordaremos agora o teorema

clássico de existência e unicidade de soluções para o problema de Cauchy por meiodo teorema de Banach-Cacciopoli. É importante observar todavia que o desenvol-vimento analítico desta aplicação segue um método originalmente inventado por J.Liouville em 1838 e também creditado a E. Picard, que o generalizou para sistemasde equações em 1890. Na verdade, estamos na contramão da história, uma vez quenão é difícil imaginar que Birkhoff e Kellog, Banach, e Cacciopoli devem ter tiradoas suas motivações concretas do trabalho de Picard, que foi amplamente divulgadono princípio do século e utilizado em diversos outros problemas semelhantes deequações integrais e diferenciais parciais. Mas isto, claro, não tira o mérito da gene-ralização de Banach-Cacciopoli, que enfatiza os pontos essenciais do argumento epossibilita a sua utilização em uma enorme variedade de questões, impensáveis paraLiouville ou Picard.

Teorema 3.9 (Teorema de Liouville-Picard : Existência & unicidade de soluçõesdo problema de cauchy para equações diferenciais ordinárias).Seja F : R×Rn → Rn contínua em todo o seu domínio R×Rn e uniformementelipchitziana na segunda variável, isto é, tal que

F (t , x)− F (t , y) ≤ L x− y

para um número real L > 0 e para quaisquer x, y, t . Então, o problema de Cauchy

dxdt

(t ) = F (t , x(t ))

x(0) = a

tem uma e única solução continuamente diferenciável x : R→Rn , x ∈ C 1(R,Rn).

Page 104: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 104/371

98 3 Equações em Espaços Métricos

Prova. Considere o espaço métrico M N =C 0([− N , N ],Rn),d ∞

(métrica uniforme),

e a função Φ : M N → M N definida por

Φ [ z](t ) = a +

t

0

F (t , z(s)) ds,

que é bem definida (verifique!). Observe agora que para t > 0 podemos escrever

Φ [ z](t ) −Φ [ y](t ) ≤t

0

F (s, z(s))− F (s, y(s)) ds

≤t

0

L z(s) − y(s) ds ≤ L | t | d ∞( z, y).

Portanto, é possível ver que, repetindo o processo, obtemos

Φ (2)[ z](t ) −Φ (2)[ y](t ) ≤t

0

F (s,ϕ ( z)(s))− F (s,ϕ ( y)(s)) ds ≤t

0

L Φ [ z](s)−Φ [ y](s) ds ≤ L

t 0

L | s | d ∞( z, y)ds ≤ L2 N 2

2! d ∞( z, y).

Quase da mesma forma, podemos obter uma desigualdade final também para t < 0 e,daí, finalmente, tomando o sup− N ≤t ≤ N do termo à esquerda após k iterações, temos

d ∞(ϕ k ( z),ϕ k ( y)) ≤ ( LN )k

k ! d ∞( z, y).

Tomando agora k suficientemente grande podemos garantir que ( LN )k

k ! < 1, ou seja,

ϕ k

será uma contração no espaço métrico completo M N . Pelo corolário do teoremade Banach-Caciopolli, concluímos queϕ temum único ponto fixo x N ∈ M N queéso-lução do problema de Cauchy no intervalo restrito [− N , N ]. Repetindo o argumentono intervalo [− N − 1, N + 1], considerando que x N +1 também é solução do mesmoproblema no intervalo restrito [− N , N ] e a unicidade dos pontos fixos, concluímosque uma única solução do problema completo existe em toda a reta real, x :R→Rn,sendo x(t ) = x N (t ) para t ∈ [− N , N ]. A diferenciabilidade da solução decorre da suacontínuidade (pois x ∈ C 0(R,Rn), e da equação de ponto fixo

x(t ) = a +

t 0

F (t , x(s))ds

em que o lado direito é a integral de uma função contínua.

Observação 3.10. 1. O teorema acima garante a existência de uma solução globaldo problema de Cauchy, isto é, a solução encontrada existe para todos os valores

Page 105: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 105/371

3.3 O Método iterativo de contrações Birkhoff-Banach-Cacciopoli 99

da variável “tempo” t na reta real, o que é um caso excepcional para equaçõesnão-lineares. Com muita frequência, a solução x(t ) de uma equação diferencialordinária se aproxima em tempo finito da fronteira onde está definido o campovetorial F, deixando assim de ser “prolongável” após tal instante finito. Isto

acontece mesmo quando a região de definição da F é todo o Rn

(neste caso, afronteira está no infinito) como mostra um exemplo simples, F (t , x) = x2, x ∈R.Quando a região onde o modelo matemático está definido (ou tem interesse) éum aberto conexo com fronteira finita, pode ocorrer que a solução atinja estafronteira em tempo finito e, portanto, deixe de existir (para efeitos do modelo)daí para diante.

2. As importantes equações lineares, isto é, aquelas para as quais F (t , x) = A(t ) x +h(t ), onde A é uma matriz n ×n, e as funções h(t ), Ai j(t ) são contínuas na reta,podem ser tratadas pelo teorema acima se A i j(t ) forem limitadas. Entretanto,mesmo que Ai j(t ) contínuas não sejam limitadas em toda a reta, elas serão li-mitadas em qualquer intervalo [− N , N ], e o argumento acima pode ser repetidopara garantir a solução em toda a reta.

3. Argumentos exatamente iguais aos utilizados acima podem ser empregados nademonstração de existência e unicidade de soluções para problemas de equa-ções diferenciais ordinárias no plano complexo. Para equações diferenciais par-ciais, equações integrais e outras equações funcionais dinâmicas, embora asdificuldades técnicas possam ser bem maiores em alguns contextos, as mesmasidéias têm sido empregadas com sucesso. Vejamos a seguir alguns exemplosrelativamente simples destas aplicações.

Exercícios :

3.29. Mostre que o problema de Cauchy : dxdt (t ) = F (t , x(t )) = x2; x(0) = a, não sa-

tisfaz às condições do teorema de Liouville-Picard e que a solução existe em umintervalo em torno da origem t = 0, mas “explode” em tempo finito (obtenha a so-

lução explícita elementar). Isto mostra que a condição de Lipschitz uniforme, paraser enfraquecida, deve ser compensada de alguma forma.

3.30. Mostre que o problema de Cauchy para as equações lineares com F (t , x) = A(t ) x + h(t ), onde A é uma matriz n × n, e h(t ), Ai j(t ) são contínuas na reta, temsolução global (isto é, definida em toda a reta) e única, x ∈C 1(R,Rn), muito emboraa uniformidade da condição de Lipschitz não seja necessariamente satisfeita.

3.31. Considerea métrica de Bielecki (nome de um matemático polonês) emC 0(R,Rn)definida por d λ (u,v) = sup

−∞<t <∞e−λ |t | |u(t ) − v(t )| e o espaço métrico de funções

M λ =

w ∈ C 0(R,Rn) ; tal que sup

−∞<t <∞e−λ |t | |w(t )| <∞

para λ > 0.

Mostre que a definição de métrica é consistente e que o espaço métrico resultante écompleto. Sob as hipóteses do teorema de Liouville-Picard, mostre que é possívelescolher um λ > 0 de tal forma que a operação funcional Φ : M λ → M λ ,

Page 106: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 106/371

100 3 Equações em Espaços Métricos

Φ [w](t ) = a +

t 0

F (s, w(s)) ds

é bem definida e uma contração. Obtenha assim a solução global, de uma só vez,

para o problema de Cauchy. Aplique este argumento em especial para as equaçõeslineares de coeficientes variáveis.Sugestão : Argumentando separadamente para t > 0, temos

d B(ϕ ( x),ϕ ( y)) = sup0≤t ≤ε e−γ t t

0(F (s, x(s),λ ) −F (s, y(s),λ ))ds

≤ sup0≤t ≤ε t

0e−γ (t −s)e−γ s (F (s, x(s),λ ) −F (s, y(s),λ )) ds

≤ sup0≤t ≤ε t

0e−γ (t −s)e−γ s L x(s) − y(s) ds

≤ sup0≤t ≤ε

t

0e−γ (t −s) Lds

d B( x, y) = L

1−e−γε γ

d B( x, y).

Analogamente se argumenta para t < 0. Escolhendo γ suficientemente grande, ϕ será uma contração na métrica d B. Para completar o argumento, basta mostrar queas métricas d ∞ e d B são equivalentes para os propósitos desejados de convergência.

3.32. Mostre, utilizando um teorema da seção anterior, que se F : R×Rn → Rn forcontínua e tiver suas derivadas parciais ∂ F k

∂ x j :R×Rn →Rn também contínuas, então

a função F é uniformemente lipschitziana em compactos [−T ,T ]×K ⊂R×Rn.

3.33. Considere as equações integrais lineares de I. Fredholm (1866-1927), genera-lizações contínuas das equações matriciais que serão estudadas com muito maioresdetalhes mais adiante,

h(t ) = λ

b

a

K ( x,ξ )h(ξ )d ξ + g(t )

onde K ∈ C 0 ([a, b] × [a, b],R) é chamado núcleo e g ∈ C 0([a,b],R) são funçõesdadas e λ é um parâmetro a ser ajustado. Mostre que para λ em algum intervalo aser determinado, | λ |≤ c, existe uma única solução h ∈ C 0([a, b],R).

3.34. Considere agora as equações integrais de Vito Volterra (1860-1940), aluno deUlisse Dini e amigo de Cesare Arzelà :

h(t ) = λ

t a

K ( x,ξ )h(ξ )d ξ + g(t ),

que se distinguem das equações de Fredholm apenas pelo limite superior livre da in-

tegral e são semelhantes ao problema de Cauchy para equações diferenciais ordiná-rias na forma integral. Utilizando o Corolário 1 do teorema de Banach-Cacciopolimostre que esta equação tem solução única para qualquer valor fixado de λ .

Page 107: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 107/371

3.3 O Método iterativo de contrações Birkhoff-Banach-Cacciopoli 101

3.35. Considere a equação funcional x(t ) = t +ε x(t k ), para 0 < ε < 1,e k > 1.a) Mostre que existe uma única solução x ∈ C ([0,1],R) e,b) Usando o método iterativo de Banach-Cacciopoli e com x0 = 0, ε = 1

2 e k = 2,estabeleça a solução dentro de um erro máximo de 10−3.

3.36. Mostre que a função ϕ ( x) = x + x−1, ϕ : [1,∞) → [1,∞), é uma contração, istoé, | ϕ ( x) −ϕ ( z) |<| x− z |, ∀ x = z ∈R, mas não tem ponto fixo.

3.37. Mostre, por outro lado que, se uma contração ϕ : M → M , d (ϕ ( x),ϕ ( y)) <d ( x, y), ∀ x = y ∈ K , tiver um ponto fixo, ele será único.

Isto mostra que a contratividade simples garante apenas a unicidade mas a uni- formidade da contração, ou seja, um mesmo α para todos os x, y não pode ser dis-pensada sem alguma ressalva compensatória para garantir a existência do ponto fixo.Vejamos uma ressalva bem sucedida :

Teorema 3.11 (Método variacional para existência e unicidade de ponto fixopara funções contrativas em compactos).Seja (K , d ) um espaço métrico compacto e ϕ : K → K uma contração não expansiva(não necessariamente uniforme), ou seja, d (ϕ ( x),ϕ ( z)) < d ( x, z). Então ϕ tem ume único ponto fixo.

Prova. Consideremos a função contínua de valores reais h( x) = d (ϕ ( x), x) que, de-finida no compacto K , deve atingir um mínimo, digamos em x0. Suponha agora queϕ ( x0) = x0. Então, comoϕ é uma não-expansão, temos h(ϕ ( x0)) = d (ϕ (2)( x0),ϕ ( x0)) <d (ϕ ( x0), x0) (=mínimo), o que é impossível. Portanto, x0 é ponto fixo e a sua uni-cidade decorre de um argumento análogo ao utilizado na demonstração do teoremade Banach-Cacciopoli.

Exercício :

3.38. Analise se é posível afirmar que as conclusões do teorema BBC valem parao caso acima, isto é, para ϕ : K → K uma contração não uniforme, e (K ,d ) umespaço métrico compacto, especialmente quanto ao método iterativo. Observe queno teorema de ponto fixo para função não expansiva, a construção da solução évariacional, ou seja, ela é caracterizada e construída como um ponto que realizaum mínimo de uma função real definida no espaço métrico compacto, d (ϕ ( x), x) =h( x)), não como limite de uma iteração.

3.39. Mostre que se uma contração ϕ : M → M , ( d (ϕ ( x),ϕ ( y)) < d ( x, y),∀ x = y ∈K ) for uma função compacta para a qual existe um conjunto fechado e limitado F invariante (isto é, ϕ (F ) ⊂ F ), então ϕ tem um e único ponto fixo em F .

Sugestão : Como ϕ é compacta, ϕ (F ) = K ⊂F é compacto. Considere o argumentodo teorema acima para a função ϕ em K e em seguida utilize o exercício anterior.

Page 108: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 108/371

102 3 Equações em Espaços Métricos

3.40. Mostre que se ϕ : M → M tem um único ponto fixo x∗ em M e ψ : M → M comuta com ϕ (isto é, ϕ ψ = ψ ϕ ), então x∗ também é um ponto fixo para ψ .

Há inúmeros resultados sobre existência, unicidade e métodos de obtenção depontos fixos em espaços topológicos que foram desenvolvidos nas últimas décadas.Voltaremos a este assunto dentro do contexto de espaços vetoriais normados noúltimo capítulo destas notas.

3.4 A dependência do ponto fixo com respeito a parâmetros

A equações matemáticas sempre envolvem um certo número de parâmetrosconstitutivos de natureza numérica que descrevem aspectos estruturais ou eventuaisdo problema e a dependência das soluções com respeito à variação destes parâme-tros é uma questão básica, que tem a ver com a estabilidade funcional de um pro-blema segundo Tikhonov. Por exemplo, em um problema de Cauchy para equações

diferenciais ordináriasdxdt

(t ) = F (t , x(t ),λ )

x(t 0) = a,

dispomos claramente de parâmetros estruturais λ ∈R p e dos parâmetros eventuais,t 0 e a. A solução obviamente dependerá de todos eles na forma x(t ,λ , a, t 0), e quemestuda um modelo matemático tem um óbvio interesse em analisar esta dependência.

Podemos facilmente agrupar todos os parâmetros deste problema por meio dasmudanças de variáveis : τ = t − t 0, z(τ ) = x(τ + t 0) −a, de onde obtemos :

dzd τ

(τ ) = F (t 0 +τ , z + a,λ ) = F (τ , z,λ )

z(0) = 0

onde λ = (λ ,t 0,a). Portanto, a distinção entre parâmetros estruturais e eventuais éirrelevante para uma abordagem teórica, bastando neste caso considerar parâmetrosestruturais e problemas com condições iniciais nas origens do tempo e espaço.

No caso de equações diferenciais funcionais (como equações diferenciais or-dinárias com retardamento) e equações diferenciais parciais, o parâmetro estruturalpode ser também constituído de funções provenientes de condições iniciais e/ou defronteira, o que estará perfeitamente contemplado no tratamento geral que apresen-taremos, uma vez que consideramos os parâmetros em um espaço métrico genérico.

Teorema 3.12 (Teorema da função implícita em espaços métricos (Banach -Cacciopoli com parâmetros)).

Seja ( M ,d ) um espaço métrico completo, (Λ ,δ ) um espaço métrico compacto eϕ : M ×Λ → M, tal que uma de suas iteradas ϕ (n) é uma contração uniforme emΛ , isto é, existe um 0 ≤ α < 1 tal que

Page 109: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 109/371

3.4 A dependência do ponto fixo com respeito a parâmetros 103

d (ϕ (n)( x,λ ),ϕ (n)( y,λ )) ≤ α d ( x, y), ∀( x, y,λ ) ∈ M ×Λ .

Então, a equação de ponto fixo com parâmetro ϕ ( x,λ ) = x

1. Tem, para cada λ ∈ Λ , um único ponto fixo x(λ ) , obtido pelo método iterativo

de Banach-Cacciopoli, e2. A função x : Λ → M é contínua, isto é, existe uma única x ∈ C 0(Λ , M ) tal queϕ ( x(λ ),λ ) = x(λ ), ∀λ ∈Λ .

Prova. Faremos a demonstração apenas para n = 1 ; os outros casos decorrem ime-diatamente do corolário apropriado do Teorema de Banach-Cacciopoli.

Já que buscamos como solução uma função x(λ ) (e não elementos de M ), consi-deremos o problema no espaço métrico

C 0(Λ , M ),d ∞

, que é completo, e a ope-

ração funcional Φ : C 0(Λ , M ) → C 0(Λ , M ) definida pela composição Φ ( z)(λ ) =ϕ ( z(λ ),λ ). Sendo composição de funções contínuas, conclui-se que ϕ ( z(λ ),λ ) ∈C 0(Λ , M ), mostrando que Φ está bem definida. Além disso, a desigualdade

d ∞(Φ ( z),Φ ( y)) = sup

λ ∈Λ

d (ϕ ( z(λ ),λ ),ϕ ( y(λ ),λ )) ≤ sup

λ ∈Λ

α d ( z(λ ), y(λ )) ≤α d ∞( z, y)

nos mostra que Φ é também uma contração uniforme emC 0(Λ , M ),d ∞

, em parti-

cular, contínua. Portanto, o Teorema de Banach-Cacciopoli pode ser aplicado nestecontexto, obtendo-se então todas as conclusões desejadas.

Exercício :

3.41. É possível considerar o espaço de parâmetros (Λ ,δ ) sem a condição decompacidade. Neste caso, tomamos o espaço das funções contínuas e limitadasC 0 B(Λ , M ), com a métrica d ∞, como domínio para Φ ; só nos basta agora que Φ preserve o conjunto C 0 B(Λ , M ). Para isto, a existência de pelo menos uma fun-ção ϕ 0 ∈ C 0 B(Λ , M ) cuja imagem Φ (ϕ 0) ∈ C 0 B(Λ , M ), basta para que tenhamos

Φ : C 0

B(Λ , M ) → C 0

B(Λ , M ) bem definida. Verifique esta afirmação e mostre que orestante do argumento é literalmente o mesmo do teorema acima.

3.42. Teorema da função implícita :Seja o compacto K = B(0, R) × B(0, r ) ⊂ Rn ×Rl e a função F : K → Rn contí-nua e continuamente diferenciável com respeito à primeira variável (isto é, F ( x,λ )

e ∂ F ( x,λ )∂ x ∈ C 0(K ,Rn)) tal que para um determinado valor λ 0 ∈ B(0,r ) tenhamos

F (0,λ 0) = 0. Considere a equação F ( x,λ ) = x, como uma continuação desta igual-

dade. Mostre que se ∂ F ( x,λ )∂ x = 0 (isto é, a matriz

∂ F k ( x,λ )∂ xm

for nula), então a equa-

ção tem solução x = ϕ (λ )nas imediações λ 0, ou seja, existe uma função “solução”contínua ϕ definida em um intervalo λ ∈ (λ 0 − ε ,λ 0 + ε ), para a qual tenhamosF (ϕ (λ ),λ ) = x.

O estudo da dependência de soluções de equações diferenciais com respeitoaos parâmetros constitutivos do problema é de importância crucial em Matemática

Page 110: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 110/371

104 3 Equações em Espaços Métricos

Aplicada, especialmente no que diz respeito à formulação e análise de modelosmatemáticos. Uma das duas primeiras apresentações deste teorema foi feita pelomatemático francês Henri Poincaré (1854-1912) no seu monumental trabalho Les Méthodes Nouvelles de la Mécanique Céleste (3 volumes), 1892-1899, e a outra é

devida ao não menos notável trabalho do matemático russo A. M. Lyapunov (...-...), Problème général de la stabilité du mouvement de 1907, sobre estabilidade desoluções de equações diferenciais ordinárias. Este teorema, que justificadamenteleva o nome de ambos no título, é o resultado fundamental da teoria moderna desistemas dinâmicos iniciada por eles mesmos na virada do século XIX para o séculoXX.

A propósito, é importante ressaltar aqui que o termo estabilidade tem significa-dos distintos em contextos distintos. Na Teoria de Sistemas Dinâmicos, há o impor-tante conceito de estabilidade de soluções segundo Lyapunov definida pelo mesmoao final do século XIX (v. Bassanezi, Ferreira, [1988]). No presente caso, estamostratando especificamente da estabilidade funcional segundo Tikhonov, distinta daestabilidade dinâmica de Lyapunov, e definida de forma precisa e abstrata somentepor volta de 1940, embora a ideia já estivesse presente de maneira difusa nos tra-

balhos de Jacques Hadamard sobre problemas específicos de equações diferenciaisparciais do início do século XX.

Teorema 3.13 (Teorema de Poincaré-Lyapunov : Existência, unicidade e depe-dência de parâmetros para as soluções locais do problemas de Cauchy comequações diferenciais ordinárias).Seja o compacto K = [−δ ,δ ] × B(0, R) × B(0, r ) ⊂ R ×Rn ×R p , e a funçãoF : K →Rn contínua e continuamente diferenciável com respeito à segunda variá-

vel (isto é, F (t , x,λ ) e ∂ F k (t , x1,..., xn,λ 1,...,λ p)∂ xm

∈ C 0(K ,Rn) , ∀k ,m). Então, o problemade Cauchy

dxdt

= F (t , x,λ )

x(0) = 0

tem uma e única solução local contínua x(t ,λ ) , isto é, existe 0 < ε ≤ δ e uma função x ∈ C 0((−ε ,ε ) × B(0,r )) que satisfaz à equação

x(t ,λ ) =

t 0

F (s, x(s,λ ),λ )ds

e, além disto, duas soluções locais coincidem na interseção de seus domínios.

Prova. Como F é continuamente diferenciável em x, assim como as suas deriva-das parciais com relação à variaveis reais xk , podemos garantir, com base em umteorema de Cálculo já demonstrado, que F é uniformemente lipchitziana em seu

domínio K com respeito a x, ou seja,

F (t , x,λ ) −F (t , y,λ ) ≤ L y− x , ∀(t , x, y) ∈ K .

Page 111: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 111/371

3.4 A dependência do ponto fixo com respeito a parâmetros 105

Observe que F também é limitada no seu domínio compacto, isto é, F (t , x,λ ) ≤C , ∀(t , x, y) ∈ K ..

Tomemos agora no espaço métrico

C 0([−ε ,ε ]× B(0,ρ)), d ∞

, o sub-espaço

métrico constituído pela bola fechada B(0, R) = M com 0 < ε ≤ δ e 0 < ρ

≤ r ,

de tal forma que a função ϕ : M × B(0,ρ) → M seja bem definida pela expressãoabaixo,

ϕ ( z,λ )(t ) =

t 0

F (s, z(s,λ ),λ )ds,

bastando para isto que C ε ≤ R (verifique!). Tal como no teorema de Liouville-Picard, é fácil ver que ϕ é lipschtziana e que uma iteração ϕ (k ) é uma contraçãouniforme. Fazendo uso do Teorema de Banach-Cacciopoli com parâmetros, obtemoso desejado.

No teorema acima, em vez de apelar para o corolário sobre a iterada contrativa,

é possivel utilizar o teorema original de Banach-Cacciopoli diretamente se conside-rarmos a métrica de Bielecki já apresentada anteriormente :

d B( x, y) = sup0≤|t |≤ε

e−γ t x(t )− y(t ) com γ > 0.

Exercício :

3.43. Verifique esta última afirmação.

O teorema completo de Poincaré se estende para o caso em que a dependên-cia de parâmetros é também diferenciável ou analítica. Para uma análise simples

deste resultado dentro do presente contexto consulte R. C. Bassanezi, W. C. FerreiraJr., Equações Diferenciais e Aplicações, Harbra, 1988, cap.5. Voltaremos a abor-dar estas questões no último capítulo deste texto que trata do Cálculo em EspaçosNormados.

Page 112: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 112/371

Page 113: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 113/371

4

Espaços Vetoriais e Álgebras Normadas

4.1 Espaços Vetoriais e Álgebras Funcionais

Até o momento, o conceito de convergência foi estudado na sua “forma pura”,ou seja, em conjuntos onde não era assumido qualquer outra estrutura além da mé-trica. Entretanto, como se pôde ver claramente nos variados exemplos apresentados,o conceito de convergência está sempre associado a outras estruturas algébricas,notadamente a de espaço vetorial, que é recorrente, a começar pelo próprio Rn, as-sim como os espaços de funções com valores nestes conjuntos. Aproveitando entãoesta ubiquidade e ainda guardando uma extraordinária abrangência de exemplosrelevantes, é natural que o próximo passo no desenvolvimento da Análise Funcio-nal seja o estudo da estrutura de espaço vetorial acoplada a uma estrutura métricaem sua forma abstrata e geral. Os espaços euclidianos Rn, e especialmente o plano(n = 2), nos fornecem uma poderosa imagem mental, ou pelo menos, um protó-tipo do que deve ser procurado como modelo axiomático para a construção de umaestrutura abstrata de espaço vetorial acoplada a um conceito de convergência. To-

davia, as interpretações do modelo abstrato resultante, como sempre acontece comgeneralizações matematicamente férteis, extrapolarão de muito as suas motivaçõesoriginais, da mesma forma como ocorreu entre o modelo de espaço métrico e a suamotivação “concreta” original, os números reais. Mesmo assim, é importante frisarque a principal “concretização” da teoria abstrata continuará se baseando, de umamaneira ou de outra, nos espaços vetoriais constituídos por funções com valores emR (ou C), onde as operações naturais de soma e multiplicação por escalar são defi-nidas ponto a ponto, o que por si mesmo será uma fonte de extraordinária riquezade aplicações.

A introdução do conceito abstrato de Espaço Vetorial na literatura matemáticapode ser creditada, assim como várias outras idéias já o foram, ao matemático ita-liano Giuseppe Peano, neste caso, por intermédio de seu livro Calcolo Geometricosecundo l’Ausdenungslehre di H. Grassmann e precedutto delle operazioni della lo-

gica dedutiva, Torino, 1888. É interessante notar que, para ser justo, ele atribui, jáno título do livro, a sua inspiração ao trabalho do matemático alemão H. Grassmann,ainda obscuro àquela época. Para um apanhado histórico sobre este assunto consulte

Page 114: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 114/371

108 4 Espaços Vetoriais e Álgebras Normadas

Jean-Luc Dorier, A General Outline of the Genesis of Vector Space Theory,Historia Mathematica, 22, 1995, 227-261,Gregory H. Moore, The Axiomatization of Linear Algebra : 1875-1940,Historia Mathematica, 22, 1995, 262-303,

além das referências históricas gerais, especialmente Kline[1970].Iniciaremos pela apresentação das definições formais de estrutura de espaço ve-

torial, transformação linear e isomorfismo linear, que supomos já serem familiaresao leitor deste texto, mas que podem ser revistos, de preferência, em um dos exce-lentes textos existentes sobre o assunto tais como : G. Strang, Introduction to Linear Algebra, Wellesley ; I. M. Gelfand, Linear Algebra, Dover, e, particularmente, P. D.Lax, Linear Algebra, J. Wiley.

Definição 4.1 (Espaço Vetorial).Um espaço vetorial é um conjunto E que contem pelo menos um elemento chamado zero, denotado naturalmente pelo símbolo 0 , no qual está definida uma operação desoma “+”, (∀ x, y ∈ E, temos x + y ∈ E) com as seguintes propriedades :

1. Associatividade :∀ x, y, z, x + ( y + z) = ( x + y) + z,

2. Comutatividade : ∀ x, y, x + y = y + x,

3. Neutralidade do zero : ∀ x, x + 0 = x.

Além disto, está associado a E um corpo chamado de escalares, F , que em geralé R ou C , e uma operação de multiplicação por escalar (∀ x ∈ E , ∀λ ∈ F , temosλ x ∈ E), satisfazendo às seguintes propriedades :

1. Associatividade : ∀ x ∈ E, ∀λ ,µ ∈ F , λ (µ x) = (λµ ) x,

2. Distributividade : ∀ x, y ∈ E, ∀λ ,µ ∈F , λ ( x + y) = λ x +λ y e (λ + µ ) x = λ x +µ x,

3. Neutralidade do escalar unitário : ∀ x ∈ E, 1 x = x.

O critério algébrico para determinar se dois espaços vetoriais simbolicamentedistintos (ou seja, com “nomes diferentes”) são de fato distintos ou, simplesmenteduas representações do mesmo objeto matemático abstrato, é instrumentalizado peloconceito de Isomorfismo Linear , que nos permite identificar duas estruturas veto-riais.

Definição 4.2 (Transformação Linear e Isomorfismo Linear).Sejam E 1 e E 2 dois conjuntos dotados de estruturas de espaços vetoriais com omesmo corpo de escalaresF (R ou C).Uma função L : E 1 → E 2 é chamada de transformação (ou operação) linear (homo-morfismo linear, na linguagem algébrica) se a sua ação pode permutar com as res- pectivas operações características do espaço vetorial, ou seja, se ∀ x, y ∈ E 1,λ ∈F :

1. L( x + y) = L( x) + L( y) , e

2. L(λ x) = λ L( x).

Page 115: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 115/371

4.1 Espaços Vetoriais e Álgebras Funcionais 109

Uma função bijetora L : E 1 E 2 que identifica os elementos destes dois conjun-tos, se for também linear, identificará as duas estruturas de espaço vetorial e, nestecaso, diremos que os dois espaços vetoriais são isomorfos por intermédio do iso-morfismo linear L.

O conjunto de todas operações lineares dentre dois espaços E 1 e E 2 será denotado por L (E 1, E 2) , ou simplesmente L (E ) quando E 1 = E 2.

Observe que se L for linear e bijetora, então L−1 também será linear (verifique).Se L for isomorfismo, então podemos efetuar as operações vetoriais de E 1 em E 2 (evice-versa) da seguinte maneira : u +λ v = L−1 ( L(u) +λ L(v)), ∀u, v ∈ E 1, ou seja, L atua como um “espelho de estruturas”. Em particular, lembre-se que dois espaçosvetoriais de dimensão finita são isomorfos se, e somente se, têm a mesma dimensão.

A definição dos conceitos de dependência e independência linear, dimensão,subespaço vetorial e etc. são os próximos passos já conhecidos da Álgebra Linearque não repetiremos aqui.

Definição 4.3 (Espaços Vetoriais Funcionais).

Uma vez obtido um Espaço Vetorial E, com escalares F , podemos imediatamenteconstruir uma enorme variedade de outros espaços vetoriais sobre os conjuntos de funções definidas em um conjunto qualquer não vazio M e com valores em E,

E =Φ ( M , E ) = “Conjunto de todas as funções ϕ : M → E”,

herdando os escalares F e definindo as operações em E pontualmente da seguintemaneira :

1. Soma : se ϕ ,ψ ∈ Φ ( M ,E ) , h = ϕ +ψ é a função h : M → E, tal que h( x) =ϕ ( x) +ψ ( x) , ∀ x ∈ M, e

2. Multiplicação por Escalar : se λ ∈F , e ϕ ∈Φ ( M , E ) , então, λϕ = g é a funçãog : M → E, tal que g( x) = λϕ ( x),∀ x ∈ M.

Não é difícil mostrar a consistência desta definição e estabelecer uma resultanteestrutura de espaço vetorial para estes conjuntos, o que deve ser verificado formal-mente pelo leitor caso lhe reste alguma sombra de dúvida sobre isto.

Observação 4.4. É importante enfatizar que na definição acima assume-se que osescalares da estrutura de espaço vetorial no conjunto Φ ( M , E ) são os mesmos, her-dados dos escalares de E , o que será sempre assumido sem ressalvas. Entretanto,se estes forem F= C, podemos considerar também uma outra estrutura vetorial nomesmo conjunto Φ ( M ,E ) com escalares R mas, não o contrário (verifique) ! Em-bora as estruturas sejam definidas no mesmo conjunto, e com a mesma operaçãosoma, mesmo assim teríamos dois exemplos distintos de espaço vetorial, pois nãoseriam isomorfos. Em particular, observe que o próprio C é um espaço vetorial de

dimensão 1 se o considerarmos com escalares C, mas terá dimensão 2 se os es-calares forem R. Em alguns casos, denota-se Φ ( M , E ) por E M , em analogia comRn.

Page 116: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 116/371

110 4 Espaços Vetoriais e Álgebras Normadas

Os exemplos de espaços vetoriais que trataremos neste texto poderão inva-riavelmente ser construídos como subespaços de Φ ( M ,E ) para os mais varia-dos conjuntos M , onde E por sua vez poderá se referir a um espaço vetorialΦ ( M ,R) (ou, Φ ( M ,C)) e assim ad infinitum. A começar dos próprios Rn e Cn,

já podemos interpretá-los como espaços funcionais Φ ( M ,R) (ou, Φ ( M ,C)) com M = I n = 1, 2,....n. É fácil vislumbrar que, utilizando esta estratégia, podemosconstruir uma infindável variedade de espaços vetoriais, na verdade, praticamentetodos que nos interessarão. Seguem abaixo vários exemplos que indicam a maneirapela qual, próxima ou mais longinquamente, a sua estrutura de um espaço vetorialé herdada de algum Φ ( M ,R) (ou, Φ ( M ,C)). Estes exemplos, que ocorrerão nestetexto com grande freqüência, servirão, ao mesmo tempo, para familiarizar o leitorcom algumas notações amplamente utilizadas na literatura da área.

Exercícios - Exemplos de Espaços Vetoriais Funcionais :

Verifique a boa definição das operações de espaço vetorial em cada subconjuntode funções abaixo mencionado, isto é, verifique se tal subconjunto é estável (i.e.,invariante) com respeito às operações de soma e multiplicação por escalar pontuaistal como definido acima para Φ ( M , E ).

4.1. a) Rn e Cn são de fato espaços funcionais Φ ( M ,R) (ou, Φ ( M ,C)) com M = I n = 1,2,....n.

b) As matrizes também são espaços funcionais : M n×m(C) ≈ Φ ( I n × I m,C) ≈Φ ( I n, (Φ ( I m,C))≈Φ ( I m, (Φ ( I n,C)), vistas, respectivamente, como arranjo denúmeros, colunas de linhas e linhas de colunas, respectivamente.

4.2. a) B( M ,Cn) = “Conjunto das funções g : M →Cn, limitadas”, onde M é umconjunto qualquer não vazio, com escalares complexos.

b) B( M ,Cn) = “Conjunto das funções g : M → Cn, limitadas”, onde M é umconjunto qualquer não vazio, com escalares reais.

4.3. C k (R,R) = “Conjunto das funções reais continuamente diferenciáveis até or-dem k ”.

4.4. a) C ∞(R,R) = ∩0≤k C k (R,R) = “Conjunto das funções reais continuamentediferenciáveis até qualquer ordem”.

b) C ∞0 (Rn,R) = “Conjunto das funções h ∈ C ∞( Rn, R) com suporte compacto”.

c) S (Rn,R) = h ∈ C ∞(Rn,R), tais que ∀α = (α 1,...α n),β = (β 1,....β n) ∈ Nn,lim| x|→∞ xβ [∂ α h( x)] = 0, ou seja, o conjunto de funções infinitamente diferen-ciáveis que decaem no infinito, assim como todas as suas derivadas, mais rapi-damente do que qualquer potência negativa −β da variável x. Este espaço tam-bém é chamado de Espaço de Schwartz. Observe que C ∞0 (Rn,R) ⊂S (Rn,R).

4.5. a) C ω (R,R) =“Conjunto de funções analíticas reais de variável real”, isto

é, funções infinitamente diferenciáveis cujas séries de Taylor representam defato e localmente a função. Obviamente, C ω (R,R) ⊂ C ∞(R,R), mas tambémsabemos que C ω (R,R) = C ∞(R,R).

Page 117: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 117/371

4.1 Espaços Vetoriais e Álgebras Funcionais 111

b) C ω (Ω ⊂ C) = “Conjunto das funções complexas analíticas definidas em umaregião Ω ”, também denotado por H (Ω ) = “Funções Holomorfas”.

c) A ( D1) = “Funções contínuas no disco fechado unitário com centro na origem, D1, e Holomorfas no seu interior ”, A ( D1)

⊂ H ( D1) = C ω ( D1)

⊂C ∞( D1)

⊂C k ( D1), ∀k ≥ 0. Analogamente, se pode definir, claro, A (Ω ) para qualquerregião Ω ⊂C.Observação : Uma função f : Ω →C é analítica segundo Weierstrass na regiãoΩ (região é o termo para um conjunto aberto e conexo) se puder ser localmenterepresentada por uma série potências de ( z− z0) em alguma vizinhança de cadaponto z0 ∈Ω , e (equivalentemente) analítica segundo Cauchy, se tiver derivadacomplexa f ( z0) em cada ponto z0 ∈ Ω . Sobre este assunto, consulte um dosmestres na área citados na bibliografia : Ahlfors, Henrici, Remmert, Cartan, ou,se for só para começar, o onipresente Courant, Cálculo, vol. 2.

4.6. BV ([0, 1],R) = “Conjunto de funções de Variação (total) Limitada (Bounded Variation)”= g : [0,1] →R; ∃C g > 0, tal que, para qualquer partição P do intervalode domínio [0,1], P =

0 = x0 < x1 < ... < xn = 1

, tenhamos Var P[g] = “Variação

de g na partição P” = k =n∑

k =1| g( xk +1)− g( xk ) |≤ C g.

4.7. E ([0, 1],R) = “Funções escada”.

4.8. R ([0, 1],R) = “Conjunto das funções reguladas” = E ([0,1],R)d ∞

.

4.9. a) Pm(C) = “Conjunto dos polinômios de grau ≤ m de coeficientes com- plexos” ⊂ H (C).

b) P(C) = ∪0≤mPm(C) = “Conjunto de todos os polinômios com coeficientes com- plexos” ⊂ H (C).

4.10. a) L 1ρ (R,R) = “Conjunto das funções g : R→ R tais que sua integral im-

própria de Riemann,∞

−∞| g( x) | dx = lim

N →∞

N − N

| g( x) | ρ( x)dx,

existe”, onde ρ ∈ C 0(R,R++) é chamada função peso. Por exemplo, ρ ( x) =exp(− x2), ou, ρ( x) = 1

1+ x2 (para ajudar) ou, ρ( x) = (1 + x2n) (para atrapalhar),ou ρ( x) = exp(−λ | x|) (um ou outro, dependendo do sinal de λ ).

b) L 1ρ (R+,R) = “Conjunto das funções g :R+ →R tais que a integral imprópria

de Riemann,∞

−∞| g( x) | ρ( x)dx, existe”, onde ρ : R+ → R++. Por exemplo,

ρ( x) = exp(

−λ x), λ > 0.

4.11. c∞(C) = g : N → C, para a qual existe o limite limk →∞ g(k ) ⊂ Φ (N,C)(com corpo de escalares complexos.

Page 118: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 118/371

112 4 Espaços Vetoriais e Álgebras Normadas

4.12. l∞(C) = B(N,C) = “Conjunto das sequências limitadas de números com- plexos”.

4.13. l 1(C) = g :N→C, para as quais ∞

∑k =0

| g(k ) |<∞ = “sequências de números

complexos que são absolutamente somáveis”.

4.14. l 2(C) = g :N→C, para as quais ∞

∑k =0

| g(k ) |2<∞ = “sequências de números

complexos que são quadrado somáveis”.

4.15. l p(C) =g :N→C, para asquais ∞

∑k =0

| g(k ) | p<∞ = “sequências de números

complexos que são p > 0 somáveis”.

Teorema 4.5 (l p(C) é de fato um espaço vetorial).Os conjuntos de funções (sequências) l p(C) ⊂ Φ (N,C) , com soma e produto por escalar definidas, como sempre, pontualmente, constituem espaços vetoriais, com

escalares reais ou complexos.

Prova. Para mostrar que l p(C), p > 0, é um espaço vetorial, basta mostrar que é fechado para as operações de soma e produto por escalar , isto é, que é subespaçode Φ (N,C).

Sejam então g ∈ l p(C) e λ ∈ C e h = λ g ; devemos mostrar que h ∈ l p(C), oque é simples. Verifique.

Sejam agora g e h ∈ l p(C) ; devemos mostrar que g + h ∈ l p(C). Antes, obser-vemos a seguinte simples desigualdade : se 0 ≤ a ≤ b então

| a + b | p≤ (| a | + | b |) p ≤ 2 p | b | p≤ 2 p(| a | p + | b | p),

o mesmo valendo, por simetria, se 0 ≤ b ≤ a.Então, para todo N , temos

N ∑

k =0| (g + h)(k ) | p =

N ∑

k =0| g(k ) + h(k ) | p≤

N ∑

k =02 p(| g(k ) | p + | h(k ) | p)

≤ 2 p(∞

∑k =0

| g(k ) | p +∞

∑k =0

| h(k ) | p).

Como a limitação à direita independe de N , concluímos que ∞

∑k =0

| (g + h)(k ) | p< ∞.

4.16. Mostre que se 1 < p1 < p2 ≤∞, então l p1 (C) ⊂ l p2 (C), ou seja, quanto menor p, menor o subespaço l p(C). Particularmente, mostre que l1(C) ⊂ l2(C) ⊂ l∞(C).

Dê exemplos de sequências para mostrar que as inclusões são estritas, ou seja, nuncasão igualdades, e os conjuntos à esquerda são sempre menores do que os que oscontêm.

Page 119: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 119/371

4.1 Espaços Vetoriais e Álgebras Funcionais 113

4.17. l pω (C) = g :N→C, tais que

∑k =0ω (k ) | g(k ) | p<∞ = “Conjunto das sequên-

cias de números complexos que são ω , p−somáveis”, onde ω : N→ R++ e p > 0.A sequência ω faz o papel de um peso que pode “facilitar ou dificultar” a soma ; por

exemplo, respectivamente, ω (k ) =

1

1+k 2 ou ω (k ) = k

2

.4.18. M ( A,C) = “Conjunto das matrizes complexas”, de diversos tipos onde oconjunto A será, dependendo do tipo de matrizes, um dos seguintes

a) A = I n = 1,.......n (matrizes colunas ou vetores do Rn),

b) A = I n × I n (matrizes n ×n),

c) A = I n × I n × I n (matrizes 3-dim n ×n),

d) A = ( I n) p, ou A = N×N= I ∞× I ∞ (matrizes semi-infinitas),

e) A = Z×Z (matrizes infinitas).

4.19. l 1(Z× Z,C) = “sequências duplamente indexadas que são absolutamentesomáveis”, isto é, g ∈ l1(Z×Z,C) se existir uma constante C g tal que, para qual-quer inteiro m, tenhamos ∑

i2

+ j2≤m |

g(i, j)

|≤C g. Semelhantemente, podemos definir

l p(Z×Z,C).

4.20. L p R (R,R) = “Conjunto das funções g :R→R tais que sua integral imprópria

de Riemann∞

−∞| g( x) | p dx existe” ( p > 0).

4.21. a) C 0

[0,1],C 0([0,1],R), d ∞

, ou, genericamente, C 0

M ,C 0(S ,R), d ∞

,

onde M e S são espaços métricos compactos.

b) O conjunto de funções C 0

[0,1],C 0([0,1],R), d ∞

pode ser identificado com

C 0 ([0,1] × [0,1],R), e eles são, de fato, espaços vetoriais.

4.22. P∞(∂ x,R) = “Conjunto dos operadores diferenciais ordinários lineares do tipo

L =k =m∑

k =0

Ak ( x)∂ m x ”, onde Ak

∈C ∞(R,R), interpretados como funções L : C ∞(R,R)

→C ∞(R,R), i.e., L ∈Φ (C ∞(R,R),C ∞(R,R)), com soma e produto por escalar defini-dos como sempre, pontualmente ou, função a função. Um espaço semelhante podeser definido para operadores diferenciais parciais. Pode-se também definir subes-paços de operadores com coeficientes analíticos Pω , polinomiais Pm, ou constantesPc.

4.23. C α ([0,1],R) = h ∈ C 0([0,1],R), para as quais existe um número ch > 0 tal

que ∀s, t , 0 ≤ s < t ≤ 1, tem-se |h(t )−h(s)||s−t |α ≤ ch, onde 0 < α ≤ 1. Estas funções são

chamadas Holderianas. Se α = 1 temos as funções Lipschitzianas.

Vários outros exemplos serão estudados ao longo do curso, mas uma boa refe-rência nesta direção é o livro de Kantorovich-Akilov já citado.

Para algumas generalizações inesperadas e “exóticas” do conceito de espaçosvetoriais que nos levam a acreditar que este modelo abstrato abrange exemplos maisestranhos do que sonha nossa vã filosofia, consulte :

Page 120: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 120/371

114 4 Espaços Vetoriais e Álgebras Normadas

V. P. Maslov, Méthodes Operatorielles, MIR, 1989, (apêndice),B. Heidergott & al., Max Plus at Work , PUP, 2006,M. E. Carchidi, Generating Exotic Looking Vector Spaces, The Coll. Math.Journal, 29(4), 1998, 304-308.

4.2 Álgebras

Umaestruturade espaço vetorial definida em um conjunto de funçõesΦ ( M ,R) = f : M → R com as operações soma e multiplicação por escalar herdadas pontual-mente da operação correspondente dos números reais, pode ser analogamente do-tada de uma operação pontual de “ produto” entre seus membros que, de tão óbvia,não poderia ser ignorada.

Um conceito genérico e informal de “produto” em um espaço vetorial E , éuma operação binária que a cada par de elementos x, y ∈ E , associa um outro ele-mento, usualmente denotado apenas por justaposição, xy ∈ E , que exibe pelo menosa associatividade, x( yz) = ( xy) z e a bilinearidade, ou seja, ( x +λ x) y = xy +λ zy e x( y +λ z) = xy +λ xz, ∀ x, y, z ∈ E , λ ∈ F . Os exemplos mais notórios de “produto”são, naturalmente, os produtos usuais dos números reais (R ) ou complexos (C), e,em seguida, as funções com valores reais ou complexos com o produto definido pon-tualmente, como já foi citado. Um espaço vetorial que também exiba um produto,será denominado, genericamente, uma álgebra.

As operações produtos definidos em álgebras A, por sua vez, podem ainda serherdados pontualmente por todos os espaços vetoriais funcionais com valores em A, Φ ( M , A) = ϕ : M → A e assim ad infinitum. Além disso, em contextos topoló-gicos, onde haverá ainda uma estrutura de convergência, operações produto serão“topologicamente” herdados pelos completamentos de álgebras. Enfim, a ocorrên-cia de uma operação “ produto” entre os elementos de um espaço funcional seráquase tão certa e comum quanto a operação soma que possibilita a definição de sua

estrutura vetorial, o que indica claramente a necessidade de estabelecer um modeloabstrato que sintetize os aspectos básicos destes inúmeros exemplos.A definição axiomática dos modelos abstratos que descrevem estas estruturas

algébricas constituídas de um espaço vetorial acoplado a uma operação produto,assim como várias de suas exemplificações relevantes para este texto, serão apre-sentadas formalmente a seguir.

Observação 4.6. É interessante observar que a denominação produto usualmente sereserva, mas não exclusivamente, a operações binárias que ocorrem em um contextocomo o que é abaixo descrito pela estrutura de álgebra. Todavia, tal como o “Ovo”no País das Maravilhas de Alice, os matemáticos são livres para chamar os seusobjetos do que bem entenderem, mesmo que isto cause confusão a eles e mais aindaaos outros.

Definição 4.7 (Axiomática da estrutura de álgebra). Dizemos que um espaço vetorial A é uma álgebra se este espaço também dispõe de

Page 121: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 121/371

4.2 Álgebras 115

uma operação, que denominaremos produto, e denotaremos, ∀ x, y ∈ A, por xy ∈ A,satisfazendo às duas seguintes propriedades :

a) Associatividade : ∀ x, y, z ∈ A, x( yz) = ( xy) z,

b) Bilinearidade : se x, y, z∈

A,λ ∈

F, então x( y +λ z) = xy+λ ( xz) e ( x +λ y) z =

xz +λ ( yz).

Ainda,

1. Uma álgebra se diz unitária (ou com unidade) se existir um elemento chamadounidade, denotado por e (ou por 1), tal que : ∀ x ∈ A, xe = ex = x.

2. Uma álgebra unitária é denominada um corpo se todo elemento não nulo teminverso, ou seja, ∀ x ∈ A, x = 0 , existe y ∈ A tal que xy = yx = e, que será únicoe, portanto, naturalmente denotado por y = x−1.

3. Uma álgebra é dita comutativa (ou abeliana) quando satisfaz ao seguinteaxioma : xy = yx, ∀ x, y ∈ A.

Definição 4.8 (Definição de sub-álgebra).Um subespaço vetorial A1 de uma álgebra A, A1 ⊂ A, se for estável para o produto,isto é, se ∀ x, y ∈ A1, xy ∈ A1 , será também uma álgebra com a estrutura herdada de A, e será denominada de sub-álgebra de A.

Definição 4.9 (Isomorfismos). Duas álgebras A e B são (algebricamente) isomorfas se existir uma função bijetorade identificação entre elementos e suas respectivas operações, isto é, uma funçãobijetora ϕ : A → B, chamada isomorfismo de álgebras, tal que : ∀a1, a2 ∈ A, λ ∈ F,tem-se :

1. ϕ (0) = 0 , ϕ (e) = e,

2. ϕ (a1 +λ a2) = ϕ (a1) +λϕ (a2) ,

3. ϕ (a1a2) = ϕ (a1)ϕ (a2).

Observe que, antes de tudo, um isomorfismo de álgebras ϕ é um isomorfismolinear entre os espaços vetoriais subjacentes, pois identifica as operações peculiaresdesta estrutura nos dois espaços.

4.2.1 Métodos de Algebrização de Espaços Vetoriais (Definições de OperaçõesProduto)

Há várias maneiras “naturais” de definir um produto (associativo e bilinear) em

certas estruturas de espaços vetoriais que as transformam em álgebras; abaixo apre-sentaremos formalmente quatro classes genéricas deste procedimento, seguidas deexemplificações “concretas”.

Page 122: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 122/371

116 4 Espaços Vetoriais e Álgebras Normadas

Pontual

Se E = Φ ( M , A) = f : M → A (para um conjunto qualquer M e uma álgebra A), podemos definir o produto e multiplicação ponto a ponto, herdando os escalares

de A. Este procedimento, uma vez iniciado com A = R ou C, pode, daí por diante,produzir álgebras funcionais em grande profusão. Por exemplo, considere a álgebraΦ ( M ,Φ ( M ,Φ ( M ,Φ ( M ,Φ ( M , A))))) !

Composição no Espaço Vetorial de Transformações Lineares L (E ) definidasem um espaço vetorial E

Não é apenas a operação pontual de produto que produz álgebras ; há tambémuma segunda origem essencialmente distinta da anterior e, em um contexto peculiar,onde ocorre naturalmente uma operação produto, que terá um importante papel parao desenvolvimento da Análise Funcional. Isto se dá nos espaços vetoriais funcionaisdas transformações lineares L (E ) = L : E → E ; L é linear, onde E é um espaçovetorial. No espaço vetorial L (E ) que é um “pequeno” subespaço de Φ (E ,E ), a

operação binária de composição pode ser naturalmente definida e, de fato, comoé fácil verificar, ela satisfaz às propriedades de associatividade e bilinearidade, e,portanto, tem todos os requisitos para ser denominada “ produto”. Como uma dasaplicações mais relevantes da Análise Funcional encontra-se exatamente no estudode operadores diferenciais e integrais lineares, não será surpresa constatar que estasálgebras têm uma posição de destaque especial nesta matéria.

Induzidas

A partir das duas operações básicas de produto definidas em espaços funcionais(pontual e composição), inúmeras outras operações deste tipo podem ainda ser defi-nidas em espaços vetoriais E por intermédio de um método de grande flexibilidade

denominado indução, que faz uso de isomorfismos lineares que “transportam” umproduto já existente em uma álgebra A para um outro Espaço Vetorial linearmenteisomorfo à ela, L : E A. Para isto, define-se um (novo) produto “∗” em E induzidopor um produto “•” (já existente) em A através do isomorfismo linear L, da seguintemaneira, formal, mas muito natural : ∀u, v ∈ E , u ∗ v = L−1 ( L(u)• L(v)).

Na verdade, o produto matricial pode ser interpretado como proveniente da apli-cação deste método, ou seja, a definição da álgebra matricial no espaço vetorial M n(C) = Φ ( I n × I n,C) é induzida pelo isomorfismo vetorial deste com o espaçovetorial das Operações Lineares L (Cn) = L (Φ ( I n,C)), que é uma álgebra com oproduto da composição.

Exercícios :

4.24. Mostre que a regra u∗

v =

L−

1

( L

(u

)• L

(v

)) de fato define um produto em E ,

tal como afirmado acima.

Page 123: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 123/371

4.2 Álgebras 117

4.25. Verifique a aplicação formal do método de indução para definir o produtomatricial comum.

Produtos matriciais em dimensão infinita, definidos em subespaços de M ∞(C

) =Φ (Z×Z,C) por intermédio de isomorfismos comL (Φ (Z,C)), e contínuos, defini-dos em subespaços de Φ ([0,1] × [0, 1],C) por isomorfismos com L (Φ ([0, 1],C)),serão extensões naturais e importantes desta idéia em Análise Funcional, a seremtratadas mais adiante.

Uma segunda e importante exemplificação do método indutivo em Análise Fun-cional ocorre com a definição de produtos que genericamente podem ser denomina-dos “Produtos de Convolução”, originados de isomorfismos lineares entre Espaçosde funções e álgebras (pontuais) de Funções Polinomiais e Exponenciais (na ver-dade, funções periódicas, em um sentido que ficará claro pelos exemplos apresenta-dos abaixo).

Finalmente, álgebras são produzidas por “heranças” :

Herança algébrica

Se E for um subespaço vetorial de uma álgebra A, E ⊂ A, estável (invariante)para o produto (isto é, ∀ x, y ∈ E , xy ∈ E ) então o próprio E será uma álgebra, ouseja, uma sub-álgebra de A.

Herança topológica

Se A for uma álgebra que é um subespaço vetorial denso em E , A = E , então, emE existirá uma única estrutura “limite” de produto de tal forma que fará de E umaálgebra e, neste caso, A será uma sub-álgebra de E , que será denominada extensãotopológica de A. Veremos como isto se dá, exatamente, quando tratarmos de álge-bras normadas. De qualquer forma, este processo utilizará os mesmo argumentosempregados na demonstração do teorema de extensões de funções uniformementecontínuas para o fecho de um espaço métrico.

Exercícios - Exemplos de Algebrização de Espaços Vetoriais :

4.26. a) R com o produto usual, o modelo concreto fundamental a partir do qual,construímos todos os outros que nos interessam aqui.

b) R2≈C com o produto complexo : ( x1, x2)( y1, y2) = ( x1 y1 − x2 y2, x1 y2 + x2 y1). O“produto vetorial” em R3 é muito “fraco de propriedades” para ser consideradoum “produto” (por que ?), mas os quaternions e álgebras de Clifford em geralchegam a formar álgebras no sentido acima. A respeito destas e outras, consulte

o excelente clássico G. Birkhoff, S. MacLane, A Survey of Modern Algebra,AMS.

Page 124: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 124/371

118 4 Espaços Vetoriais e Álgebras Normadas

c) Cn (ou Rn) com o produto “banal” herdado dos números complexos quandointerpretados como funçõesΦ ( I n,C),α ∗β = (α (1)β (1),.......,α (n)β (n)) , quenunca teve muita distinção em Matemática, ao contrário do seguinte exemplo,mais artificioso.

d) Produto “cíclico”, ou convolução em C N .Considere os vetores a ∈C N , e, ao invés de visualizá-los como um conjuntode valores numéricos linearmente ordenados a = (a1,....,a N ), interprete estaordenação disposta periodicamente em um círculo percorrido no sentido horá-rio, de tal forma que a N -ésima coordenada α N esteja situada imediatamenteanterior à primeira, a1, e identifique a N +1 = a1, e etc. Uma das maneiras for-mais de descrever esta situação, é identificar C N com a álgebra das funções N −periódicas, Φ N − per (Z,C) = ϕ : Z→ C, ϕ (k + N ) = ϕ (k ),∀k ∈ Z. Pode-se mostrar que este conjunto é um espaço vetorial funcional de dimensão N combase

ϕ m(k ) = exp

2π im

N k

1≤m≤ N , e se constitui em uma (sub)álgebra com asoperações pontuais.Associando biunivocamente os vetores a = (a1,....,a N ) às funções

ϕ (s) = ∑1≤m≤ N

am exp2π im N

s= L(a),

definimos um isomorfismo L : C N →Φ N − per (Z,C) entre os dois espaços veto-riais, de onde obtemos :

a∗b L⇐⇒ ϕ (s)ψ (s) =

1≤r ≤ N

ar exp

2π ir N

s

1≤ j≤ N b j exp

2π i j N s

= ∑1≤k ≤ N

1≤m≤k

ak −mbm

exp

2π ik N

s

(a∗b)(k )

= L−1

( L(a) L(b)) = ∑1≤m≤k ak −mbm.

Esta identificação resulta em um produto induzido associativo, distributivo, co-mutativo, e tem elemento identidade, em C N . Observe que nem todo elementonão nulo tem inverso. É interessante destacar o envolucro matemático do pro-cesso, mas para obtermos uma relação explícita em termos das coordenadas dea e b é necessário “fazer as contas”. Identificações como essas dão origem aprodutos em espaços vetoriais essencialmente distintos dos simples produtosponto a ponto.

4.27. Produto de convolução no “espaço de sequências quase-nulas” c0(N,C)Consideremos na álgebra com operações pontuais Φ (Z,C), o subespaço ve-

torial de (todas) as funções periódicas, ou seja, Φ per (Z,C) = ∪0≤ N Φ N − per (Z,C),

pois, a soma ou o produto entre uma função P−periódica e outra Q−periódica,dá origem a uma função PQ-periódica, e, de fato, este espaço é gerado pela baseβ N ,m(k ) = exp

2π im

N k

0≤m≤ N <∞, ou seja,

Page 125: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 125/371

4.2 Álgebras 119

Φ per (Z,C) =

ϕ : Z→C : ϕ (s) = ∑

0≤ N ≤ M

m= N

∑m=1α m exp

2π im

N s

,

e, portanto, tem dimensão infinita. Associando os elementos de

c0(N,C) = α : N→ C : ∃ nα tal que, se k > nα ⇒ α (k ) = 0 ⊂Φ (N,C),

onde α = (α 1,....α N ,0,0, 0, 0...),α N = 0, com a função N -periódica

m= N

∑m=1α m exp

2π im

N s

,

podemos induzir neste espaço um produto de convolução.

4.28. Produtos de Convolução em l1(C) =

a : Z→ C : ∑

−∞< j|a(k )| <∞

.

Comecemos pelo :

Teorema 4.10 (Teorema de Fubini-Tonelli).Seja F : Z×Z→ R+. Se uma das somas parceladas é finita,

∑−∞<m

∑∞−<k

F (k , m)

= S < ∞,

então, para qualquer enumeração (rearranjo) do conjunto Z×Z , isto é, qualquer função bijetora, n : N Z×Z , a sequência f ( j) = F (n( j)) pertence a l1(C) , e

∑−∞<m

∑∞−<k

F (k ,m)

= ∑

−∞< j f ( j) = ∑

−∞<k

∑∞−<m

F (k ,m)

e, vice-versa, se existir uma enumeração n : N Z×Z tal que f ( j) = F (n( j)) ∈l1(C) , então as somas parceladas são finitas e iguais como acima.

Prova. Considerando o primeiro caso, para cada J existem M e K tais que n([0, J ]) ⊂[− M , M ]× [−K ,K ], e, portanto,

∑0< j< J

f ( j) ≤ ∑− M <m< M

−K <k <K

F (k ,m)

≤ S .

Como isto acontece para todo J , conclui-se que a série é finitamente somável e∑

0< j<∞ f ( j) ≤ S . Revertendo o argumento, para cada M e K existe um J tal que todos

os índices [− M , M ] × [−K ,K ] ⊂ n([0, J ]), de onde concluímos que S ≤ ∑0< j<∞

f ( j),

e daí, a igualdade. Os outros casos seguem de forma semelhante.

Page 126: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 126/371

120 4 Espaços Vetoriais e Álgebras Normadas

Consideremos agora o espaço de funções contínuas definidas pelo fecho uni-forme de Séries de Fourier com coeficientes em l1(Z,C), ou seja,

E = ϕ : [0,1]

→C ;ϕ (s) = ∑

−∞<k

a(k ) exp(2π iks)⊂C 02π

− per ([0, 1],C).

É fácil provar (via teste de Weierstrass) que se a(k ) ∈ l1(Z,C), então a série deFourier, ∑

−∞<k a(k ) exp(2π iks), de fato, converge uniformemente. Portanto, pode-

mos considerar o isomorfismo linear natural L : l 1(Z,C) → E , L(a) = ϕ (s) =

∑−∞<k

a(k ) exp(2π iks). Como as funções C 02π − per ([0,1],C) formam umaálgebra com

operações pontuais, sabemos que sendo E um seu subespaço vetorial, será tambémuma sub-álgebra se for fechada (estável) para a respectiva operação produto. Paraconfirmar esta suspeita e, ao mesmo tempo, obter a forma deste produto, lança-mos mão do Teorema de Fubini-Tonelli, que nos garante que o produto pontual emC 02π − per ([0,1],C) quando restrito a E , pode ser interpretado como o produto porconvolução (que é um rearranjo da soma), pois,

∑−∞<k

a(k ) exp(2π iks)

∑−∞<m

b(m) exp(2π ims)

=

∑−∞< j

k +m= j

a(k )b(m)

exp(2π i js).

Assim l 1(Z,C) se torna uma álgebra com o produto de convolução induzido pelosubespaço E das funções periódicas contínuas.

Observe que pelo (segundo) teorema de aproximação de Weierstrass (o trigono-métrico), toda função contínua é uniformemente aproximável por polinômios trigo-nométricos, onde, cada um deles pode ser interpretado como uma série de Fouriercom coeficientes em sequências quase nulas :

c0(Z,C) =

a : Z→ C; ∃ ˙ M > 0 tal que a(k ) = 0 se |k | > M ⊂ l1(Z,C).

Entretanto, não podemos garantir que toda função contínua e periódica pode serescrita como limite uniforme de uma série de Fourier. Portanto, o conjunto E éum subconjunto estrito de C 02π − per ([0, 1],C). Situação análoga ocorre com as fun-

ções contínuas C 0([0,1],C), que podem ser uniformemente aproximáveis por po-linômios, mas não, em geral, por uma séries de potências, que é uma construçãopolinomial “organizada”, isto é, recursiva e acumulativa no sentido da ordem degrau.

4.29. Produtos de Convolução (formais) em espaço de funções.Consideremos agora apenas aspectos formais, sem nos determos em condições

de pertinência ou de convergência.Uma função contínua f ∈ C 0([0,1],C) pode ser interpretada (a grosso modo)com um vetor de coordenadas f t = f (t ). Utilizando uma analogia com os exemplos

Page 127: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 127/371

4.2 Álgebras 121

discretos anteriores, podemos associar esta função àquela obtida por superposição

de funções periódicas na forma : p(k ) =1

0 f t exp(2π tk )dt .

Considere o espaço vetorial funcional C 00(R,R) = “Funções reais contínuas

com suporte compacto” e a identificação formal (de Fourier) entre estas fun-ções e a álgebra gerada por superposição contínua de exponenciais da formaϕ p( x) = exp(ipx)

p∈ R, da seguinte forma L[ f ]( x) =

∞ −∞

f ( p)exp(ipx)d p .

O produto induzido por esta identificação será o produto de convolução :

f ∗g( x) =∞

−∞ f ( x − t )g(t )dt , que, se colocado em uma notação indicial ( f ∗g) x =

∞ −∞

f x−t gt d t exibe uma analogia óbvia com os produtos de convolução em espaços

de funções de variável discreta. Este produto é associativo e bilinear, e também co-mutativo, mas não tem elemento unitário, ao contrário dos seus análogos discretos.O produto de convolução adquire uma grande importância no desenvolvimento daAnálise Harmônica, que trata da representação de funções por séries e integrais de

Fourier, e suas generalizações, bem como na teoria de processamento de sinais.Se considerarmos agora o espaço vetorial funcional C 00(R,R) = “Funções reais

contínuas com suporte compacto” e a identificação formal (de Laplace) entre es-tas funções e álgebra gerada por superposição contínua de exponenciais da formaϕ p( x) = exp(− px)

p∈ R, da seguinte forma, L[ f ]( x) =

∞ 0

f ( p) exp(− px)d p, obte-

mos que o produto induzido por esta identificação será o produto de convolução :

f ∗g( x) = x 0

f ( x− t )g(t )dt .

Um teorema devido a Émile Borel fornece a descrição exata do espaço de fun-ções que é associado a esta identificação. O matemático polonês Jan Mikusinskipartiu desta álgebra para desenvolver um interessante Cálculo Operacional e para adefinição de funções generalizadas por métodos algébricos. Referência : Ditkine &

Proudnikov.

4.30. Produto de Convolução no “Espaço de sequências quase-nulas” =

c0(N,C) = α : N→ C : ∃ nα tal que α (k ) = 0 se k > nα ⊂Φ (N,C).

É o produto induzido pelo isomorfismo entre a (sub)álgebra funcional das funçõespolinomiais (produto pontual) e via representação por base canônica. O espaço ve-torial das sequências quase-nulas de números complexos exibe um isomorfismolinear natural com a (sub)álgebra funcional dos polinômios (em x) com coeficientescomplexos. Por intermédio deste isomorfismo linear L : c0(C) ←→ P(C), podemosdefinir então o seguinte “produto” : ϕ ∗ψ (k ) = ∑

0≤ j ≤k ϕ (k − j)ψ ( j), que, após as

verificações de praxe, nos leva à obtenção de uma estrutura de álgebra em c0

(C).

Page 128: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 128/371

122 4 Espaços Vetoriais e Álgebras Normadas

4.2.2 Outros Exemplos de Álgebras

1. C 0( M ,C) = “Funções contínuas entre um espaço métrico M e valores com- plexos”.

2. C k

(Rn

,R), k ≥ 0.3. C ∞(Rn,R).

4. C ∞0 (Rn,R) = h ∈ C ∞(Rn,R) : h de suporte compacto, isto é, existe um com-pacto K h tal que h( x) = 0 se x /∈ K h.

5. P(C) = “Conjunto de funções polinomiais com coeficientes complexos e valorescomplexos”.

6. H (Ω ) = “Funções holomorfas, isto é, funções de variável e valores complexos,analíticas na região Ω do plano complexo”.

7. a) H ( D1) = “Funções holomorfas definidas no disco unitário D = z; | z |< 1do plano complexo”= ϕ : D → C; ϕ ( z) = ∑

k ≥0ak zk convergente em D1,

com produto pontual.

b) lω

(C) = “Conjunto das sequências h : N→ C somáveis no seguinte sen-tido : ∑0≤k <∞

h(k ) zk ∈ H ( D1)”.

O produto de convolução pode ser definido da seguinte maneira : ∀h, g ∈lω (C), h ∗ g(k ) = ∑

0≤ j≤k h( j)g(k − j). Esta álgebra é obviamente induzida

pela álgebra das funções holomorfas no disco unitário H ( D1). Para outrasimportantes e úteis considerações nesta linha consulte : P. Henrici, Applied and Computational Complex Analysis, vol. 1, 2, J. Wiley, 1974.

8. C 02π − per (R,R) = “Funções contínuas h : R → R, 2π − periódicas” = h ∈C 0([0,2π ],R) tais que h(0) = h(2π )≈C 0(S 1,R), onde S 1 é o círculo unitáriono plano.

9. C m2π −

per (R,R) = “Funções h

∈C m(R,R) , 2π

− periódicas” =

h

∈C m([0,2π ],R)

tais que h(k )(0) = h(k )(2π ),∀k ,0 ≤ k ≤ m≈C m(S 1,R).10. C 02π − per (R,R) = “Funções contínuas, periódicas, com período 2π ; operações

de soma e produto por escalar pontuais e produto de convolução : g ∗ h(t ) =2π 0

g(s)h(t − s)ds.

11. C 0([0,1]× [0,1],R)≈C 0

[0,1],C 0([0,1],R), d ∞

tem uma estrutura de álge-

bra com o produto “matricial contínuo” : g h( x, y) =1

0g( x, s)h(s, y)ds.

12. Considere o conjunto das transformações integrais lineares L(E ) do espaço ve-torial E = C 0([0,1],R) nele mesmo, e o seu sub-espaço definido por meio denúcleos k ∈ C 0([0, 1] × [0,1],R), da seguinte forma : K : E → E , K [ϕ ](t ) =1

0k (t , s)ϕ (s)ds. A composição de dois operadores K 1 e K 2 com núcleos respec-

tivamente k 1, k 2 ∈C 0([0,1] × [0,1],R) é um operador integral linear do mesmo

Page 129: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 129/371

4.2 Álgebras 123

tipo, com núcleo k 3 = k 1 k 2 ∈ C 0([0, 1]× [0, 1],R), com o produto () definidono exemplo anterior, e estes operadores formam uma álgebra não comutativae sem unidade, isto é, a identidade I não pode ser escrita nesta forma. Como I ∈ L(E ), conclui-se que, na verdade, os operadores integrais lineares formam

uma sub-álgebra (própria) de L(E ). Observe que, tal como no caso das matrizes(finitas), pode-se analisar este procedimento sob o ponto de vista do isomor-fismo linear, e sua respectiva indução, entre a álgebra das funções núcleos coma operação “matricial” e uma sub-álgebra das operações lineares em E .

13. Sub-álgebra gerada por um elementoSe a for um elemento qualquer de um espaço vetorial podemos “inventar”uma álgebra comutativa unitária formada pelos elementos “formais” do tipo

P[a] =

p(a) = ∑

1≤m≤ N cmam : p ∈ P(C)

, com multiplicação induzida pela ál-

gebra funcional dos polinômios. Exemplos importantes destas álgebras são osoperadores diferenciais ordinários lineares de coeficientes constantes, a seguir.

14. Álgebras Operacionais de Heaviside

Dado qualquer operador linear T pertencente à álgebra dos operadores li-neares L(E ) (produto composição), podemos definir a (sub-)álgebra comutativa

e unitária gerada por ele : P[T ] =

p(T ) = ∑

1≤m≤ N cmT m : cm ∈C

. Não é difí-

cil verificar que P[T ] e P[ z,C] = “ Álgebra dos Polinômios” (produto pontual)são álgebras isomorfas.Um dos exemplos particularmente importantes deste procedimento, é o caso

onde T = ∂ = d dx ∈ L (C ∞(R,C)) e P[∂ ] =

p(∂ ) = ∑

0≤m≤ N cm∂

m, cm ∈C

=

“Operadores diferenciais ordinários lineares de coeficientes constantes”, quedá origem à uma Álgebra de Heaviside. A importância desta álgebra decorredo fato de que todas as equações diferenciais ordinárias lineares de coefi-cientes constantes podem ser reescritas na forma p(∂ )u = f , e assim, trata-das operacionalmente por um método que transcende as suas particularidadese têm um alcance consideravelmente maior do que as técnicas ad hoc tradi-cionais. Estas mesmas técnicas são, por exemplo, úteis para o estudo de equa-ções de recorrência lineares, ou, de diferenças finitas. Neste caso, a álgebrade operadores é gerada pelo operador deslocamento (shift ) T = E ∈ Φ (Z,C),

onde E [ f ](k ) = f (k + 1), e P[E ] =

p(E ) = ∑

0≤m≤ N cmE m,cm ∈C

= “Opera-

dores lineares de recursão de coeficientes constantes”, ou, equivalentemente,q(∆) = ∑

0≤m≤ N bm∆

m ,bm ∈C

= “Operadores de diferenças finitas com co-

eficientes constantes”, onde ∆ [ f ]( x) = f ( x + 1) − f ( x), ou seja, ∆ = E − 1 é ooperador de diferença, e q(∆ ) = p(E ), quando, q(ξ ) = p(ξ + 1).

Oliver Heaviside (18..-19..) foi um autodidata inglês e um dos grandes res-ponsáveis pela fundamentação matemática da recém inventada e abstrata teo-ria eletromagnética de Maxwell, desenvolvendo para isto métodos matemáticos

Page 130: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 130/371

124 4 Espaços Vetoriais e Álgebras Normadas

eficientes para resolver os problemas de suas aplicações técnicas. Em muitassituações o método operacional de Heaviside é mais simples e tão eficientequanto o método operacional de Mikusinski. Para um tratamento introdutóriodestas técnicas e suas aplicações, consulte R. C. Bassanezi, W. C. Ferreira Jr.,

Equações Diferenciais com Aplicações, Harbra, 1988.15. Álgebra das Matrizes Operacionais

M n( A) = “ Matrizes quadradas n×n com elementos em álgebras” =Φ ( I n × I n, A)= M : I n × I n → A =

M k j

, M n( A) = Φ ( I n × I n, A) ≈ Φ I n,Φ ( I n, A) =ϕ : I n → Φ ( I n, A). Este espaço vetorial (com a sua estrutura definida pelasoperações pontuais de soma e multiplicação por escalar) pode ser dotado deduas estruturas distintas de álgebra ; a do produto também pontual e do pro-duto induzido pelo seu isomorfismo com as transformações lineares em An.Esta última estrutura considerada para álgebras de matrizes M n( A) = “ Matrizesquadradas n × ncom coeficientes M i j ∈ A, uma álgebra”, tem a sua importân-cia em alguns contextos, como, por exemplo, quando A = P(C) = “ Álgebrados polinômios complexos”, ou quando A = P(∂ ) = “ Álgebra dos operadoresdiferenciais lineares de coeficientes constantes”, que são úteis no estudo de sis-temas de equações diferenciais lineares (v. Bassanezi-Ferreira[1988]).

16. Sub-álgebra gerada por dois elementos não comutantes - Álgebras Ordenadas

Os operadores P∞( x,∂ ) = “Operadores diferenciais ordinários lineares

L =k =m

∑k =0

Ak ( x)∂ m, ∂ = d dx

e Ak ∈C ∞(R,R)”,

são dotados de uma estrutura natural de álgebra com a operação de composição,isto é, como sub-álgebra de L (C ∞(R,R)). Pode-se também definir álgebras“menores” com coeficientes analíticos Pω , polinomiais Pm, ou constantes P0,e P0 ⊂ P∞ ⊂ Pω , mas não com operadores com coeficientes apenas k −vezesdiferenciáveis ! Álgebras semelhantes podem ser definidas analogamente para

operadores diferenciais parciais.Uma generalização do Método Operacional de Heaviside para operadores li-neares de coeficientes variáveis é o passo natural e desejável para aplicações emequações diferenciais, especialmente da Física Matemática, mas não é uma ta-refa tão simples. Neste caso, encontramos imediatamente uma simples equaçãooperacional, ∂ x − x∂ = Identidade, que torna esta álgebra não comutativa e,portanto, consideravelmente mais restritiva e sem as propriedades convenientesda álgebra polinomial. Esta não é uma deficiência do método, e sim uma dificul-dade natural do problema. Em geral, dados dois elementos a e b de uma álgebra,podemos definir uma sub-álgebra com unidade gerada por todos os produtos fi-nitos destes elementos. Entretanto, se a e b não comutam, como, por exemplo éo caso das operações de multiplicação pela variável x, M x[ f ]( x) = x f ( x), e di-ferencial, ∂ = d

dx, em A = L (C ∞(R,R)), esta sub-álgebra não será polinomial

e muito menos comutativa. Uma artificiosa maneira de tratar estes problemasfoi inventada pelo físico Richard Feynman (192..-198..), que introduziu a ideia

Page 131: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 131/371

4.2 Álgebras 125

das chamadas Álgebras Ordenadas (de Feynman), posteriormente desenvolvi-das como Teoria Matemática por Viktor P. Maslov (19..–). As aplicações emvista são exatamente as álgebras geradas pelos operadores de multiplicação ede diferenciação, um assunto que abordaremos com mais detalhes, mas rapida-

mente, em um capítulo seguinte. Referências : V. P. Maslov & V. P. Nazaikinski ;V.P.Maslov ; G. Johnson & M. Lapidus.

17. Funções (ou formas) multilinearesSe E e F forem espaços normados, definimos o espaço das funções (ou for-mas) k-lineares como : M k (E ,F ) = h : E k → F : h linear em cada variávelseparadamente para todo k inteiro positivo, e M 0 = F , (onde E k = “ produtocartesiano de k espaços E × ... × E ”). Claro que M 1(E ,F ) = L(E , F ).O subespaço de M k (E ,F ) das funções (ou formas) k-lineares simétricas é defi-nido e denotado por M k

S (E , F ) =

h ∈ M k (E ,F ) tais que h( x1,..,a,b,... xn) = h( x1,..., b,a,..., xn), onde a eb ∈ E ocupam, respectivamente, posições adjacentes, digamos i, i + 1 e i + 1, i.

O sub-espaço de M k (E , F ) das funções (ou formas) k-lineares alternadas (ouantisimétricas) é definido e denotado por M k

A(E ,F ) =

h ∈ M k (E ,F ) tais que h( x1,..,a,b,..., xn) = −h( x1,.., b,a,..., xn), onde a eb ∈ E ocupam, respectivamente, posições adjacentes, digamos i, i + 1 e i + 1, i.

Estas funções são chamadas antisimétricas porque h( x1,..,a, b,..., xn) = 0 sea = b. Como as formas k -lineares alternadas tem propriedades de “produto”,é comum usar-se a notação ∧k E ∗ = M k (E ,R), que é denominado de produtoalternado. Se E = H for um espaço de Hilbert podemos identificar H = H ∗ ecom isto definir um produto alternado ∧k H , que no caso k = 2 em H = R3,pode ser identificado com o produto vetorial, e no caso k = n para H = Rn,pode ser identificado com a função determinante, ou com o volume orientado.

Referências : V. I. Arnold, Metodi Matematici della Meccanica, MIR ; S. Lang, Differentiable Manifolds, Addison-Wesley.

Um operador polinomial p : E → R é definido como p( x) =k =m∑

k =0mk ( x,..., x),

onde cada função mk ∈ M k (E , F ) é k −linear.

Exercícios :

4.31. Mostre que o espaço L(E , G) = L (E , L(E ,F )) onde se encontram os va-lores de derivadas de segunda ordem, pode ser identificado algebricamente com M 2(E , F ).

4.32. Mostreque o espaço L(E 2, F ) nãoé identificável com o espaço L (E , L(E , F )).

Os espaços das funções k-lineares “incorporam” de certa forma o conceito de“multiplicação de vetores”, o que não ocorre em L(E 2,F ). Exemplifique isto emRn, mostrando por exemplo, que L (R, L(R,R)) ≈R, enquanto, L(R2,R) ≈R2.

Page 132: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 132/371

126 4 Espaços Vetoriais e Álgebras Normadas

4.33. Mostre que o espaço L(E ,G) = L (E , L(E , F )) pode ser identificado algé-brica e topologicamente com M 2(E , F ), isto é, existe um isomorfismo algébricoe topológico entre os dois espaços normados.

18. Álgebras de LieNeste caso, nos afastamos um pouco do conceito de álgebra tal como apresen-tado acima, já que o produto a ser introduzido tem características muito pecu-liares. O protótipo para esta álgebra são os espaços L(E ), onde, ao invés do pro-duto composição, utilizamos uma modificação sua que enfatiza a não comuta-tividade desta operação, ou seja, o Colchete de Lie (Sophus Lie (18..-18..), ma-temático norueguês) : [T ,S ] = T S −ST , que, neste caso específico é denominadode comutador . Obviamente, se a álgebra original for comutativa, a álgebra deLie associada a ela é trivial. A abstração desta estrutura realça três propriedadesbásicas deste exemplo : [aT + bS , R] = a[T , R] + b[S , R] (bilinearidade), [T S ] =−[ST ] (não comutatividade antisimétrica), [T , [S , R]]+[S , [ R, T ]]+[ R, [T ,S ]] = 0(relação cíclica). O modelo abstrato da Álgebra de Lie não será tratado neste

texto e ocorrerá apenas como propriedade resultante de outras estruturas, espe-cialmente de operadores lineares. Produtos que mantêm a bilinearidade e esta-belecem uma expressão linear para ? ?

19. Álgebras de Boole e Reticulados.Outras estruturas matemáticas que exibem uma operação binária são super-postas à estrutura de espaço vetorial, e, embora não apresentem todas as ca-racterísticas “típicas” de um produto, são também denominadas álgebras, taiscomo as álgebras de Boole ou, Reticulados ( Lattices). Estas, em particular, sãomodelos abstratos de algumas propriedades das operações binárias max (∨) emin (∧) definidas em funções de valores reais (por exemplo, f ,g ∈ Φ ( M ,R), ( f ∨g)( x) = max f ( x) , g( x)) e têm mostrado uma certa importância emAnálise Funcional. Entretanto, não serão tratadas neste capítulo por serem mais

próprias de outros contextos e, em particular, por não satisfazerem a bilineari-dade (verifique). Estas álgebras são utilizadas no contexto do Teorema de Stone-Weierstrass, que generaliza o respectivo teorema clássico de aproximação uni-forme por funções contínuas (v. Apêndice).

Exercícios :

4.34. Mostre que as álgebras para operadores diferenciais ordinários são sempreunitárias, e são comutativas no caso de coeficientes constantes e não-comutativasnos outros casos.

4.35. a) Mostre que os operadores diferenciais ordinários polinomiais com coe-

ficientes complexos P(∂ ,C) = p(∂ ) =n∑

k =0a

k ∂ k , a

k ∈C , (onde d

dx = ∂ ), se

constitutem em uma sub-álgebra de L (E , E ), onde E = C ∞(R,C), e p(∂ ) :

Page 133: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 133/371

4.2 Álgebras 127

C ∞(R,C) →C ∞(R,C). Mostre ainda que esta álgebra é (naturalmente) isomorfaà álgebra dos polinômios de coeficientes complexos

P(C) = p(λ ) =n

∑k =0

ak λ k ; ak

∈C .

b) Mostre que este isomorfismo e o Teorema Fundamental da Álgebra nos permi-tem fatorar todo operador polinomial diferencial da seguinte forma :

p(∂ ) =n

∑k =0

ak ∂ k = an ∏

1≤k ≤n

(∂ −λ k ) ,

e, com isto, obtemos soluções imediatas para a equação diferencial ordináriahomogênea p(∂ )u = 0.

c) Utilizando o algoritmo de divisão polinomial, mostre que todo operador po-

linomial não nulo p(∂ ) =n∑

k =0

ak ∂ k , tem um operador polinomial diferencial

quase-inverso para toda ordem, qm(∂ ), no seguinte sentido : p(∂ ) qm(∂ ) =1 + Rm(∂ )∂ m+1, Rm(λ ) ∈ P(C). Observe que para funções polinomiais de grau≤ m, o operador qm(∂ ) atua como inverso à direita de p(∂ ), ou seja, uma solu-ção da equação diferencial ordinária p(∂ )u( x) = h( x) = b0 + .... + bm xm é dadapor u0( x) = qm(∂ ) (h( x)).

4.36. a) Considere P(E ,C) = “Conjunto dos operadores de recursão lineares

do tipo L =m= N ∑

m=0amE m, am ∈ C”, onde E é o operador linear de desloca-

mento, E : Φ (N,C) → Φ (N,C), E [ f ](k ) = f (k + 1), e é um elemento daálgebra L (Φ (N,C)), com a operação de composição. Portanto, P(E ,C) ⊂L (Φ (N,C)) é uma sub-álgebra comutativa gerada por um só elemento E . De-senvolva uma àlgebra operacional análoga à dos operadores diferenciais ordiná-rios lineares de coeficientes constantes para resolver explicitamente equações

de recorrência da forma f (k + N ) =k = N −1∑

k =0ak f (k + m), ou, equivalentemente,

equações de diferenças finitas q(∆) f = ∑0≤m≤ N

bm∆m f = 0.

b) Mostre que se h(k ) = γ k , for uma função exponencial, então, para todo γ ∈C, p(E )h = p(γ )h, para qualquer p ∈ P(E ,C). Utilize este simples fato e mostreque as funções periódicasΦ N − per (Z,C) =ϕ : Z→ C,ϕ (k + N ) = ϕ (k ),∀k ∈ Zconstituem o núcleo do operador p(E ) em Φ (Z,C), para o polinômio p( x) =

x N − 1, gerado pelas N funções h j(k ) = (ω j)k , onde ω j é uma N -ésima raiz

complexa da unidade. Referência : R. C. Bassanezi, W. C. Ferreira Jr., Equa-ções Diferenciais, Harbra, 1988.

Page 134: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 134/371

128 4 Espaços Vetoriais e Álgebras Normadas

4.3 Métodos Gerais de Topologização de Espaços Vetoriais eÁlgebras

Começaremos pela topologização de espaços vetoriais e posteriormente as álge-

bras serão tratadas como uma consequência natural.Há basicamente quatro formas de “topologizar” um espaço vetorial, o que vale

dizer para nossos propósitos, dotar um Espaço Vetorial de uma estrutura de conver-gência, mas não qualquer estrutura de convergência. Alguns pré-requisitos são in-dispensáveis para que o resultado seja algo de útil sob o ponto de vista matemático.A experiência mostra que um minimum minimorum de condições deve, sem dúvida,requerer que as operações de típicas de EV, i.e., soma e multiplicação por escalar,sejam contínuas, caso contrário, o que teriam uma coisa a ver com a outra ?

O “modelo concreto de perfeição” de um espaço vetorial é naturalmente o Rn,mas nem todas as suas extraordinárias propriedades deverão ser editadas na des-crição do modelo abstrato, pois, senão, o melhor seria estudar o próprio Rn, semmaiores rodeios. O objetivo aqui é, como sempre acontece na Matemática, definiruma estrutura “caricata” (como todo modelo deve ser) que represente uma classe

muito mais ampla de objetos matemáticos, mas que, ao mesmo tempo, guarde um“quê” intuitivo do modelo concreto, e daí, analisar quais as propriedades que sãosimultaneamente comungadas por todos estes exemplos. As quatro maneiras de to-pologizar um espaço vetorial tem, portanto, sua interpretação original nos espaçosRn, embora a conveniência de algumas delas não seja tão aparente neste exemploespecífico. De qualquer forma, vale a pena utilizá-lo como meio de explanação deconceitos para aproveitar a intimidade que o leitor deve ter com os mesmos e, assim,começaremos a enumerá-las pelas mais conhecidas.

Seja então um espaço vetorial E .

1. Norma

O conceito de norma generaliza, naquilo que convém para os propósitos anun-

ciados, o módulo de um vetor de R, x, a partir da qual se define uma métricad ( x, y) = x− y.

2. Produto interno (ou, produto escalar)

O produto escalar é anterior ao conceito de norma, pois com ele se define nãoapenas, a própria norma, mas também um conceito de posição relativa entre osvetores. Assim, uma vez definido x, y, passa-se imediatamente para a definiçãode norma, x =

x, x, e consequentemente de distância.

3. Convergência FracaO conceito de convergência fraca se baseia em uma maneira de determinar aconvergência de uma sequência x(k ) x’, por intermédio de uma “batelada detestes”, nenhum deles conclusivos por si próprios, ao contrário do que se faz em

espaços normados, onde o critério da norma, x(k )

− x→

0, é necessário e su-

ficiente para que se afirme, sem ambiguidade, x(k ) → x. O exemplo mais notóriodesse procedimento “fraco” em Rn é o teste de convergência por coordenadas :

Page 135: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 135/371

4.3 Métodos Gerais de Topologização de Espaços Vetoriais e Álgebras 129

denotemos por p j : Rn → R, p j( y) = y j, as funções que determinam as proje-ções sobre as respectivas coordenadas j. Então, diz-se que a convergência se dácoordenada a coordenada, x(k ) x, se p j( x(k ) − x) → 0, ∀ j, 0 ≤ j ≤ n. Genera-lizando, podemos tomar um sem número de vetores unitáriosvλ λ ∈Λ e definir

(em Rn) as projeções pλ ( x) = x,vλ , e dizer que a Λ−convergência, x(k ) Λ→ x,se dá quando pλ ( x

(k ) − x) → 0, ∀λ ∈Λ , onde este conjunto de índices pode serqualquer. É claro que esta família deve ser suficientemente grande (no sentidode dimensões contempladas) para garantir que o conceito de convergência pro-duza um único limite (quando houver). Por exemplo, se tomarmos uma famíliade projeções por coordenadas menor do que a dimensão n do espaço, é fácilver que o limite não será, em geral, único. No caso especial do Rn, o conceitode convergência fraca não introduz nenhuma nova “topologia”, mesmo que abatelada de testes seja grande. Entretanto, como veremos mais adiante, em es-paços de dimensão infinita, a estória é bem outra. Considere, por exemplo, oespaço vetorial l 2(N,R) = “Sequencias reais quadrado somáveis” (que são omais próximo que temos de Rn em dimensão infinita), e a família de testes por

coordenadas p j : l2

(N,R) →R, p j( y) = y j, e, por outro lado, a norma “euclidia-na” x2 =

∑0≤k

( x(k ))2

12

. É fácil verificar que a convergência fraca determi-

nada por esta família de “testes” é conclusiva, ou seja, determina um limite semambiguidades. Também, não é difícil mostrar que existindo o limite x(k ) → x, no

sentido da norma x(k ) − x

→ 0, então teremos também a convergência fraca

x(k ) x (no sentido de todas as coordenadas) p j( x(k ) − x) → 0, ∀ j,0 ≤ j < ∞.Mas, por outro lado, a recíproca não é verdadeira, bastando tomar a sequência x(k ) = ek = (0,..., 1, 0, 0,...), ou seja, x(k )( j) = δ k j, que obviamente convergepara zero fracamente (coordenada a coordenada), mas não converge fortemente,isto é, na norma.Portanto, neste sentido, o conceito de convergência fraca é “menos exigente” e,

assim, mais rico do que o de convergência forte, pois, produz mais sequenciasconvergentes, e isto será muito útil em vários contextos.É interessante observar que, no estudo de produtos cartesianos enumeráveis deespaços métricos, definimos uma métrica emR∞ que estabelecia um conceito deconvergência equivalente à convergência simultânea de coordenadas ; a métricade Tikhonov, d 0( x, y) = ∑

0≤k

12k

| x(k )− y(k )|1+| x(k )− y(k )| . A grande diferença desta métrica

com a métrica da norma .2 em l2(N,R) ⊂R∞, é que as convergências coorde-nada a coordenada em d 0 comparecem “ponderadamente” por 1

2k , tornando-asprogressivamente menos importantes, e, consequentemente, apenas uma quan-tidade finita delas poderão influir em cada tolerância de aproximação.Um exemplo muito comum de convergência fraca é fornecido pelo conceito demomentos em espaços de funções integráveis. Por exemplo, considere o espaçovetorial das funções C ∞0 (R,R) = “Funções contínuas de suporte compacto”, etambém uma família de funções, ϕ n(t )0≤n, digamos, ϕ n(t ) = t n0≤n. De-

Page 136: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 136/371

130 4 Espaços Vetoriais e Álgebras Normadas

finimos “Momento” de uma função f com relação a uma das funções ϕ n, aos

funcionais M n : C ∞0 (R,R) →R, M n( f ) =∞

−∞ f (t )ϕ n(t )dt e, define-se convergên-

cia fraca àquela determinada por esta família de “testes”.

A convergência pontual de funções é, de certa forma, também, uma convergên-cia fraca em espaços funcionais, onde a família de “testes”, por exemplo emC ∞0 (R,R), são as funções de avaliação Φ t t ∈R, e Φ t ( f ) = f (t ) ; neste caso,uma família não-enumerável. A propósito, observe que a igualdade usual entreduas funções f e g é decidida (na verdade, definida !) com base na verificaçãonumérica para toda esta família (não enumerável !) de funcionais, ou seja, pontoa ponto : f = g ⇐⇒ f (t ) = g(t ), ∀t ∈R⇐⇒Φ t ( f ) =Φ t (g), ∀t ∈R . A questãosobre a possibilidade de reduzirmos a quantidade destes testes para uma famíliaenumerável de funcionais lineares e que ainda mantenha a capacidade de dis-tinguir duas funções quaisquer é o tema do Princípio de Coordenadas de Hellya ser tratado mais adiante.A definição de convergência fraca em alguns textos da literatura se aplica tãosomente ao caso em que (já dispondo de uma topologia de convergência pré-

via, normada, por exemplo, e chamada convergência forte), a batelada de testesse refere automaticamente à família de todos os funcionais lineares contínuos,isto é, as funções de L (E ,R) (ou L (E ,C) se os escalares são complexos).Entretanto, o conceito alargado é mais interessante porque nos possibilita defi-nir ab ovo uma topologia em espaços vetoriais ainda “virgens”, escolhendo, porexemplo, de antemão, as funções que desejamos fazer contínuas ! O conceito deconvergência fraca é fundamental para o desenvolvimento da Teoria de Funçõesgeneralizadas, ou distribuições, tal como desenvolvida por Laurent Schwartz,Kurt-Otto Friedrichs e Sergei Sobolev, dentre outros, na primeira metade doséculo XX. Referências : Gelfand[], Schwartz[], Sobolev [], Vladimirov[].

4. Família de SeminormasA convergência regida por seminormas é um caso especial de convergência

fraca onde se utiliza apenas “testes” com funções reais não-negativas, p : E →R+ chamadas seminormas, caracterizadas pelo fato de exibirem todas as pro-priedades da norma, exceto a positividade definida. Assim, o conceito de dis-tância gerado por uma delas é uma pseudo-métrica que, por si mesma não podedistinguir limites. Uma grande família delas, todavia, possibilita que uma su-pra a deficiência da outra e, no conjunto, o conceito de convergência resulteadequado para a especificação única de limites.As projeções em coordenadas são o protótipo do conceito de seminormas everemos mais tarde que esta idéia será extremamente generalizada pela artifi-ciosa teoria desenvolvida (“inventada” mesmo !) por Stefan Banach na décadade 1920.O leitor deve se lembrar que no estudo da topologia de espaços funcionais, aaproximação uniforme em compactos faz uso do conceito de famílias de pseudo-métricas. Naquele caso, substituímos uma família enumerável de pseudo-métricaspor uma única métrica d 0( x, y) = ∑

0≤k

12k ∆k ( x, y)

1+∆k ( x, y) . Este procedimento não será

Page 137: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 137/371

4.4 Espaços Vetoriais e Álgebras Normadas 131

conveniente se decidirmos preservar a estrutura linear do espaço, pois a mé-trica d 0( x, y) tem características essencialmente não-lineares. Para mantermoso contexto dentro da linearidade, o preço a ser pago é a manutenção obrigatóriade toda a família de “testes“. Assim, por exemplo, em C ∞(Rn,R), necessitamos

de toda a família de seminormas p N 0≤ N , p N ( f ) = sup x≤ N | f ( x)|, para definirexatamente o conceito de convergência uniforme em compactos.

4.4 Espaços Vetoriais e Álgebras Normadas

A ideia de módulo como comprimento de um vetor é mimetizada em um espaçovetorial abstrato por meio do conceito de norma. As suas características básicas sãoressaltadas na definição a seguir, que foi introduzida por Maurice Fréchét e pelomatemático húngaro Frigyes Riesz (1880-1956), e inicialmente desenvolvida pelopolonês Stefan Banach (1892-1945) no começo da década de 1920.

Definição 4.11 (Norma).Uma norma em um espaço vetorial E com escalares F é uma função com valoresreais positivos, denotados por x ,∀ x ∈ E, com as seguintes propriedades :

a) Positividade Definida : ∀ x ∈ E , x ≥ 0 , e, ( x = 0 ⇐⇒ x = 0).

b) Homogeneidade Positiva : ∀λ ∈F, ∀ x ∈ E , λ x = |λ | x , onde |λ | = módulodo número λ .

c) Sub-aditividade : ∀ x, y ∈ E , x + y ≤ x + y.

A métrica decorrente do conceito de norma é definida de forma natural, tal comono Rn , por d ( x, y) = x− y.

Observação 4.12. 1. Os exemplos úteis de topologia em espaços vetoriais não che-

gam a ser muito mais gerais do que as obtidas por normas, se levarmos em contao teorema de A. N. Kolmogorov : “Um espaço vetorial topológico é normado⇐⇒ a origem dispõe de uma vizinhança convexa” (que é uma propriedade ubí-qua nos exemplos de interesse). Referência : Kantorovich-Akilov, capítulo XI.

2. Um espaço vetorial normado não trivial, ao contrário dos espaços métricos, nãoé limitado, como se pode ver facilmente através da expressão

d (λ x, 0) = |λ | x .

Basta que exista um x = 0. Consequentemente, um espaço vetorial normado nãotrivial também não pode ser compacto.

3. Um espaço vetorial normado completo é chamado de Espaço de Banach emhomenagem a Stefan Banach, que foi um dos principais iniciadores da Análise

Funcional (junto com F. Riesz, David Hilbert e inúmeros outros), principal-mente pelo seu histórico livro : Théorie des Opérations Lineaires, Varsóvia,1932.

Page 138: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 138/371

132 4 Espaços Vetoriais e Álgebras Normadas

Exercício :

4.37. a) Mostre que, de fato, as operações de soma e produto por escalar são contí-nuas em um espaço normado e, portanto, ele é um espaço vetorial topológico,isto é, se x

n → x

∈E , y

n → y

∈E e λ

n →λ em F , então λ

n x

n + y

n →λ x + y .

b) Mostre ainda que a norma é uma função contínua, na verdade, uma função não-expansiva, isto é, lipchitziana de constante α = 1.

No caso de uma álgebra, é necessário acrescentar uma propriedade que acople anorma ao produto algébrico, o que será feito pela definição :

Definição 4.13 (Álgebra Normada).Uma álgebra normada A é um espaço vetorial normado satisfazendo ainda à se-guinte propriedade :

d) Limitação do produto : existe uma constante C, tal que

xy

≤C

x

y

, ∀

x, y∈

A.

Em particular, dizemos que A é uma álgebra de Banach se em d) tivermos C = 1 e for um espaço de Banach.

Exercício :

4.38. Mostre que o produto em uma álgebra normada é contínuo, isto é, se an → ae bn → b, então, anbn →ab.

Exemplos de Normas :

1. Em Rn e Cn temos :

a) x∞ = max1≤k ≤n | xk |b) x1 =

n∑

k =1| xk |

c) Tal como se faz para Rn e Cn, podemos definir normas para qualquer pro-

duto cartesiano finito de espaços vetoriais E 1 × ... ×E n =i=n∏

i=1E i, (E i, . i),

como :i) ( x1,..., xn) ∞= sup xii, ou,

ii) ( x1,..., xn) 1=i=n∑

i=1 xii,

e outras mais, como veremos mais adiante. Em todos estes casos, estamosinteressados em definir convergência no espaço produto como equivalente

a convergências simultânea coordenada a coordenada. Observe que i=n∏i=1

E ,

(E ,.i), pode ser identificado como o conjunto de funções F ( I n, E ).

Page 139: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 139/371

4.4 Espaços Vetoriais e Álgebras Normadas 133

d) Considere em R2 o polígono P (a figura plana), com centro na origem evértices nos pontos do círculo unitário exp[ i2π m

N ] exp[iθ ], 0 ≤ m ≤ N − 1.Para cada vetor v ∈ R2, defina sua norma com o Funcional de Minkowskida seguinte maneira :

| v |= inf λ > 0, tais que λ −1v ∈ P.

Interprete geometricamente esta definição !

Exercícios :

4.39. a) Para n = 2, analize o “formato” da bola unitária com as normas acima.

b) Mostre que as normas dos exemplos 1., a) e b), podem ser escritas por meiodos Funcionais de Minkowski. Os Funcionais de Minkowski mostram como osconceitos de norma e de vizinhança convexa da origem são intercambiáveis, eeste argumento vale, com certo cuidado, para dimensão infinita. É por aí que oteorema citado acima, de Kolmogorov, pode ser demonstrado.

4.40. B( A,R), h ∞= sup x∈ A | h( x) |.4.41. Em C 0([0, 1],Rn) :

a) h ∞= sup x∈ A | h( x) |.

b) h 1=1

0| h( x) | dx.

4.42. Em C m([0, 1],R), temos as chamadas normas de Sobolev, h m, p :

a) h m,∞=m∑

k =0 ∂ (k )h ∞, onde ∂ (k )h significa a k -ésima derivada da função h.

b) h m,1=m∑

k =0 ∂ (k )h 1.

Mostre as propriedades que caracterizam os exemplos acima como normas. Observeque eles são espaços de Banach.

4.43. Mostre que B( A,C), h ∞= sup x∈ A | h( x) |, é uma álgebra normada com oproduto ponto a ponto.

4.44. Mostre que P(C) ⊂C ω ([0,1],C) ⊂C ∞([0,1],C) ⊂C m([0,1],C) ⊂C 0([0, 1],C)são sub-álgebras normadas de ( B([0,1],C), || . ||∞).

4.45. Mostre que

C 1([0,1],R), h 1,∞=

k =1∑

k =0 ∂ (k )h ∞

é uma álgebra de Ba-

nach.

4.46. Mostre que a álgebra C 02π − per (R,R) = “Funções contínuas periódicas com período 2π ”, onde soma e multiplicação por escalar são definidas ponto a ponto, e

o produto, pela convolução g∗h(t ) = 12π

2π 0

g(s)h(t − s)ds, é uma álgebra de Banach

com norma h ∞.

Page 140: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 140/371

134 4 Espaços Vetoriais e Álgebras Normadas

4.47. Mostre que as funções C m2π − per (R,R) = “Funções contínuamente diferenciá-veis até ordem m, e periódicas com período 2π ” formam uma álgebra normada comas operações de soma, multiplicação por escalar e produto ponto a ponto, com anorma

h m,∞=k =m

∑k =o

1k ! ∂ (k )h ∞ .

4.48. Seja HC ( D) = h : B(0, 1) ⊂ C→ C = “Funções analíticas (holomorfas)no disco unitário aberto e continuas no disco fechado” = H ( B(0, 1))∩C 0( B(0, 1)).Mostre que :

a) h ∞= sup| z|≤1 | h( z) | e

b) h 1=2π 0

| h(eiθ ) | d θ

são normas em HC ( D).

4.49. BV 0 ([0,1],Rn) = h : [0, 1] → R : h(0) = 0 e Var (h) < ∞, onde, h v=

supPk =n∑

k =1 h( xk +1) −h( xk ) < ∞= Var (h), chamada variação total da função h no

intervalo [0, 1], e onde o sup é tomado sobre todas as partições P = x1 < .... < xnfinitas deste intervalo.

4.50. Mostre que os exemplos abaixo são espaços de Banach. Sugestão : O pri-meiro é um caso especial de funções limitadas com valores em um espaço métricocompleto, e o seguinte pode ser tratado “segurando-se o rabo da sequência e admi-nistrando a cabeça finita”, e é um caso especial dos espaços de Minkowski que serãotratados logo adiante.

a) l∞(C), h ∞= sup| h(k ) |,0 ≤ k < ∞.

b) l 1(C), h ∞= ∑0

≤k | h(k ) |

4.51. M n(C) = matrizes n × n complexas,

a) A ∞= max | Ai j |,b) A 1= ∑

1≤i, j≤n| Ai j |,

c) A 0= supv=1 Av , onde v ∈ Cn, e a norma usada para medida de v ede Av é uma das normas usuais de Cn,

d) A 2=

1≤i, j≤n| Ai j |2

12

=

Tr ( AA∗) = raiz quadrada do traço do produto

da matriz pela sua transposta conjugada, chamada norma de Frobenius.

4.52. Funções Holderianasa) Funções Holderianas Simples :

Page 141: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 141/371

4.4 Espaços Vetoriais e Álgebras Normadas 135

C H ([0,1],R) = h ∈ C 0([0,1],R), para as quais existe um número ch > 0 tal

que ∀s, t , 0 ≤ s < t ≤ 1, temos |h(t )−h(s)||s−t | ≤ ch.

Podemos definir h H = h ∞ + supch, para h ∈ C ([0,1],R), e . H é umanorma. Observe que C 1

([0

,1

],R

) ⊂C H

([0

,1

],R

), mas a inclusão obviamente

não é uma igualdade (verifique).

b) Funções α −Holderianas :

C H α ([0,1],R) = h ∈ C 0([0,1],R), para as quais existe um número ch > 0 tal

que ∀s, t , 0 ≤ s < t ≤ 1, temos |h(t )−h(s)||s−t |α ≤ ch.

Podemos definir h H α = h ∞ + supch para h ∈ C α ([[0, 1],R) e . H α é umanorma (verifique).

4.4.1 Normas de Minkowski - Espaços l p

Estudaremos agora a importante classe de p−normas de Minkowski, que ge-neralizam para p ≥ 1 as diversas normas . 1 já apresentadas. Abordaremos es-pecificamente o exemplo l p(N,C), que é mais simples nas particularidades, masapresenta todas as ideias dos outros casos, e, de fato, começaremos pelo Rn e comuma desigualdade básica :

Lema 4.14 (Desigualdade de Holder).Se a,b > 0 e p > 1 , então, vale a desigualdade : ab ≤ a p

p + bq

q , onde q é chamado

conjugado de p e satisfaz à relação simétrica : p−1 + q−1 = 1. A igualdade ocorreapenas no caso em que b = a p−1).

Prova. Observe que q > 1 e p(q) → 1 quando q → ∞, monotonicamente, e vice-versa, pela simetria entre p e q. Para demonstrar a desigualdade, basta analisar com

métodos do cálculo elementar, a função real h( x) =

a p

p +

xq

q − ax para x ≥ 0, e mos-trar que ela atinge um mínimo nulo, que realiza a igualdade de Holder, exatamentepara x = a p−1.

Lema 4.15 (Holder-Minkowski).Se g ∈ l p(C) e h ∈ lq(C) , então a função z : N→C , definida por z(k ) = g(k )h(k ) , é

tal que z ∈ l1(C) e∞

∑k =0

|g(k )h(k )| ≤ g p hq , onde p e q são conjugados e h p = ∞

∑k =0

(|h(k )|) p

1 p

.

Prova. Da Desigualdade de Holder, temos para cada k :

|g(k )

| |h(k )

|g p hq ≤ |g(k )

| p

pg p p + |h(k )

|q

qhqq .

Somando agora até qualquer n para os dois lados da desigualdade acima, temos

Page 142: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 142/371

136 4 Espaços Vetoriais e Álgebras Normadas

k =n

∑k =0

|g(k )| |h(k )|g p hq

≤ p−1 + q−1 = 1.

e, no limite, ∞

k =0 |g(k )

| |h(k )

| ≤ g

p

h

q .

Exercício :

4.53. Mostre, como subproduto deste argumento, que para cada x ∈Rn existe um y ∈Rn, tal que a desigualdade de Holder se transforma em igualdade, ou seja,

n∑

k =1 xk yk =

x p yq, ou ainda, x p = max yq≤1

n∑

k =1 xk yk

.

Teorema 4.16 (Desigualdade de Minkowski - Espaços l p(C)).

Se p ≥ 1 e l p(C) = h : N→C , tais que

∑k =0 |h(k )| p <∞ , denotamos ∞

∑k =0

|h(k )| p 1

p

= h p .

Então, ∀g, h ∈ l p(C ) , temos

g + h p ≤gq +h p ,

e . p é uma norma em l p(C).

Prova. A mais simples e a mais ilustrativa, devida a A. A. Kirillov :

“ A demonstração matemática não tem por objetivo o convencimento,mas o esclarecimento”. Yu. I. Manin

Consideremos o conjunto compacto em Rn,K =

y ∈Rn : yq = 1

, e o su-

bespaço vetorial E deC 0(K ,R),.∞

definido pelas funções f x( y) =

k =n∑

k =1 xk yk , para

x ∈Rn. De acordo com a desigualdade (igualdade) de Holder podemos escrever que

f x∞ = max yq≤1

n∑

k =1 xk yk

= x p. Ora, mas f x∞ satisfaz às condições de norma

em E e, portanto, o mesmo acontece com x p, como se desejava demonstrar.

Para um tratamento alternativo das desigualdades de Minkowski consulte M.Aligranda, A simple proof of Hoder-Minkowski inequalities, Am. Math. Monthly,102, 1995.

Teorema 4.17 (Os Espaços de Minkowski são de Banach & etc).Os espaços l p(C) , 1 ≤ p ≤∞ , satisfazem às seguintes propriedades :

Page 143: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 143/371

4.4 Espaços Vetoriais e Álgebras Normadas 137

a) São espaços de Banach.

b) Escala de espaços de Banach : l p1 (C) ⊂ l p2 (C) se p1 ≤ p2 , e a inclusão é umaimersão contínua, ou seja, a identidade i : l p1 (C) → l p2 (C) é contínua, pois

h

p2

≤h

p1 .

c) Além disso, l p1 (C) é denso em l p2 (C) se 1 ≤ p1 ≤ p2 < ∞.

d) Os espaços de Minkowski, para p < ∞ , são separáveis, isto é, dispõem de umsubconjunto enumerável denso, que pode ser tomado como sendo c+

0 (Q+ iQ) =“Conjunto das sequências quase-nulas formadas por complexos com partesreal e imaginárias racionais”.

e) O espaço dos funcionais lineares contínuosL (l p(C),C) é isomorfo ao espaço

conjugado lq(C) , pela associação L( y) =∞

∑k =1

xk yk .

f) Somente para 1 < p < ∞ , os espaços l p(C) são estritamente convexos (Desi-gualdades de Clarkson).

g) O Espaço l∞ não é separável.

Prova. a) O caso p = ∞ é simplesmente um caso particular de B( A,C). Consi-deremos então 1 ≤ p < ∞, e seja (hn) ∈ l p(C) uma sequência de Cauchy.Observemos inicialmente que, pela continuidade da norma, hn p −hm p ≤hn −hm p, podemos concluir que a sequência numérica hm p converge e,do fato |hn(k )| ≤ hn p, concluímos que a sequência numérica (em n) hn(k )converge para cada k fixo. Definiremos então uma função h : N→ C, h(k ) =limn→∞hn(k ), que será a candidata natural a limite da sequência. Mostremosinicialmente que h ∈ l p(C). Escrevendo a desigualdade para um número finitode termos,

k =m∑

k =0|h(k )| p

1 p

k =m∑

k =0 h(k ) −h j(k )

p 1

p

+

k =m∑

k =0 h j(k )

p 1

p

≤ k =m∑

k =0

h(k ) −h j(k ) p 1

p+h j

p ,

e tomando o limite para j →∞, concluímos que, para todo m,k =m

∑k =0

|h(k )| p 1

p

≤ lim j→∞

h j

p < ∞,

o que implica em h ∈ l p(C). Mostremos agora que hn converge para h na normade l p(C). Seja então ε > 0. Tomemos N ε tal que se n, j ≥ N ε tenhamos hn −h j p≤ ε . Usando um argumento triangular semelhante ao anterior, escrevemos

Page 144: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 144/371

138 4 Espaços Vetoriais e Álgebras Normadask =m∑

k =0|h(k ) −hn(k )| p

1 p

k =m∑

k =0

h(k ) −h j(k ) p 1

p

+

k =m∑

k =0

h j(k ) −hn(k ) p 1

p

≤k =m∑

k =0 h(k )

−h j(k )

p

1 p

+hn

−h j p

≤k =m∑

k =0

h(k ) −h j(k ) p 1

p

+ε ,

e fazendo agora o limite para j →∞ na desigualdade das pontas, concluímos

que, se n ≥ N ε , então, para todo m temos

k =m∑

k =0|h(k ) −hn(k )| p

1 p

≤ ε .b) Seja h ∈ l p1 e tal que h p1 = 1. Então, | h(k ) |≤ 1,∀k , e, portanto, | h(k ) | p2≤

|h(k )| p1 , (visto que p1 < p2), de onde vem que ( h p2 ) p2 ≤ h p1

p1 = 1.Se agora g ∈ l p1 , tomamos h = g

g p1e obtemos o resultado desejado.

c,d) Basta mostrar que c+0 (Q+ iQ) = “Conjunto das sequências quase nulas de

complexos racionais, c+0 ⊂ l1, é denso em l p, para p < ∞. Isto, em particular,

mostra que, d), estes espaços de Minkowski são separáveis.e,f) O item e) será tratado logo adiante e a demonstração do item f) é extremamente

técnica (e relativamente recente !) e pode ser encontrada no clássico S. Sobolev,Funtional Analysis and Applications, AMS, 1950.

g) Para a demonstração de item g) considere o subconjunto de todas as sequên-cias ∆ = δ : N→ 0,1 que pode ser biunivocamente relacionado a R pelaexpansão binária dos reais e, cujos elementos estão isolados uns dos outros poruma bola de raio 1. Portanto, um conjunto denso neste espaço deveria ter pelomenos um elemento em cada uma destas não-enumeráveis bolas, ou seja, nãopode ser enumerável. (Agradeço ao Jeffferson Leite pela correção da redaçãoanterior e a demonstração deste fato)

Exercício :

4.54. a) Mostre que c+0 (Q+ iQ) é enumerável e denso em l1.

b) Considere o espaço vetorial Cn. Mostre que podemos definir normas . p, p ≥ 1, e que lim p→∞ v p= v ∞.

c) Mostre que a álgebra definida em l 2(C) pelo produto “polinomial” g · h(k ) = j=k

∑ j=0

g( j)h(k − j) é bem definida e se constitui em uma álgebra de Banach

que pode ser identificada com a álgebra HC ( D) = “Funções holomorfas nodisco | z |< 1 e contínuas no círculo, com produto pontual e norma g =

0| g( z) |2 d θ

12

. Sugestão : Observe que, se g ∈ HC ( D) e g ≡ 0 no cír-

culo, então g ≡ 0 no disco pela fórmula de Cauchy. Para calcular a norma de g,escreva-a como g( z) =

∑n=0

an zne faça z = expiθ .

Page 145: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 145/371

4.4 Espaços Vetoriais e Álgebras Normadas 139

Um teorema análogo e importante vale para o caso contínuo.

Teorema 4.18 (Espaços de Minkowski

L p([0, 1],R)).

No espaço vetorial de funções contínuas C 0([0, 1],R) podemos calcular h p =

1 0

| h( x) | p dx 1

p , para p ≥ 1. Pois bem, C 0([0, 1],R),h p

é um espaço nor-

mado que terá uma designação especial : L p([0,1],R) , denominado (Pré) espaçode Lebesgue-Minkowski. (Os espaços de Lebesgue-Minkowski, de fato, serão defi-nidos mais adiante como completamentos destes). Além disto, a identidade i : L p1 ([0,1],R) → L p2 ([0, 1],R) , se 1 ≤ p1 ≤ p2 < ∞ ,é uma imersão contínua. Observe a exclusão de p = ∞ , pois, neste caso, temoslim p→∞ h p = h∞.

Prova. A demonstração segue exatamente os mesmos passos utilizados para o casol p(C), uma vez considerada a desigualdade de Holder. Observe que, ao contráriodos l p(C), os espaços

L p([0, 1],R) são constituídos dos mesmos elementos, a sa-

ber, C 0

([0, 1],R) ; apenas as normas são diferentes.Para mostrarmos o limite, usamos argumento análogo ao utilizado para oRn (exercí-cio). Observemos que h p ≤ h∞ = M =| h( z) | para algum z. Tomemos ε > 0 edefinimos uma função escada hε ( x) = (1−ε ) M , em um intervalo [ z−α , z+β ] onde| h( x) |≥ (1− ε ) M , e zero nos outros pontos. Então, é fácil ver que lim p→∞ h p =

M . Por outro lado, temos que h p =

1 0

| h( x) | p 1

p

dx ≥ h p, de onde concluí-

mos o desejado.

Uma vez demonstrada a consistência da definição da norma de Minkowski parafunções infinitamente diferenciáveis, podemos facilmente generalizar esta definiçãopara que inclua não apenas convergência em média dos valores das funções, mastambém das suas derivadas. Este procedimento prepara o cenário para a introdução

das funções generalizadas de Sobolev que desempenham um papel importante nateoria de Equações Diferenciais Parciais e que serão definidas mais adiante comoelementos do espaço completado na respectiva norma.

(Pré) Espaços de Sobolev :

a) W mop (Ω ) = o conjunto base é C ∞o (Ω ,R) e a norma é h p,m=|α |=m

∑|α |=0

∂ α h p.

b) W m p (Rn) = o conjunto base é C ∞o (Rn,R) e a norma é h p,m=|α |=m

∑|α |=0

∂ α h p.

Os diversos exemplos de espaços de funções diferenciáveis reais definidas emRn, que são de importância fundamental em análise em geral e particularmente noestudo de equações diferenciais, serão estudados em um capítulo a parte. Mais sobreestes espaços em Kantorovich-Akilov.

Page 146: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 146/371

140 4 Espaços Vetoriais e Álgebras Normadas

4.4.2 Espaços vetoriais com topologias geradas por famílias de normas ousemi-normas

Alguns conceitos úteis de convergência são por vezes melhor introduzidos atra-vés de famílias de métricas ou de pseudo-métricas. O exemplo típico deste procedi-mento é a convergência uniforme em compactos já estudada em espaços métricos.Há dois aspectos, ou lições, a serem ressaltados com respeito a este exemplo.

O primeiro fato interessante é que, embora uma pseudo-métrica talvez não se-pare elementos de um espaço (o que é indispensável para a propriedade de unicidadedo limite), por outro lado, uma família de pseudo-métricas pode perfeitamente re-solver esta questão, o que aliás ocorreu no referido exemplo. No contexto de um es-paço vetorial, o papel das pseudo-métricas será representado pelas chamadas semi-normas, cuja definição segue todos os requisitos da norma, exceto pela positividadedefinida. Este procedimento que garante a unicidade do limite por meio de uma família de seminormas será amplamente utilizado no presente contexto.

Em segundo lugar, lembramos que o conceito de convergência uniforme emcompactos foi, no final das contas, representado por uma única métrica construída

como soma de uma série pseudo-métricas modificadas (limitadas). Este resultado éparticularmente útil, uma vez que é conceitualmente mais simples lidar com umamétrica em lugar de uma família delas. A dificuldade de utilização deste procedi-mento na teoria de espaços vetoriais topológicos está ligada, em geral, a duas razões.Em alguns casos, devido à não-enumerabilidade da família de semi-normas, é im-possível construir uma série numérica e, de fato, nestes casos produz-se espaçosvetoriais topológicos não-metrizáveis. Um exemplo notável e importante deste fe-nômeno ocorre na construção da teoria de distribuições de Schwartz que veremoslogo a seguir. Entretanto, mesmo no caso de uma família enumerável, a introduçãode uma metrização única para descrever a topologia não produz uma norma, comose pode facilmente observar pelo método de construção, e optar por isto, significariaperder propriedades importantes que acoplam a estrutura algébrico-geométrica dosespaços vetoriais à estrutura topológica, o que não se faz impunemente. Portanto,

nesta seção, apresentaremos um procedimento extremamente geral de topologiza-ção de espaços vetoriais por meio de famílias de seminormas que nem sempre podeser substituída por uma única norma.

As semi-normas compartilham de todas as propriedades que caracterizam anorma mas com a possível exceção da positividade definida.

Definição 4.19 (Seminorma). Dizemos que uma função p definida em um espaço vetorial E assumindo valoresreais se constitui em uma seminorma se satisfizer às seguintes propriedades :

a) Positividade : p : E →R+ , isto é, ∀ x ∈ E , p( x) ≥ 0.

b) Homogenidade positiva simétrica : ∀λ ∈ F ,∀ x ∈ E , p(λ x) =| λ | p( x).

c) Sub-aditividade : ∀ x, y ∈ E , p( x + y) ≤ p( x) + p( y).

É claro que uma norma é, em particular, uma semi-norma. Por outro lado, pode-mos garantir apenas que a distância gerada por uma semi-norma,∆ ( x, y) = p( x− y),

Page 147: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 147/371

4.4 Espaços Vetoriais e Álgebras Normadas 141

é uma pseudo-métrica, e a propriedade de separação de elementos e, em particular,a unicidade do limite, não é garantida com o uso de uma semi-norma isoladamente;a não ser que ela seja uma norma ! Vejamos então como contornar esta dificuldadecom uma família de semi-normas. Dada uma família de semi-normas ( pλ )λ ∈Λ , de-

finiremos convergência de acordo com esta família da seguinte maneira :Definição 4.20 (Convergência em Seminormas).Se ( pλ )λ ∈Λ for uma família de semi-normas em um espaço vetorial, dizemos quehn ∈ E converge para h ∈ E segundo a topologia induzida por ela, se, ∀λ ∈ Λtemos : pλ (hn −h) → 0 quando n → ∞.

Se esta família separa pontos, isto é, se ∀ h, g ∈ E existe λ ∈ Λ tal que pλ (h −g) > 0, então, a unicidade do limite estará garantida (verifique).

Como veremos, o mesmo conceito de convergência pode ser descrito por meiode duas famílias distintas de semi-normas, e um critério útil para verificar quandoisto realmente acontece é o teorema abaixo, cuja demonstração é uma simples ob-servação da definição de convergência.

Teorema 4.21. Dadas duas famílias de seminormas, ( pλ )λ ∈Λ e (ργ )γ ∈Γ , elas defi-nem a mesma topologia, ou seja, as mesmas sequências convergentes com mesmoslimites, se para cada semi-norma pλ existe uma semi-norma ργ e uma constantecγλ tal que ∀h ∈ E , pλ (h) ≤ cγλ ργ (h) e vice-versa.

Analisemos então alguns exemplos que são os protótipos deste conceito e queserão suficientes para os nosso propósitos.

Exemplos de Famílias de Seminormas :

1. Convergência Uniforme em CompactosConsideremos o espaço vetorial das funções contínuas C 0(Ω ,R) com domínio

na região Ω ⊂ Rn

, para as quais definiremos a família de semi-normas ( pK )onde K percorre o conjunto de todos os compactos contidos em Ω :

pK (h) = sup x∈K

| h( x) | .

É claro que a convergência definida por esta família de semi-normas é exata-mente a convergência uniforme em compactos. Esta família obviamente separaas funções de C 0(Ω ,R).Como já vimos, este mesmo conceito de convergência pode ser representadode uma maneira mais “econômica” fazendo uso de uma “torre” enumerável decompactos K m ⊂ K m+1 ⊂Ω que esgota o conjunto Ω , isto é,Ω = ∪0≤ jK j . Comesta construção, definimos a família de semi-normas

ρm(h) = sup x∈K m

| h( x) | .

Page 148: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 148/371

142 4 Espaços Vetoriais e Álgebras Normadas

A questão agora é se os conceitos de convergência representados por estas duasfamílias são equivalentes, isto é, se

∀hi,h, pK (hi −h) → 0,∀K ⇐⇒ ρm(hi −h) → 0,∀m.

Exercício :

4.55. Demonstre que as duas famílias de semi-normas acima são equivalentesno sentido que definem o mesmo conceito de convergência.Sugestão : Como cada K m faz parte da primeira família, a demonstração nadireção (⇒) é imediata. Para a direção (⇐), utilize o fato de que cada compactoK , qualquer que seja ele, pode ser coberto por um número finito de compactosK m.

Como já mostramos no estudo de espaços métricos, este espaço pode ser metri-zado, ou seja, é possível definir a sua topologia por meio de uma única métrica,e isto é feito a partir de uma família enumerável.

2. Convergência Uniforme de Todas as Derivadas em Compactos - Espaço E (Ω )Consideremos o espaço vetorial C ∞(Ω ,R) e a família de semi-normas ( pK ,α ),sendo K ⊂Ω compacto e α o conjunto de índices α = (α 1,....α n) ∈Nn,

pK ,α (h) = sup x∈K

∂ (α )h( x) ∞,

onde, | α |= j=n

∑ j=1

| α j | e ∂ (α ) = ∂ |α |

∂ α 1

x1 ......∂ α n xn.

A convergência hn → h ∈ C ∞(Ω ,R) segundo esta família de semi-normas, si-gnifica convergência uniforme em subconjuntos compactos de Ω das funções∂ (α )hn para as respectivas funções ∂ (α )h, para todo α . Este espaço é utilizado

na construção de funções generalizadas, ou distribuições, em uma região Ω , eo espaço vetorial topológico resultante é denotado por

E (Ω ) = “Funções teste para distribuições de suporte compacto no domínioΩ ”.

Por uma construção análoga à do caso anterior, é possível verificar que podemossubstituir esta família de semi-normas por uma outra equivalente e enumerávele, portanto, este espaço também é metrizável.

Exercício :

4.56. Mostre, para n = 1, que o espaço vetorial topológico E (Ω ) é completo,isto é, se (hm) é uma sequência de Cauchy para cada semi-norma, então elaconverge em cada semi-norma.

Page 149: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 149/371

4.4 Espaços Vetoriais e Álgebras Normadas 143

Sugestão : Considere separadamente cada bola fechada Bi( z,q) ⊂ Ω usada naconstrução dos K m, onde a função e todas as suas derivadas convergem unifor-memente quando interpretadas como elementos de C 0( Bi,R). Lembre-se princi-palmente do teorema elementar de séries de funções que garante que os limites

uniformes de uma função e de sua derivada são, respectivamente, função e de-rivada (Courant, cap. VIII).

3. Convergência Uniforme das Derivadas em Compactos - D(Ω ) = “Espaço de funções teste para distribuições no domínio Ω ”Consideremos agora o espaço vetorial das funções infinitamente diferenciáveise de suporte compacto :

C ∞0 (Ω ,R) = h ∈ C ∞(Ω ,R), e ∃ compacto K h ⊂Ω tal que h( x) = 0 se x /∈ K h.

Neste espaço desejamos definir um conceito de convergência semelhante aoconcebido para a construção de E (Ω ), mas que seja mais restrito no seguintesentido : hm →h se,

i) hm

→h na topologia de E (Ω ), isto é, uniformemente em compactos com

todas as suas derivadas, eii) Existe um compacto K , característico da sequência convergente, tal que

todas as hm tem suporte em K .

A formalização deste conceito de convergência é obtida com a seguinte estranhafamília de semi-normas :

pS (h) =∞

∑m=1

sup|α |≤m

S m sup

x∈K m+1−K m| ∂ (α )h( x) |

,

onde S percorre o conjunto de todas as sequências numéricas inteiras, ou seja,S ∈N∞ (que é um conjunto não-enumerável pois, contem as expansões decimaisdos números reais), e

K m

é uma “torre” de compactos que esgotam Ω . Ob-

serve que a soma acima é finita, uma vez que a função h tem suporte compactoe, portanto, será nula após um certo m0. Não nos deteremos em demonstrar quede fato esta família de semi-normas define a convergência desejada. A definiçãodesta topologia em textos mais abstratos é normalmente feita por meio de umaconstrução denominada topologia induzida. Entretanto, uma teoria de distribui-ções pode ser perfeitamente construída fazendo uso direto do conceito concretode convergência representado pelas condições i) e ii) acima, sem necessidadede abstrações exageradas.Consulte, por exemplo, os excelentes : V. S. Vladimirov, Generalized Functionsin Mathematical Physics, Ed. MIR, 1979 ; V. S. Vladimirov, Equations of Ma-thematical Physics, Ed. MIR, 1984 ; ou o clássico I. M. Gelfand, G. E. Shilov,Generalized Functions, 3 volumes, Acad. Press, 1967. O tratamento abstratopode ser encontrado em M. Reed, B. Simon, Functional Analysis, AcademicPress, 1970 ; ou, no original L. Schwartz, Théorie des Distribuitions, G. Villars,1950.

Page 150: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 150/371

144 4 Espaços Vetoriais e Álgebras Normadas

4. Espaço de Schwartz : S (Rn)

Consideremos o espaço vetorial S (Rn,R) = h ∈ C ∞(Rn,R), tais que ∀α =(α 1,...α n),β = (β 1,....β n) ∈ Nn, lim| x|→∞ xβ [∂ α h( x)] = 0. Definimos então afamília de semi-normas :

p∞α ,β (h) = xβ [∂ α h( x)] ∞,

que são de fato normas e enumeráveis. Também é possível demonstrar (o quenão faremos nem sugerimos fazer), que esta família de normas é equivalente auma das seguintes

piα ,β (h) = xβ [∂ α h( x)] i, para i = 1, 2.

Este espaço vetorial topologizado por estas semi-normas é chamado de Schwartz(em homenagem ao matemático francês Laurent Schwartz (...-...) que inventoua teoria de distribuições na década de 1940, dentre outras coisas), ou então deEspaço de funções teste para distribuições temperadas.

4.4.3 Convergência Fraca

O conceito de convergência fraca é natural, intrínseco e muito útil no estudo deEspaços Vetoriais. Uma de suas vantagens é poder é descrever uma topologia, naqual algumas funções pré-escolhidas são contínuas, ou seja, uma topologização ca-suística. Assim, a questão básica é : dada uma família de funções (naturalmente degrande interesse “a priori”), qual é a topologia mais simples (isto é, mais fraca, nosentido de que impõe menos condições), que torna todas estas funções simultanea-mente contínuas?

Em geral, esta família previamente escolhida é de funcionais lineares, ou seja,funções lineares definidas no espaço vetorial e com valores escalares. O exemplode fato mais importante da aplicação deste método, produz o conceito usualmentedenominado convergência fraca (ou topologia da convergência fraca). Isto ocorre

quando, em um espaço vetorial normado E (portanto, originalmente já topologizadopor uma norma), considera-se a família de seminormas definidas pelos módulosdos funcionais lineares contínuos, ou seja, | p| p∈E ∗ , onde E ∗ = L (E ) = “Espaçovetorial dos funcionais lineares contínuos l : E →R(C)”, com a qual se define emE uma nova topologia, denominada da convergência fraca que, como veremos, nãoé, em geral, igual à topologia induzida pela norma, denominada, no caso, (topologiada) convergência forte.

Definição 4.22 (Topologia da convergência fraca).Suponha que (ϕ λ )λ ∈Λ seja uma família de funções lineares ϕ λ : E → C , ondeE é um espaço vetorial com escalares em C. Definimos então a seguinte famíliade semi-normas : ( pλ )λ ∈Λ , onde pλ ( x) =| ϕ λ ( x) |. A convergência descrita por este procedimento representa o seguinte conceito : diz-se que xn x , ou que xn

converge fracamente para x segundo a família de funcionais (ϕ λ )λ ∈Λ se, para todoλ ∈ Λ , tenhamos ϕ λ ( xn) → ϕ ( x)”. (Observe a seta parcial que denota a conver-gência fraca).

Page 151: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 151/371

4.5 Espaços com produto interno 145

Em geral o termo convergência fraca, sem qualificativos, em um espaço vetorialnormado se refere à topologia induzida pela família de todos os funcionais linearescontínuos.

Exercício :

4.57. a) Mostre que a convergência fraca em um espaço normado é mais fracado que a convergência forte (isto é, da norma), ou seja, se xn → x, (isto é, xn − x → 0), então, xn x.

b) Mostre que a recíproca vale em Rn (isto é, a convergência fraca implica naconvergência na norma).

Sugestão : use o resultado de Álgebra Linear que fornece a representação explícitapara um funcional linear. Veremos mais adiante que esta afirmativa não vale em es-paços de dimensão infinita em geral, e é exatamente este fato que torna interessantea convergência fraca.

4.5 Espaços com produto interno

Nesta seção introduziremos o conceito de produto interno que nos acrescentaum pouco mais da rica estrutura geométrica dos espaços euclideanos. O conceito denorma provêm da ideia de comprimento de um vetor em R3, mas não permite a abs-tração de conceitos geométricos básicos como ângulo e ortogonalidade. A abstraçãodo conceito de ortogonalidade é obtida por meio da definição de produto interno :

Definição 4.23 (Produto Interno em Espaço Real).Se E for um espaço vetorial com escalares reais, então um produto interno entrequaisquer elementos x, y

∈E, é um número real denotado por

x, y

satisfazendo as

seguintes condições :1. Simétrico : ∀ x, y ∈ E , x, y = y, x.

2. Linear na primeira posição : ∀ x, y, z ∈ E ,∀λ ∈ R, λ x + y, z = λ x, z + y, z.

3. Positividade definida : ∀ x ∈ E , x, x ≥ 0 , e x, x = 0 ⇔ x = 0.

Na verdade, o produto interno é uma forma quadrática positiva definida.O exemplo mais notável de espaços com produto interno não é exemplo, é a

motivação : em Rn, o produto canônico é dado por x, y =k =n∑

k =1 xk yk , que, obvia-

mente, satisfaz às condições acima. No caso dos espaços com escalares complexos,por exemplo Cn, é necessária uma modificação formal para que dela tiremos uma

norma. Uma interpretação geométrica simples do produto interno neste caso nãoexiste.

Page 152: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 152/371

146 4 Espaços Vetoriais e Álgebras Normadas

Definição 4.24 (Produto Interno em Espaços Complexos).Se E for um espaço vetorial com escalares complexos, então um produto internoentre quaisquer elementos x, y ∈ E, é um número complexo denotado por x, y ∈Csatisfazendo as seguintes condições :

1. Conjugação : ∀ x, y ∈ E , x, y = y, x (onde, se α = a + ib ∈ C,α = a − ib =conjugado de α ).

2. Linear na Primeira posição : ∀ x, y ∈ E ,∀λ ∈ R, λ x, y =λ x, y.

3. Positividade Definida : ∀ x ∈ E , x, x ≥ 0 , e x, x = 0 ⇔ x = 0.

Exercício :

4.58. Mostre que no caso real, o produto é linear também na segunda variável, mas,no caso complexo é apenas distributivo na segunda variável e satisfaz à propriedade :∀ x, y ∈ E ,∀λ ∈C, x,λ y =λ x, y.

A analogia entre os espaços vetoriais reais com produto interno e os espaços

euclideanos (Rn) é feita em grande parte através de interpretações geométricas. Poreste motivo, a própria linguagem e as definições nos sugerem fortemente esta ana-logia. Por outro lado, é necessário estabelecer limites dentro dos quais a intuiçãogeométrica pode ser utilizada, uma vez que os espaços de dimensão infinita têm al-gumas surpresas que os distinguem dos Rn, ainda que em muitos casos a surpresaprovenha exatamente das extraordinárias, e bem-vindas, semelhanças. Nesta seção,apresentaremos alguns poucos fatos elementares desta natureza ; outros serão acres-centados em seções posteriores.

Iniciaremos com a demonstração de um resultado que se constitui na peça fun-damental para que possamos associar ao produto interno axiomatizado acima umconceito geométrico de posição relativa e ortogonalidade entre vetores ; a desigual-dade de Cauchy-Schwartz. Esta desigualdade foi provada no caso do Rn por Cau-chy em suas notas de curso já mencionadas (

∼1823), mas traz também o nome de

Hermann A. Schwartz (1843-1921), aluno de Weierstrass, que a generalizou paraespaços abstratos. A literatura russa acrescenta ainda o nome de Bunyakowski. Asua demonstração abstrata é surpreendentemente muito mais simples e elegante doque as demonstrações clássicas.

Teorema 4.25 (Desigualdade de Cauchy-Bunyakowski-Schwartz-CBS).Se (E ,.) for um espaço vetorial com produto interno (sobre R ou C), então

i) Vale a desigualdade de CBS : ∀ x, y ∈ E , | x, y |2≤ x, x y, y ,ii) A igualdade só acontece no caso em que x e y são linearmente dependentes

(colineares), e,

iii) x =

x, x é uma norma no espaço E.

Prova. Para o caso real :

Page 153: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 153/371

4.5 Espaços com produto interno 147

i) Considere o polinômio de segundo grau e variável real p(t ) = x−ty, x−ty = x− ty 2. Então, pela positividade definida, temos que p(t ) ≥ 0 para todo t , e sóatingirá o zero no caso em que x e y são colineares. Desenvolvendo o produto,usando de sua linearidade e simetria, temos

p(t ) = y 2 t 2 + 2 x, yt + x 2 .

Como o polinômio não terá raízes reais distintas, o seu discriminante deverásatisfazer à desigualdade

x, y2− x 2 y 2≤ 0,

o que nos dá imediatamente a desigualdade CBS, e como a igualdade só acon-tece se p(t ) atingir o valor zero, ou seja, quando x e y forem colineares, concluí-mos também a segunda afirmação ii).

iii) Para mostrarmos que x = x, x é uma norma, basta verificar a sub-

aditividade, uma vez que as outras propriedades são óbvias. Então,

x + y2 = x− y, x− y = x2 + 2 x, y+ y2

≤ x2 + 2 x x + y2 = ( x + x)2 ,

o que finaliza a demonstração.

Exercício :

4.59. Demonstre a desigualdade CBS para o caso complexo. Sugestão : Suponhaque x = 1, o que é sempre possível sem perda de generalidade. Em seguida façaa expansão do produto α x − y,α x − y ≥ 0 dentro das leis, e tome capciosamenteα = y, x.

Uma questão natural que surge agora é sobre a diferença real, se houver ( !),entre o conceito de norma tal como definido originalmente e o conceito de normaproveniente de um produto interno, ou seja, como determinar se uma norma provêmde um produto interno. Não será difícil verificar que o conceito de espaço normadoé mais geral, pois abrange situações que não são contempladas com um possívelproduto interno subjacente. O teste intrínseco para resolver esta questão tem umainterpretação geométrica bem evidente e denomina-se “lei do paralelogramo” e foidemonstrada no caso geral por John von Neumann (∼ 1920) :

Teorema 4.26 (Teorema de von Neumann - Regra do Paralelogramo).Seja (E , . ) um espaço vetorial normado real ou complexo. Então, a norma . é proveniente de um produto interno , em E, se, e somente se, for válida a regra

do paralelogramo :

∀ x, y ∈ E , x + y2 + x− y2 = 2( x2 + y2).

Page 154: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 154/371

148 4 Espaços Vetoriais e Álgebras Normadas

Prova. (⇐) A verificação da necessidade é imediata ; basta que se desenvolva osprodutos que originam as normas da esquerda, cancelando-se os produtos cruzados.(⇒) Supondo-se a existência de um produto interno que origine a norma, ele deveser necessariamente definido pela mesma norma da seguinte maneira para o caso

real : x, y = 14

x + y 2 − x− y 2 .

Para o caso complexo, a expressão que define o produto é um pouco mais compli-cada,

x, y = 14

x + y2 − x− y2 + i x + iy2 − i x− iy2

e a demonstração das propriedades também. Veja detalhes do caso real no próximocapítulo e o caso geral em Maslov [1985].

Exercício :

4.60. Mostre que o produto interno é contínuo, isto é, que a função de duas variáveisπ : E ×E →C, π ( x, y) = x, y, é contínua, tomando a norma de E ×E como sendo ( x, y) 1= x + y . Veremos logo adiante que esta escolha para norma de E ×E é irrelevante.

Dentre os espaços com produto interno, serão de notável importância para aAnálise aqueles que forem completos na métrica do produto, denominados de Es-paços de Hilbert. A nomenclatura destes espaços é uma homenagem a David Hil-bert (1862-1943), o último universalista da escola de Göttingen (na linha de Gauss,Riemann, Klein) que, junto com o francês Henri Poincaré (1854-1912), moldou odesenvolvimento da matemática no século XX.

Definição 4.27 (Espaços de Hilbert). Denominamos de Espaço de Hilbert um espaço vetorial com produto interno que é

um espaço de Banach com a norma do produto.

Nada mais natural agora do que apresentarmos alguns exemplos importantes deespaços com produto interno que se constituirão na classe de objetos matemáticosmais comuns do meio para o final deste texto.

Exemplos de Espaços com Produto Interno :

1. Rn e Cn com seus produtos usuais : x, y =k =n∑

k =1 xk yk . Observe que a definição

vale para ambos os casos.

2. a) Se E i são espaço com produtos internos .i, então podemos definir em

i=n∏i=1

E i = E o produto ( x1.... xn), ( y1..... yn)π = i=n∑i=1

xi, yii . Verifique.

Page 155: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 155/371

4.5 Espaços com produto interno 149

b) Em particular, se A for um conjunto finito, podemos definir em F ( A,E ) =“Conjunto das funções g : A → E ”, onde (E ,.), é um espaço com produtointerno, o seguinte produto g, hF = ∑

a∈ Ag(k ),h(k ) .

Exercício :

4.61. Mostre que : Se (E ,.) for um Espaço de Hilbert, então (F ( A,E ),,F )será também um Espaço de Hilbert.

3. l2(C) = “Espaço de Minkowski”, com o produto interno natural

g,h =∞

∑k =0

g(k )h(k ),

que é bem definido por conta da desigualdade de Holder. Como já sabemos queé completo, l 2 é um espaço de Hilbert. Veremos em várias oportunidades queeste exemplo é o protótipo mais geral possível desta estrutura, o que não desfazdesta mas mostra a importância daquele. Na verdade, este é o único dentre osespaços de Minkowski que é um espaço proveniente de um produto interno, oque o torna mais especial ainda.

Exercício :

4.62. Mostre que nenhum outro l p(C), para p = 2, com a norma usual, x p, éum Espaço de Hilbert, ou seja, é um Espaço de Banach (completo), mas a suanorma não provem de um produto interno. Sugestão : Considere no caso real, osvetores do subespaço c+

0 ⊂ l p(C), x = (1,0, 0,...,0,...), e y = (0, 1, 0, 0,..., 0,...),e mostre que a regra do paralelogramo não vale para eles.

4. M n×n(C) =F ( I n × I n,C) = “Espaço das matrizes complexas n×n, com o pro-duto P,Q = Tr (PQ∗) = “Traço da matriz produto de P pela conjugada trans- posta (adjunta) de Q”.Observe que esta definição é um caso particular do exemplo genérico 2b), onde A = I n × I n e E = C. Portanto, é um espaço de Hilbert.

Os exemplos abaixo trazem o prefixo pré porque os espaços que realmente nosinteressarão em Análise Funcional serão os seus completamentos nas suas res-pectivas normas, o que somente será tratado, mais adiante, com a introdução daTeoria de Integração de Lebesgue, que é exatamente o resultado deste processo,tal como a Integral de Riemann foi resultado do completamento do espaço defunções escada.

5. Pré-Espaços de Lebesgue :

Page 156: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 156/371

150 4 Espaços Vetoriais e Álgebras Normadas

a) L 2([0,1],C),.

, onde o conjunto de funções é C 0([0, 1],C), e o produto

interno é h,g =1

0h( x)g( x)dx .

b) L 2(R,C),., onde o conjunto de funções é C ∞0 (R,C) ( funções in- finitamente diferenciáveis de suporte compacto), e o produto interno é

h, g =+∞ −∞

h( x)g( x)dx.

Estes espaços podem ser amplamente generalizados com produtos internos ponderados por funções peso ρ , como, por exemplo :

c) L 2([0,1],C),.ρ

, onde o conjunto base de funções é C 0([0, 1],C), e o

produto interno é h, gρ =1

0h( x)g( x)ρ( x)dx, e ρ ∈C 0([0, 1],R++).

d) L 2(R,C),.ρ

, onde o conjunto base de funções é C ∞0 (R,C), e o pro-

duto interno é h, gρ =+∞ −∞ h( x)g( x)ρ( x)dx, e ρ ∈C

0([R,R

++

). Por exem-plo, ρ( x) = exp− x2.Para funções definidas em Rn, ou em uma região aberta Ω ⊂Rn :

e) L 2(Rn,C),.

, onde o conjunto de funções é C ∞0 (Rn,C), e o produto

interno é h,g = Rn

h( x)g( x)dx.

f) L 2(Ω ⊂Rn,C),.

, onde o conjunto de funções é C ∞0 (Ω ,C), e o pro-

duto interno é h,g = Rn

h( x)g( x)dx.

Exercício :

4.63. a) Mostre que os pré-espaços de Lebesgue L 2([0,1],C) e L 2(R,C)são espaços com produto interno mas não espaços de Hilbert.

b) Mostre que, dentre os L p([0,1],C) e L p(R,C), para p ≥ 1, os únicoscujas normas provem de produto interno são aqueles para os quais p = 2.

6. Pré-Espaços de Hilbert-Sobolev :

a) H 0(Ω ) =W 02 (Ω ) = L 2(Ω ,C),.

, onde o conjunto de funções é C ∞0 (Ω ,C),

Ω ⊂Rn é uma região aberta, e o produto interno é h,g2 = Ω

h( x)g( x)dx.

b) H 0(Ω ,ρ) = W 02 (Ω ,ρ) = L 2(Ω ,R),

.

ρ, onde o conjunto de funções

é C ∞0 (Ω ,R), Ω ⊂ Rn é uma região aberta, ρ ∈ C 0(Ω ,R++) e o produtointerno é h,gρ =

Ω

h( x)g( x)ρ( x)dx.

Page 157: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 157/371

4.5 Espaços com produto interno 151

c) H m(Ω ) = W m2 (Ω ,R), onde o conjunto de funções é C ∞0 (Ω ,R), Ω ⊂ Rn éuma região aberta, m ≥ 0 é um número natural, e o produto interno é dadopor

h,gm =

|α |=m

∑|α |=0∂ α

h,∂

α

g2.

7. Funções com valores em espaços de Hilbert

a) Considere o conjunto das funções C 0

[0, 1],C 0([0, 1],R)

, onde definimos :

g,h× =1

0g(t ),h(t )2dt . Observe que pela identificação

C 0

[0, 1],C 0([0, 1],R)≈ C 0([0,1]× [0,1],R),

podemos escrever

g, h

× =

1

0 g(t ),h(t )

2dt =

[0,1]2

g(t ,s)h(t , s)dsdt ,

e portanto, identificarC 0

[0,1],C 0([0,1],R)

,,×

com L 2(Ω ,C),.

,

para Ω = [0, 1]2.

b) Analogamente, se (E ,,) for um espaço com produto interno, podemosdefinir um produto interno em C 0([0,1], E ) da seguinte maneira :

g, hF =

1 0

g(t ),h(t )dt .

8. Pré-Espaço de Bohr (Harald)Considere o conjunto das funções B = g : R→ C, que podem ser escritasna forma de uma soma finita do tipo g(t ) = ∑

λ ∈F aλ expiλ t , para qualquer

conjunto finito F , onde λ ∈ R e ak ∈C e o produto interno

g,h = limT →∞

1T

T −T

g(t )h(t )dt

.

Observação : Este é um dos poucos exemplos comuns e úteis de espaços comproduto interno não separáveis.

9. HC ( D) = “Funções holomorfas no disco unitário | z |< 1 e contínuas no círculo

unitário | z |= 1”, com o produto interno g, h2 = 12π

2π 0 g( z)h( z)d θ .

Page 158: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 158/371

152 4 Espaços Vetoriais e Álgebras Normadas

10. H m(C) =g :N→C, taisque ∞

∑k =0

(1+k 2)m | g(k ) |2<∞, com o produto interno

g,hm =∞

∑k =0

(1 + k 2)mg(k )h (k ), onde m ≥ 0.

Exercício :

4.64. a) Mostre que os exemplos acima são de fato espaços com produto in-terno.

b) Mostre que no último exemplo, H m1 ⊂ H m2 se m2 ≥ m1 ≥ 0, e que H m1 édenso em H m2 .

Estes espaços serão importantes no estudo de séries de Fourier a ser apresentadoem capítulo posterior.

4.6 Geometria de espaços vetoriais normados

Passaremos agora a abordar alguns aspectos geométricos da estrutura de espa-ços vetoriais normados e, particularmente, de espaços com produto interno, comalgumas raras incursões em espaços semi-normados. O objetivo deste tratamentoé utilizar o máximo possível, não somente a linguagem, mas também a intuiçãogeométrica que os espaços euclidianos naturalmente nos oferecem. Iniciaremos poralgumas considerações de caráter geral para espaços normados.

4.6.1 Equivalências e Isomorfismos

Quando consideramos dois conjuntos, sem nos preocuparmos com quaisquer es-truturas que por acaso tenham, a equivalência entre eles é simplesmente estabelecidapor meio de uma função bijetora, o que garante a mesma cardinalidade para ambose chamado isomorfismo de conjuntos.

Entretanto, se ambos dispõem de uma estrutura de espaço vetorial, a identifica-ção simples entre elementos sem que haja uma correspondência entre as operações,não é suficiente. A equivalência entre estes dois objetos matemáticos (isto é, conjun-tos com estruturas de espaço vetorial), exige a identificação elemento a elemento ede suas respectivas operações. Em Álgebra Linear, esta identificação de estruturas érealizada por meio de funções bijetoras lineares que são denominados isomorfismosentre espaços vetoriais.

Definição 4.28 (Isomorfismos entre Espaços Vetoriais).

Dizemos que dois espaços vetoriais com os mesmos escalares F , (E 1, +, ·,F) e(E 2,⊕,,F) são isomorfos se existir uma função ϕ : E 1 → E 2 tal que :

a) ϕ é bijetora (isomorfismo de conjuntos).

Page 159: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 159/371

4.6 Geometria de espaços vetoriais normados 153

b) ϕ é linear, isto é, ∀ x, y ∈ E 1 e ∀λ ∈ F, temos, ϕ ( x + y) = ϕ ( x) ⊕ϕ ( y) , e ϕ (λ · x) = λ ϕ ( x).

Observação 4.29. 1. A título de simetria da relação, seria natural exigir que ϕ −1

fosse também linear, mas isto não é necessário, já que isto é uma consequênciaimediata da própria linearidade de ϕ (verifique).

2. A utilização de símbolos diferentes para as operações nos dois espaços vetoriaissó tem por objetivo mostrar que a identificação pode ser feita entre duas estru-turas completamente distintas, mas tal pedantismo não irá se repetir, a menosque seja absolutamente indispensável.

Se agora os espaços vetoriais dispuserem também de uma estrututa topológicadescrita por normas, é interessante analisar a possibilidade de identificar as trêsestruturas (conjunto, espaço vetorial, topologia) simultaneamente. Como já vimosno caso de espaços métricos, as topologias são identificadas por meio de funções

bicontínuas. Portanto,Definição 4.30 (Isomorfismos entre Espaços Vetoriais Normados). Dizemos que dois espaços vetoriais com os mesmos escalares em F , normados,(E 1 , . 1) e (E 2, . 2) , são isomorfos, se existir uma função ϕ : E 1 → E 2 , a ser denominada isomorfismo entre os espaços vetoriais normados E 1 e E 2 , tal que :

a) ϕ é bijetora (isomorfismos de conjuntos),

b) ϕ é linear, isto é, ∀ x, y ∈ E 1 e ∀λ ∈ F , temos, ϕ (λ x + y) = λ ϕ ( x) +ϕ ( y) (iso-morfismos de espaços vetoriais) e,

c) ϕ é bicontínua, isto é, ϕ e ϕ −1 são contínuas (isomorfismo topológico, tambémdenominado homeomorfismo).

No caso em que não somente a álgebra e a topologia são preservadas mas tam-bém a geometria for preservada (e que é importante para alguns aspectos da teoriade aproximações), temos o conceito de isometria :

Definição 4.31 (Espaços Isométricos). Dizemos que dois espaços vetoriais normados, (E 1, . 1) e (E 2, . 2) , são iso-métricos se existir um isomorfismo de espaços vetoriais normados ϕ : E 1 → E 2 talque : ∀ x ∈ E 1 , ϕ ( x)2 = x1.

As funções lineares desempenham um papel importante no estudo da AnáliseFuncional, em grande parte porque as duas operações básicas da Análise, a deriva-ção e a integral, são lineares e também por representarem as identificações entre as

estruturas de espaços vetoriais. A continuidade das funções lineares pode ser cara-terizada de maneira simples e completa :

Page 160: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 160/371

154 4 Espaços Vetoriais e Álgebras Normadas

Teorema 4.32 (Caracterização de continuidade de funções lineares).Sejam (E 1, . 1) e (E 2, . 2) dois espaços vetoriais normados com os mesmosescalares. Então, se h : E 1 → E 2 for linear, são equivalentes :

a) h é contínua em algum ponto de E 1 ,

b) h é contínua em E 1 ,

c) h é limitada em conjuntos limitados,

d) h é limitada na bola unitária,

e) h é lipschitziana.

Prova. a) ⇒ b) Se h for contínua em z, então, h( x) − h( y) = h( x − y) = h( x − y + z) − h( z) e, portanto, se x → y, então h( x) → h( y), ou seja, h é contínua em todo oespaço E 1.b) ⇒ c) Como h é contínua na origem, existe um δ > 0, tal que se x 1≤ δ ,então h( x) ≤ 1. Se agora z ∈ E 1, z = 0, então h(δ z

z ) ≤ 1, de onde vem que

h( z) ≤ 1δ z , ∀ z ∈ E 1.

c) ⇒ d) Óbvio.d) ⇒ e)Se h for limitada na bola unitária, digamos por m, então, usando o argumentoacima, temos h( z) ≤ m z ,∀ z ∈ E 1, e, daí,

h( x) −h( y) = h( x− y) ≤ m x− y , ∀ x, y ∈ E 1.

e) ⇒ a) Óbvio.

Pelo que acabamos de ver, a limitação de uma função linear na bola unitáriadetermina a sua constante de Lipschitz, que caracteriza a sua continuidade, e, maisainda, uma continuidade uniforme. Portanto, é comum designar-se uma função li-near contínua como limitada, o que, na verdade, significa limitada na bola unitáriaou, equivalentemente, limitada em conjuntos limitados. Esta definição de limitação já foi encontrada no final do capítulo de espaços métricos. É claro que uma função li-

near não é limitada em todo o espaço todo E 1, a menos que seja nula. Basicamente,estas observações decorrem do fato de que uma função linear é homoteticamentedeterminada pelo seu comportamento na bola unitária.

Definição 4.33 (Espaços vetoriais e álgebras de funções lineares).

a) O espaço vetorial das funções lineares limitadas (contínuas) entre dois espaçosvetoriais normados E 1 e E 2 é denotado por L (E 1,E 2).

b) No caso em que E 2 = F (escalares, R ouC), então os elementos deL (E ,F) sãochamados funcionais lineares, e L (E ,F) é chamado espaço dual de E, sendotambém denotado por E ∗.

c) No caso em que E 2 = E 1 = E, designamosL (E 1, E 2) simplesmente por L (E ). Neste caso, de fato, temos uma (sub)àlgebra de todas as operações lineares

L(E ) com a operação de composição, já que a composição preserva a conti-nuidade.

Page 161: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 161/371

4.6 Geometria de espaços vetoriais normados 155

Usando os argumentos acima, podemos prover uma norma para estes espaçosque mede a continuidade das funções lineares e obter uma das classes de exem-plos mais importantes de espaços, e, álgebras, normadas, muitos dos quais são deBanach :

Teorema 4.34 (Espaços normados de funções lineares limitadas (contínuas)).Sejam (E 1 , . 1) e (E 2, . 2) dois espaços vetoriais normados com os mesmosescalares e consideremos o espaço vetorial L (E 1, E 2). Então,

a) Podemos definir uma norma neste espaço, chamada norma uniforme, da se-guinte maneira :

l1 = sup x1≤1

l( x) 2 .

b) Se E 2 for um espaço de Banach, então L (E 1, E 2) será um espaço de Banach.Em particular, os espaços de funcionais lineraes contínuos, E ∗ =L (E ,R) , (ou,L (E ,C)), com a norma l0 = sup x1≤1 |l( x)| , são espaços de Banach.

c) Se E for espaço de Banach, então L (E ,E ) = L (E ) será uma álgebra de Ba-

nach, em que a operação produto é definida pela composição.Prova. a) Exercício. Mostre que a definição é viável e de fato é uma norma.

b) Considere uma sequência de Cauchy (ϕ n) em L (E 1,E 2). Da continuidadeda norma, | ϕ n 0 - ϕ m 0|≤ ϕ n − ϕ m 0, e concluímos que a sequên-cia numérica de Cauchy ϕ n 0 converge. Analogamente, concluímos que ϕ n( x) 2 converge para todo x ∈ E 1. É fácil ver que a função ϕ , definidapontualmente por meio deste limite, ϕ ( x) = limϕ n( x), é linear (verifique). Masesta função é também limitada na bola unitária pois, para x 1≤ 1, temos ϕ ( x) 2= lim ϕ n( x) 2≤ lim ϕ n 0. Finalmente, dado um ε > 0, existe N 0, tal que se m, n > N 0, temos ϕ n −ϕ m 0≤ ε . Portanto, para ∀ x, x 1≤ 1,escrevemos

ϕ n( x)−ϕ ( x) 2≤ϕ n( x)−ϕ m( x) 2 + ϕ m( x)−ϕ ( x) 2≤ ε + ϕ m( x)−ϕ ( x) 2,

e, fazendo o limite na desigualdade das pontas para m →∞, concluímos que, sen > N 0, então ϕ n −ϕ 0≤ ε .

c) Já sabemos que L (E ) é de fato uma álgebra com a composição e é um espaçode Banach. Para que seja uma álgebra de Banach (e que a composição seja umaoperação contínua), devemos mostrar que : se ϕ ,ψ ∈L (E ) então ϕ ψ 0≤ϕ 0 ψ 0. Mas, para x 1≤ 1, temos

ϕ ψ ( x) 2= ϕ (ψ ( x)) 2 ≤ ϕ 0 ψ ( x) 2 ≤ ϕ 0 ψ 0,

de onde vem o resultado.

Dispomos assim de algumas informações preliminares sobre as funções linearescontínuas e podemos retornar agora às questões de isomorfismos de espaços veto-riais normados.

Page 162: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 162/371

156 4 Espaços Vetoriais e Álgebras Normadas

Nunca é demais enfatizar que um espaço vetorial normado (EVN) é um objetomatemático que consta de três ingredientes : 1) um conjunto, 2) uma estrutura de es-paço vetorial e, 3) uma estrutura de convergência (topologia), no caso, descrita poruma norma. Os dois primeiros itens determinam a estrutura algébrica e o último a es-

trutura topológica. Em um mesmo conjunto podemos ter duas estruturas algébricasdistintas que resultam dois espaços vetoriais distintos, ainda que os elementos se- jam os mesmos. Um exemplo deste fato é o conjuntoC com as estruturas de espaçovetorial com escalares reais e com escalares complexos ; o primeiro tem dimensão2, e o segundo tem dimensão 1. Entretanto, o que ocorre com maior freqüência emAnálise é que tenhamos no mesmo espaço vetorial duas normas diferentes, e, por-tanto, dois espaços vetoriais normados diferentes, ainda que sejam o mesmo espaçovetorial. Já vimos diversos exemplos disto e esta é uma flexibilidade que é de fatoutilizada com grandes vantagens.

Por outro lado, ainda que tenhamos duas normas diferentes, podemos ter amesma estrutura topológica, ou seja, convergências idênticas podem eventualmenteser descritas por duas normas distintas, assim como em espaços métricos umamesma estrutura topológica (isto é, de convergência) pode ser descrita por duas

métricas bem distintas. Em espaços normados não há tanta flexibilidade quanto emespaços métricos para a descrição da sua topologia porque, de fato, a métrica játem restrições fortes, por ser necessariamente originada de uma norma. Para melhordescrever estas situações, introduziremos alguns conceitos nas definições abaixo.

Definição 4.35 (Ordem das Topologias). Dizemos que a topologia 1 é mais fraca do que a 2, quando definidas em um mesmoespaço, se a convergência pela segunda implica na convergência pela primeira (istoé, se xn → x por 2 implica xn → x por 1). Dizemos também que as topologias são iguais (ou equivalentes) se as sequênciasconvergentes e seus limites são idênticos para ambos critérios, isto é, xn → x por 2⇔ xn → x por 1.

Ao contrário dos espaços métricos, onde uma topologia mais fraca não era ne-cessariamente decorrente de uma métrica uniformemente limitada pela mais forte,em um espaço vetorial E normado, isto sempre acontece, ou seja, se duas topologiassão respectivamente definidas pelas normas . 1 , . 2, a topologia 1 é mais fracado que a 2, se, e somente se, existir um número positivo β tal que

∀ x ∈ E , x 1 ≤ β x 2,

e as topologias serão idênticas se, e somente, as normas forem equivalentes, ou seja,se ∃ α ,β tais que

∀ x ∈ E , α x 2 ≤ x 1 ≤ β x 2 .

Exercício :

4.65. Demonstre os fatos acima e justifique, com exemplos, a comparação feita re-lativamente à situação em espaços métricos gerais. Sugestão : Considere a função

Page 163: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 163/371

4.6 Geometria de espaços vetoriais normados 157

(linear) identidade i : E 2 → E 1 e observe que dizer que “topologia 1 é mais fracado que a 2” é o mesmo que dizer que a função i é contínua. Podemos ter métricastopologicamente equivalentes sem que sejam métricas equivalentes. Lembre-se ded e d

1+d , ou ainda√

d .

Observação 4.36. 1. É bom lembrar que aspectos importantes da geometria do es-paço normado, tal como a convexidade estrita da bola unitária, que é funda-mental para o estudo de aproximação de funções a ser tratada logo a seguir, sãomodificados com a norma, mesmo que a topologia se mantenha a mesma. Oexemplo mais notável e simples desta situação é dado pelas normas . 1, . 2

em R2 ; a bola unitária na primeira norma contém segmentos lineares inteiros,ao contrário da segunda.

2. Da Álgebra Linear, sabemos que uma condição necessária e suficiente para quedois espaços vetoriais de dimensões finitas sejam isomorfos é que tenham amesma dimensão. Isto de certa maneira nos diz que, algebricamente, um espaçovetorial de dimensão finita é essencialmente um Rn. É razoavelmente surpreen-dente que esta afirmação se estenda para a inclusão das topologias normadas.

Este resultado será estabelecido de forma precisa pelo teorema abaixo e melhoresclarecido no caso geral pelo teorema de Riesz a seguir.

Teorema 4.37 (EVN dimensão finita ⇒ “Isomorfismo algébrico≈ Isomorfismotopológico”).

a) Dois espaços vetoriais normados de dimensões finitas são isomorfos como tais,isto é, existe uma bijeção, linear, bicontínua entre eles, se, e somente se, tiverema mesma dimensão.

b) Em Rn , e de fato, em qualquer espaço de dimensão finita, quaisquer duas nor-mas são equivalentes.

Prova. a) A Álgebra Linear garante que entre espaços de dimensão finita só épossível um isomorfismo algébrico se tiverem mesma dimensão, e, portanto,consideraremos esta condição já satisfeita. Como a relação de isomorfismo deEVN é transitiva, basta mostrar que qualquer espaço vetorial normado de di-mensão n é isomorfo ao espaço Rn com a norma, digamos, x ∞. Seja então(E , . ) um espaço vetorial normado de dimensão n. Tomemos uma base al-gébrica α 1......α n de E , e consideremos a função linear Φ : Rn → E , definida

por Φ ( x) =k =n∑

k =1 xk α k , que é um isomorfismo algébrico entre os dois espaços, E

e Rn. Mostraremos que é bicontínua. A sua continuidade é óbvia pois :

Φ ( x) =

k =n

∑k =1

xk α k

≤k =n

∑k =1

| xk | α k ≤

k =n

∑k =1

α k

x∞ = M x∞ .

Para mostrar que a inversa é contínua, consideremos a função de valores reaisϕ ( x) = Φ ( x) sobre a “esfera” S 1 = x ∈Rn, x ∞= 1. Como sabemos,

Page 164: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 164/371

158 4 Espaços Vetoriais e Álgebras Normadas

este é um conjunto compacto no espaço métricoRn, x ∞. Como a função ϕ écontínua (pois Φ é contínua e a norma também é contínua), ela deve atingir ummínimo em S 1 (Teorema de Weierstrass), digamos ϕ ( x0) = m. Mas, necessaria-mente, devemos ter m > 0, pois Φ não se anula exceto no zero e x0 ∞= 1.

Daí, temos que ∀ x ∈ S 1, Φ ( x) ≥ m, e, portanto, ∀ x ∈Rn

, Φ ( x) ≥ m x ∞,ou, ∀ y =Φ ( x) ∈ E , Φ −1( y) ∞≤ 1m y .

b) Basta considerar (Rn = E , . ) com uma norma qualquer e, no caso anteriortomar Φ = identidade, e teremos ∀ x ∈ Rn :

m x ∞≤ x ≤ M x ∞,

e como equivalência de normas é uma relação transitiva ...

Observe que o argumento chave para a demonstração acima foi a propriedadede compacidade da esfera unitária em algum espaço normado de dimensão finita, nocaso, escolhido como o Rn com a norma . ∞. Na verdade, poderíamos enunciar oteorema acima na forma : “se algum espaço normado de dimensão finita tem a esferaunitária compacta, então todos os espaços de mesma dimensão serão isomorfos

como espaços vetoriais normados”. O teorema acaba por implicar que todas as bolasfechadas em espaços vetoriais normados de dimensão finita são compactas (funçõescontínuas levam compactos em compactos).

Exercício :

4.66. a) Demonstre a primeira parte do teorema acima fazendo uso do Teorema deEstabilidade de Tikhonov.

b) Mostre que, se (E , . ) for um espaço vetorial normado, então, todos os seussubspaços vetoriais E 0 de dimensão finita são conjuntos fechados.Sugestão : escolha uma base de E 0 e argumente com as coordenadas ou use oteorema anterior com o EVN (E 0, . ).

Se um resultado semelhante fosse válido para dimensão infinita, as vantagens daabstração do conceito de norma para a representação de processos de convergêncianestas situações estariam muito limitadas. Entretanto, este não é o caso devido aoteorema que veremos logo a seguir e que, apesar de sua formulação abstrata e geo-métrica, desempenha um papel fundamental na teoria e nas aplicações da AnáliseFuncional às equações integrais e diferenciais. Este é um dos vários importantesteoremas que levam o nome de Frigyes Riesz (1880-1956), um matemático húngaroque foi um dos principais responsáveis pelo desenvolvimento da Análise Funcionalna linha iniciada por David Hilbert. O livro F. Riesz, B. Sz-Nagy, Functional Ana-lysis, Dover, 1990 (edição original, Budapest, 1952), escrito a partir das notas deaula compiladas pelo seu aluno e segundo autor, é um dos mais notáveis clássicosda literatura de análise (e de matemática), sob todos os aspectos. A edição da Dovera preço de capa US$13.95 é talvez uma das melhores compras que um analista pode

fazer.O teorema de Riesz mostrará como a topologização de um espaço vetorial queacopla as duas estruturas (algébrica e topológica) através de uma norma, as torna

Page 165: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 165/371

4.6 Geometria de espaços vetoriais normados 159

interdependentes, isto é, a compacidade da esfera unitária é uma característica so-mente da dimensão finita. A sua demonstração faz uso de um argumento geométrico(natural, mas não óbvio!), que procura construir uma sequência de elementos da es-fera unitária como que formando um sistema “quase-ortogonal”, de tal maneira que

distem um dos outros mais do que um valor fixo; isto impede que se acumulem emtorno de qualquer ponto, e, portanto, impede a compacidade da esfera em dimensãoinfinita. Observe que a falha de compacidade neste caso não é devida ao fato de queo conjunto “é muito grande” (ilimitado) ou, aberto, mas ao fato de que tem mui-tas dimensões. Como o argumento geométrico é importante por si mesmo, ele seráressaltado como um Lema.

Lema 4.38 (Lema de Riesz - Existência do elemento Quase-ortogonal).Se E , . , for um espaço vetorial normado, e E 0 um subespaço fechado de E, então∀ε > 0 , existe um elemento da esfera unitária z /∈ E o , “quase-ortogonal” a E o , istoé, tal que a distância de z a E o = d ( z, E o) = inf x− z , x ∈ E o ≥ 1− ε .Prova. (Tente seguir os argumentos com um esboço geométrico). Como E o é fe-chado, temos que d ( z,E 0) = d > 0 (verifique). Por outro lado, pela definição de d ,

podemos obter uma sequência en ∈ E o que estejam “quase na projeção ortogonal de z em E o”, ou seja, d n = z − en → d . Fazendo agora uma translação e homotetia,consideremos os vetores unitários xn = z−en

d n e teremos :

∀e ∈ E 0,

z− en

d n− e

= 1d n

z− (en −d ne) ≥ d d n

,

onde a última desigualdade provêm da definição de d e do fato que (en −d ne) ∈ E 0.Fazendo n →∞, como d

d n → 1, concluímos o desejado.

Teorema 4.39 (Teorema de Riesz - Caracterização topológica de dimensão emespaços vetoriais normados).Seja (E , . ) um espaço vetorial normado. Então, E tem dimensão finita se, e so-mente se, a sua esfera unitária for compacta.

Prova. (⇒) Se o espaço vetorial normado tem dimensão finita, já vimos anterior-mente que ele é isomorfo ao Rn com a norma . ∞ e, portanto, tal como este, tema sua esfera unitária compacta.

(⇐) Para isto, provaremos que se dimE = ∞, então a esfera unitária não é com-pacta. Tomemos então uma sequência infinita (vk ) de elementos linearmente inde-pendentes de E e consideremos os espaços E n = “Espaço gerado por v1,......vn”,de dimensão finita n e, portanto, fechados (v. exercício). Com base no lema de Riesz,construímos agora uma sequência de elementos da esfera unitária (en) de tal formaque d (en, E n) ≥ 1

2 . Esta sequência não pode ter pontos de acumulação pois, ∀n = m, en − em ≥ 1

2 , de onde concluímos que a esfera unitária neste caso, não pode sercompacta.

Passaremos a estudar rapidamente agora alguns aspectos muito gerais dos espa-ços vetoriais topológicos relacionados ao conceito geométrico de convexidade, quepode ser formulado independentemente da topologia.

Page 166: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 166/371

160 4 Espaços Vetoriais e Álgebras Normadas

4.6.2 Espaços Quocientes

Considere um espaço vetorial normado (E , . ) e um subespaço vetorial E 0. Seidentificarmos os elementos de E que diferem apenas por translações ao longo de

E 0, podemos construir uma relação de equivalência, x ∼ y se x− y ∈ E 0, e com isto,o conjunto de classes de equivalência

x = [ x] = z ∈ E , tais que z − x ∈ E 0 = x + E 0,

que é um hiperplano, e denominamos ao conjunto de todas estas classes comoconjunto quociente, denotado por E

E 0. Interprete geometricamente estas construções

em R3.

Exercício (Álgebra Linear) :

4.67. a) Mostre que a relação definida é uma relação de equivalência.

b) Mostre que o espaço vetorial quociente pode ser bem definido pelas operações

com representantes da classe : [ x] + [ y] = [ x + y], λ [ x] = [λ x].c) Mostre que, se E 0 for um subespaço fechado então podemos definir uma norma

em E E 0

da seguinte maneira : |[ x]| = inf x + e , e ∈ E 0. Interprete geome-tricamente esta norma como a distância entre o hiperplano x + E 0 e o planoE 0.

d) Mostre que se E 0 não for fechado, o máximo que podemos dizer é que |[ x]| éuma semi-norma .

O importante teorema que se segue nos mostra que esta construção é bem defi-nida no sentido que propriedades importantes do espaço original são preservadas.

Teorema 4.40 (Espaços Quocientes).Considere um espaço de Banach (E ,

.

) e um subespaço vetorial E 0 fechado.

Então, o espaço quociente E E 0 com a norma |[ x]| = inf x + e , e ∈ E 0 é tambémum espaço de Banach.

Prova. Seja ([ xn]) uma sequência de Cauchy em E E 0

. Tomemos uma subsequência

([ xnk ]) tal que [ xnk +1 ] − [ xnk ]

< 2−k . Agora, para cada classe [ xnk ], tomamos umrepresentante ξk ∈ [ xnk ], tal que

[ξnk +1 ] − [ξnk ] < 2−k . Então ξk é uma sequência

de Cauchy em E e, portanto, converge, digamos, para ξ0. Como [ xnk ]− [ξ0]

≤ξnk −ξ0 , concluímos que [ xnk ] → [ξ0]. Mas como a sequência [ xn] é de Cauchy,concluímos que, de fato, [ xn ] → [ξ0].

Exercícios :

4.68. a) Considere o EVN (E ([0, 1],R), . ∞) das funções escada e o subespaço

de funções

E 0 = h ∈ E ([0, 1],R), h( xk ) = 0 para uma quantidade finita de pontos xk .

Page 167: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 167/371

4.6 Geometria de espaços vetoriais normados 161

b) Considere o EVN ( R ([0,1],R), . ∞) das funções reguladas (Riemann Inte-gráveis) escada e o subespaço de funções

E 0 = h ∈E

([0,1],R),

1

0

|h| = 0.

Mostre que E 0 são, de fato, subespaços vetoriais e analise estes casos à luz do quefoi feito para espaços quocientes e interprete os resultados. Observe que a integralde Riemann é invariante dentro de uma mesma classe de equivalência, ou seja, é umconceito que está mais afeito à classe de equivalência do que às funções individuaispropriamente ditas.

4.69. Considere o EVN E = (C ∞([0, 1],C), . ∞) e o subespaço P N (C) = “Espaçodas funções polinomiais complexas de grau ≤ N ”. Mostre que este é um subespaçofechado de E e analise o significado de E

P N .

4.70. Considere o EVN E = (C ∞([0, 1],C),

.

∞) e o subespaço

E N =

f ∈ E : f (k )(0) = 0, 0 ≤ k ≤ n

.

Mostre que este é um subespaço fechado de E e analise o significado de E P N

.

4.71. Considere o EVN E = (C ∞(R,C, ) . ∞) e o subespaço E 0 = C ∞2π − per (R,C).

Mostre que este é um subespaço fechado de E e analise o significado de E P N

.

4.72. Mostre que dados os espaços vetoriais normados (E i, . i), eΦ ∈L (E 1,E 2),então podemos definir o espaço quociente E 1

N (Φ ) = E ∼ e definir uma transformação

linear limitada e injetiva Φ : E ∼ → E 2 como Φ ([ x]) = Φ ( x), e, além disto,Φ

=Φ .

Definição 4.41 (Conjunto de medida nula). Diz-se que um conjunto A0 ⊂R é nulo (ou tem medida nula) se, para todo númeroreal ε > 0 , existe uma família finita de intervalos fechados I k 1≤k ≤n , I k = [ak , bk ](talvez superpostos), que cubram o conjunto A0 , no sentido, A0 ⊂ I k , de tal ma-

neira que a soma de seus comprimentos seja menor do que ε , ou seja,k =n∑

k −1(bk −ak ) ≤

ε .

A equivalência entre funções (descontínuas em sua maioria) quando diferementre si apenas em um conjunto nulo (que pode ser infinito) é uma técnica importante

para situações em que o conceito que interessa é representado por uma integral.Trataremos destes casos mais adiante no estudo das integrais de Lebesgue e nasdefinições dos importantes espaços de Lebesgue e de Sobolev.

Page 168: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 168/371

162 4 Espaços Vetoriais e Álgebras Normadas

4.6.3 Convexidade

O conceito de convexidade tem a sua origem na ideia de segmento de reta doespaço euclideano e pode ser facilmente abstraída para qualquer espaço vetorial,assim como os conceitos decorrentes de conjunto convexo e de funções convexasda geometria e do cálculo elementar. Este conceito, mesmo emRn, demonstra a suagrande utilidade pelas suas vastas aplicações em otimização. O desenvolvimentoinicial destas ideias deveu-se muito a Hermann Minkowski (1864-1909), que de-senvolveu o assunto com vistas a aplicações na teoria dos números. A extensão doconceito de convexidade para dimensão infinita e o seu acoplamento com a topo-logia é relativamente recente e está intimamente ligada às teorias de otimização,de controle, aproximação de funções e métodos para análise de equações diferen-ciais. Apresentaremos aqui apenas os elementos básicos que serão empregados maisadiante.

Definição 4.42 (Conjuntos e Funções Convexas).Seja E um espaço vetorial.

a) Se x, y

∈E, denominamos de segmento que une x a y, denotado por [ x, y] , ao

conjunto :

[ x, y] = x +λ ( y− x), 0 ≤ λ ≤ 1 = µ x + γ y : µ ,γ ≥ 0 , e µ + γ = 1.

b) Dizemos que um subconjunto A ⊂ E é convexo se ∀ x, y ∈ A temos [ x, y] ⊂ A, ouseja, se A contêm os segmentos entre quaisquer de seus pontos.

c) Dizemos que h : E →R é uma função convexa se ∀ x, y ∈ E temos h(µ x + γ y) ≤µ h( x) +γ h( y) , onde µ ,γ ≥ 0 e µ + γ = 1 ; e estritamente convexa se a desi-gualdade for estrita para o interior do segmento.

A relação entre os conceitos de conjunto convexo e funções convexas pode serfacilmente entendido através do seguinte resultado :

Exercícios :4.73. Mostre que h : E → R é uma função convexa se, e somente se, os conjuntos H c = x ; h( x) ≤ c são convexos.

4.74. Interprete este resultado no caso de uma função de variável real h : R→ R.

4.75. Mostre que uma função de variável real h : R→ R é convexa se, e somentese, o seu epigráfico E p(h) = ( x, y) ; h( x) ≤ y, ∀ x, y ∈R for um conjunto convexo.(Observe que um conjunto convexo é, em particular, conexo).

Uma função que satisfaça a condição reversa da desigualdade convexa, ou seja,∀ x, y ∈ E , h(µ x+γ y) µ h( x)+γ h( y), ∀µ ,γ ≥ 0, e µ +γ = 1, pode ser denominadanegativamente convexa, já que −h é uma função convexa.

Alguns resultados simples serão enunciados a seguir como observações e exercí-

cios.

Propriedades básicas da convexidade :

Page 169: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 169/371

4.6 Geometria de espaços vetoriais normados 163

Definição 4.43. Dados n elementos x1, x2,..., xn de um espaço vetorial E, deno-

minamos de combinação linear convexa às combinações lineares do tipok =n∑

k =1µ k xk

quando µ k ≥

0 para todo k ek =n∑

k =1µ k = 1 , isto é, são somas ponderadas dos elemen-

tos xk . Ao conjunto de todas estas combinações convexas, denominamos simplexogerado por estes elementos e o denotamos por

[ x0, x1,..., xn] =

k =n

∑k =1

µ k xk : µ k ≥ 0 ek =n

∑k =1

µ k = 1

.

Exercícios :

4.76. Mostre que um simplexo é um conjunto convexo, e se x1, x2,..., xn ⊂ A e Afor convexo, então, [ x1, x2,..., xn] ⊂ A.

4.77. Mostre que se p : E →R for convexa, então, p

k =n∑

k =0µ

k x

k ≤k =n∑

k =0µ

k p( x

k ), para

qualquer combinação convexa.

4.78. Mostre que se h ∈ C 2([0,1],R), e ∂ 2h( x) ≥ 0, então h é convexa. Interpretea desigualdade acima como “a corda está sempre acima do gráfico da função entredois pontos”, ou, “o conjunto E p(h) = ( x, y) ∈ [0, 1] ×R ; y ≥ h( x) é convexo”.Este resultado simples é a origem de algumas desigualdades importantes da Aná-lise, em geral chamadas de Jensen. Talvez a mais antiga e mais elementar seja :“a mé dia aritmética é menor que a média geométrica”, e uma outra famosa deste

tipo é : exp

k =n∑

k =0µ k xk

k =n∑

k =0µ k exp( xk ), ou, equivalentemente, a desigualdade da

“entropia” : k =n∑

k =0µ k log( xk ) ≤ log

k =n∑

k =0µ k xk

. Verifique-as.

4.79. Generalizando a soma anterior para o caso contínuo, se µ ∈ C 0([0,1],R+) e1 0µ ( x)dx = 1 (isto é, µ agora é uma distribuição contínua de pesos, ou de probabi-

lidade), então h( x) ≤ h( x), onde g( x) =1

0µ ( x)g( x)dx = valor médio de g.

4.80. Se Aλ for uma família qualquer de conjuntos convexos, então a sua interseção∩ Aλ será um conjunto convexo. Verifique.

4.81. Se A for convexo e α ∈ E , então a translação de A por α , isto é, A +α =a +α ;a ∈ A é convexo. Verifique.

4.82. Se C for um conjunto qualquer, denominamos envoltória convexa de C ao

menor convexo que o inclui, que pode ser caracterizado como C o = ∩ Aλ onde Aλ representa todos os convexos que contêm C . Verifique que x0, x1,......., xno =[ x0, x1,..... xn].

Page 170: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 170/371

164 4 Espaços Vetoriais e Álgebras Normadas

4.83. As funções convexas h : E → R em espaços vetoriais E definem conjuntosconvexos da seguinte maneira : x;h( x− x0) ≤ c. Verifique.

4.84. Se hi for uma família finita de funções convexas, então ∨hi = maxhi tam-bém é convexa.

4.85. As semi-normas, normas e funcionais lineares são todas funções convexas.

Um tipo de função convexa um pouco mais geral do que a seminorma e quedesempenha um papel importante na geometria e na topologização de espaços veto-riais, são os funcionais de Minkowski :

Definição 4.44 (Funcionais de Minkowski). Dizemos que uma função p definida em um espaço vetorial E é um funcional de Minkowski se satisfizer às seguintes propriedades :

a) Positividade : p : E →R+ , isto é, ∀ x ∈ E , p( x) ≥ 0.

b) Homogeneidade positiva :∀λ ≥

0,∀ x

∈E , p(λ x) = λ p( x).

c) Sub-aditividade : ∀ x, y ∈ E , p( x + y) ≤ p( x) + p( y).

Os conjuntos convexos limitados e os funcionais de Minkowski são relacionadosbiunivocamente a menos, basicamente, de translações. Dado um conjunto convexo A contendo a origem e limitado, podemos definir um funcional de Minkowski p A

da seguinte maneira : p A( x) = inf λ > 0;λ −1 x ∈ A. Naturalmente, é fácil observarque as normas (e seminormas), assim como os módulos de funcionais lineares sãofuncionais de Minkowski.

Exercício :

4.86. Faça algumas experiências geométricas no plano para assimilar a ideia de fun-cional de Minkowski analisando as normas usuais do Rn, x2 , x1 , x∞, quantoa estes aspectos geométricos. Analise geometricamente as diferenças entre os fun-cionais de Minkowski e as normas e os funcionais lineares.

Os funcionais lineares são funções convexas especiais, nas quais estaremos par-ticularmente interessados, e que definem conjuntos convexos especiais. O estudo dageometria destes conjuntos é uma maneira de obter informações sobre os funcionaislineares utilizados para os definirem.

Definição 4.45 (Hiperplanos).Se l : E →R for uma função linear, então o conjunto N (l) = Núcleo de l = x ∈ ;l( x) = 0

e suas translações π c =

x

∈E ; l( x) = c

são chamados hiperplanos pelo

seguinte motivo :

Page 171: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 171/371

4.6 Geometria de espaços vetoriais normados 165

Teorema 4.46 (Decomposição do Espaço).Se l : E → R for uma função linear não-nula, com l(v) = 1 , e N (l) = Núcleo del = x ∈ ; l( x) = 0 então podemos escrever :

E = N (l)⊕

v

,

ou seja, todo vetor x ∈ E pode ser escrito de uma única forma como x = x0 +λ v,onde x0 ∈ N (l) e λ um escalar.

Prova. Basta escrever x = x− l( x)v + l( x)v, onde x0 = x − l( x)v, e λ = l( x).

Modelos geométricos euclidianos (dimensões 2 e 3) também nos levam a definirsemi-espaços separados por hiperplanos da seguinte maneira : H c = x ∈ E , l( x) ≤c.

Exercício :

4.87. Mostre que se lk for uma família finita de funcionais lineares, então p =∨lk = maxlk é um funcional convexo. Interprete geometricamente emR2 os conjun-tos convexos definidos por A =

x

∈E , p( x) =

∨lk ( x)

≤c

.

O estudo de convexidade por meio de funcionais lineares e vice-versa é umaárea de grande importância básica e será assunto de um tópico separado.

4.6.4 Aproximação e convexidade estrita

A bola unitária em um espaço vetorial normado é uma manifestação das pro-priedades da sua topologia (v. teorema de Riesz). Veremos agora que a bola unitáriatambém traz informações importantes sobre propriedades métricas do espaço. Paraisto definiremos o seguinte conceito :

Definição 4.47. Seja (E , . ) um espaço vetorial normado. Dizemos que E é es-

tritamente convexo se a sua esfera unitária não contêm segmentos não triviais, ouseja, ∀ z, y ∈ S 1 = x ∈ E : x = 1 , temos [ z, y]∩S 1 = z, y.

Exercício :

4.88. Mostre que o espaço euclideano com a norma . 2, a usual, é estritamenteconvexo, mas o mesmo não acontece neste espaço com a normas . ∞ e . 1

(basta um esboço em dimensão 2).

Frequentemente, desejamos aproximar funções de um espaço vetorial normado“grande” (E , . ), por funções de um subespaço (menor e mais administrável) E 0.Quando E 0 for denso em E podemos realizar estas aproximações com tanta precisãoquanto desejarmos pois, E 0 = E . O teorema de Weierstrass é um resultado típicodesta situação.

Entretanto, em várias ocasiões, o espaço E 0 não é denso em E e, portanto, érazoável perguntar se existe uma melhor aproximação, ou seja, dado um x ∈ E , seexiste um x0 ∈ E 0 tal que a distância seja realizada por ele : d ( x, E 0) = x− x0.

Page 172: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 172/371

166 4 Espaços Vetoriais e Álgebras Normadas

Definição 4.48 (Aproximação ótima). Dizemos neste caso que x0 é uma aproximação ótima, ou que realiza a distânciaentre x e E 0. Quando isto acontece para todos os x ∈ E, dizemos que E 0 satisfaz à propriedade da aproximação ótima em E .

O teorema abaixo é simples e útil :

Teorema 4.49 (Espaços de Dimensão Finita têm Aproximador ótimo).Se (E , . ) for um espaço normado e E 0 for um subespaço de dimensão finita,então E 0 satisfaz à propriedade de aproximação ótima.

Prova. Basta tomar umabase α 1,...,α n de E 0 e considerar para um v ∈ E a funçãoreal contínua (verifique) ϕ v : Rn →R,

ϕ ( x1,..., xn) = v−k =n

∑k =1

xk α k ,

que atinge um mínimo em uma grande bola fechada B(v, R), para r > d (v,E 0). Nem sempre o mínimo é atingido por apenas um elemento do subespaço E 0,

o que pode parecer estranho à nossa intuição euclideana. Entretanto, isto ocorremesmo em situações simples no Rn. Por exemplo, observe que um segmento inteirodo subespaço E 0 = ( x, 0) aproxima otimamente o elemento (0, 1) no espaço ve-torial normado (Rn, . ∞), e é fácil ver que a culpa deste fenômeno recai sobre abola unitária facetada deste espaço. O teorema abaixo confirma esta suspeita :

Teorema 4.50 (Unicidade da Aproximação ótima ≈ Convexidade Estrita).Se (E , . ) for um espaço normado, então todos seus sub-espaços E 0 de dimensão finita satisfazem à propriedade de aproximação ótima de forma única se, e somentese, E for estritamente convexo.

Prova. Sejam u− x = v− x = d ( x, E 0) = d , onde x ∈ E e u,v ∈ E 0. Assim, se z ∈ [u,v], então z = u +λ (v−u), para 0 ≤ λ ≤ 1, e

x− z = u +λ (v−u)− x = (1−λ )(u− x) +λ (v− x) ≤ (1−λ )d +λ d = d .

Ou seja,

[u, v] ∈ S d ( x0) ⇐⇒

u− x0

d ,

v− x0

d

∈ S 1 ⇐⇒ d ([u,v], E 0) = d .

Complete o argumento.

Casos particulares deste problema assumem uma enorme importância tanto teó-rica quanto nas aplicações. Por exemplo, no caso particular de polinômios, embora

a norma uniforme . ∞ não seja estritamente convexa, a sua estrutura intrínsecagarante que o aproximante ótimo seja único, um resultado importante devido a P.Chebychev em teoria de aproximação :

Page 173: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 173/371

4.6 Geometria de espaços vetoriais normados 167

Definição 4.51 (Polinômio de Chebychev).Se

E = C 0([0,1],R), . ∞ , e E 0 = P N (R) = “Subespaço das funções polinomiais

reais de grau ≤ N”. Então, dada uma função h ∈ C 0([0, 1],R) o único polinômiode grau ≤ N que melhor a aproxima na norma . ∞ é chamado polinômio de

Chebychev de grau N para h, e denotado por T N (h, x).

Não é fácil obter este polinômio, mesmo para funções muito simples comoh( x) = e x, experimente com n = 2.

Exercício :

4.89. Considere Pn como subespaço vetorial de E =C 0([0,1],R), . ∞

e 0 = x0 <

x1 < ... < xn = 1.

a) Mostre que p : E → R, p(h) = max0≤i≤n | h( xi) | é uma semi-norma em E euma norma em Pn.

b) Analise a questão da melhor aproximação de uma função h ∈ E por meio dos

polinômios de Pn nesta semi-norma. Referência : consulte P. J. Davis, Interpo-lation and Approximation, Dover.

Não é difícil observar pelos argumentos que, com a convexidade estrita, a uni-cidade da aproximação ótima vale para qualquer conjunto convexo A em lugar deum subespaço vetorial E 0, pois a única propriedade utilizada deste foi a sua convexi-dade. Entretanto, observe também que em um espaço de dimensão infinita a existên-cia da aproximação ótima para um conjunto convexo em geral pode não ser válida.Mas o resultado parcial já é suficientemente importante para registrá-lo :

Teorema 4.52. Se (E , . ) for um EVN estritamente convexo, A um sub-conjuntoconvexo e se para x ∈ E existir um elemento a ∈ A que minimiza a distância entre xe A, então, a é único.

Prova. Exercício.

Uma subclasse importante dos subespaços estritamente convexos são aquelesem que a norma provêm de um produto interno.

Exercício :

4.90. Mostre que um espaço vetorial com produto interno é um EVN estritamenteconvexo. Sugestão : considere para x, y ∈ S 1 o polinomio de segundo grau em t definido por p(t ) = x + t ( y − x) 2= x + t ( y − x), x + t ( y − x) ≥ 0, observandoque p(0) = p(1) = 1. Mostre que p(t ) < 1 para 0 < t < 1 ⇐⇒ x = y. Os leitoresinteressados em maiores informações sobe convexidade e suas aplicações podemconsultar : L. A. Lyusternik, Convex Figures and Polyhedra, Heath, 1965 (elemen-

tar) ; V. Alexéev, V. Tikhomirov, S. Fomine, Commande Optimale, MIR, 1982; E.Zeidler, Applied Functional Analysis, Springer, 1996 ; V. Tikhomirov, Analysis II ,Encycl. of Math. Sc., vol 14, Springer, 1990.

Page 174: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 174/371

168 4 Espaços Vetoriais e Álgebras Normadas

4.6.5 O Teorema de Hahn-Banach-Helly e o Princípio das Coordenadas

Como já vimos, o estudo dos funcionais lineares e de convexidade em dimensãoinfinita estão intimamente ligados. O principal resultado desta área é um teorema

devido a S. Banach, e também H. Hahn (1879-1934) e E. Helly (1884-1943), quegarante a existência destes funcionais em quantidade e na forma adequada à suautilização. A geometria euclideana nos mostra claramente pela álgebra linear que osfuncionais lineares contínuos existem em Rn e são todos caracterizados por meio deprodutos internos. (Veremos mais adiante que, surpreendemente, o mesmo aconteceem espaços de Hilbert).

Na verdade, esta representação implica que todos os funcionais lineares defini-dos em Rn são contínuos.

Exercício :

4.91. a) Mostre que se h :Rn →R for linear, então será necessariamente contínuoem qualquer norma, já que são todas equivalentes.

b) Mostre que esta afirmação é falsa em geral para espaços de dimensão infinita.Sugestão : C 1([0,1],R), . ∞, l(h) = ∂ h(0).

Considerando estes fatos, e como a estrutura de produto interno não está as-segurada em um EVN, é necessário saber em que condições é possível dispor defuncionais lineares contínuos, o que é respondido pelo famoso teorema de Hahn-Banach-Helly. Abordaremos este teorema sob um ponto de vista geométrico nestaseção e posteriormente apresentaremos algumas de suas aplicações analíticas. Ademonstração deste teorema está baseada em um argumento inventado por EduardHelly em um artigo de 1912, mas a sua popularidade foi motivada por um artigo deH. Hahn de 1927 e pela publicação do clássico Théorie des Operations Lineairesde Banach em 1932. Na literatura, entretanto, o teorema é conhecido injustamente

apenas como Teorema de Hahn-Banach. Referência : H. Hochstadt, Math. Intelli-gencer , 2(3), 1980.Além disso, foi também o próprio Helly que enfatizou a interpretação mais in-

teressante e intuitiva deste teorema como sendo a demonstração da possibilidade deverificar igualdades vetoriais por intermédio de uma família de igualdades numéri-cas, uma extensão do método usual da igualdade coordenada a coordenada em espa-ços de dimensão finita. Para melhor entendermos o argumento, observemos que emRn, a maneira direta (ou, “prática”) de verificação de uma equação vetorial α = β é por intermédio da sua equivalência à um sistema de n igualdades numéricas :α k = β k , que pode, por sua vez, ser interpretada como a verificação de n testes comos funcionais lineares pk (α ) = α , ek , onde ek é a base ortonormal do espaço emquestão.

Observemos que a igualdade vetorial somente poderá ser substituída por igual-

dades com funcionais lineares se tivermos uma família que inclua pelo menos ndeles linearmente independentes ; qualquer quantidade menor do que esta será insu-ficiente.

Page 175: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 175/371

4.6 Geometria de espaços vetoriais normados 169

Lembrando, como já fizemos insistentemente, que vetores do Rn podem ser in-terpretados como funções, ou seja, Rn ≈F ( I n,R), fica fácil expandir estas ideiaspara contextos bem mais amplos e inclusivos. Observemos, por exemplo, que umaigualdade f = g em espaços de funções, digamos, C 0(R,R), também é equivalente

à verificação (prática ? !) de uma quantidade não-enumerável de igualdades numéri-cas, f (t ) = g(t ), ∀t ∈R, ou seja, ponto a ponto. Um pouco de meditação nos mostraque, se as funções são encaradas como “vetores”, nada mais natural então do quepensar nos seus valores pontuais, f (t ) = f t como sendo suas respectivas coorde-nadas. Assim como o vetor na matemática mais contemporânea ganhou status deobjeto matemático (em contraposição à antiga percepção de serem simplesmenteum arranjo conveniente de números), também as funções têm ganhado progressiva-mente (a partir da Dinâmica do Meio Contínuo com Euler e finalmente na MecânicaQuântica), o status de objeto matemático, ao invés de serem vistas como regras deassociação de valores pontuais. Assim, nada mais natural do que procurar “liberar”a igualdade de funções da necessidade do teste com a família não-enumerável defuncionais lineares “avaliação pontual”, f (t ) = g(t ). A idéia de Helly é exatamenteesta, mas para isto, é necessário que disponhamos de quantidade suficiente de fun-

cionais lineares para que a idéia do “método generalizado das coordenadas” possaser estendido para um espaço de dimensão infinita. Resta saber o que poderá serconsiderado “suficiente”, e isto o teorema de Helly nos dirá.

A construção de funcionais lineares contínuos em espaços de funções é um dostemas mais importantes da Análise, uma das mais notáveis sendo a construção dateoria de integral de Lebesgue. A estratégia mais fundamental deste procedimentoconsiste no método de extensão da definição do funcional, a partir de um espaçorelativamente simples, para espaços maiores por meio de argumentos de completa-mento em diversas topologias, isto é, para o seu fecho. O teorema abaixo, que temum similar em teoria de espaços métricos para funções uniformemente contínuas, éa peça fundamental no argumento topológico.

Teorema 4.53 (Extensão de funcionais lineares para o fecho de um sub-espaço

normado).Suponha que E 0 seja um subespaço vetorial de um EVN (E , . ) , denso em E (isto

é, E 0.

= E), e que ϕ : E 0 → F, é uma função linear contínua, ϕ ∈L (E 0,F ) , onde(F , . 1) é um EVN de Banach. Então, existe uma única extensão contínua de ϕ ,que denominaremos ϕ : E → F , ϕ ∈L (E ,F ) , e além disto, ϕ = ϕ .

Prova. Se x ∈ E , definimos ϕ ( x) = limn→∞ϕ ( xn), onde ( xn) ⊂ E 0 e xn → x. ComoE 0 é denso em E , sempre existem sequências ( xn) deste tipo e ϕ ( xn) será de Cau-chy, uma vez que ϕ é contínua e lipschitziana, e, portanto, ϕ ( xn) converge em F (verifique). Por outro lado, se ( yn) ⊂ E 0 e yn → x, é fácil ver que limn→∞ϕ ( xn) =limn→∞ϕ ( yn), uma vez que ϕ é contínua e lipschtziana (verifique). Portanto, ϕ estábem definida e é obviamente a única extensão linear possível de ϕ . Vejamos se ϕ écontínua em E . Como

ϕ ( x) = limn→∞ϕ ( xn) ≤ lim

n→∞ ϕ ( xn) ≤ ϕ lim

n→∞ xn ≤ϕ x ,

Page 176: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 176/371

170 4 Espaços Vetoriais e Álgebras Normadas

vemos que ϕ ∈L (E , F ) e que ϕ ≤ ϕ . Mas, pela propria definição da normatemos

ϕ = sup ϕ ( x) , x ∈ E , x = 1 ≥ ϕ = sup ϕ ( x) , x ∈ E 0, x = 1,

já que E 0 ⊂ E , e portanto, ϕ = ϕ .

Apresentaremos agora o argumento de Helly que é simples, mas sutil e nospermite realizar o passo geométrico crucial na extensão.

Lema 4.54 (Lema de Helly : extensão uma dimensão preservando a norma).Seja E 0 um subespaço vetorial de um EVN (E , . ) e ϕ ∈ L (E 0,R) = E ∗0 um funcional linear limitado com norma ϕ E 0 = 1. Então, dado um a ∈ E −E 0 , existe pelo menos um funcional linear contínuo ϕ : E 1 = E 0 ⊕a → R que é extensão deϕ e que mantêm a norma unitária, ϕ E 1 = 1.

Prova. A definição algébrica da extensão é muito fácil, a questão é manter a limi-tação da norma do funcional estendido sob controle. Como todo vetor x da soma

direta E 1 = E 0 ⊕a é escrito como x = x0 +λ a de uma única maneira, podemosdefinir ϕ ( x) =ϕ ( x0) +λϕ (a) =ϕ ( x0) +λ c onde ϕ (a) = c pode ser algebricamentequalquer valor. Usaremos esta liberdade de escolha para que o funcional estendidotenha norma unitária. Para isto, é necessário e suficiente escolher uma constante ctal que

| ϕ ( x) |=| ϕ ( x0) +λϕ (a) |=| ϕ ( x0) +λ c |≤ x0 +λ a , ∀ x ∈ E 1,

isto é, ∀ x0 ∈ E 0 e ∀λ ∈ R. Dividindo por λ , estas desigualdades são equivalentes a

|ϕ ( x0) + c| ≤ x0 + a , ∀ x0 ∈ E 0,

ou ainda, equivalentes às desigualdades simultâneas

ϕ ( x0) + c ≤ x0 + a , ∀ x0 ∈ E 0, e ϕ ( z0) + c ≥ − z0 + a , ∀ z0 ∈ E 0,ou seja,

−ϕ ( z0) − z0 + a ≤ c ≤ x0 + a−ϕ ( x0), ∀ x0, z0 ∈ E 0.

Para que possamos conseguir um número fixo c que satisfaça simultaneamente aestas desigualdades ∀ x0, z0 ∈ E 0, é necessário e suficiente que qualquer valor obtidona extremidade direita da desigualdade seja maior ou igual do que qualquer umoutro obtido na extremidade esquerda, ou seja, que

−ϕ ( z0)− z0 + a ≤ x0 + a −ϕ ( x0), ∀ x0, z0 ∈ E 0,

ou, equivalentemente, que

ϕ ( x0)

−ϕ ( z0)

≤ z0 + a

+

x0 + a

,

∀ x0, z0

∈E 0.

Mas isto é verdade porque, dentre outras coisas, a norma unitária de ϕ nos permiteescrever ∀ x0, z0 ∈ E 0,

Page 177: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 177/371

4.6 Geometria de espaços vetoriais normados 171

ϕ ( x0)−ϕ ( z0) ≤ |ϕ ( x0) −ϕ ( z0)| ≤ x0 − z0≤ x0 + a− ( z0 + a) ≤ z0 + a + x0 + a .

Uma vez obtido o número c, concluímos pelas próprias desigualdades impostas,

que ϕ ≤ 1. Como ϕ é uma extensão de ϕ , sabemos por outro lado que ϕ =sup ϕ ( x) , x ∈ S 1(E 1) ≥ sup ϕ ( x) = ϕ ( x) , x ∈ S 1(E 0) = 1, uma vezque S 1(E 0) ⊂ S 1(E 1), de onde tiramos finalmente que ϕ = 1.

Observe que a escolha do número c no lema de Helly é arbitrária dentro dascondições impostas ; portanto, a extensão neste caso não é única em geral.

O teorema de Hahn-Banach-Helly explora o resultado do lema acima para pos-sibilitar a extensão de funcionais de qualquer subespaço para todo o espaço veto-rial. Este teorema será demonstrado abaixo para o caso em que o espaço vetorialnormado é separável, isto é, o espaço contêm um subconjunto enumerável denso.Esta é a única etapa desta demonstração em que a topologia descrita pela normaem questão é acionada. Uma demonstração mais geral evita este argumento e mos-tra que o teorema HBH é na verdade um teorema essencialmente geométrico e não

topológico. Optamos por enfatizar a demonstração topológica porque, além de sermais construtiva e concreta (na medida que estes argumentos abstratos permitem !),este caso é suficiente para abrangir a maioria das situações de interesse da AnáliseFuncional e certamente todas deste curso. Uma versão mais geométrica do teoremaHBH-geométrico será enunciada e ligeiramente comentada ao final.

Teorema 4.55 (Teorema de Hahn-Banach-Helly (versão topológica)).Seja (E , . ) um EVN separável, E 0 um sub-espaço vetorial de E, eϕ ∈L (E 0,R) =E ∗0 um funcional linear limitado com norma ϕ E 0 = 1. Então, existe pelo menosum funcional linear contínuo ϕ : E →R , isto é, ϕ ∈L (E ,R) = E ∗ , que é extensãode ϕ e que mantem a norma unitária, ϕ E = 1.

Prova. Se E 0 for denso em E , então basta utilizar o teorema de extensão de funcio-nais lineares limitados para o fecho.

Suponhamos então que E 0 não é denso em E . Portanto, existe um elemento x0 ∈ E − E 0 e uma bola B( x0,r ) tal que B( x0,r ) ∩ E 0 = / 0. Tomemos agora doconjunto C enumerável e denso em E , o subconjunto xn,n ≥ 1 = C ∩ (E − E 0)que é enumerável, e não vazio pois C ∩ B( x0,r ) = / 0.

Consideremos então a “torre” enumerável de subespaços vetoriais E n ⊂ E n+1

construídos recursivamente da seguinte maneira : E 0 é o próprio já fornecido, eE n+1 = E n ⊕ xn+1. Observemos que ∪E n = E ∞, é um subespaço vetorial densoem E , pois contêm todo o conjunto C . Usando repetidamente o lema de Helly, po-demos construir uma sequência de funcionais lineares contínuos de norma unitá-ria ϕ n ∈ L (E n,R) de tal maneira que ϕ n+1 é uma extensão de ϕ n. Com basenesta consistência, podemos definir um funcional linear contínuo de norma unitáriaϕ ∞ ∈L (E ∞,R) da seguinte maneira : se x ∈ E ∞ então existe n tal que x ∈ E n e por-

tanto, ϕ ∞( x) = ϕ n( x) = ϕ m( x), ∀m ≥ n. Assim retornamos novamente às condiçõesdo teorema de extensão para o fecho com o subespaço denso E ∞ e o funcional linearunitário ϕ ∞, concluindo a demonstração.

Page 178: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 178/371

172 4 Espaços Vetoriais e Álgebras Normadas

A versão geométrica deste teorema tem a extraordinária virtude de relacionarde forma profunda propriedades analíticas dos funcionais lineares com conceitose argumentos de caráter essencialmente geométrico em espaços vetoriais, o queabre uma nova e grande avenida conceitual para o tratamento de inúmeros pro-

blemas. Esta conexão provêm da interpretação de conjuntos H c = x ∈ E , l( x) ≤ ccomo semi-espaços definidos por funcionais lineares l e da identificação de conjun-tos convexos C e funcionais de Minkowski p na forma C = x ∈ E , p( x) ≤ c. Asemi-norma e a norma são casos particulares de um funcional de Minkowski ; paraa norma, o conjunto convexo C é uma bola “cheia” e para a semi-norma, C é umabola “ilimitada”. (Analise geometricamente a semi-norma emR2 : p( x) =| x1 |). As-sim, o teorema HBH pode ser interpretado geometricamente por meio do importanteconceito de separação de um conjunto convexo : “dado um ponto x0 que não estána bola unitária de um EVN, B1 = x ∈ E , x = 1, então, podemos construir umsemi-espaço H 1= x ∈ E , l( x) ≤ 1 que contêm inteiramente a bola unitária e nãoo ponto x0”.

Medite sobre o significado geométrico desta afirmação tal como lhe parece emdimensão finita, e pequena!

A demonstração do teorema é uma simples adaptação da demonstração anteriore nos revela que podemos separar não só bolas, mas qualquer conjunto convexo eisto está baseado essencialmente no fato de que a demonstração do lema de Hellypode ser inteiramente reconstruída substituindo-se a norma por um funcional deMinkowski, uma vez que apenas as propriedades comuns a estes dois tipos de fun-ções foram utilizadas.

Teorema 4.56 (Teorema de Hahn-Banach-Helly (versão geométrica)).Seja E um espaço vetorial real, p : E →R um funcional de Minkowski, isto é, ∀ x, y ∈E ,∀λ ∈R+ : i) p( x) ≥ 0 , ii) p(λ x) = λ p( x) se λ > 0 , e iii) p( x + y) ≤ p( x) + p( y).Sejam E 0 um subespaço vetorial de E e ϕ : E 0 → R , um funcional linear tal que∀ x0 ∈ E 0 , ϕ ( x0) ≤ p( x0). Então, existe pelo menos uma extensão linear ϕ : E →Rde ϕ 0 tal que ∀ x ∈ E, ϕ ( x) ≤ p( x).

Prova. (Esboço). Os argumentos do Lema de Helly podem ser repetidos (verifique)e com isto construímos cadeias (“torres”) de espaços vetoriais e funcionais linearesde forma análoga ao caso anterior, que produzem uma ordem parcial no conjuntodas extensões com extremo superior em cada cadeia. Isto nos permite utilizar o lemade Zorn para obtermos um elemento maximal que é a solução do problema.

Uma outra variação natural e útil do teorema HBH trata de funcionais em espa-ços vetoriais com escalares complexos, que só foi obtida recentemente pela troikaBohnenblust-Sobczyk-Soukhomlinov ; a sua demonstração não é tão difícil quantoa pronúncia dos nomes dos autores !

Teorema 4.57 (Teorema HBH (versão complexa BSS)).Seja E um espaço vetorial complexo, p : E → R um funcional de Minkowski, E 0

um subespaço vetorial de E, e ϕ : E 0 → C um funcional linear tal que ∀ x0 ∈ E 0 ,| ϕ ( x0) |≤ p( x0). Então, existe pelo menos uma extensão linear ϕ : E →C de ϕ 0 talque ∀ x ∈ E, | ϕ ( x) |≤ p( x).

Page 179: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 179/371

4.6 Geometria de espaços vetoriais normados 173

Prova. Para maiores detalhes destes teoremas e um tratamento do conceito geomé-trico de separação consulte Kolmogorov-Fomin, seção III.2.

Passaremos agora a algumas aplicações imediatas da teoria de HBH. Iniciemos

com uma definição.Definição 4.58 (Conjuntos enumeráveis fechados e completos em um EVN).

a) Uma sequência, S = x0,..., xn,... é dita fechada se o espaço gerado por to-das as combinações lineares finitas de seus elementos, denotada por [S ] =

k =m∑

k =0λ k xk , ∀λ k

, é denso em E, isto é, se [S ] =

k =m∑

k =0λ k xk , ∀λ k

.= E.

b) A sequência S = x0,..... xn,..... é dita completa se for válida a seguinte impli-cação : ∀ϕ ∈ E ∗ , ϕ ( xn) = 0,∀n ⇒ ϕ ≡ 0 .

Observação 4.59. 1. É necessário tomar um certo cuidado com os termos destadefinição ( fechada e completa), uma vez que são usados em outros contextos esignificados distintos. Observe que o conceito de sequência fechada não exigeque o conjunto formado pelos elementos (“soltos”) da sequência seja denso. Oexemplo típico deste fato é fornecido pela sequência xn(t ) = t n de elementos doespaço

C 0([0,1],R), . ∞

, que é fechada pelo teorema de Weierstrass, mas

obviamente não se constitui em um conjunto denso. O mesmo acontece com asequência xn(t ) = expi2π nt em

C 0([0,1],C), . ∞

pelo mesmo teorema.

Como se vê, não é difícil produzir sequências fechadas.

2. Observe que podemos interpretar os elementos de E como funcionais linearesem E ∗ = L (E , R), de forma natural, ou seja, x(l) = l( x), para ∀ x ∈ E , l ∈E ∗. Quando estes dois espaços coincidem, ou seja, quando todos os funcionais

lineares em E ∗ são desta forma, dizemos que o espaço normado E é reflexivo, já que podemos identificar, algébrica e topologicamente, E E ∗. Em geral, omáximo que podemos dizer é que, com esta identificação, temos uma inclusão :E ⊂ E ∗∗. O conceito de sequência completa pode ser reformulado da seguintemaneira : “ A sequência S = x0,..., xn,... é dita completa se dado qualquer ϕ ∈E ∗ tal que xn(ϕ ) = 0, ∀n, então ϕ ≡ 0”, ou seja, “se o conjunto de seminormasem E ∗, pn, pn(ϕ ) = |ϕ ( xn)|, for suficiente para separar elementos de E ∗.

3. Como já observamos, em álgebra linear finita, a igualdade entre duas funçõeslineares quaisquer pode ser verificada apenas testando-se os seus valores noselementos de uma base. Entretanto, um conceito útil de base para um EVN emgeral traz muitas dificuldades. As sequências completas são as substitutas natu-rais para a verificação de igualdades entre funcionais lineares contínuos sem anecessidade de testar seus valores em todos os pontos do espaço. A questão é

saber como determiná-las. Para isto temos o importante :

Page 180: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 180/371

174 4 Espaços Vetoriais e Álgebras Normadas

Teorema 4.60 (Teorema de Banach - As sequências fechadas e completas são asmesmas).Seja (E , . ) um EVN. Uma sequência xnn≥0 ⊂ E é completa se, e somente se, for fechada.

Prova. (⇐) Suponha que a sequência seja fechada, e tomemos ϕ ∈ E ∗ tal queϕ ( xn) = 0, ∀ xn. Mas então, dado um x ∈ E , basta tomar uma sequência de com-binações lineares finitas de xn,

z j =k =m j

∑k =0

λ jk xk → x,

e como ϕ ( z j) = 0, pois ϕ ( z j) = ϕ

k =m j

∑k =0λ

jk xk

=

k =m j

∑k =0λ

jk ϕ ( xk ) = 0, pela continui-

dade de ϕ , concluímos que ϕ ( x) = 0.(⇒) Suponha agora que a sequência xn seja completa mas não fechada. Então,existirá um elemento z

0 ∈E que não pode ser aproximado pelos elementos do es-

paço vetorial [ xn], formado pelas combinações lineares finitas dos xn, ou seja, épossível ter uma bola B( z0,r ) que não tenha nenhum elemento de [ xn]. Então nosubespaço vetorial E 0 = [ xn]⊕ z0, podemos definir um funcional linear limitadoϕ 0 : E 0 →R, fazendo ϕ 0( z0) = 1, e ϕ 0( x) = 0 para todos os x ∈ [ xn] (verifique).Agora, pelo teorema HBH, estendemos ϕ 0 para todo o espaço E e observamos que∀ xn, ϕ 0( xn) = 0, mas obviamente, ϕ 0 = 0. Portanto, não é possível que xn sejacompleta. Por absurdo, concluímos a hipótese.

4.6.6 Aplicações do princípio de coordenadas de Helly

O teorema de Hahn-Banach-Helly nos possibilita tornar equivalentes igualdadesem espaços normados, ou até com menos estrutura ainda, em uma família de igual-

dades escalares (reais ou complexas) por meio dos funcionais lineares. Esta é umaferramenta teórica de extrema importância para diversas construções e para a de-monstração e simplificação de vários resultados. Vejamos alguns exemplos simples.

Problema de Momentos :

Consideremos a sequência xn(t ) = t n no espaçoC 0([0,1],R), . ∞

, que é fe-

chada pelo teorema de Weierstrass. Dada uma função regulada (Riemann integrável)h ∈ R ([0,1],R), tomemos o seguinte funcional linear limitado Φ h : C 0([0, 1],R) →R, isto é, Φ h ∈C 0([0,1],R)∗, definido como

Φ h(g) =

1

0

g(t )h(t )dt .

Page 181: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 181/371

4.7 Extensão de espaços vetoriais normados - Teorema do completamento 175

O teorema de Banach então nos permite enunciar o seguinte importante resultado :

“se os momentos de todas as ordens de uma função regulada h, M n(h) =1

0t nh(t )dt ,

são nulos, então h ≡ 0”.

Na verdade, esta afirmação vale para uma classe de funções muito mais geraisdo que as funções reguladas; basta que a integralΦ h(g) possa ser definida como umfuncional linear limitado para alguma norma em um espaço que inclua as funções xn(t ) = t n.

Exercício :

4.92. a) Mostre que, de fato, Φ h ∈C 0([0, 1],R)

∗.

b) Demonstre a afirmação acima “se M n(h) = 0 ∀n ≥ 0, então h ≡ 0”.

c) Demonstre uma afirmação semelhante para funções com valores complexos

C 0([0,1],C) e momentos definidos na forma M n(h) =1

0expi2π nθ h(θ )dt .

d) Considere agora o espaço vetorial normado HC ( D−0) = “Funções holomor- fas no disco unitário sem a origem”, com a norma h = sup0≤θ ≤2π | h(eiθ ) |.Mostre que a sequência de funções gn( z) = znn≥0 , não é fechada pois não écompleta.Sugestão : Considere o funcional Φ (h) =

| z|=1

h( z)dz, Φ (gn) = 0, mas Φ = 0.

e) Mostre que se α ,β ∈ E , um espaço normado, e se | λ (α ) |≤ |λ (β )| para todosos λ ∈ E ∗, então α ≤ β . Observe que esta é uma maneira de demonstrar,ou verificar, desigualdades de normas em espaços normados por meio de desi-gualdades na reta real ; é o chamado Princípio de Hahn-Banach-Helly.

Existência da Função de Green para o Operador Laplaceano :

Este notável exemplo de aplicação concreta de um teorema abstrato foi desen-volvido por Peter Lax (um matemático contemporâneo famoso por suas originaiscontribuições à Análise Funcional, Numérica e Equações Diferenciais Parciais),como preparação para o seu exame de qualificação sob orientação de Richard Cou-rant. O trabalho foi publicado em : P. D. Lax, On the Existence of Green’s Function,Proc. AMS, 3(4), 526-531, 1952. (Observe que Courant foi aluno de Hilbert, quefoi aluno de ...).

4.7 Extensão de espaços vetoriais normados - Teorema docompletamento

O teorema do completamento que foi provado para espaços métricos pode na-turalmente ser aplicado para espaços vetoriais normados e se constitui em um dos

Page 182: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 182/371

176 4 Espaços Vetoriais e Álgebras Normadas

principais instrumentos para a construção de espaços funcionais e de extensão deseus funcionais limitados e demais operações. A extensão é de grande utilidade teó-rica e prática porque o completamento de Cauchy preserva todas as estruturas e nãoapenas a métrica.

Teorema 4.61 (Teorema de completamento - Espaços vetoriais normados, comproduto interno, e álgebras).

a) Seja (E , . ) um EVN. Então existe, a menos de isometrias, um único espaçode Banach

E , . −

no qual E é isometricamente imerso.

b) Se (E , . ) for um espaço vetorial com produto interno, onde x2 = x, x ,então existe, a menos de isometrias, um único espaço de Hilbert

E , . −

no

qual E é isometricamente imerso.

c) Se ( A, . ) for uma álgebra normada, então existe, a menos de isometrias, umaúnica álgebra de Banach

A, . −

na qual A é isometricamente imersa.

Prova. a) Basta utilizar o método de Cauchy para o completamento do espaçométrico e observar que, como as operações de soma e produto por escalar e afunção de valor real “norma” são uniformemente contínuas, então a estrutura deespaço vetorial e de norma se estendem por continuidade. É importante observarque a imersão, sendo isométrica, preserva também a geometria de E .

b) Como o produto interno pode ser escrito em termos da norma que é preservadapor isometria, concluímos que o o produto interno também é preservado naimersão.

c) Como o produto em uma álgebra é contínuo, conclui-se que o produto é preser-vado na extensão, assim como a desigualdade da norma do produto.

Este procedimento teórico será utilizado para a construção de diversos impor-tantes espaços funcionais da Análise Funcional assim como para a extensão do

conceito de integral.

Exemplos de espaços de Banach / Hilbert obtidos por completamento :

1. Espaços de Lebesgue - L 1([0, 1],C)

Definição 4.62. Consideremos o espaço vetorial normadoC 0([0, 1],C), . 1

,

h 1=

1 0

|h ( x)|dx,

que não é completo. O completamento deste espaço é denominado espaço de Lesbegue, ou espaço das funções integráveis segundo Lebesgue, e denotado por L 1([0,1],C).

Page 183: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 183/371

4.7 Extensão de espaços vetoriais normados - Teorema do completamento 177

Observe que, de acordo com o método de construção do espaço completado,os novos elementos são sequências de funções, e não funções no sentido clás-sico que determina valores ponto a ponto. A identificação clássica no entanto,é importante e será feita através da análise de convergência pontual destas se-

quências de funções contínuas que definem os novos elementos. Como as se-quências são de Cauchy segundo uma norma integral, não se pode esperar quea convergência pontual ocorra para todos os valores da variável. Entretanto, aconvergência pontual existe para quase todos os valores da variável, (ou seja,a menos de um conjunto de medida nula), e são iguais para os elementos deuma mesma classe de equivalência de sequências. Estes resultados, que não sãotriviais, resolverão a questão da interpretação clássica do espaço completado.Algumas funções descontínuas mas integráveis segundo Riemann (por exem-plo, as reguladas), podem ser consideradas como elementos deste espaço. En-tretanto, existe um grande conjunto de elementos do espaço completado quenão podem ser identificados como funções integráveis segundo Riemann. Umexemplo clássico e simples, mas longe de representar um caso excepcional, é afunção de Dirichlet D( x) que tem valor nulo para os x irracionais e D(q) = 1

para q racional. Esta função não é integrável segundo Riemann, (verifique), masé integrável segundo Lebesgue.

2. Espaços de Lebesgue - L 1(R,C)

Definição 4.63.

Consideremos o espaço vetorial normadoC 00(R,C), . 1

, .1 =

∞ −∞

|h ( x)|dx,

que não é completo. Observe que a integral que define a norma, na verdade seestende apenas a um intervalo finito que contem o suporte compacto da funçãoh. O completamento deste espaço é denominado de Lesbegue, ou Espaço das funções integráveis na reta segundo Lebesgue, e denotado por L 1(R,C).

Exercício :

4.93. Mostre que o completamento do espaçoC ∞0 (R,C), sendo denso em (C 00(R,C),

.1), h 1=∞

−∞|h ( x)|dx, também nos dá L 1(R,C), a menos de uma isome-

tria.

3. Espaços de Lebesgue-Minkowski - L p(Ω ,C) e L p(Rn,C)

a) L p(Ω ,C) = “Completamento do espaço vetorial normado C 00(Ω ,C),

.

p, h p=

Ω

|h ( x)| p dx 1 p

( integral de Riemann)”.

Page 184: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 184/371

178 4 Espaços Vetoriais e Álgebras Normadas

b) L p(Rn,C) = “Completamento do espaço vetorial normadoC 00(Rn,C), . p

,

h p=

Rn

|h ( x)| p dx

1 p

(integral de Riemann)”.

4. Espaço de funções quadrado somáveis, ou, espaço de Riesz-Fisher -L 2(Rn,C)

Os casos especiais L 2(Rn,C), e L 2(Ω ,C) ( p = 2), são os únicos espaços deHilbert dentre os espaços de Banach L p(Rn,C) e L p(Ω ,C).

5. Espaços de Sobolev - W m p (Rn,C) , p ≥ 1 , m ∈N.

W m p (Rn,C) = “Completamento do espaço C ∞0 (Rn,C), com norma h p,m=|α |=m

∑|α |=0

∂ α h p”. Observe que W 0 p (Rn,C) = L p(Rn,C). No caso em que p =

2, denotamos W m

2

(Rn,C) = H m(Rn,C), denominados de espaços de Sobolev- Hilbert em Rn.

6. Espaços de Sobolev - W mop (Rn,C) , p ≥ 1 , m ∈N.

W m0 p(Ω ,C) = “Completamento do espaço C ∞0 (Ω ⊂ Rn,C) com a norma

h p,m=|α |=m

∑|α |=0

∂ α h p”. Observe que W 0 p (Rn,C) = L p(Rn,C). No caso em

que p = 2, denotamos W m02(Ω ,C) = H m0 (Ω ,C), denominados de espaços deSobolev-Hilbert em Ω com condições nulas na fronteira, ou com traço nulo.

4.8 Apêndice :

4.8.1 Convexidade estrita em EVN

Como já vimos no estudo de convexidade em espaços normados, o otimizantepode não existir ou, no caso em que a esfera unitária não for estritamente convexa,pode existir mais de um elemento, o que surpreende a ingenuidade de nossa intuição.Portanto, é interessante iniciar o estudo desta questão indagando sobre a convexi-dade da esfera unitária em espaços com produto interno. Para isto, consideremosque x, y ∈ S 1(0) = z ∈ H , z = 1 e analisemos o segmento que os une, por meiodas suas normas que são dadas na forma :

p(t ) =

x−

t ( y−

x)

2= x

−t ( y

− x), x

−t ( y

− x)

= x 2 +2t x, y− x + t 2 y− x 2

= 1 + 2t Re x, y− x+ t 2 y− x 2≥ 0.

Page 185: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 185/371

4.8 Apêndice : 179

Mas como p(0) = p(1) = 1,e,sendo p um polinômio de segundo grau, não negativo,concluímos que p(t ) < 1 se 0 < t < 1, o que implica em convexidade estrita daesfera unitária. Observe, geometricamente, que max1− p(t ) ; 0 ≤ t ≤ 1 = 1 −

1−( Re x, x− y)2

x− y2 = arco máximo da corda.

Entretanto, no caso real temos mais do que convexidade estrita, na verdade,dispomos de uma propriedade chamada convexidade uniforme, que segue da regrado paralelogramo : ∀ x, y ∈ S R(0),

x− y 2= 2 x 2 +2 y 2 − x + y 2= 4 R2− x + y 2= 4( R2− 12

( x + y) 2

que pode ser geometricamente interpretada como

x− y = 2(

R+ 1

2( x + y) )

R− 1

2( x + y) ≤ 2

√ 2 R ·∆ M ( x, y)

onde ∆ M ( x, y) = arco máximo da corda que liga x a y, isto é, ∆ M ( x, y) = R

−d ([ x, y], 0), onde d ([ x, y], 0) = distância do segmento [ x, y] à origem = sup x +t ( y − x) , 0 ≤ t ≤ 1. Observe em particular que ∆ M ( x, y) é uma função contínuacom relação às variáveis x e y .

Analise geometricamente estes fatos em R2 ou R3.. No caso de uma esfera re-donda, isto é, na métrica euclideana usual, o máximo da corda é atingido exatamenteno ponto médio. Entretanto, isto não é, em geral, verdade, como pode ser visto emproduto interno do tipo x, yS = x,Sy, onde S é uma matriz simétrica e o produto, é o euclidiano ; neste caso a esfera é uma elipse. O conceito de convexidade uni-forme vem do fato de que se o arco máximo entre dois pontos da esfera se aproximade zero então estes dois pontos se aproximam entre si, ou, a distância entre dois pon-tos da esfera depende apenas do valor do arco máximo. Podemos então expressareste conceito sem a necessidade do produto interno, fazendo uso apenas da norma,com a seguinte definição :

Definição 4.64. Dizemos que um espaço normado (E , . ) é uniformemente convexose existir uma função real positiva α : R+ → R+ tal que α (r ) ↓ 0 se r → 0 , e quetenhamos a seguinte estimativa : ∀ x, y ∈ S 1(0) , x− y ≤ α (∆ M ( x, y)).

A propósito, além dos espaços com produto interno em geral, os espaços l p

e L p, para 0 < p < 1, são uniformemente convexos ; um teorema não trivial de-vido a Clarkson (1936). Para melhor apreciar esta propriedade, é interessante fazeresboços comparativos entre a situação favorável (norma euclideana usual em R2),e a desfavorável (norma . ∞). Este conceito é que vai possibilitar a construçãodo “pé” da projeção. Trataremos esquematicamente desta questão ampliando aindamais o nosso escopo para considerar conjuntos convexos em geral, e não somente

subespaços vetoriais.Seja então, uma sequência de elementos hn ∈ H 0, tal que d n = hn − h →d (h, H 0), cuja existência é garantida pela própria definição de distância de um ponto

Page 186: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 186/371

180 4 Espaços Vetoriais e Álgebras Normadas

a um conjunto. O nosso objetivo é mostrar que hn se constitui em uma sequênciade Cauchy e, portanto, converge em H ; daí, é fácil verificar que o limite é o ele-mento aproximante. Para isto, devemos então mostrar que hn − hm → 0 quandom,n → ∞, e, para relacionar esta questão ao conceito de convexidade, escrevemos

vn = 1d n

(hn −h).

Exercício :

4.94. a) Mostre que vn − vm → 0, (quando m,n → ∞), se e somente se hm −hn → 0.

b) Mostre que a função de três variáveis d ([u, v],h) = distância entre o segmento[u, v] e h =ϕ (u, v,h) é contínua.

Consideremos os resultados dos exercícios acima e escrevemos

vn − vm ≤α (1−d ([vn, vm], 0)).Mas,

d ([vn,vm], 0) = inf γ ,µ ≥0 γ vn +µ vm = 1d n

inf γ ,µ γ (hn −h) +µ d nd m

(hm −h) = 1

d n inf γ ,µ γ hn +µ d n

d mhm − (γ +µ d n

d m )h) ,

e, como d n,d m → d para m,n → ∞, concluímos que

d ([hm,hn], h) +ε mn = inf γ ,µ

γ hn +µ d nd m

hm − (γ +µ d nd m

)h) ,

onde ε mn → 0 com m,n → ∞, pela continuidade mostrada na exercício acima. Mas,como hn e hm estão em um conjunto convexo, e pela sua definição, temos que

d ([hm,hn],h) ≥ d ou, que d ([vn, vm], 0) ≥ d d n + 1d n ε mn → 1, quando m, n →∞, e, pelamonotonicidade do limite da função α temos, finalmente,

vn − vm ≤α (1− d d n

− 1d nε mn) → 0, quando m,n → ∞.

Com isto podemos enunciar o seguinte teorema :

Teorema 4.65 (Existência e unicidade de um aproximante ótimo para um conjuntoconvexo fechado em um espaço de Banach uniformemente convexo).Se (E , . ) for um espaço de Banach uniformemente convexo e se K for um sub-conjunto convexo fechado, então,

a) ∀h ∈ E, existe um aproximante ótimo h0 ∈ K, isto é, h−h0 = d (h,K ) ,

b) h0 é único, ec) se hn for uma se´ quência aproximante, isto é, se h− hn → d (h,K ) , para n →∞ , então hn → h0.

Page 187: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 187/371

4.8 Apêndice : 181

Embora este tratamento tenha exigido várias passagens, o seu conteúdo geométricoé simples e baseia-se em noções de geometria plana elementar. Consideramos queeste é um bom exemplo da aplicação de construções geométricas elementares na ob-tenção de propriedades profundas em espaços de dimensão infinita. Naturalmente,

o teorema vale em particular para espaços de Hilbert e neste caso tem uma demons-tração mais simples e mais importante que já apresentamos.

4.8.2 Referências específicas

Sobre o Cálculo Operacional de Mikusinski com o produto de convolução e oseu conceito de funções generalizadas, consulte :

J. Mikusinski, Operational Calculus, Pergamon Press, 1959.A. Erdélyi, Operational Calculus and Generalized Functions, Holt 1962.V. Ditkine, A. Proudnikov, Calcul Opérationnel, MIR, 1979.O. Heaviside, Operators in Mathematical Physis, Proc. Royal Soc. A., 52,1893, pg. 504; 1894, pg. 105.

Sobre Análise de Fourier, há vários excelentes livros introdutórios e mais avan-çados, tanto quanto se queira, tais como,

Y. Katznelson, An Introduction to Harmonic Analysis, J. Wiley.R. E. Edwards, Fourier Series : A modern Introduction, vol. 1, Holt, 1967.H. Dym, H. McKean, Fourier Series and Integrals, Acad. Press, 1972.T. Körner, Fourier Analysis, Cambridge U. Press, 1988.E. Stein, R. Sharkhir, Fourier Analysis, Princeton U. Press, 2003.

Sobre tratamento de sinais discretos,

G. Strang, T. Nguyen, Wavelets and Filter Banks, Wellesley, 1997.

Sobre tratamento de sinais discretos,

L. Loomis, Abstract Harmonic Analysis, Van Nostrand, 1953.M. A. Naimark, Normed Rings, Noordhof, 1964.R. Douglas, Banach Algebras of Operators, Academic Press, 1968.

Sobre álgebra em geral, as referencias clássicas são

G. Birkhoff, S. McLane, A Survey of Modern Algebra, AMS.B. van der Waerden, Modern Algebra, Springer.

Sobre álgebras de séries de potências complexas e a teoria de Weierstrass,consulte um dos excelentes

Page 188: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 188/371

182 4 Espaços Vetoriais e Álgebras Normadas

P. Henrici, Applied and Computational Complex Analysis, vol. 1, J. Wiley,1974. (Com ênfase em formulações algébricas e numéricas).R. Remmert, Theory of Complex Functions, Springer, 1991. (Tratamentoclássico e histórico).

L. Ahlfors, Complex Analysis, A. Wesley, 1957. (Clássico).

Sobre o desenvolvimento dos Métodos Operacionais não Comutativos, consulte

V. P. Maslov, Méthodes Opératorielles, MIR, 1989.V. P. Maslov, V. S. Nazaikinski, Non Commutative Methods ..., W. de Gruy-ter.

Sobre aproximação,

P. J. Davis, Interpolation and Approximation, Dover, 1963.F. Deutsch, Approximation in inner product spaces, Springer.

Sobre a vida de Banach e seus arredores,

R. Kaluza, Stefan Banach : A Scientific Life, Birkhauser, 1993.

Page 189: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 189/371

5

Espaços de Hilbert

“ A Matemática não é um amontoado de teoremas, tanto quanto umacasa não é um amontoado de tijolos, ou uma novela não é um amontoadode sentenças ; o importante em tudo é o panorama e o enredo !” H.

Poincaré

5.1 Topologização de espaços vetoriais com um produto interno

Considerando-se o papel especial que os espaços vetoriais dotados de um pro-duto interno desempenham em Análise Funcional, pela variedade e riqueza de re-sultados associados à sua estrutura matemática e às suas interfaces em outras áreasda Ciência, é razoável que sejam tratados em um capítulo à parte. O produto internonão só topologiza o espaço vetorial, como também torna possível generalizaçõesde profundidade e significados inesperados para diversos conceitos elementares dageometria métrica de espaços euclideanos, o que vale dizer, do espaço físico que

nos é mais familiar e, portanto, mais intuitivo. Na verdade, a linguagem geométricaé deliberadamente utilizada nesta teoria, não apenas como metáfora, mas como umaespécie de catalisador de ideias e de métodos. Por este motivo, o leitor deve sesentir encorajado, sempre que possível, a utilizar sua intuição geométrica plana ouespacial para assimilar conceitos abstratos e acompanhar os diversos argumentos,sempre, naturalmente, com as devidas ressalvas, mas sem permitir que estas inibamdemasiadamente a sua audácia.

O conceito de norma provêm da ideia de comprimento de um vetor em R3, masnão permite a abstração de conceitos geométricos básicos como ângulo e ortogona-lidade, que são fundamentais à nossa intuição natural de espaço físico. Nesta seção,voltaremos a definir formalmente o produto interno, que, além de estabelecer umatopologia normada, acrescenta uma parte substancial da estrutura geométrica dosespaços euclideanos, o qual, entre outros dividendos futuros, também nos permitirá

a formalização matemática de conceitos importantes como o grau de independêncialinear e de correlação entre dois (e eventualmente mais) vetores. Ou seja, com oproduto interno, embora ainda sujeitos a ressalvas, podemos utilizar a intuição geo-

Page 190: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 190/371

184 5 Espaços de Hilbert

métrica com muito mais desenvoltura ; em espaços (meramente) normados é comose estivéssemos fazendo geometria elementar com “as duas mãos amarradas nascostas”.

Os axiomas utilizados para a definição de produto interno em espaços vetoriais

com escalares reais seguem essencialmente a nossa intuição geométrica, enquantoque, para espaços com escalares complexos, onde ela pouco nos ajuda, faremosuso da experiencia do caso real e da conveniência matemática como argumentaçãosuplementar.

Definição 5.1 (Produto interno em espaço real).Se E for um espaço vetorial com escalares reais, então, um produto interno entrequaisquer elementos x, y ∈ E é um número real, denotado por x, y , satisfazendo àsseguintes condições :

1. Simetria : ∀ x, y ∈ E , x, y = y, x.

2. Linearidade : ∀ x, y, z ∈ E , ∀λ ∈R, λ x + y, z =λ x, z + y, z.

3. Positividade definida : ∀ x ∈ E , x, x ≥ 0 , e x, x = 0 ⇔ x = 0.

O termo “produto” é utilizado aqui por conta da bilinearidade da operação, istoé, linearidade na primeira e segunda variável, separadamente. Observe que não uti-lizamos os termos “comutatividade e distributividade”, para as propriedades de si-metria e linearidade, respectivamente, que são reservados para operações “produto”onde o resultado é um vetor, tal como nas álgebras, e não um escalar.

O exemplo mais notável para esta estrutura, obviamente não é exemplo, é a mo-

tivação : em Rn, o produto canônico é dado por x, y =k =n∑

k =1 xk yk que, sem falsas

surpresas, satisfaz às condições acima. No caso dos espaços com escalares com-plexos, por exemplo Cn, é necessária uma modificação formal para que tenhamos

como obter uma norma, ou seja, uma métrica, o que, afinal de contas, é o nossoprimeiro objetivo. Uma interpretação geométrica intuitiva do produto interno nestecaso não existe, e a escolha dos axiomas segue o necessário critério de conveniência(e consistência) matemática.

Definição 5.2 (Produto interno em espaços complexos).Se E for um espaço vetorial com escalares complexos, então um produto internoentre quaisquer elementos x, y ∈ E é um número complexo, denotado por x, y ∈C ,satisfazendo as seguintes condições :

1. Conjugação : ∀ x, y ∈ E , x, y = y, x , (onde, se α = a + ib ∈C, α = a− ib =“conjugado de α ”).

2. Linearidade na primeira posição :

∀ x, y, z

∈E ,

∀λ

∈C,

λ x + z, y

x, y

+

z, y.3. Positividade definida : ∀ x ∈ E , x, x ≥ 0 , e x, x = 0 ⇔ x = 0.

Page 191: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 191/371

5.1 Topologização de espaços vetoriais com um produto interno 185

Exercício :

5.1. Mostre que no caso real, o produto é linear também na segunda variável ; mas,no caso complexo é apenas distributivo na segunda variável e, em lugar da lineari-

dade, satisfaz à propriedade dita Hermiteana : ∀ x, y ∈ E , ∀λ ∈C

, x,λ y =λ x, y.

A analogia entre os espaços vetoriais reais com produto interno e os espaçoseuclideanos (Rn) é intermediada em grande parte pelas interpretações que a pró-pria linguagem e as definições fortemente nos sugerem. Por outro lado, é necessárioestabelecer limites dentro dos quais a intuição geométrica pode ser utilizada, umavez que os espaços de dimensão infinita nos apresentam várias surpresas que osdistinguem dos Rn, ainda que, em muitos casos, a surpresa provenha exatamentedas extraordinárias, e bem-vindas, semelhanças entre eles. Nesta seção, apresenta-remos alguns poucos fatos elementares desta natureza; outros serão acrescentadosem seções posteriores.

Iniciaremos com a demonstração de um resultado que se constitui na peça fun-damental para que possamos associar ao produto interno axiomatizado acima umconceito geométrico de posição relativa e ortogonalidade entre vetores ; a desigual-dade de Cauchy-Schwartz. Esta desigualdade foi provada no caso do Rn por Cau-chy em suas notas de curso já mencionadas (∼ 1823), mas traz também o nome deHermann A. Schwartz (1843-1921), aluno de Weierstrass, que a generalizou paraespaços abstratos. A literatura russa acrescenta ainda o nome de Bunyakowski. Asua demonstração abstrata é surpreendentemente muito mais simples e elegante doque as demonstrações clássicas.

Teorema 5.3 (Desigualdade de Cauchy-Bunyakowski-Schwartz-CBS).Se (E ,.) for um espaço vetorial com produto interno (sobre R ou C), então

1. Vale a desigualdade de CBS : ∀ x, y ∈ E , | x, y|2 ≤ x, x y, y ,2. A igualdade só acontece no caso em que x e y são linearmente dependentes

(colineares), e,

3. x = x, x é uma norma no espaço E.

Prova. Para o caso real : 1) Considere o polinômio de segundo grau e variável real p(t ) = x − ty, x − ty = x − ty 2. Então, pela positividade definida, temos que p(t ) ≥ 0 para todo t , e p(t ) só atingirá o zero no caso em que x e y são colineares.Desenvolvendo o produto, usando de sua linearidade e simetria, temos

p(t ) = y 2 t 2 + 2 x, y t + x 2 .

Como o polinômio não poderá ter duas raízes reais distintas (pois neste caso atingi-ria valores negativos), o seu discriminante deverá satisfazer à condição

x, y2− x 2 y 2≤ 0,

Page 192: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 192/371

186 5 Espaços de Hilbert

o que nos dá imediatamente a desigualdade CBS. A igualdade se verifica apenasno caso em que p(t ) atingir o valor zero com uma raiz dupla, e isto ocorrerá se, esomente se x e y forem colineares, de onde concluímos também a segunda afirmação.

Paramostrarmos que x =

x, x é uma norma, basta verificar a sub-aditividade,

uma vez que as outras propriedades são óbvias. Então, x + y 2 = x + y, x + y = x2 + 2 x, y+ y2

≤ x2 + 2 x y + y2 = ( x + y)2 ,

o que finaliza a demonstração. O caso complexo é tema do próximo exercício.

Exercício :

5.2. Demonstre a desigualdade CBS para o caso complexo. Sugestão : Suponha que x = 1, o que é sempre possível sem perda de generalidade. Em seguida faça aexpansão do produto α x − y,α x − y ≥ 0 dentro das leis, e tome capciosamente

α = y, x.

Uma questão que se impõe naturalmente agora diz respeito à diferença, se hou-ver( !), entre o conceito de norma tal como definido originalmente e o conceito denorma proveniente de um produto interno, ou seja, se é de fato necessário definir umproduto interno separadamente, ou se o conceito de norma já não traria embutido,de alguma forma, um conceito anterior de produto interno. E, no caso, negativo,como determinar se uma norma provêm de um produto interno. Não será difícilverificar que o conceito de espaço normado é mais geral, pois abrange situaçõesque não são contempladas com um produto interno subjacente, ou ainda, a defini-ção de produto interno realmente introduz novos elementos na estrutura vetorial. Oteste intrínseco para resolver esta questão tem uma interpretação geométrica bem

evidente e denomina-se lei do paralelogramo, e foi demonstrada no caso geral porJohn von Neumann († 1955), que, todavia, merece ser lembrado por contribuiçõesmuito mais importantes, tanto à Teoria de Espaços de Hilbert como a várias outrasáreas da Matemática, Lógica, Computação, Física e Dinâmica dos Fluidos.

Teorema 5.4 (Teorema de von Neumann-Jordan - Regra do Paralelogramo).Seja (E , . ) um espaço vetorial normado, real ou complexo. Então, a norma . é proveniente de um produto interno , em E, se, e somente se, for válida a regrado paralelogramo :

∀ x, y ∈ E , x + y2 + x− y2 = 2( x2 + y2).

Prova. (⇐) A verificação da necessidade é imediata ; basta que se desenvolva os

produtos que originam as normas da esquerda, cancelando-se os produtos cruzados.(⇒) Caso real : A definição de produto interno, naturalmente, parte da suposiçãode que ele pode ser escrito em termos de normas da seguinte maneira :

Page 193: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 193/371

5.1 Topologização de espaços vetoriais com um produto interno 187

x, y = 14

x + y2 − x− y2

.

A positividade definida e a simetria decorrem imediatamente da expressão utilizada.Passemos então à linearidade, cuja demonstração exige alguma sutileza emprestada

de quem muito teve dela. Comecemos com a manipulação abaixo

x, z + x, y = 14 ( x + z 2 − x− z 2) + 1

4 ( x + y 2 − x− y 2)

= 14 ( x + z 2 + x + y 2)− 1

4 ( x− z 2 + x− y 2).

Usando com atenção a regra do paralelogramo para α = x+ z e β = x+ y no primeiroparêntesis e α = x − z e β = x− y no segundo, obtemos :

x, z + x, y = 18 ( 2 x + y + z 2 + z− y 2) − 1

8 ( 2 x− ( y + z) 2 + z− y 2)

= 12 ( x + 1

2 ( y + z) 2 − x− 12 ( y + z) 2) = 2 x, 1

2 ( y + z),

ou seja, ∀ x, y, z ∈ E temos x, z + x, y = 2 x, 12 ( y + z). Fazendo y = 0, temos x, z = 2 x, 1

2 z, que é uma homotetia rudimentar ; só com o número 2.É interessante observar agora como esta ingênua propriedade irá implicar na

linearidade do produto! Em particular temos que x, 2k y = 2k x, y para qualquerinteiro k , positivo ou negativo (verifique).

Para começar, observamos que a distributividade está automaticamente provada,pois, x, z+ x, y = 2 x, 1

2 ( y + z) = x, ( y + z), onde usamos a propriedade recémobtida na igualdade final.

Agora, lembremos que se λ for um número real, podemos escrevê-lo na ex-

pansãobinária, o que significa aproximá-lo por uma sequênciado tipo λ = limn→∞

k = N ∑

k =− N λ k 2k ,

onde λ k = 0 ou λ k = 1. Mas então, usando a distributividade, e a homotetia com po-tências de 2, podemos escrever :

x,

k = N

∑k =− N

λ k 2k

y =

k = N

∑k =− N

λ k 2k x, y,

e, pela continuidade da norma, concluímos que vale a igualdade no limite.A demonstração para o caso complexo segue considerações análogas, mas com-

preensivelmente muito mais tediosas, pois deve partir de uma longa fórmula para aexpressão candidata a produto interno,

x, y = 14

x + y2 − x− y2 + i x + iy2 − i x− iy2

,

e não será desenvolvida aqui. Referência : Maslov[1984].

Exercícios :

Page 194: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 194/371

188 5 Espaços de Hilbert

5.3. Interprete geometricamente no plano a regra do paralelogramo.

5.4. Verifique se a fórmula acima de fato expressa o produto interno em termos denormas em um espaço com produto interno de escalares complexos.

5.5. Mostre que o produto interno é contínuo, isto é, que a função de duas variáveisπ : E × E −→ C, π ( x, y) = x, y, é contínua, tomando a norma de E × E comosendo ( x, y) 1= x + y . Veremos logo adiante que esta escolha para normade E ×E é irrelevante.

Dentre os espaços com produto interno, serão de notável importância para aAnálise Funcional aqueles que forem completos na métrica do produto. A nomen-clatura destes espaços é uma homenagem a David Hilbert (1862-1943), o últimouniversalista da escola de Göttingen (na linha de Gauss, Riemann, Klein) que, juntocom o francês Henri Poincaré (1854-1912), moldou o desenvolvimento da matemá-tica no século XX.

Definição 5.5. Denominamos espaço de Hilbert um espaço vetorial com produtointerno que é um espaço de Banach com a respectiva norma.

Nada mais natural agora do que apresentarmos alguns exemplos importantes deespaços com produto interno, que se constituirão na classe de objetos matemáticosmais comuns do meio para o final deste curso.

5.2 Exemplos de espaços vetoriais com produto interno

1. Rn

e Cn

com seus produtos usuais : x, y =

k =n

∑k =1 xk yk . Observe que a definiçãovale para ambos os casos.

2. a) Se E i são espaços com produtos internos .i, então podemos definir emi=n∏

i=1E i = E o produto ( x1,..., xn), ( y1,..., yn)π =

i=n∑

i=1 xi, yii. Verifique.

b) Em geral, se A for um conjunto finito, podemos definir em Φ ( A, E ) =“Conjunto das funções g : A → E ”, onde (E ,.E ) é um espaço com produtointerno, o seguinte produto : g, hF = ∑

a∈ Ag(k ), h(k )E . De fato, esta estra-

tégia e suas generalizações naturais dão origem à maior parte dos exemplosde espaços funções com produto interno.

Exercícios :Mostre que valem as afirmativas :

Page 195: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 195/371

5.2 Exemplos de espaços vetoriais com produto interno 189

5.6. Se (E ,.E ) for um espaço de Hilbert, então (Φ ( A,E ),,F ) será tambémum espaço de Hilbert, para A finito.

5.7. O espaço vetorial dos polinômios complexos P(C) = ∪P N (C) pode ser do-

tado dos seguintes produtos internos :a) Dada uma sequência infinita de distintos números complexos zk , se p,q ∈

P N (C), então, p, q = ∑0≤k ≤ N

p( zk )q( zk ).

b) Dado um número complexo z0, define-se, para p, q ∈ P(C),

p, q = ∑0≤k <∞

p(k )( z0)q(k )( z0).

5.8. Espaço vetorial c0(C) = “Sequências quase-nulas” = f : N→C : ∃ n f >

0 tal que f (k ) = 0 ∀k > n f , onde f ,g = ∑0≤k

f (k )g(k ) é um produto interno.

5.9. Espaço vetorial c B(C) =

f : N → C, f limitada

, com produto interno

f , g = ∑0≤k 0

f (k )g(k )ρ(k ), onde ρ ∈ l1(C) e ρ(k ) > 0 ∀k .

5.10. Espaço de Minkowski, p = 2

l2(C) = “Espaço de Minkowski com o produto interno natural g,h =∞

∑k =0

g(k )h(k )”,

que é bem definido por conta da desigualdade de Holder, e dá origem à norma

canônica (euclidiana) : f 2 =

∑k =0

| f (k )|2 1

2

. Como já sabemos que l2 é um

espaço de Banach nesta mesma norma, concluímos que, na verdade, ele é umEspaçode Hilbert. Como c0(Q) =h : N→Q , sequências racionais quase-nulasé um conjunto enumerável e denso em l2(R), podemos concluir que l2(C) é se-parável. Veremos em várias oportunidades que este exemplo é o protótipo mais

geral possível desta estrutura, o que não desfaz desta mas mostra a importân-cia daquele. Na verdade, este é o único dentre os espaços de Minkowski queé um espaço proveniente de um produto interno, o que o torna mais especialainda. Para mostrar isto, considere no caso real, os vetores x, y do sub-espaçoc+

0 , x = (1, 0,0,..., 0,...), e y = (0,1,0,0,...,0,...), e mostre que a regra do pa-ralelogramo não vale para eles.

3. M n×n(C) =Φ ( I n × I n,C) = “Espaço das matrizes complexas n×n”, com o pro-duto interno P,Q = Tr (PQ∗) = traço da matriz produto de P pela conjugadatransposta (adjunta) de Q.Observe que esta definição é um caso particular do exemplo genérico 2b., onde

A = I n × I n e E =C

, portanto, é um espaço de Hilbert. Esta construção pode serestendida para casos Φ ( I n × I n, A), onde A é uma álgebra com produto interno.

Page 196: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 196/371

190 5 Espaços de Hilbert

4. Pré-espaços de Lebesgue

Estes exemplos são uma extensão natural (para “soma contínua”) do exemplo2b. :

a) L 2 ([0,1],C) = Espaço vetorial C 0([0, 1],C), com o produto internoh, g

=

1 0

h( x)g( x)dx.

b) L 2([0,1],Cn)

= Espaço vetorial C 0([0,1],Cn), com o produto interno

h, g =

1 0

∑1≤k ≤n

hk ( x)gk ( x)dx =

1 0

h( x), g( x)dx.

c) Analogamente, podemos definir L 2(Ω ,C),.

= Espaço vetorialC ∞0 (Ω ,C),

com o produto interno h,g = Ω

h( x)g( x)dx, onde Ω ⊂ Rm é uma região

aberta ; eventualmente Ω = Rm

.d) Generalizando, se (E ,,)E , for um espaço com produto interno, podemosdefinir um produto interno g, hF em F = C 0([0,1], E ), da seguinte ma-

neira : g,hF =1

0g(t ),h(t )E dt .

Exercício :

5.11. a) Mostre que o exemplo 4a. é de fato um espaço com produto interno,mas não é um Espaço de Hilbert.

b) Mostre que este é o único espaço dentre os

L p([0, 1],C), p ≥ 1, que é

um espaço com produto interno. (Aproveite o argumento empregado para

responder a mesma questão sobre os espaços de sequências de Minkowski)c) Como exemplo “concreto” da estratégia definida em 4d., considere o espaço

vetorial F = C 0 ([0,1],E ), onde E = C 0 ([0, 1],C) é dotado da norma uni-forme .∞ para caracterizar a continuidade das funções de C 0 ([0,1], E ),

mas utilize o produto interno a, b =1

0a( x)b( x)dx, também definido no

mesmo conjunto, para definir o produto interno de F . Analise a identifica-ção

C 0([0, 1],C 0([0,1],R) ≈ C 0([0, 1] × [0, 1],R),

e daí, g, h =

[0,1]2g(t , x)h(t , x)dxdt e, portanto, identifique F com ( L 2(Ω ,C),.),

para Ω = [0, 1]2.

Page 197: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 197/371

5.2 Exemplos de espaços vetoriais com produto interno 191

5. (Pré)-espaços de Lebesgue com peso L 2ρ (R,C),.ρ

= Espaço vetorial C 00 (R,C), com o produto interno h,gρ =+∞

−∞h( x)g( x)ρ( x)dx, onde ρ

∈C 0([R,R+), por exemplo, ρ( x) = exp

− x2

.A

função positiva ρ é denominada “função de peso”, ou, “ponderação”, pois elade fato pondera desigualmente a integração ao longo da reta na integral. Nocaso ρ( x) = exp− x2, enfatiza a região mais próxima da origem e “desen-fatiza” exponencialmente a parte da integral distante da origem. Obviamente,o conceito de peso pode ser empregado para funções integráveis definidas emqualquer regiãoΩ do Rn, por exemplo, dotando o espaço vetorialC 00(Ω ,C), doproduto interno h,gρ =

Ω

h( x)g( x)ρ( x)dx.

6. Espaços de LebesgueOs espaços de Lebesgue (às vezes também denominados de espaços de Riesz-Fischer) são os completamentos obtidos dos respectivos pré-espaços e de-

notados com os mesmos símbolos sem o acento (˜), isto é, L 2

(Ω ,C) = L 2(Ω ,C),.

, e etc.

7. Espaços de Sobolev

Os espaços de Sobolev são os completamentos dos respectivos pré-espaços :

a) H 00 (Ω ) =W 02 (Ω ) = L 2(Ω ,C),.

=L 2(Ω ,C) ; completamento do es-

paço C ∞0 (Ω ,C), (ondeΩ ⊂Rn é uma região aberta), com o produto internoh, g2 =

Ω

h( x)g( x)dx.

b) H 00 (Ω ,ρ) =W 02 (Ω ,ρ) =

L ρ

2(Ω ,R),.ρ

=L 2ρ (Ω ,C) ; completamento

do espaço C ∞0 (Ω ,C), com o produto interno h, gρ = Ω

h( x)g( x)ρ( x)dx,

onde ρ ∈C 0(Ω ,R+).

c) H m0 (Ω ) = W m2 (Ω ,R); completamento do espaço C ∞0 (Ω ,R), Ω ⊂ Rn, com

o produto interno h,gm =|α |=m

∑|α |=0

∂ α h,∂ α g2, onde m ≥ 0 é um número

natural.

d) H 00 (Rn) = W 02 (Rn) = L 2(Rn,C),.

=L 2(Rn,C) ; completamento do

espaço C ∞0 (Rn,C), com o produto interno h,g2 = Ω

h( x)g( x)dx.

e) H m(Rn) = W m2 (Rn) ; completamento do espaço C ∞0 (Rn,C), com o produto

interno dado por h, gm = |α

|=m

∑|α |=0∂ α h,∂ α g2.

Page 198: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 198/371

192 5 Espaços de Hilbert

f) H m(Ω ) = W m2 (Ω ,R); completamento do espaço C ∞(Ω ,C)∩C 0(Ω ,C) =“Espaço das funções que são infinitamente diferenciáveis no interior deuma região aberta e limitada Ω ⊂ Rn e contínuas no fecho Ω ”, com oproduto interno

h,gm = |α |=m∑|α |=0

∂ α h,∂ α g2,

onde m ≥ 0 é um número natural e Ω ⊂Rn é uma região aberta.Observe que há uma distinção explícita para completamento de espaçosde funções que se anulam na fronteira (suporte compacto) H m0 (Ω ), e deespaços sem esta restrição, H m(Ω ), onde se exige apenas que ela se estendacontinuamente até a fronteira.

8. Pré-espaço de Bohr (Harald)

Considere o conjunto das funções B = g :C→C : g(t ) =m∑λ =1

aλ expiλ k t , λ k ∈

R, ak ∈C, m ∈N, com o produto interno g, h = limT →∞ 1T

T −T

g(t )h(t )dt .

Este é um dos poucos exemplos de espaços de Hilbert não separáveis que têmalguma importância.

9. HC ( D) = “Funções holomorfas no disco unitário | z |< 1, e contínuas no cír-

culo unitário | z |= 1”, com o produto interno g,h2 = 12π

2π 0

g( z)h( z)d θ .

10. Espaços de Sobolev Discretos

hm(C) = u : Z→C, tais que ∞

∑k =−∞

(1 + k 2)m | u(k ) |2< ∞, com o produto

interno u, vm =∞

∑k =−∞

(1 +k 2)mu(k )v (−k ), onde m ∈R. Observe que se m > 0,

as sequências de hm são rapidamente decrescentes, enquanto que se m < 0 assequências de hm podem ser ilimitadas. Obviamente, h0 = l2.

Exercícios :

5.12. Mostre que os exemplos 7-9 acima são de fato espaços com produto interno.

5.13. Mostre que a soma u, vm no exemplo 9 é bem definida, e é de fato umprodutointerno e que são espaços de Hilbert.

5.14. Mostre que, no exemplo 9,

hm2

⊂hm1

se m

1 ≤m

2, e que hm2

é denso em hm1

.Na verdade, c0(C) = u :N→C : ∃ N g tal que u(k ) = 0,∀k ≥ N g ⊂ hm(C),∀m ≥ 0,(espaço das sequências quase-nulas), é denso em todos eles.

Page 199: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 199/371

5.3 Geometria de espaços com produto interno : Teoria de F. Riesz 193

5.15. Mostre que se u ∈ hm+ε (C), ε ≥ 0, então,

u m≤ u m+ε =∞

∑k =−∞

(1 + k 2)m+ε | u(k ) |2 .

5.16. Observe que os espaços hm(C) fazem restrições fortes para a convergência desuas sequências se m > 0, e relaxam as condições se m < 0. Definimos h∞(C) =∩m∈Rhm(C), e h−∞(C) = ∪m∈Rhm(C). Mostre que a interseção h∞ contêm mais doque o espaço das sequências quase nulas.

5.17. Mostre que podemos definir um isomorfismo linear entre HC ( D1) e h∞(C),que pode ser uma isometria se definirmos o produto interno em h∞(C) utilizandom = 2. Observação : uma função analítica no disco unitário, f ∈ HC ( D1), pode serescrita (de acordo com Weierstrass) como uma série de potências convergente para

| z| < 1, f ( z) =∞

∑k =0

ak zk , assim como todas as suas derivadas complexas,

f (n

)( z) =

∑k =n

k !(k −m)! ak z

k −

n, onde

k !(k −m)! = O(k

m) para k →∞.

Os espaços hm(C) são importantes no estudo de séries de Fourier, de espaços defunções analíticas e funções generalizadas. Alguns tópicos destes assuntos serãoapresentados no final deste capítulo. Podemos também definir espaços análogos parafunções discretas de várias variáveis :

hm(C) = u : An→ C :∞

∑k 2=0

(1 + k 2)m | u(k ) |2< ∞,

onde k = (k 1,...,k n) ∈ Zn, k 2 = k 21 + ... + k 2n, e u, vm =∞

∑k 2=0

(1 + k 2)mu(k )v(−k ).

Referência : L. Bers, F. John, M. Schechter, Partial Differential Equations, J. Wiley,1964, capítulo 3.

5.3 Geometria de espaços com produto interno : Teoria de F.Riesz

Para obtermos o máximo proveito da interpretação geométrica dos espaços comproduto interno, é necessário adquirir familiaridade operacional com o argumentogeométrico no contexto abstrato, o que exige uma reformulação de alguns conceitose resultados clássicos de geometria espacial na linguagem do produto interno. As-

sim, observa-se como alguns dos argumentos mais elementares da geometria analí-tica podem ser facilmente abstraídos da noção de dimensão, o que, de certa forma, já foi feito quando estendemos estes mesmos argumentos para espaços Rn (n > 3)

Page 200: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 200/371

194 5 Espaços de Hilbert

por intermédio do cálculo vetorial. Entretanto, é importante frisar que o objetivoneste texto, como em muitos outros, não é desenvolver uma geometria analíticaem dimensão infinita, por mais interessante e divertido que isto possa parecer (ede fato pode ser mesmo !), mas interessa-nos principalmente fazer uso da intuição

geométrica para descrever e argumentar sobre conceitos e resultados que tenhamsignificado nas aplicações da teoria abstrata em espaços de funções. Ou seja, aquia geometria será um meio, elegante, sem dúvida, mas não um fim. Para iniciar esteprograma, nada melhor do que reformular o vetusto e ubíquo teorema de Pitágoraspor intermédio desta nova linguagem.

Exercícios :(Faça esboços geométricos para todos os exercícios abaixo)

5.18. Enuncie e demonstre o teorema de Pitágoras generalizado para n ≥ 2 catetos,ou seja, para o quadrado do comprimento da diagonal de um n−hiper-cubo. Esboçogeométrico em R3.

5.19. Analise geometricamente no plano a regra do paralelogramo : a média dos

quadrados das diagonais é igual à soma dos quadrados dos lados.5.20. Mostre que em um triângulo com vértices na bola unitária, se dois deles sãodiametralmente opostos, o terceiro é ortogonal.

5.21. Considere uma sistema ortonormal e1,...,ek em H , isto é, ei, e j = δ i j. Mostre

que, ∀α ∈ H , α 2≤m=k ∑

m=1| α m |2, onde α m = α , em = “projeção ortogonal” de α

em em, e, α 2=m=k ∑

m=1| α m |2⇐⇒ α =

m=k ∑

m=1α mem.

5.22. Como no caso anterior, mostre que a menor distância entre um elemento α ∈ H e o subespaço H m de dimensão finita m, gerado por e1,..., em, é dada por α −

k =m∑

k =1α k ek , onde α ⊥ =

k =m∑

k =1α k ek é a projeção ortogonal de α em H m.

5.23. Demonstre o teorema do paralelogramo : “as somas dos quadrados dos com-primentos das diagonais de um paralelogramo é igual à soma dos quadrados doscomprimentos de todos os seus lados”.

Para generalizarmos estas idéias, consideremos então um espaço com produtointerno H , um subspaço H 0 ⊂ H , e h ∈ H − H 0. A questão geométrica mais naturalneste cenário, a julgar pelo que mentalizamos em R3, é a possibilidade de projetarortogonalmente o vetor h em H 0, ou seja, obter um elemento h0 ∈ H 0 que seja únicoe tal que d (h, H 0) = h− h0 , onde h −h0 seria ortogonal ao subespaço H 0 (isto é,ortogonal a todos os elementos de H 0). O importante e justamente famoso Teoremade Riesz nos garante exatamente esta possibilidade, desde que H seja um espaço de Hilbert e H 0 um subespaço fechado (condições supérfluas em dimensão finita). As

suas variadas e profundas consequências nos mostrarão que se trata de um dos maisimportantes teoremas da Matemática e, certamente, da Análise Funcional.

Page 201: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 201/371

5.3 Geometria de espaços com produto interno : Teoria de F. Riesz 195

Teorema 5.6 (Teorema de Riesz - A projeção ortogonal em subespaços fecha-dos).Seja ( H ,,) um espaço de Hilbert real e H 0 um subespaço fechado. Então, paracada h ∈ H,

1. Existe um aproximante ótimo, dito minimizante, h0 ∈ H 0 , tal que, h−h0 =d (h, H 0) = inf

z∈ H 0h− z.

2. A solução h0 é única.

3. Se h0 for o elemento minimizante, então h−h0 é ortogonal a H 0 , isto é, ∀ z ∈ H 0 , z, h−h0 = 0 , e denota-se este fato da seguinte maneira : (h−h0) ⊥ H 0.

4. A perpendicularidade (h − h0) ⊥ H 0 é uma condição necessária e suficiente,que caracteriza completamente a solução h0 , ou seja, h0 é minimizante se, esomente se, (h−h0) ⊥ H 0.

5. Se hn ∈ H 0 for uma sequência minimizante, isto é, hn −h = d n → d =d (h, H 0) , para n →∞ , então hn −h0 = O

√ d n −d

. (Diz-se : hn − h0 é

(pelo menos) da mesma ordem de√

d n − d para n →∞ , ou seja, no limite, existe

uma constante positivaC > 0 , tal que vale a estimativa hn −h0 ≤C √ d n −d).6. A solução é estável com relação à variação do parâmetro h, isto é, a função

solução do problema variacional de Riesz, P H 0 : H → H 0 , P H 0 (h) = h0 , chamada projeção ortogonal em H 0 , é contínua, além de, linear e, é uma identidade em H 0. (Também é contínua com respeito à “variação” do subespaço fechado H 0em um sentido a ser especificado).

Prova. 1. Pela definição de ínfimo, existe uma sequência hn em H 0 tal que h−hn < d + 1

n , onde d = d (h, H 0).

an −am2 +an + am2 = 2(an2 +am2).

Assim,

hn − hm2 = 2(hn −h2 + hm −h2)−hn + hm −2h2

= 2(d 2n + d 2m)− 4 hn+hm

2 −h2

.

Como o elemento hn+hm2 é o ponto médio do segmento [hn,hm] e, portanto, está

em H 0, conclui-se que hn+hm2 −h ≥ d = inf z∈ H 0 z−h , de onde tiramos

hn −hm 2≤ 2(d 2n + d 2m) −4d 2 −→ 0, quando n,m →∞.

Portanto, a sequência hn é de Cauchy e converge no espaço de Hilbert para umelemento h0 ∈ H , e sendo H 0 fechado, conclui-se que h0 ∈ H 0. Portanto, pelacontinuidade da norma, concluímos que h0 é um elemento minimizante pois

d n = hn − h → h0 − h e, como d n → d , concluímos que h0 − h = d =d (h, H 0).

Page 202: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 202/371

196 5 Espaços de Hilbert

2. Suponha que h∗ fosse outro elemento minimizante. Então, é fácil provar que[h0, h∗] seria formado de elementos minimizantes (verifique). Daí, concluímosque o segmento [ 1

d (h0 − h), 1d (h∗ − h)] estaria contido inteiramente na esfera

unitária, o que acontece em um espaço estritamente convexo (como é o caso

em que a norma provêm de produto interno) somente se o segmento for trivial,isto é, se h0 = h∗. Esta demonstração está intimamente ligada ao conceito deconvexidade do espaço com produto interno.

3,4. Uma outra maneira instrutiva de mostrar, simultaneamente, que o elemento mi-nimizante h0 é único, e caracterizado pela condição de ortogonalidade (h −h0) ⊥ H 0, é utilizar o argumento de Fermat (˜1690), que também será essencialem outras ocasiões. Para isto, basta analisar o efeito de uma perturbaçãoδ ∈ H 0no vetor h0 sobre o valor da distância h−h0 ,

h0 +δ −h 2= h− h0 +δ ,h−h0 +δ = h−h0 2 +2h−h0,δ + δ 2,

de onde concluímos que a condição minimizante para h0 é equivalente ao fatode que,

∀δ

∈ H 0,

0 ≤ 2h−h0,δ + δ 2 .

Ora, mas para que esta expressão seja sempre não negativa para todo δ ∈ H 0,é necessário e suficiente que o termo de primeira ordem em δ se anule ; (casocontrário tomamos δ = − 1

4 (h−h0)). Portanto, se δ = 0 (e h0 +δ = h0), temos

h0 +δ −h2 −h−h02 = δ 2 > 0.

De sobra, concluímos que não há outro elemento de H 0, distinto de h0, quetambém minimize a distância.

5. Basta tomarmos o limite m → ∞ na desigualdade hn − hm 2≤ 2(d 2n + d 2m) −4d 2, de onde temos

hn −h0 ≤ 2(d n + d )( d n −d ) = O( d n −d ).

6. Esta questão será abordada e desenvolvida em uma seção em separado, emboraseja importante ressaltá-la neste exato contexto.

Observação 5.7. 1. O Teorema de Riesz é também válido para espaços de Hilbert complexos, onde não temos a interpretação geométrica usual como guia, masagora, de posse da argumentação analítica obtida no caso real, é possível deduzi-la, ainda que de forma ligeiramente mais sutil, mas não especialmente maisdifícil. Referência : Lusternik-Sobolev, cap. 2.

Exercício :

Page 203: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 203/371

5.3 Geometria de espaços com produto interno : Teoria de F. Riesz 197

5.24. O Teorema de Riesz para a projeção ortogonal guarda uma óbvia semel-hança com o lema de Riesz sobre a existência de elementos quase ortogonaisda bola unitária em espaços normados. Mostre que, no caso de um espaço deHilbert, a ortogonalidade do lema de Riesz é de fato realizada por mais de um

elemento, ou seja, “se H 0 for um subespaço fechado de um espaço de Hilbert,que não seja todo o espaço, então existe mais de um elemento da esfera unitáriade H que é ortogonal a H 0”. Interprete geometricamente esta multiplicidade.

2. O Teorema de Riesz aborda um tipo especial de problemas, denominados pro-blemas variacionais, que iremos tratar com maiores detalhes e generalidade emoutras seções (v. Apêndice - Teoria de Lax-Milgram). Estes problemas são ca-racterizados por um funcional não linear com valores reais, J : A →R, limitadoinferiormente, e consistem na determinação dos elementos que realizam o mí-nimo deste funcional, isto é, os chamados elementos minimizantes, a0 ∈ A taisque J (a0) ≤ J (a),∀a ∈ A. Costuma-se representar este tipo de problema com aseguinte notação :

mina∈ A J (a).Observe que objetivo principal do problema variacional não é exatamente de-terminar o ínfimo m = inf J (a) (que obviamente existe, já que o funcionalé limitado inferiormente), mas sim os elementos minimizantes a0, J (a0) = m.A importância desta classe de problemas foi originalmente motivada pelo fatode que vários problemas de equações diferenciais (especialmente o Problemade Dirichlet) admitem uma reformulação variacional e, com isto, as soluçõespodem ser procuradas como limites de elementos minimizantes ; exatamentecomo foi feito na demonstração do Teorema de Riesz. Esta estratégia deu ori-gem então aos chamados Métodos Variacionais, de grande importância em Ma-temática Aplicada, que incluem os Métodos de Petrov-Galerkin, Rayleigh-Ritz,e vários outros que serão abordados mais adiante. Posteriormente, importantes

problemas originalmente variacionais, tais como a otimização de controles, pro-cessos e decisões, e vários outros que surgiram motivados em grande parte porquestões de planejamento, logísticas e de natureza econômica, também foramincluídos nesta classe motivando ainda mais, pois, financeiramente(!), o seudesenvolvimento nas últimas décadas.Embora o Teorema de Riesz trate da minimização do funcional distância J h(a) = z−a , a argumentação que o demonstra utiliza o funcional J h : H 0 →R, J h(a) = a−h 2, obviamente porque o funcional J h define um problema va-riacional aparentemente distinto daquele, mas de fato, equivalente, pois amboscompartilham das mesmas soluções, que é o que interessa no caso. A escolhadeste último deve-se a uma mera questão de conveniência matemática, uma vezque é mais fácil de ser manipulado por conta do produto interno. Esta flexibili-dade para a escolha de funcionais distintos que definem problemas variacionais

equivalentes, isto é, com as mesmas soluções, é um grande trunfo destes méto-dos, e não um tropeço !

Page 204: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 204/371

198 5 Espaços de Hilbert

3. É notável como uma argumentação geométrica de origem tão singela como aprojeção ortogonal é a motivação intuitiva de um dos teoremas mais fundamen-tais da Análise Funcional. O problema variacional

mina∈ H 0

h−

a

2 ,

que pode representar uma vasta classe de questões centrais e de amplo signi-ficado da Matemática Aplicada (como veremos alhures), é solucionado peloTeorema de Riesz da maneira mais completa que se poderia esperar, pois :

a) garante que existe uma solução minimizante,

b) garante que esta solução é única,

c) mostra que a solução é estável, isto é, varia continuamente com os dadosdo problema, no caso, h e H 0,

d) fornece uma condição necessária e suficiente (ortogonalidade) que carac-teriza a solução de maneira operacional, e, melhor, distinta da sua defini-ção original,

e) apresenta um método concreto, e de fato útil, para calcular o elementominimizante e,

f) fornece uma estimativa para a taxa de convergência do método.

g) tudo isso com uma interpretação geométrica extremamente intuitiva e ar-gumentações relativamente simples !

Nem todos os problemas variacionais têm respostas tão decisivas assim ; naMatemática em geral, nem se fala!Em Análise Funcional, apenas o Teorema de Banach pode rivalizar com o Teo-rema de Riesz quanto ao fator custo benefício !

4. O item 3) do Teorema de Riesz foi separado do item 4) que o engloba, porqueé uma condição necessária muito comum em problemas que buscam elemen-tos minimizantes. O mais notável e o ancestral comum de todos os argumentosnestes contextos é o Teorema de Fermat (isto é, o simples e útil), que forneceuma condição necessária para o ponto de mínimo interior de uma função realdiferenciável como um zero da derivada. Sabemos que no Cálculo Elementar, oTeorema de Fermat nos fornece apenas uma condição necessária, mas não su-ficiente. Entretanto, no caso particular acima, a condição 3) se mostra tambémsuficiente, por conta de peculiaridades do funcional utilizado (na verdade, suaconvexidade estrita, como veremos adiante). Embora a condição de ortogonali-dade não seja diretamente construtiva, veremos mais adiante que ela é a base devários métodos algorítmicos eficientes para o cálculo numérico de soluções deproblemas variacionais.

Exercícios - Argumento de Fermat (~1690) :

5.25. Considere o polinômio real p(t ) = at 2 + bt .

Page 205: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 205/371

5.3 Geometria de espaços com produto interno : Teoria de F. Riesz 199

1. Mostre que se o polinômio p(t ) for não-negativo em alguma vizinhança à di-reita do zero (t ∈ [0,ε )), então necessariamente b 0.

2. Mostre que se o polinômio p(t ) for não-negativo em uma vizinhança completado zero, (t

∈[

−ε ,ε )), então necessariamente b = 0.

3. Considere um polinômio real p(t ) =k =m∑

k =2n+1ak t k . Refaça os mesmos argumentos

acima com respeito a a2n+1 = b.

5.26. Em geral, considere uma função real definida em uma vizinhança do zero, f : V (0) →R, que possa ser escrita na forma f (t ) = a(t )+ B(t ),onde a(t ) é de ordemmenor do que B(t ) (ou seja, escreve-se a = o( B), e significa |a(t )| ≤ ε (t ) | B(t )|, ondeε (t ) → 0). Então, em alguma vizinhança do zero, talvez menor do que V 0, o sinal dafunção f (t ) é “comandado” por B(t ), ou seja, será o mesmo sinal de B(t ).

5.27. Considere uma função de valor real, F : B(0,r ) ⊂ E → R, definida em umavizinhança do zero de um espaço com produto interno E , da forma F (h) = Lh +λ

h, h

, onde L é funcional linear, ou seja, F é uma perturbação quadrática de L.

Então, F mantêm o mesmo sinal em toda a vizinhança B(0,r ), se, e somente se, L = 0.

5.28. Considere uma função de valor real, F : B(0,r ) ⊂ E → R, definida em umavizinhança do zero de um espaço normado E , da forma F (h) = Lh +ϕ (h), onde Lé linear e ϕ (h) = o (h), ou seja, F é uma perturbação de L com termo de menorordem. Então, se F mantêm o mesmo sinal em toda a vizinhança, conclui-se que L = 0. Observação : em todos os casos, o argumento consiste simplesmente em“fatorar” o termo de maior ordem que comanda o sinal na vizinhança.

A primeira demonstração da unicidade do elemento minimizante utilizou apenasa propriedade de convexidade estrita da norma (ou seja, do funcional do problema

variacional), e que é peculiar a um espaço com produto interno. Para aproveitar esteargumento com funcionais que tenham uma estrutura mais geral do que o quadradoda norma, definiremos o conceito de funcional convexo e estritamente convexo.

Definição 5.8 (Funcional Convexo). Dizemos que o funcional com valores reais J : A → R , definido em um conjuntoconvexo A, é convexo se ∀a, b ∈ A,∀t ∈ (0, 1) , tenhamos

J ( ta + (1− t )b) ≤ tJ (a) + (1− t ) J (b),

e dizemos que é estritamente convexo se a desigualdade for estrita para 0 < t < 1.

É fácil ver que se J for estritamente convexo, então o elemento minimizante,quando existir, será único (v. exercício abaixo). A definição de convexidade provêmdo conceito geométrico elementar de convexidade para funções reais, e significa que

Page 206: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 206/371

200 5 Espaços de Hilbert

o gráfico entre dois pontos está sempre abaixo da corda (i.e., o segmento de reta)que os liga.

Exercícios - Convexidade :

5.29. Mostre, geometricamente, que as seguintes funções (funcionais !), são estrita-mente convexas :

a) ϕ ( x) = − ln x( x > 0),

b) ϕ ( x) = exp( x),

c) ϕ ( x) = ax2 + bx + c, se a > 0,

d) Analiticamente, que ϕ : Rn → R, ϕ ( x) = a x, x + bβ , x + c é estritamenteconvexa se, e somente se, a > 0.

e) Em geral, dada uma função F ∈C 2(R,R), temos F (2)( x) ≥ 0, se, e somente se,F for convexa.

5.30. a) Desigualdades de Jensen

Utilizando a definição de integral de Riemann como limite de somas, mostreque se F for contínua e convexa, temos a notável desigualdade :

F

1 0

f ( x)dx

≤1

0

F f ( x)dx.

Escreva-a explicitamente para as funções F = exponencial e F = − logarítmo,que são casos importantes.

*b) Analise desigualdades convexas no contexto contínuo. Considere uma funçãodensidade, isto é,

ρ ∈C 0(Rn,R+) ∩L 1(Rn,R+) e Rn

ρ( x)dx = 1,

e uma função convexa F : Rn→ R. Interprete então a seguinte integral :

F

Rn

xρ( x)dx

,

sob o ponto de vista “convexo”, como “F da média ponderada de pontos davariável”. Em que circunstâncias é possível estimá-la com respeito à “média ponderada dos valores da F nos respectivos pontos” ?

5.31. Mostre que se um funcional J : K → R, definido em um conjunto convexoK , for estritamente convexo, então ele poderá ter no máximo um elemento minimi-zante.

5.32. Mostre que se um funcional for convexo, então o segmento entre dois elemen-tos minimizantes é completamente formado por elementos minimizantes.

Page 207: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 207/371

5.3 Geometria de espaços com produto interno : Teoria de F. Riesz 201

5.33. a) Mostre que o funcional de Riesz, J (h) = z−h definido em um subes-paço fechado H 0, onde z /∈ H 0, é estritamente convexo. Este, obviamente não éum exemplo, e sim a motivação do conceito, mas é sempre bom verificar se oparticular está incluído na formulação generalizada, tal como intencionado !

b) Mostre que se f : R→ R for uma função estritamente crescente e convexa, ese J : E →R for um funcional estritamente convexo, então o funcional J f (a) = f ( J (a)) é estritamente convexo. Relacione esta conclusão com a substituiçãoda norma pelo quadrado da norma no Teorema de Riesz.

5.34. Mostre que o problema variacional de Riesz (com o funcional J z(h) = z−h)é equivalente ao problema variacional

minh∈ H 0

J z( z) = 12

z, z− z, h

para o funcional quadrático

J z : H 0 →R, definido por

J z(h) = 1

2 z, z− z, h, onde z ∈ H é fixo. Mostre inicialmente que o funcional é limitado inferiormente, e com

isto, conclua que o problema variacional é consistente. Interprete geometricamenteeste problema em R2. Sugestão : complete os quadrados para o funcional acima, eobserve que o problema variacional resultante é equivalente, ou seja, produz exata-mente a mesma solução, isto é, o mesmo elemento minimizante.

O leitor observador irá notar também que na demonstração de existência desolução do Teorema de Riesz, a hipótese de que H 0 é um subespaço vetorial somentefoi utilizada para assegurar que o ponto médio hn+hm

2 do segmento [hn,hm] pertenciaao conjunto H 0, uma propriedade característica de conjuntos convexos, e não apenasdos subespaços vetoriais.

Exercício :

5.35. Mostre que um subconjunto fechado A de um espaço vetorial normado E é convexo se, e somente se, para quaisquer dois pontos a, b ∈ A, o ponto médiom(a,b) = 1

2 a + 12 b ∈ A. Sugestão : Utilize a expansão binária de números reais para

mostrar que qualquer elemento do segmento [a, b] pode ser aproximado pelo pontomédio, entre os pontos médios, ... médios, ... entre a e b. Observação : Este exercícionão é importante para o que se segue!

As observações acima sobre a demonstração de existência e unicidade no Teo-rema de Riesz nos indicam que a sua essência está muito ligada ao conceito deconvexidade, tanto do funcional quanto do domínio. Portanto, é mais do que naturalo enunciado do importante teorema que se segue, que trata de um problema va-

riacional com o mesmo funcional do Teorema de Riesz, mas agora definido em umsubconjunto convexo fechado de um espaço de Hilbert. A condição necessária (e su-ficiente) que caracteriza o elemento minimizante neste caso decorrerá ainda de uma

Page 208: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 208/371

202 5 Espaços de Hilbert

aplicação do argumento de Fermat, e é chamada condição de Stampacchia (GuidoStampacchia (..-..), matemático italiano contemporâneao) ou inequação variacio-nal, e tem uma interpretação geométrica clara, como veremos. Observe a analogiaentre os dois teoremas.

Teorema 5.9 (Teorema de Riesz : A projeção em conjuntos convexos fechados).Seja ( H ,,) um espaço de Hilbert real e K um subconjunto convexo fechado. Consi-deremos o problema variacional

mina∈K

h−a,

para um h ∈ H qualquer, fixo. Então :

1. Existe um minimizante a0 ∈ K, isto é, a0 é tal que h−a0 = d (h,K ).

2. a0 é único.

3. a0 será um elemento minimizante se, e somente se, ∀a ∈ K, h−a0,a−a0 ≤ 0.

4. Se hn ∈ K for uma sequência minimizante, isto é, hn −h = d n → d = d (h, K ) , para n → ∞ , então hn −a0 = O(√

d n −d ).

5. A função solução PK : H → K , PK (h) = a0 , chamada projeção em K, é contínuae, obviamente, uma identidade em K.

Prova. 1,2, e 4 podem ser demonstrados de maneira literalmente igual a que foi ado-tada no teorema anterior ; verifique. Em particular, o item 2 pode ser demonstradofazendo-se uso da convexidade estrita do funcional de Riesz.

Vejamos o item 3, que deve ser interpretado geometricamente pelo leitor antesde qualquer formalização. Esta caracterização do elemento minimizante é o análogoconvexo (ou, um caso particular) da ortogonalidade, e pode ser obtida por argumen-tos completamente semelhantes. Suponha então que h0 seja um elemento minimi-zante e tomemos a = a0 +δ

∈K . Então, a0 +t δ

∈K ,

∀t

∈(0,1) (observe a restrição

ao valores de t ), de onde vem que

a0 + t δ −h 2 = h−a0 − t δ ,h−a0 − t δ

= h−a0 2 −2h−a0,δ t + δ 2 t 2,

e daí,

0 ≤ a0 + t δ −h 2 − h−a0 2= −2h−a0,δ t + δ 2 t 2,

ou seja, concluímos que para todo t ∈ (0, 1) temos

0 ≤ −2h− a0, a−a0t + δ 2 t 2.

Mas isto só poderá acontecer se h − a0, a − a0 ≤ 0. Por outro lado, se esta desi-gualdade for válida ∀a ∈ K , podemos reconstituir a expressão inicial que descreve

Page 209: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 209/371

5.3 Geometria de espaços com produto interno : Teoria de F. Riesz 203

o fato de que a0 é um elemento minimizante, o que prova a suficiência da condiçãode Stampacchia.

A demonstração da continuidade da função projeção, assim como o estudo dasua variação com respeito a “variações” do conjunto convexo K será o tema de um

próximo exercício.

Exercícios :

5.36. Analise a variação do ponto projetado a0 em um convexo fechado K , comrespeito à variação do ponto h, e também com respeito à “variações” do próprioconjunto. Interprete geometricamente a análise.

5.37. Mostre que, no Teorema de Riesz-Stampacchia para subconjuntos convexos,se h /∈ K , então, o hiperplano que passa por a0 e é perpendicular a h − a0, separa oespaço H em dois semi-espaços, um que contêm o conjunto convexo K e outro quecontêm o elemento a0, mas pode não ser o único hiperplano que faz esta separação.Interprete esta última ressalva geometricamente no plano euclideano.

Usaremos estes resultados para explorar um pouco mais a geometria dos espa-ços com produto interno, com vistas a aplicações futuras. A unicidade do elementoprojetado em ambos os casos, por exemplo, nos leva imediatamente à definição deuma função projeção :

Definição 5.10 (Projeção Ortogonal).

1. Sejam ( H ,,) um espaço de Hilbert (real ou complexo) e H 0 um subespaço fechado. Então, para cada h ∈ H definimos como projeção ortogonal de hno subespaço H 0 como sendo o elemento h0 , único minimizante da distânciad (h, H 0) = h − h0 , e denotamos por P H 0 , ou apenas P, quando não houver

dubiedade, a função P : H −→ H 0 , tal que P(h) = h0 , denominada uma projeçãoortogonal em H.

2. Sejam ( H ,,) um espaço de Hilbert real e K um subconjunto convexo fechado.Então, para cada h ∈ H definimos o único elemento a0 ∈ K que minimiza adistância d (h, K ) , como a projeção de h em K, e denotamos por PK , ou sim- plesmente P, quando não houver dubiedade, a função P : H −→ K, tal queP(h) = a0 , denominada projeção em K.

As projeções ortogonais podem ser geometricamente interpretadas como “som-bras” e, no seu contexto analítico, se constituem em métodos matemáticos emprega-dos para descrever aspectos parciais de elementos ou subconjuntos de um espaço deHilbert. A reconstrução de um elemento, ou de um subconjunto convexo, dadas as

suas “sombras” em alguns subespaços, é um problema geométrico natural que, noespaço euclideano, é denominado, justificadamente, “shape from shading”, e ocorreem diversos contextos com significados práticos surpreendentes. A importância das

Page 210: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 210/371

204 5 Espaços de Hilbert

projeções ortogonais fez com que o estudo dos subespaços fechados de um espaçode Hilbert se tornasse também um tópico de interesse central em Análise Funcionaldesde o início, e motivo de muitas aplicações relevantes. Referências : Galakhtio-nov[2004], Halmos[], Horn[1989].

O desenvolvimento de métodos para a simplificação educada, classificação eextração de informações (data mining) de um conjunto de dados que são frequen-temente representados como elementos de um espaço de Hilbert, também é umaexigência cada vez mais séria e complexa que a Ciência contemporânea apresentaà Matemática Aplicada. Como já foi bem dito, a tecnologia está nos “afogando emum mar de dados enquanto estamos sedentos (ou vazios) de conhecimento ”, dadosestes provenientes de um Projeto Genoma, do deciframento de cadeias metabóli-cas, aceleradores lineares, telescópios Hubble, meteorologia global e de aparelhos“online” médicos e químicos, extremamente rápidos e detalhistas. É imprescindível,portanto, desenvolver métodos para “simplificação e extração de conhecimento” deconjuntos de dados massivos, que também se apresentam “corrompidos” por ruídose informações espúrias, cujos elementos (vetores ou funções) são representáveiscomo pontos dispersos em um espaço de Hilbert. Voltaremos a estas importantes

questões quando tratarmos de equações integrais e suas aplicações. Referências :Scholkpf-Smola[], Ramsay[], Vapnik[], Majda[], Rijsbergen[], Stewart[], Wing[],Sirovich[].

Por outro lado, em Análise Numérica, a aproximação de soluções de equaçõesdiferenciais é quase sempre obtida por meio de suas projeções em subespaços de di-mensão finita, o que é realizado por meio de estratégias comumente denominadas demétodos de Petrov-Galerkin, Ritz, aproximação espectral e etc., que serão tratadasrapidamente em próximos capítulos. Referências : Mikhlin[], Temam[], Dautray-Lions[], Gottlieb[].

Algumas soluções de equações diferenciais, ordinárias e parciais, que represen-tam modelos matemáticos de comportamento de grande complexidade microscópica(por exemplo, regimes caóticos ou turbulentos), apresentam uma estrutura extrema-mente fina que nem sempre nos interessam conhecer, ou nos seriam aproveitáveis.

Portanto, é necessário analisá-las por partes, e sob diferentes aspectos que descartamo excesso de informações, o que na linguagem geométrica dos espaços de Hilbertsignifica projetá-los em subespaços menores, adequadamente escolhidos para res-saltar as características que desejamos observar. Esta atitude é particularmente im-portante e aplicável com sucesso no estudo de Dinâmica Populacional de variadasorigens, com métodos provenientes da Física Estatística. A análise de sinais simples,de imagens e sinais espaciais-temporais também faz uso da mesma estratégia deprojetar “dados funcionais” em subespaços “convenientes”, que possam recolher oconteúdo mais importante da mensagem e descartar o que se pode considerar “ruí-dos” ou “excesso de informações”. Referências : Gorban[], Chorin[], Zwanzig[],Deuflhard[], Lasota-Mackey[], Cvitanovic[], Vilamiu-Ferreira[].

O teorema de decomposição ortogonal, a ser apresentado em seguida, é o co-meço de um longo caminho que nos levará até às barbas de um dos maiores triunfosda Análise Moderna e da Matemática, a Teoria Espectral. Esta teoria tem as suasraízes nos teoremas de Álgebra Linear sobre matrizes simétricas, que demonstram

Page 211: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 211/371

5.3 Geometria de espaços com produto interno : Teoria de F. Riesz 205

a possibilidade de decomposição do espaço euclideano em somas ortogonais de su-bespaços (autoespaços) que são interessantes pela peculiaridade de informações querevelam. Sob outro ponto de vista, talvez mais geral, o Teorema Espectral permite adecomposição da identidade (i.e., do operador I ) em somas de projeções apropria-

das. O início da generalização deste teorema para dimensão infinita se deve a DavidHilbert, e sua formulação abstrata é devida ao trabalho do húngaro Frigyes Rieszrealizado durante as duas primeiras décadas do século XX. A formulação matemá-tica rigorosa da Física Quântica, que faz uso crucial desta teoria, baseia-se nas ideiasoriginais de P. A. M. Dirac (..-..), mas deveu-se principalmente ao trabalho do ma-temático (também húngaro) J.von Neumann (1903-1955), reunido em 1932 no seuclássico texto Mathematical Foundations of Quantum Theory. Como a Teoria Quân-tica, em uma de suas interpretações, trata do processo de extração de informaçõesrepresentadas em um espaço de Hilbert, é natural que o extraordinário desenvolvi-mento de seus conceitos e métodos tenham alguma coisa a dizer sobre o importanteproblema de mineração de dados (data mining) e de recuperação e manuseio deinformações (information retrieval). Apesar disso, somente nos últimos anos estaconexão tem sido efetivamente explorada, com o surgimento recente de novas áreas

de Teoria de Conhecimento e Aprendizado ( Learning Theory), atualmente em francoprogresso e com perspectivas práticas espetaculares ainda por se concretizarem. Re-ferências : van Rijsbergen[2006], Hirvensalo[], Nielsen-Chuang[2000], Lax[].

O ponto de partida da Teoria Espectral em Análise Funcional foram as aulasproferidas por David Hilbert em Göttingen na confluência dos séculos XIX-XX, eo trabalho simultâneo de sua escola matemática, especialmente Eberhard Schmidt eRichard Courant, tendo as notas de aulas deste último se transformado no clássico“Courant-Hilbert I”, certamente um dos livros mais influentes de toda a Matemática,pura e aplicada. A edição inaugural deste texto em alemão é de 1928 ( Methoden der Mathematischen Physik , 2 vol. Springer-Verlag, Berlim, 1928). A Teoria Espectral,desde a sua origem até às suas diversas ramificações atuais, tem ocupado uma po-sição central na Matemática e desempenhou um papel fundamental na formulaçãoda Física Moderna, assim como também na reformulação de muitos temas da Física

Clássica. O seu desenvolvimento é talvez o exemplo mais expressivo da história dainterface entre a Matemática e suas aplicações no século XX. Consulte algumas dasreferências históricas a este respeito, onde comparecem alguns dos seus principaispersonagens : Reid[], Garding[1997], Packel[1974]. Vários deste aspectos particu-lares serão abordados em capítulos seguintes.

A formulação do teorema da decomposição ortogonal em um contexto abstratodeve-se também ao italiano Beppo-Levi (1875-1928), e representa a expressão deresultados completamente intuitivos do ponto de vista euclideano.

Teorema 5.11 (A função projeção e a decomposição de Riesz-Beppo-Levi).Seja ( H ,,) um espaço de Hilbert (real ou complexo) e H 0 um subespaço fechadoe sua projeção ortogonal P : H

−→ H 0. Então,

1. P : H → H 0 é uma transformação linear,

2. P é de fato uma projeção no sentido que P 2 = P,

Page 212: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 212/371

206 5 Espaços de Hilbert

3. P0 = 1 ,

4. N (P) = “Núcleo de P” = h ∈ H ,P(h) = 0 é igual ao “complemento ortogo-naldeH 0”, ou, em outra notação, N (P) = H ⊥0 = h ∈ H : h,α = 0, ∀α ∈ H 0 ,e

5. H = H 0 ⊕ N (P) e H 0⊥ N (P) , ou seja, o espaço H é escrito como a soma diretaortogonal de H 0 e N (P) , e significa que todo elemento h ∈ H pode ser escritode maneira única como a soma h = h0 +α , onde h0 ∈ H 0 , e α ∈ N (P) , chamadadecomposição ortogonal de Riesz-Beppo-Levi.

Prova. 1. Sejam h e g ∈ H . Denominemos, para simplificar a notação, P(u) =u0,∀u ∈ H . Então, lembrando que (h− h0)⊥ H 0, temos

h + g −P(h + g) 2= inf x∈ H 0 h + g− x 2

= inf x∈ H 0 h0 + (h− h0) + g0 + (g− g0) + x 2

= inf z∈

H 0

(h

−h0) + (g

−g0) + z

2

= inf z∈ H 0

(h−h0)2 +(g−g0)2 + 2h− h0, g−g0 + z2

= h + g− (h0 + g0) 2 .

e, pela unicidade do elemento minimizante, concluímos que P(h + g) = h0 +g0 = P(h) + P(g). A demonstração de que P(λ h) = λ P(h) é mais simples.

2. É claro que se h0 ∈ H 0, então, P(h0) = h0. Como P(h) ∈ H 0 ∀h ∈ H , concluímosque P(P(h)) = P2(h) = P(h).

3. Se h0 ∈ H 0, então P(h0) = h0 , de onde vem que P 0= suph=0P(h)h ≥ 1.

Para qualquer h ∈ H escrevemos h = h − h0 + h0 e, como h − h0 ⊥ h0, temos

h

2=

h

−h

0 2 +

h

0 2, ou seja,

h

2

≥ h

0 2=

P(h)

2. Portanto,

P 0≤ 1, e, finalmente, P 0= 1.

4. Seja g ∈ N (P), isto é, g0 = P(g) = 0. Então, como g − g0⊥ H 0 (Teorema deRiesz, item 3), concluímos o desejado.

5. Pelo Teorema de Riesz, ∀h ∈ H , podemos escrever h = h0 + h− h0, onde h0 ∈ H 0 e h − h0⊥ H 0. A unicidade da decomposição provêm da caracterização daprojeção ortogonal e de sua unicidade fornecida pelo teorema de Riesz.

O estudo de convexidade está intimamente ligado à noção de hiperespaços, quecomo já vimos no contexto de espaços normados, são definidos como os núcleos defuncionais lineares, assim como também à noção associada de hiperplanos, que sãotranslações de hiperespaços. Os hiperplanosΠ são generalizações das ideias geomé-

tricas de reta no plano e de plano no espaço, ou seja,Π = v +E 0 = x = v +e0, e0 ∈E 0 são translações dos subespaços E 0 que têm deficiência de dimensão 1 com re-lação ao espaço completo E , no seguinte sentido : E = E 0 ⊕ [α ], onde α = E 0, onde

Page 213: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 213/371

5.3 Geometria de espaços com produto interno : Teoria de F. Riesz 207

[α ] é o subespaço unidimensional gerado por α . Para estabelecer o conceito de de-ficiência em geral temos a definição abaixo que faz uso da decomposição ortogonalde Riesz-Beppo-Levi.

*Exercício :5.38. Analise a possibilidade de definir um conceito (intuitivo) de continuidade daprojeção ortogonal de Riesz P H 0 : H → H 0 no subespaço fechado H 0 do espaçode Hilbert H , com respeito a “variações” do espaço H 0, a começar pela definiçãoapropriada de uma “métrica” no conjunto de subespaços fechados de H .

Definição 5.12.Sejam ( H ,,) um espaço de Hilbert (real ou complexo) e H 0 um subespaço fechado,com sua projeção ortogonal P : H −→ H 0. Então, dizemos que a deficiência de H 0em H é a dimensão do seu complemento ortogonal, dim H ⊥0 , e, pelo teorema dedecomposição ortogonal, dim H ⊥0 = dim N (P) , podendo ser finita ou infinita.

Os hiperespaços e hiperplanos podem ser geometricamente melhor representa-dos em um espaço com produto interno do que em um simples espaço vetorial.Observe que se α ∈ H −0, então podemos definir o hiperespaço ortogonal aα daseguinte forma : E 0 = [α ]⊥ = h ∈ H ,α , h = 0 = N (lα ), onde lα ∈ H ∗ é o funcio-nal linear limitado definido pelo produto interno com α , isto é, lα (h) = h,α . Emespaços de dimensão finita, sabemos pela Álgebra Linear que todos os funcionais li-neares são representáveis como o produto interno por um elemento fixo. O teoremade Representação de Riesz-Frechet, a ser apresentado em seguida, confirma maisuma vez a nossa expectativa intuitiva quanto a este aspecto para espaços de Hilbertabstratos.

Exercícios - Interpretação geométrica de funcionais lineares em R3 (GeometriaAnalítica) :

5.39. Interprete geometricamente o funcional linear l(h) = h,α em R3 (α ∈ R3,fixo) como (múltiplo de) uma projeção na direção de um vetor unitário, cujo planonormal que passa pela origem é exatamente o núcleo de l.

5.40. Mostre que todo funcional linear em um espaço de dimensão finita é limitado(contínuo) e da forma l(h) = h,α para algum α ∈ R3. Utilize a interpretaçãoanterior para demonstrar este fato, sem recorrer a existência de bases.

5.41. Interprete um hiperplano emR3 como o plano caracterizado pelos vetores cujaprojeção na normal ao plano é igual à distância deste plano à origem, e também que

este hiperplano é dado pela translação do hiper-espaço caracterizado pela normal,ao longo desta mesma normal, por um comprimento igual à sua distância à origem.

Page 214: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 214/371

208 5 Espaços de Hilbert

5.42. Mostre que todo funcional linear emRn é “essencialmente” a função distânciaa um hiper-espaço (um subespaço de dimensão n−1). Explique o “essencialmente”.

Teorema 5.13 (Teorema de representação de Riesz-Fréchét - Representação defuncionais lineares limitados como produtos internos).Seja ( H ,,) um espaço de Hilbert (real ou complexo) e λ ∈ H ∗ = L( H ,R (ou C))um funcional linear limitado não-nulo. Então,

1. N (λ ) = h ∈ H ,λ (h) = 0 = “Núcleo de λ ” é um subespaço fechado de H, ea sua deficiência é = 1.

2. Existe um único w ∈ N (λ )⊥ tal que λ (h) = h,w, ∀h ∈ H, isto é, λ é repre-sentada pelo produto interno com um elemento fixo w, e,

3. λ 0 = w.

Prova. 1. Sendo λ contínuo, o seu núcleo é um subespaço fechado. Para determi-narmos a deficiência de N (λ ), basta utilizar uma decomposição simples válida

para EVN em geral. Já que λ = 0, podemos tomar v tal que λ (v) = 1, e daí po-demos escrever, h = (h −λ (h)v) +λ (h)v, ∀h ∈ H . Observando que, com isto, H = N (λ ) ⊕ [v], onde [v] representa o espaço (unidimensional) gerado por v,concluímos o desejado.

2. Consideremos o mesmo v anterior tal que λ (v) = 1, e v0 a sua projeção or-togonal em N (λ ). Tomemos então a componente de v ortogonal a N (λ ), ouseja, α = v − v0 ∈ N (λ )⊥, e concluímos que λ (α ) = 1. Assim, ∀h ∈ H po-demos então escrever a decomposição h = (h − λ (h)α ) + λ (h)α , e fazendoo produto interno desta expressão por α , obtemos λ (h) α 2= h,α , ou,λ (h) = h, α α 2 , de onde tiramos w = α α 2 .

3. A unicidade de w é clara.

4. Pela Desigualdade de Schwartz temos que |λ (h)

| =

|h, w

| ≤ w

h

, e,

portanto, λ 0 ≤ w. Por outro lado, λ ww = w, de onde vem λ 0=

w.

Este teorema mostra que as interpretações geométricas anteriormente apresen-tadas para um funcional linear em Rn podem ser literalmente reproduzidos em umespaço de Hilbert. Em particular : todo funcional linear contínuo em um espaço de Hilbert é essencialmente a função distância a um hiper-espaço fechado.

Exercícios :

5.43. a) Mostre que o espaço vetorial da matrizes quadradas reais M n(R) (comoperações de soma e multiplicação por escalares pontuais) é um espaço de Hil-

bert se dotado do produto interno de Frobenius : A, B = Tr ( ABt ) = ∑i, j

Ai j Bi j.

Estenda esta definição de produto interno para o caso complexo M n(C).

Page 215: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 215/371

5.3 Geometria de espaços com produto interno : Teoria de F. Riesz 209

b) Mostre que as matrizes simétricas S n(R) e as matrizes anti-simétricas A n(R)são subespaços de M n(R). Mostre ainda que M n(R) = S n(R) ⊕A n(R), isto é,que toda matriz M ∈ M n(R) pode ser escrita de uma única forma M = A + S ,onde A ∈ A n(R) e S ∈ S n(R). Sugestão : utilize a simples mas importante

decomposição de Helmholtz : M = 12 ( M + M

t

) + 12 ( M − M

t

).c) Finalmente, mostre que estes subespaços são ortogonais, ou seja, que a decom-

posição M n(R) = S n(R) ⊕A n(R), é de fato uma decomposição ortogonal deBeppo-Levi.

d) Dada uma matriz M ∈ M n(R), obtenha as matrizes simétrica e anti-simétricamais próximas de M na métrica de Frobenius.

5.44. Considere o funcional linear traço, Tr : M n(C) →R. Obtenha a representaçãode Riesz-Fréchét para este funcional linear.

Uma das consequências imediatas e importantes do teorema de Representaçãode Riesz-Fréchét é o seguinte :

Teorema 5.14 ( H isométrico com H ∗).Seja ( H ,,) um espaço de Hilbert (real ou complexo). Então H ∗ = ( L( H ,R (ou C)) , . 0) é um espaço de Hilbert isométrico a H.

Prova. Basta utilizar a representação de Riesz-Frechet para funcionais lineares li-mitados, e vice-versa, observando-se que, pelo item 3 deste teorema, as respectivasnormas são idênticas. Naturalmente, a isometria faz de H ∗ também um espaço deHilbert pela regra do paralelogramo (Teorema de von Neumann).

Esta identificação é frequentemente levada tão ao pé da letra que o representante

de um funcional λ ∈ H ∗ é também denotado por λ , ou seja, escreve-se λ (h) =h,λ . Aliás, esta notação é levada ainda mais a sério, e mesmo em espaços vetoriaisonde não há produto interno subjacente, a atuação de um funcional linear l em umelemento x é frequentemente denotada também por x, l.

É interessante observar que o teorema de Hahn-Banach-Helly tem uma demons-tração imediata a partir destes resultados, assim como as diversas propriedades geo-métricas que serão enunciadas a seguir.

Exercícios :

5.45. Seja A um subconjunto estritamente convexo, fechado, de um espaço de Hil-bert real ( H ,,). Mostre que para todo hiperespaço N (λ ), onde λ ∈ H ∗, existe umhiperplano h0 + N (λ ) =Π que é suporte de A, isto é,

a) (h0 + A)∩ A = h0, e,b) A está totalmente situado em um dos semi-espaços definidos por ∏.

Page 216: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 216/371

210 5 Espaços de Hilbert

5.46. Enuncie e demonstre o teorema de Hahn-Banach-Helly em um espaço de Hil-bert, não necessariamente separável.

5.47. Seja A um subconjunto convexo, fechado, de um espaço de Hilbert ( H ,,) eh

0 /∈

A. Mostre que existe um hiperplano∏= x0 + N (λ ) separando h

0 de A.

5.48. Se A for um convexo fechado e P A : H → A ⊂ H for a projeção de Riesz em A, mostre que ∀a ∈ A, h − P A(h), a − P A(h) ≤ 0. Interprete geometricamente adesigualdade e o caso em que ela é estrita.

O teorema de representação de Riesz-Fréchét é uma versão abstrata em (es-paços de Hilbert) de uma classe de teoremas que caracterizam a forma de funcio-nais lineares em espaços funcionais concretos. Deste teorema podemos concluir, porexemplo, que

1. Todo funcional linearλ no espaço de Hilbert l2(C) é necessariamente da forma

λ (g) =∞

∑k =0

g(k )α k , onde a sequência α k ∈ l2(C).

2. Todo funcional linear λ no espaço de Hilbert L 2([0,1],R) = “Completamento

de C 0([0,1],R) na norma h 2=

1

0| h( x) |2 dx

12

” pode ser escrito, para

h ∈ C 0([0,1],R), como um limite : λ (h) = limk →∞

1 0

h( x)α k ( x)dx onde α k é

uma sequência de Cauchy no conjunto C 0([0,1],R), e norma . 2. Afirmaçõesanálogas podem ser feitas com respeito aos espaços de Hilbert-Sobolev H m (Ω ).

5.4 Geometria de Pitágoras em dimensão infinita : basesortonormais e representação de Fourier

5.4.1 Bases ortonormais

O conceito de base em dimensão finita é uma questão bem resolvida pela Álge-bra, mas de uma maneira que se torna imprópria no caso de espaços de dimensãoinfinita. Portanto, é interessante repensar este importantíssimo conceito para quepossamos generalizá-lo convenientemente.

O objetivo fundamental do conceito de base é proporcionar um método de ca-racterizar de forma unívoca, inequívoca e econômica todos os elementos do espaçovetorial, por meio das operações naturais dentro do contexto, isto é, utilizando com-binações lineares a partir do menor conjunto possível de elementos do espaço.

Uma base é como se fosse um alfabeto a partir do qual se pode exprimir todosos “nomes” de elementos do espaço. Este conceito obviamente provêm da repre-

sentação dos números naturais a partir de um conjunto finito de “dígitos” (que deveter no mínimo dois elementos, como no caso binário, e tem dez na representaçãodecimal) em que a identificação do número se faz por intermédio de uma sequência

Page 217: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 217/371

5.4 Geometriade Pitágoras em dimensão infinita : bases ortonormais e representação de Fourier 211

finita e protocolizada de operações aritméticas. A representação dos números reaistem que admitir também expansões infinitas, ou seja, nas construções do “nome deum número real” utiliza-se não somente a aritmética mas também uma topologia deconvergência para as suas identificações.

Entretanto, em dimensão infinita, a questão não é tão simples, uma vez que com-binações lineares (finitas) são, em geral, insuficientes para gerar todo o espaço comuma família aparentemente apta a ser uma base. Quando insistimos que apenas asoperações algébricas devam ser utilizadas para descrever o espaço, é claro que paga-remos o preço tendo que considerar bases muito grandes. Uma base de Hamel paraum espaço vetorial é uma família haa∈ A de vetores linearmente independentes,(com respeito a combinações lineares finitas), que gera todo o espaço por meio decombinações lineares finitas de seus membros. Consideremos agora l2(C), cuja can-didata natural para base é a família de sequências ek k ∈N, definidas por ek ( j) =δ k j.É claro que ek k ∈N não é uma base de Hamel para l2(C).

Por outro lado, a estrutura matemática resultante da associação entre as estru-turas topológica e algébrica é muito mais rica e, portanto, deve ser utilizada nadefinição do conceito de base como um processo construtivo. Observe a ênfase no

termo “processo”, pois, tal como na expansão digital dos números naturais e dosreais, o que se deseja é uma construção protocolada, algorímitca e sistemática enão simplesmente uma aproximação desorganizada. A definição seguinte exprimeeste conceito devido a Juliusz Schauder, outro justamente famoso matemático polo-nês da geração de Banach.

Definição 5.15 (Base de Schauder).Uma Base de Schauder para um espaço vetorial normado (E , . ) é uma famíliaenumerável hk k ∈ N de elementos de E tal que qualquer v ∈ E possa ser descrito

unicamente por uma sequência de coeficientes ck , da forma v = limm→∞

k =m∑

k =0ck hk ,

ou ainda, v =

∑k =0 ck hk , isto é, limm→∞ k =m

∑k =0 ck hk − v = 0.

Observe que a aproximação de um elemento v em uma Base de Schauder deveser feita de forma ordenada ; não basta que as combinações lineares finitas sejamdensas em E . Por exemplo, as funções polinomiais xnn∈N não formam uma Basede Schauder em

C 0([0, 1],R), . ∞

, embora qualquer elemento de C 0([0, 1],R)

possa ser aproximável tanto quanto se queira por combinações lineares finitas delas.Esta afirmação decorre do fato de que se para qualquer função contínua f , tivésse-mos uma representação convergente por série de potências, ∑ ak xk = f ( x), isto ca-racterizaria f como uma função analítica, o que nem toda função contínua pode ser.A exigência de enumerabilidade da base pretende discriminar as descrições “econô-micas nos ingredientes” (sob o ponto de vista algorítmico), e a unicidade, aquelas

que são “econômicas no método”. Observe que a exigência de unicidade nesta defi-nição é equivalente ao conceito de independência linear do caso finito.

Page 218: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 218/371

212 5 Espaços de Hilbert

Desta forma, vemos que tanto a topologia empregada, como a maneira pela qualé utilizada, torna-se crucial para a definição de uma Base de Schauder em um espaçovetorial topológico. Por este motivo, pode existir mais do que um critério conve-niente para a definição de bases em espaços vetoriais de dimensão infinita, variando

a topologia podemos variar as bases.Em espaços com produto interno, consideraremos bases que façam uso nãoapenas da estrutura algébrico-topológica mas também da geometria. Neste caso,fazendo uso do conceito de ângulo, podemos minimizar, além da quantidade devetores da base, também a quantidade de informação que cada elemento da basecontribui. Em outras palavras, em uma base onde os vetores são ortogonais entre si,cada vetor contribui com uma direção que nenhum outro da base tem qualquer pos-sibilidade de descrever, mesmo parcialmente, ao contrário de bases não ortogonaisem que há “sobreposições de informações”.

Uma Base de Schauder ortonormal será o conceito útil para a caracterização debases em espaços com produto interno e, de certa maneira, uma base ortonormalé a mais econômica, pois cada “eixo” descreve unicamente as componentes na suadireção sem redundâncias, ou sobreposições entre elas. Passaremos a tratar deste as-

sunto a seguir. Esta linguagem emprestada à teoria de informação tem mais do queuma simples intenção metafórica, pois os conceitos de correlação e de conteúdo deinformação de fato podem se exprimir por intermédio dos conceitos de ortogonali-dade e, ao final das contas, por intermédio do conceito de produto interno. (Consultea respeito : Schölkopf-Smola[2002], Kirby[1994], Jollife[1986]).

Definição 5.16 (Bases ortonormais de Hilbert - Coeficientes de Fourier).

1. Uma família de elementos não nulos hα α ∈ A em um espaço com produto in-terno ( H ,,) , é denominada de ortogonal se hα ,hβ = 0 se α = β e,

2. Ortonormal se hα , hβ = δ αβ , onde δ αβ , chamado símbolo de Kronecker, é nulo para α = β e δ γγ = 1,∀γ ∈ A.

3. Uma Base de Schauder hk k ∈N , ortonormal em um espaço com produto in-terno ( H ,,) , é denominada de Base de Hilbert, ou Base Ortonormal.

4. Se h ∈ H, e hk k ∈N for um sistema ortonormal no espaço com produto interno( H ,,) , então denominamos a projeção escalar de h em hk , isto é, h,hk , deCoeficiente de Fourier de h em hk , e o denotamos por hk = h,hk .

Exercícios :

5.49. Mostre que ek k ∈N é uma Base de Schauder para l p(C), p ≥ 1.

5.50. Mostre que as funções xnn∈N não formam uma Base de Schauder em(C 0([0, 1],R), . ∞). Sugestão : todas as funções h( x) em

C 0([0,1],R), . ∞

que

são aproximáveis por uma série de potências em x são analíticas em uma vizinhançada origem !

Page 219: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 219/371

5.4 Geometriade Pitágoras em dimensão infinita : bases ortonormais e representação de Fourier 213

5.51. Mostre que se um espaço normado tem Base de Schauder, então ele é separá-vel (não tente provar o contrário, porque não vale !).

5.52. Considere E =

C 0([0, 1]), . ∞

, e a família (enumerável) hmnn,m∈, for-

mada por funções definidas como tendo como gráfico um triangulo de base [

m

2n ,

m+1

2n ]e altura unitária, e zero no resto do intervalo, e h+(t ) = t , h−(t ) = 1 − t . Por tri-angulação do arco da corda do gráfico de uma função contínua em [0,1], podemosconcluir que esta é uma Base de Schauder para E . Faça o esboço geométrico. Mostreque esta é uma Base de Schauder também para

C 0([0,1]), . p

. Em particular,

mostramos assim que estes espaços são separáveis.Observação : Um famoso teorema de Krein-Milman-Rutman afirma que (C 0([0, 1]), . ∞) tem uma Base de Schauder polinomial, e a sua demonstração depende daconstrução geométrica acima descrita. Referência : E. W. Cheney, Introduction to Approximation Theory, McGraw-Hill, 1966.

Nesta seção, trataremos de conceitos tão antigos e importantes em Matemáticaquanto o Teorema de Pitágoras (

∼ 585 a.C.), a Teoria de Joseph Baptiste Fourier

(1768-1830) e o desenvolvimento moderno da Análise Funcional pela escola deHilbert, representado aqui pelo seu aluno Erhard Schmidt (1876-1959). (Sobre estahistória, consulte W. A. Coppel, J. B. Fourier : On the occasion of his two hundredthbirthday, Am. Math. Monthly, 76, 468-83, 1969).

Uma vez introduzido o conceito e a possibilidade de se realizar projeções or-togonais em um espaço de Hilbert, nada mais natural do que tentar levar adiante oprograma de euclidianizar a teoria de dimensão infinita por intermédio do conceitode bases ortonormais. Este será o objetivo desta seção.

Exercício :

5.53. Mostre que uma família ortogonal é formada por vetores linearmente indepen-dentes.

Teorema 5.17 (Sistemas ortonormais - Coeficientes de Fourier - Projeção orto-gonal - Desigualdade de Bessel).Seja hα α ∈ A uma família ortonormal em um espaço complexo com produto interno( H ,,). Então,

1. hα α ∈ A é linearmente independente,

2. A projeção ortogonal de qualquer h ∈ H em um subespaço de dimensão finitagerado por elementos da família, digamos, = H n = [h1,...,hn] , é dada por

h0 =k =n

∑k =1

h, hk hk = P H n (h),

onde os números complexos h,hα são denominados Coeficientes de Fourier de h no sistema ortonormal hα α ∈ A.

Page 220: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 220/371

214 5 Espaços de Hilbert

3. Para qualquer subconjunto finito h1,..., hn da família hα α ∈ A temos

k =n

∑k =1

| h,hk |2≤ h 2 ,

denominada Desigualdade de Bessel.

4. Existe no máximo uma quantidade enumerável de Coeficientes de Fourier não-nulos para cada elemento h ∈ H.

5. Se ck = h,hα k k ∈N forem os Coeficientes de Fourier não nulos de h, então, asequência ck pertence ao espaço l2(C).

Prova. 1. Exercício anterior.

2. Seja então h ∈ H e H n = “Espaço gerado pelos vetores h1,..., hn da família

orotonormal hα α ∈ A”. Então, para um k =n∑

k =1ak hk ∈ H n, temos

h−

k =n∑

k =1

ak hk

2 =

h

2

−∑2 Re (ak

h, hk

) +∑

|ak

|2

= h 2 −∑ |ak −h, hk |2 −∑ | h,hk |2

Observe que, de acordo com o Teorema de Riesz, o inf

h−

k =n∑

k =1ak hk 2

ocorre exatamente, e unicamente, para o elemento ortogonalmente projetado.Por outro lado, o segundo termo da igualdade acima nos mostra que isto acon-tece quando ak −h,hk = 0 para todos os índices k ’s. Portanto, obtemos a im-portante, simples e intuitiva fórmula para a projeção ortogonal em um subes-

paço gerado por uma base ortonormal finita : P H n (h) =k =n∑

k =1h,hk hk .

3. Como h = h0 + (h − h0), onde h0,h − h0 = 0, e h0 =k =n∑

k =1h, hk hk , usamos o

Teorema de Pitágoras na primeira igualdade (isto é, fazemos o produto interno),e obtemos que h 2= h − h0 2 + h0 2= h − h0 2 +

k =n∑

k =1| h,hk |2, de

onde tiramos que k =n∑

k =1| h, hk |2≤ h 2.

4. Seja h ∈ H . Em virtude da Desigualdade de Bessel, para cada inteiro n ∈N,existe apenas um número finito de hα para os quais |h,hα | ≥ 1

n . Daí vem aconclusão imediata.

5. A própria Desigualdade de Bessel nos leva à esta conclusão.

Observação 5.18. 1. Ressaltamos no teorema anterior, a fórmula para a projeção

ortogonal e a consequente Desigualdade de Bessel, que são extremamente intui-tivas do ponto de vista geométrico, mas nem tanto nos vários contextos analíti-cos em que ocorrem e onde têm uma importância fundamental. Por este motivo

Page 221: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 221/371

5.4 Geometriade Pitágoras em dimensão infinita : bases ortonormais e representação de Fourier 215

a interpretação geométrica aqui é indispensável. Por exemplo, veja abaixo osexercícios sobre construção de polinômios ortogonais.

2. O item 4 do teorema anterior nos sugere que as bases ortonormais sejam enu-meráveis. Isto não é verdade em geral, mas todos os exemplos concretos que

trataremos são constituídos de espaços que dispõem de uma base ortonormalenumerável. O teorema seguinte caracteriza estes espaços. A construção destasbases ortonormais é realizada por meio de um argumento geométrico intuitivosemelhante ao utilizado em Álgebra Linear de dimensão finita, chamado orto-gonalização de Gram-Schmidt e que faz uso da fórmula de projeção ortogonal.

Como já argumentamos, em espaços de Hilbert o conceito de base é muito maisrico, pois dispõe de uma estrutura geométrica conveniente para a sua descrição einterpretação. Esta vantagem se torna especialmente importante em espaços de Hil-bert separáveis, isto é, aqueles que contêm um subconjunto enumerável denso, quecobre a grande maioria dos exemplos que nos interessam.

Teorema 5.19 (Teorema de Schmidt : Existência de bases ortonormais em es-paços separáveis).Se ( H ,,) for um espaço com produto interno e separável, isto é, contêm um sub-conjunto enumerável denso, então,

1. Existe uma base ortonormal de H e,

2. Todas as famílias ortonormais são enumeráveis, e portanto podemos dizer queum espaço de Hilbert de dimensão infinita, separável, tem dimensão ℵ0.

Prova. 1. Consideremos gk k ∈N uma família densa em H , que podemos consi-derar como normalizada, gk = 1, e apliquemos a ela o método de ortogona-lização de Gram-Schmidt de forma recursiva :

a) Sejam h1 = g1, H 1 = [h1] = espaço gerado por h1.b) Suponha construídos h1,...,hn ortonormais e consideremos H n = [h1,...,hn] =espaço gerado pelos vetores h1,..., hn.

c) Se H n = H , o teorema está demonstrado. Caso contrário, existe algum gk /∈ H n, pois H n é topologicamente fechado.

d) Seja agora gk n+1 o primeiro elemento da família gk k ∈N que não pertenceao subespaço H n. Definimos então

hn = gk n+1 −(projeção ortogonal de gk n+1 em H n) = gk n+1 − j=n

∑ j=1

h j,gk n+1h j,

e hn = 1hn hn.

Verificamos assim que gk ∈ H n para k ≤ n, e, portanto, [g1,...,gn] ⊂ H n, e ob-

viamente h j j≥1 é um sistema ortonormal.Para mostrarmos que h j j≥1 é de fato uma base de Schauder, observemos que,dado um h ∈ H , então ∀ε > 0, existe um n0 tal que se n ≥ n0, temos d (h, H n) ≤ ε

Page 222: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 222/371

216 5 Espaços de Hilbert

(basta que o elemento gk que aproxima h na distância ε esteja em H n). Mas istosignifica que para n ≥ n0, temos

h−

j=n

∑ j=1

h j, hh j

= d (h, H n)

≤ε .

Observe que as projeções sucessivas de h em espaços H n simplesmente acres-centam termos à expansão e não modificam os coeficientes de Fourier ante-riores, construindo assim uma aproximação organizada de Schauder.

2. Seja então uα α uma família ortonormal. Com base no item 4 do teorema ante-rior, concluímos que para cada hn da base ortonormal de Schmidt, temos apenasuma quantidade enumerável de uα para os quais uα ,hn = 0. Portanto, apenasuma quantidade enumerável de elementos da família não são ortogonais a todosos hn. Portanto, se existir um uβ ortogonal a todos os hn, devemos ter necessa-riamente que uβ = 0, uma vez que hn é denso em H , o que é impossível, jáque a uα α é uma família ortonormal e não tem elementos nulos.

Observação 5.20. 1. Com este resultado, podemos falar de dimensão para espaçoscom produto interno separáveis, se considerarmos apenas as bases ortonormaisde Hilbert como referenciais. Neste caso, ou o espaço tem dimensão finita, oua sua dimensão tem a cardinalidade ℵ0.

2. O argumento empregado no item 2 do teorema acima não é válido se conside-rarmos uma família uα α apenas linearmente independente, sem a condiçãode ortogonalidade. Por exemplo, como já vimos, a família ek k ∈N no l2(C) éuma base de Hilbert mas não de Hamel. É razoável esperar que uma famílialinearmente independente que se constitua em uma base de Hamel para l 2(C)tenha “muito mais elementos” do que a base de Hilbert para suprir a deficiênciade sua capacidade construtiva. Curiosidade : será que uma base destas seria

enumerável ?3. Os exercícios abaixo mostram alguns exemplos de construção de bases ortonor-

mais para espaços de Hilbert funcionais pelo Método de Gram-Schmidt. Natu-ralmente, a base mais conhecida e estudada é a base trigonométrica de Fourier.As outras bases polinomiais também são tão importantes que recebem nomesespeciais, e suas diversas propriedades tem sido estudadas intensamente desdeque surgiram como soluções de problemas de fronteira para equações diferen-ciais ordinárias lineares especiais, até os dias de hoje. No penúltimo capítulo,voltaremos a encontrar estas bases como resultados de diagonalização de ope-radores integrais lineares.

Exercícios :

5.54. a) Mostre que o espaço com produto interno

C 0([0,1],R),g, h2

não écompleto. Sugestão : considere uma sequência de funções contínuas f n ∈

Page 223: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 223/371

5.4 Geometriade Pitágoras em dimensão infinita : bases ortonormais e representação de Fourier 217

C 0([0,1],R) que “converge” para uma função escada, h na “pseudo-norma”.2, por exemplo, h( x) = 0, 1

2 ≤ x ≤ 1,h( x) = 1 para 0 ≤ x ≤ 12 . Mostre, em

seguida, que não existe uma função contínua limite, analisando o que esta possí-vel limite faria para acomodar as coisas nas imediações do ponto de desconti-

nuidade x0 = 1/2. (Cuidado, a definição do produto g,h2 para funções comdescontinuidades finitas exige um argumento de equivalência, caso contrário, apositividade definida é falha!)

b) Mostre que o espaço de HilbertL 2([0,1],C) =C 0([0, 1],C).2

, obtido do com-pletamento de

C 0([0, 1],C),g,h2

= L 2([0,1],C), é separável e, portanto,

dispõe de bases ortonormais de Hilbert.Sugestão : Observe que a norma .2 é majorada pela norma .∞, e os polinô-mios se constituem em um conjunto denso em C 0([0, 1],C).

5.55. Mostre que as funções exp(i2π kx)k ∈Z ⊂C ∞ per ([0,1],C)=g ∈ C ∞([0, 1],C) ;

∂ (k )

x g(0) = ∂ (k )

x g(1),∀k ≥ 0 = C ∞1− per (R,C) formam um sistema ortonormal no

espaço com produto interno C 0([0,1],C),g, h

2 =

1

0 g( x)h( x)dx.

5.56. a) Usando o Teorema de Weierstrass (trigonométrico), mostre que a famíliaexp(i2π kx)k ∈Z é uma base ortonormal para o espaço de Hilbert L 2([0, 1],C)

=C 0([0, 1],C).2

. Esta base é chamada de base trigonométrica ou de Fourier .Este assunto será tratado com detalhes na próxima seção.

b) Calcule os coeficientes de Fourier das funções a) g(t ) = 1, b) g(t ) = t , c) g(t ) =exp(t ), d) g(t ) = cos(t ), no exemplo acima.Como já vimos, é comum denotar o k −ésimo coeficiente de Fourier de uma

função g ∈C 0([0, 1],C) na base trigonométrica por gk =1

0g( x) exp(−2π ikx)dx.

5.57. Mostre que as combinações lineares do tipo m∑−m

ck exp(i2π kx), onde ck = c−

k ,

são reais e densas em

C ∞ per ([0,1],R), . ∞ e, portanto, densas em L 2([0,1],C).Conclua obtendo uma base ortonormal trogonométrica paraL 2([0,1],C).

5.58. Mostre que a família de funções exp(i2π k , x)k ∈Zn ⊂ C ∞1− per (Rn,C), onde

k = (k 1,..., k n) ∈ Zn é um multi-índice de inteiros, e k , x = j=n

∑ j=1

k j x j, formam uma

base ortonormal para o espaço de Hilbert L 2([0,1]n,C), obtido do completamento

C 0([0,1]n,C).2

= L 2([0,1]n,C).2

=L 2([0,1]n,C).

5.59. Conclua que as famílias de polinômios abaixo formam bases ortonormais

paraL 2ρ ([−1,1],C), obtido do completamento C 0([−1, 1],C).ρ

=L 2ρ ([−1,1],C),

onde g, hρ =+1 −1

g( x)h( x)ρ( x)dx, uma vez que são ortonormalizações de Gram-

Schmidt da família xnn∈ N (de Weierstrass) neste espaço :

Page 224: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 224/371

218 5 Espaços de Hilbert

a) Polinômios de Legendre : ρ( x) = 1.

b) Polinômios de Tchebytchev do primeiro tipo : ρ( x) = (1− x2)− 12 .

c) Polinômios de Tchebytchev do segundo tipo : ρ( x) = (1− x2)12 .

d) Polinômios de Jacobi : ρ( x) = (1 − x)α (1 − x)β , α ,β > −1. (Estes incluemnaturalmente os polinômios de Tchebytchev, de Gegenbauer e outros).

5.60. Obtenha os 5 primeiros polinômios de Legendre.

5.61. Os polinômios de Hermite são obtidos da ortonormalização de Gram-Schmidtda família xnn∈N em

C 0((−∞,∞),R),g,hρ

, ρ( x) = exp(− x2). Obtenha os

três primeiros polinômios de Hermite.

5.62. Mostre que xnn∈N ⊂L 2ρ ([0,∞],R) para ρ( x) = xα exp(− x),α > −1. A or-tonormalização desta família neste espaço produz os chamados polinômios ortogo-nais de Laguerre.

5.63. Obtenha o polinômio de quinto grau que melhor aproxima a função h( x) =

exp(− x) em L 2([−1, 1],R). Sugestão : Use os polinômios de Legendre calculadose faça a projeção ortogonal.

5.64. Mostre que os espaços de funções HC (Ω ) = “Funções holomorfas (analíti-cas), em Ω e contínuas em Ω ”, onde Ω é uma região aberta delimitada por umacurva ∂Ω retificável (isto é, sobre a qual se pode fazer integrais de linha de funçõescontínuas), com os produtos g, h1 =

∂Ω

g( z)h( z)ds, (ds = comprimento de arco), e

g, h2 = Ω

g( z)h( z)dx, (dx = elemento de área), são espaços separáveis.

5.65. Obtenha os chamados polinômios de Bergmann para Ω , resultantes da orto-normalização da família znn∈N em ( HC (Ω ),g, h2), para o caso em que Ω =disco unitário. Sugestão : Utilize coordenadas polares para efetuar o cálculo da in-

tegral do produto interno.

5.66. Obtenha os chamados polinômios de Szëgo paraΩ , resultantes da ortonorma-lização da família znn∈N em ( HC (Ω ),g, h1), para o caso em que Ω = quadradounitário [0, 1]2, até o terceiro grau.

5.67. Escreva os elementos de ( HC (Ω ),g, h2), para o caso em que Ω = disco

unitário, como séries g( z) =∞

∑k =0

ak zk , e faça uma identificação deste espaço com um

subespaço de l2(C).

5.68. Escreva um algoritmo para a obtenção de polinômios ortonormais de Le-gendre, Tchebytchev (1-2), Jacobi, Laguerre, Hermite usando o argumento recor-

rente de Gram-Schmidt em um pacote computacional com capacidade simbólica,por exemplo, o Mathematica R.

Page 225: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 225/371

5.4 Geometriade Pitágoras em dimensão infinita : bases ortonormais e representação de Fourier 219

5.69. Obtenha os polinômios até terceiro grau, de duas variáveis, ortonormais emL 2([0, 1]2,C) aplicando o método de Gram-Schmidt à família xn ymn,m∈N. Su-gestão : Utilize a experiência adquirida no exercício anterior e resolva a questão no Mathematica R para não perder muito tempo em cálculos elementares errados !

5.70. Matute sobre a questão de obter uma família ortonormal de funções esféricas

em L 2(S (2),R) = C 0(S (2),R).2

, onde S (2) = x ∈R3, x = 1, e o produtointerno herdado de C 0(S (2),R) é g, h2 =

S (2)

g( x)h( x) d ω , e d ω é o elemento de

superfície.

5.71. Obtenha os primeiros quatro polinômios de “Legendre-Sobolev” (este nomenão é marca registrada !) aplicando o método de Gram-Schmidt à família xn no

espaço H m([−1,1]) = (C m([−1, 1],C),,m), para m = 1, onde g,hm =k =m∑

k =0∂ k g,∂ k h0,

e g, h0 =+1

−1g( x)h( x)dx. Observação : H m([−1,1]) é o espaço de Sobolev-Hilbert

obtido do completamento de H m([−1, 1]), que será discutido mais adiante nestemesmo capítulo.

Mostraremos a seguir algumas maneiras equivalentes e úteis para caracterizaruma base de Hilbert.

Teorema 5.21 (Caracterizações equivalentes de uma base de Hilbert).Seja ( H ,,) um espaço de Hilbert e hnn∈N uma família ortonormal. Então, astrês seguintes afirmações são equivalentes :

1) hnn∈N é uma base de Hilbert, isto é, hnn∈N é uma sequência fechada.

2) ∀h ∈ H , h 2

=

∑ j=1 | h j, h |2

(Identidade de Parseval, ou, Teorema de Pitá-goras),

3) Dado h ∈ H, se | h j, h |= 0 para todo j ∈N , então h = 0 ; ou seja, hnn∈N é uma sequência completa.

Prova. 1) ⇒ 2). Consideremos os subespaços H n = [h1,.......hn] e h ∈ H . Então, a

projeção ortogonal de h em H n é dadapor j=n

∑ j=1

h j,hh j e d (h, H n) = h− j=n

∑ j=1

h j, hh j .

Mas, como hnn∈N é uma base de Hilbert, limn→∞ h − j=n

∑ j=1

h j,hh j = 0, de

onde tiramos que o limite do quadrado destes termos também é zero, ou seja,

limn→∞ h 2

−n

∑ j=1 | h j, h |2, que é a identidade de Parseval. (É óbvio que 2)

⇒1)).

Page 226: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 226/371

220 5 Espaços de Hilbert

2) ⇒ 3). Óbvio.

3) ⇒ 1). Seja h ∈ H e considere a sequência gm = j=m

∑ j=1

h j, hh j. Pela desigualdade

de Bessel, concluímos que ∞

∑ j=1

| h j, h |2 converge, e portanto, como, gm −gn 2=

j=m

∑ j=n

| h j,h |2, concluímos que gm é de Cauchy e converge para g =∞

∑ j=1

h j,hh j.

Mas agora é fácil ver que g −h, hk = 0 para todo k , o que da hipótese 3) nos leva

a concluir que g −h = 0, ou seja, h =∞

∑ j=1

h j,hh j, e assim, hnn∈N é uma base de

Hilbert.

O item 1 da observação acima é um prenúncio de que há uma similaridade es-trutural (dimensão) entre espaços com produto interno separáveis. Veremos logoabaixo que esta similaridade vai muito mais além do que a mera dimensão paraespaços de Hilbert. O resultado a seguir demonstra que os axiomas de espaço deHilbert separável são suficientemente estritos para que as suas realizações concretassejam essencialmente todas iguais.

Teorema 5.22 (Universalidade do l2 como um espaço de Hilbert separável).Seja ( H ,,) um espaço com produto interno separável complexo (real). Então,

a) H é isométrico a um subspaço de l 2(C) (respectivamente, l2(R)).

b) Se H for um espaço de Hilbert, H será isométrico a l 2(C) (respectivamente,l2(R)).

Prova. a) Se H for de dimensão finita, a álgebra linear resolve a questão. Supon-hamos então que dim H =ℵ0 e que hnn∈N seja uma de suas bases ortonormaisde Hilbert. Consideremos agora a função i : H −→ l2(C), i(h) = h, hk k ∈N,

que é bem definida, em virtude da desigualdade de Bessel, e linear. Comohnn∈N é uma base, então ∀h ∈ H vale a igualdade de Parseval, isto é,

h 2=∞

∑k =1

| h, hk |2. Isto significa que i é uma isometria entre H e a sua

imagem i( H ) ⊂ l2, ou seja, H é isométrico a um subespaço de l2.

b) Mostraremos agora que, se H for de Hilbert, isto é, completo, então i será umaisometria entre H e l 2(C), e para isto, basta mostrar que i é sobrejetiva. Seja

então ck ∈ l2(C). Observe que a sequência S n(h) =n∑

k =0ck hk é de Cauchy, pois

S n(h)−S m(h) 2≤n∑

k =mck hk 2=

n∑

k =m| ck |2, e a sequência numérica

n∑

k =0| ck |2

é de Cauchy, pois converge. Portanto, existe h =∞

∑k =0

ck hk , e, pela continuidade

do produto interno, temos que h,hk = lim m∑k =0

ck hk , h j = ck , de onde vem que

i(h) = ck k .

Page 227: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 227/371

5.4 Geometriade Pitágoras em dimensão infinita : bases ortonormais e representação de Fourier 221

Observação 5.23. 1. Observe que uma isometria é uma bijeção linear que preservaperfeitamente todas as estruturas (algébrica, topológica, geométrica) de um es-paço com produto interno. A não ser pelo nome de seus elementos, dois espaçosisométricos são indistinguíveis.

2. Este teorema nos mostra claramente que todos os espaços com produto interno,separáveis, são indistinguíveis estruturalmente dos subespaços de l 2(C), e osespaços de Hilbert complexos (reais) separáveis são essencialmente o própriol2(C) (l2(R)).

3. Com este teorema, dispomos de uma maneira para representar o completamento(abstrato) de espaços com produto interno separáveis, por meio de um espaçonumérico “concreto”, isto é, o l2(C). Utilizaremos esta capacidade para melhorentender as estruturas dos espaços de Lebesgue e Sobolev-Hilbert.

Devido a sua importância, apresentaremos estas observações formalmente nopróximo teorema :

Teorema 5.24 (Completamento de espaços com produto interno separáveis).Seja ( H ,,) um espaço complexo com produto interno e separável. Então, podemosidentificar o completamento H de H como um subespaço de l 2(C) , a menos de umaisometria. Se dim H = ∞ , então, H será identificado com o próprio l2(C) e pode ser

representado por séries formais∞

∑k =1

ck hk onde ck ∈ l2(C) e hn é uma base de

H. Se dim H < ∞ , então, H é isométrico a Cn.

Prova. Como uma isometria é uma função uniformemente contínua podemos,estendê-la para o completamento de H e, pelos resultados do teorema anterior,concluímos o resultado.

No que segue, faremos uso concreto das conclusões dos teoremas acima.

5.4.2 Bases de Fourier

Voltaremos agora a tratar das questões geométricas em espaços funcionaisconcretos, com uma atenção especial às séries de Fourier. Esta seção, junto comos exercícios abaixo, pode ser considerada como uma introdução rápida à Análisede Fourier, que merece um estudo em separado. Nesta empreitada, o leitor tem asorte de dispor de uma vasta e excelente literatura, tal como exemplificada pelasreferências abaixo :

J. B. Fourier, Théorie Analytique de la Chaleur . Paris, 1822. (Histórico).

E. Prestini, The Evolution of Applied Harmonic Analysis, Birkhauser, 2005. (Histó-ria)

Page 228: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 228/371

222 5 Espaços de Hilbert

C. Lanczos, Linear Differential Operators, Dover, 1997. (Clássico, de leitura agradá-vel, recheado de ideias, como todos livros do autor).

C. Lanczos, Applied Analysis, Dover.

R. Courant, D. Hilbert, Methods of Mathematical Physics, vol. I, J. Wiley, 1965.(Clássico dos clássicos).

A. N. Kolmogorov, S. V. Fomin, Elementos de la Teoria de Funciones y del AnalisisFuncional, Mir 1927, capítulo IX.

H. Dym, H. P. McKean, Fourier Series and Integrals, Academic Press, 1972.

T. Körner, Fourier Analysis, Cambridge U. Press, 1998.

E. Stein, R. Shakarchi, Fourier Analysis - An Introduction, Princeton U. Press, 2003.

No que se segue, faremos uso dos seguintes espaços :

1. C 0([0,1],C).2,ρ

= L 2ρ ([0,1],C).2,ρ

=L 2ρ ([0, 1],C), ou L 2ρ ([0,1],R)

2. C 0([0,1]n,C).2,ρ = L 2ρ ([0, 1]n,C)

.2=L 2ρ ([0,1]n,C), (idem)

3. C ∞o (Rn,C).2,ρ = L 2ρ ([Rn,C)

.2,ρ

=L 2ρ (Rn,C), (idem)

4. HC ( D) = funções holomorfas (analíticas), em D e contínuas em D, onde D é o disco unitário aberto do plano complexo, e D = z ∈ C, | z |≤ 1, comos produtos g,h1 =

| z|=1

g( z)h( z)ds, (ds = comprimento de arco), e g, h2 = D

g( z)h( z)dx, (dx = elemento de área).

Exercícios :

5.72. Mostre que C ∞0 ((0, 1),C).2

= C ∞ per ([0,1],C).2 = C 0([0,1],C)

.2=L 2([0,1],

C). Sugestão : observe que C ∞0 ((0, 1),C) ⊂ C ∞ per ([0, 1],C) ⊂ C 0([0,1],C).

5.73. Mostre que a família de funções ek ( x) = exp(2π ikx)k ∈Z, é um sistema orto-normal em

C 0([0,1],C), . 2

.

5.74. Mostre que a família de funções ek ( x) = exp(2π ikx)k ∈Z, é um sistema orto-gonal em H m([−1,1]) = (C m([−1, 1],C),,m), para m ≥ 0, onde

g, h

m =

k =m

∑k =0∂ k g,∂ k h

0, e

g, h

0 =

+1

−1

g( x)h( x)dx.

Page 229: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 229/371

5.4 Geometriade Pitágoras em dimensão infinita : bases ortonormais e representação de Fourier 223

O teorema de Weierstrass trigonométrico nos garante que a família de fun-ções ek ( x) = exp(2π ikx)k ∈Z gera um espaço denso em

C 0 per ([0, 1],C), . ∞

, ou

ainda, que os polinômios trigonométricos são densos neste espaço e, portanto, em

C 0([0,1],C),

.

2, e consequentemente em C 0([0,1],C)

.2= L 2([0,1],C)

.2=

L 2([0, 1],C). Faremos uma demonstração específica deste fato, sem apelar para oteorema geral, e com isto obteremos também resultados mais detalhados caracterís-ticos da Análise de Fourier.

Mostraremos que, na verdade, ek ( x) = exp(2π ikx)k ∈Z é uma base de Hilbertpara

C 0([0, 1],C), . 2

.

Teorema 5.25 (Séries de Fourier podem ser escritas para funções abstratas,mas sem compromisso de convergência de qualquer natureza !).

Se g ∈L p([0,1],C) = C 0([0,1],C). p

, p ≥ 1 , podemos escrever a série de Fourier para g que denotaremos por

S N (g)(t ) =

k = N

∑k =− N gk ek (t ) =

k = N

∑k = − N

g, ek ek (t ).

Prova. Seja gn uma sequência de Cauchy em

C 0([0,1],C), . p

que repre-

senta um elemento gn = g ∈L p([0,1],C). Usando a desigualdade de Hölder, po-

demos verificar que a sequência numérica1

0gn(s)ek (s)ds é de Cauchy, converge, e

que independe da sequência gk representante de g. Ainda mais, pelo mesmo argu-

mento, vemos que se g ∈C 0([0, 1],C), então limn→∞

1 0

gn(s)ek (s)ds =1

0g(s)ek (s)ds.

Portanto, podemos escrever a soma

S N (g)(t ) =

k = N

∑k =− N gk ek (t ) =

k = N

∑k =− N g, ek ek (t )

para qualquer N .

Embora possamos escrever a série de Fourier para funções em L p([0,1],C),nesta seção pretendemos apenas estudá-las para o caso clássico.

Teorema 5.26 (Teorema de Bessel-Fourier).

a) A família de funções ek (t ) = exp(2π ikx)k ∈Z é um sistema ortonormal em

C 0([0, 1],C), . 2

, e portanto, em C 0([0,1],C).2

=L 2([0, 1],C).

b) Se g ∈ C 0([0, 1],C).2 = L 2([0,1],C) , então podemos definir os coeficientesde Fourier

Page 230: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 230/371

224 5 Espaços de Hilbert

gk = g,ek =

1 0

g(s)exp(−2π iks)ds = limn→∞

1 0

gn(s) exp(−2π iks)ds,

onde

gn

é uma sequência de Cauchy em C 0([

0,1

],C

), . 2 que define g, eneste caso temos

∑−∞

| gk |2≤1

0

| g(s) |2 ds = limn→∞

1 0

| gn(s) |2 ds.

Prova. a) Exercício.

b) Basta aplicar a desigualdade de Bessel para o sistema ortonormal ek emC 0([0,1],C).

O teorema principal a ser demonstrado abaixo (Fourier-Dini) contem vários ar-gumentos que são tão importantes e cássicos em Análise quanto o seu próprio re-

sultado, e merecem uma atenção especial por parte do leitor. Por este motivo, taisargumentos serão apresentados como lemas ; a relevância de cada um pode ser indi-cada pelo nome associado a ele.

Lema 5.27 (Lema de Riemann).

a) Se g ∈ C m([0, 1],C), m ≥ 1 , então gk = g,ek =1

0g(t )e−2π ikt dt = O ( 1

k ) , para

k →∞.

b) Se g ∈ C m per ([0,1],C), m ≥ 1 , então gk =1

0g(t )e−2π ikt dt = 1

2π ik (∂ g)k =

1(2π ik )m

(∂ mg)k = O ( 1k m ) , para k → ∞.

c) Se g ∈ C m per ([0,1],C), m ≥ 1 , vale a fórmula operacional gk = 1

(2π ik )m (∂ mg)k ,

ou, (2π ik )m gk = (∂ mg)k .

d) Se g ∈L 1([0,1],C) = C 0([0, 1],C).1

, então, limk →∞

1 0

g( x)e−2π ikxdx = 0.

Prova. a) Integre por partes

gk =

1 0

g( x) exp(−2π ikx)dx

=

1

0 −1

2π ik

∂ x

g( x)exp(

−2π ikx)

+

1

2π ik (∂ xg( x) ) exp(

−2π ix)

dx

e verifique que

Page 231: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 231/371

5.4 Geometriade Pitágoras em dimensão infinita : bases ortonormais e representação de Fourier 225

| gk | =|1

0

g(t )e−2π ikxdx |

=| 1

−2π ik [g(1) −g(0)]− 1

−2π ik

1

0∂ g(t )e−

2π ikx

dx |≤ M

k .

b) Utilize o mesmo argumento acima recursivamente observando que ∂ ng(1) −∂ ng(0) = 0, para 0 ≤ n ≤ m, uma vez que g ∈ C m per ([0, 1],C).

c) Basta recolher os termos da integração por partes.

d) Observe que a integral1

0g( x)h( x)dx é definida para uma função h ∈C 0([0, 1],C)

pelo limite limn−→∞

1 0

gn( x)h( x)dx =1 0

g( x)h( x)dx, onde gn é uma sequência

de Cauchy em

C 0([0,1],C), . 1

que representa g ∈L 1([0,1],C). ComoC ∞([0, 1],C) é denso em

C 0([0, 1],C), . 1

, a sequência gn pode ser to-

mada neste subespaço. Usando agora a observação acima, a igualdade1

0

gn( x) exp(−2π ikx)dx

=

1 0

gn( x) −gm( x)exp(−2π ikx)dx +

1 0

gm( x) exp(−2π ikx)dx,

a desigualdade

| gn,ek |≤ gn −gm 1 + | gm,ek | ≤ ε + | gm,ek |,o limite n −→∞ e, posteriormente, o limite k −→∞, concluímos o desejado.

A fórmula que acabamos de obter,

gk =

1 0

g(t )e−2π ikt dt = 12π ik

(∂ g)k = 1

(2π ik )m (∂ mg)k ,

ou, (∂ mg)k = (2π ik )m gk , válida para g ∈ C m per ([0,1],C), m ≥ 1, é de fundamentalimportância para as aplicações da Análise de Fourier, como cálculo operacional emequações diferenciais ordinárias e parciais.

Exercício :

5.75. Mostre que se g ∈ C m per ([0,1],C), m ≥ 1, então ∂ n(S N (g)) = S N (∂ ng), 0 ≤ n ≤m, isto é, a série de Fourier da derivada é a derivada da série de Fourier de umafunção periódica continuamente diferenciável.

Page 232: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 232/371

226 5 Espaços de Hilbert

Lema 5.28 (Núcleo de Dirichlet).

Denominamos núcleo de Dirichlet a função D N (θ ) =k = N ∑

k =− N exp(ik θ ) , que pode ser

escrita como

D N (θ ) =k =∑

k =− N

exp(ik θ ) = e−iN θ − ei( N +1)θ

1− eiθ

= e

i2 θ (e−i 2 N +1

2 θ − ei 2 N +12 θ )

ei2 θ (e− i

2 θ − ei2 θ )

= sen( 2 N +1

2 θ )

sen( 12θ )

,

e ela satisfaz1

0

D N (2πζ )d ζ = 1.

Prova. Basta observar que D N provêm de uma sequência geométrica para a obten-

ção da fórmula e integrar a soma para concluir a segunda parte.

Lema 5.29 (Morse Simplificado).Seja g ∈C m([0, 1],C), m ≥ 1 , e a função G( x = 0, t ) = 1

x (g( x+t )−g(t )) , e G(0,t ) =

g(t ). Então G ∈ C m−1([0, 1]2,C).

Prova. Escreva, com o Teorema Fundamental do Cálculo,

g( x + t )− g(t ) =

1 0

g(t +θ x)d θ

x,

e observe que G( x,t ) =1

0g(t +θ x)d θ .

Teorema 5.30 (Teorema de Fourier-Dini).Se g ∈ C m per ([0,1],C), m ≥ 1 , então :

a) ∂ n(S N (g)) = S N (∂ ng), 0 ≤ n ≤ m, isto é, a série de Fourier da derivada é a

derivada da série de Fourier de uma função periódica continuamente diferen-ciável.

b) S N (g) converge uniformemente para g, isto é, S N (g) − g ∞→ 0 , e portanto,em particular, S N (g) −g 2→ 0.

c) S N (∂ ng) = ∂ n(S N (g)) converge uniformemente para ∂ ng, isto é,

∂ nS N (g)

−∂ ng ∞→ 0 , para todo 0 ≤ n ≤ m−1.

Prova. a) Exercício.

Page 233: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 233/371

5.4 Geometriade Pitágoras em dimensão infinita : bases ortonormais e representação de Fourier 227

b) Com base no Lema de Riemann, se m ≥ 1, usando a desigualdade de Cauchy-Schwartz em Cn, podemos escrever :

k = N

∑k =− N | gk

|≤

k = N

∑k =− N |

1

k || (∂ g)k |≤

k = N

∑k =− N |

1

k |2

k = N

∑k =− N | (∂ g)k

|,2

e, sabendo que as séries do último termo convergem (o primeiro fator pelo cál-culo elementar e o segundo pela Desigualdade de Bessel), concluímos que asérie do primeiro termo é de Cauchy, o que implica, por majoração, que a sé-

rie de Fourier S N (g)(t ) =k = N ∑

k =− N gk ek (t ) é de Cauchy na norma . ∞, ou seja,

converge uniformemente para uma função h ∈ C 0 per ([0, 1],C). Devemos agoramostrar que h = g. Para isto utilizaremos o argumento fundamental da teoria,escrevendo

S N (g)(t ) =k = N

∑k =

− N

gk ek (t ) =k = N

∑k =

− N

g, ek ek (t )

=k = N

∑k =− N

1 0

g(s)(exp(−2π iks)dsexp(2π ikt )

=

1 0

g(s)

k = N

∑k =− N

(exp(−2π iks) exp(2π ikt ))

ds

=

1 0

g(s)

k = N

∑k =− N

(exp(2π ik (t − s))

ds

=

1 0

D N (2π (s− t ))g(s)ds =

1 0

D N (2πζ )g(t +ζ )d ζ ,

onde fizemos uso da fórmula para o núcleo de Dirichlet. Observando agora que1

0 D N (2πζ )d ζ = 1, escrevemos

S N (g)(t )−g(t ) =

1 0

D N (2πζ ) (g(t +ζ ) −g(t ))d ζ

=

1 0

sen((2 N + 1)πζ )

sen(πζ ) (g(t +ζ ) −g(t ))d ζ ,

que pode ser escrito na forma

S N (g)(t ) −g(t ) =1

0

sen((2 N + 1)πζ ) ζ

sen(πζ )G(ζ , t )

d ζ .

Page 234: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 234/371

228 5 Espaços de Hilbert

Mas, como ζ sen(πζ ) é analítica, pelo Lema de Morse temos que ζ sen(πζ ) G(ζ ,t ) ∈C m−1([0, 1]2,C), e, portanto, de acordo com o Lema de Riemann, concluímosque, pontualmente, lim N →∞S N (g)(t ) = g(t ). Então g(t ) = h(t ), e concluímosque o limite é de fato uniforme.

c) Utilizando os resultados anteriores, concluímos o desejado neste item.

Exercícios :

5.76. Mostre que ek (t ) = exp(2π ikx)k ∈Z,éuma base de Schauder em (C 1 per ([0,1],C), . ∞).

5.77. Mostre que se h ∈C 0 per ([0, 1],C) e m∑

k =0ck ek −h ∞→ 0 então, necessariamente

devemos ter ck = hk = h, ek . Portanto, de acordo com o comentário histórico logoabaixo, ek não é uma base de Schauder em

C 0 per ([0, 1],C), . ∞

.

Finalmente obteremos o resultado desejado :

Teorema 5.31 (Teorema de Fourier : as funções trigonométricas formam umabase de Hilbert para L 2([0,1]|,C)). A família de funções ek (t ) = exp(2π ikx)k ∈Z é uma base ortonormal em

C 0([0,1],C).2

=L 2([0, 1],C).

Prova. O teorema de Fourier-Dini nos assegura que se g ∈ C m per ([0,1],C), então S N (g) − g ∞→ 0. Portanto, S N (g) − g 2→ 0, e, como C m per ([0,1],C) é densoemC 0([0, 1],C), . 2

, (v. exercício acima), concluímos que também é denso em

C 0([0,1],C).2

=L 2([0, 1],C), de onde vem o resultado desejado.

Teorema 5.32 (Teorema de Weierstrass - Trigonométrico).

a) Os polinômios trigonométricos P(sen2π t , cos2π t ) , onde P( x, y) é um polinô-mio de duas variáveis, são densos em

C 0 per ([0,1],R), . ∞

.

b) Os polinômios trigonométricos P(ek ,e−k ) = q(ek ) , onde P( x, y) é um polinômiode duas variáveis, e q(λ ) é uma função racional, são densos em (C 0 per ([0,1],C), . ∞).

Prova. a) Seja g ∈ C 1 per ([0,1],R) ⊂ C 0 per ([0, 1],C), então

g−k =

gk e, portanto,

g−k e−2π ikt = gk e2π ikt , de onde vem que S N (g)(t ) =

k = N ∑

k =− N

gk exp(2π ikt ) é real.

Se escrevermos gk = ck eiθ k , onde | gk |= ck , então,

Page 235: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 235/371

5.4 Geometriade Pitágoras em dimensão infinita : bases ortonormais e representação de Fourier 229

S N (g)(t ) = Re

k = N

∑k =− N

ck eiθ k exp(2π ikt )

= c0 +

k = N

∑k =1

ck 2 Re (exp(i(2π kt +θ k )))

= c0 + 2k = N

∑k =1

ck cos((2π kt +θ k ))

é um polinômio trigonométrico que aproxima g uniformemente pelo teoremade Fourier-Dini. Para provarmos que o resultado vale para g ∈ C 0 per ([0,1],R),aproximamos g uniformemente por um polinômio p(t ) pelo teorema cássicode Weierstrass e fazemos uma correção C ∞ nas extremidades para obtermosuma função g ∈ C ∞ per ([0, 1],R) que aproxima g. (Verifique a possibilidade destaconstrução por meio de funções do tipo rampa). Agora, basta utilizar o teoremade Fourier-Dini para g.

b) Para demonstrar b), utilizamos argumento semelhante nas partes real e imaginá-ria da função.

Observação 5.33. Observações históricas :

1. A Teoria de Fourier não tem por objetivo provar o Teorema de WeierstrassTrigonométrico, que pode ser obtido com menos esforço técnico pela gene-ralização de M. Stone para o teorema clássico de aproximação de Weierstrass(Apêndice, Capitulo II). De qualquer forma, este resultado é um subprodutointeressante da teoria.

2. A Teoria de Fourier se constitui em um dos núcleos básicos e centrais da análise,e da matemática, desde que foi inventada por Joseph Fourier em 1807. O seutrabalho inicial sobre o assunto foi recusado pela Academia de Ciências Fran-cesa através de um comitê formado por ninguém menos que Lagrange, Laplacee Legendre. O seu livro Théorie Analytique de la Chaleur , um dos maiores clás-sicos da matemática de todos os tempos, e que se originou deste trabalho, só foipublicado em 1822. Para um apanhado histórico do desenvolvimento desta teo-ria consulte o artigo supracitado de Coppel e a biografia de Fourier escrita porI. Grattan-Guiness.

3. A questão da convergência pontual das séries de Fourier foi o ponto de atritoque motivou a recusa do trabalho de Fourier. A trinca dos grandes L’s mencio-nados acima desprezou toda a intuição física e o extraordinário formalismo dotrabalho por causa de uma questão, matematicamente importante, sem dúvida,mas que na estrutura da teoria e nas aplicações representava apenas um detalhetécnico. É interessante notar o paralelo histórico entre a questão de convergên-cia pontual das séries de Fourier e a existência de elemento minimizante para o

princípio de Dirichlet ! ! Se houvesse um decreto real que impedisse a utilizaçãoe a aplicação de qualquer resultado matemático antes de sua demonstração pelacúpula cardinalícia, as séries de Fourier teriam sido mantidas em quarentena

Page 236: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 236/371

230 5 Espaços de Hilbert

até 1966, apesar de estudadas intensamente desde a época de Fourier, isto é,século e meio. Isto significaria que a maior parte do desenvolvimento tecnoló-gico elétrico, eletrônico e mecânico mais sofisticado, e da física moderna, esta-ria apenas em sua infância. Quem sabe com isto teríamos evitado que as duas

Guerras mundiais, dentre outras, utilizassem mais do que cavalos e canhões depólvora. É o lado otimista da questão. Kolmogorov (o do livro), mostrou emum trabalho histórico que existem funções em L 1([0, 1]) cuja série de Fourierdiverge em todos os pontos! ! Mas o espaço L 1 é muito maior do que o es-paçoL 2, que é um espaço de Hilbert e onde a teoria de Fourier é mais natural.Pois bem, em 1966, L. Carlson demonstrou finalmente que a série de Fourier deuma função de L 2 converge para quase todos os pontos, no sentido de que oconjunto dos pontos em que não ocorre a convergência tem medida nula. Mesmo funções contínuas periódicas tem séries de Fourier que divergem em inúmeros pontos. É interessante observar que o conceito generalizado de funções, quenão se preocupa neuroticamente com seus valores ponto a ponto, é amplamentecontemplado com esta abordagem.

5.5 Apêndice I

5.5.1 Teoria de Lax-Milgram : Extensão da Teoria de Riesz para FuncionaisQuadráticos

Introdução

Uma aplicação importante da Teoria de Riesz-Frechet, ou, poderíamos dizer, asua principal motivação analítica original, é proveniente da formulação variacionalabstrata de problemas clássicos de fronteira para equações diferenciais, especial-mente o famoso problema de Dirichlet.

A caracterização de soluções de problemas em equações diferenciais como umproblema variacional para um funcional não linear ϕ : H →R tem uma longa histó-ria, intimamente ligada ao início e subsequente desenvolvimento da Análise Fun-cional, e é originada dos chamados princípios variacionais da Física, através doque comumente se denomina equações variacionais de (Fermat-)Euler-Lagrange. Oprotótipo principal destas questões é o famoso princípio de Dirichlet, que relacionao problema de fronteira (chamado problema de Dirichlet), para o operador de La-place,

−∆u = f , em Ω ,

u = 0, em ∂Ω (fronteira de Ω ),

ao problema de determinar a função u que minimiza o funcional (quadrático)

J (v) = Ω

12 ∇v 2 − f v

dx,

Page 237: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 237/371

5.5 Apêndice I 231

no completamento do espaço H 0 = C 20(Ω ,R). O funcional acima é aplicado a fun-ções de duas variáveis, diferenciáveis, e com valores nulos na fronteira de Ω (di-tas admissíveis), e pode ser interpretado fisicamente como a energia potencial total(elástica + gravitacional) de uma membrana deformada de acordo com o gráfico de

v( x1, x2), quando submetida à uma distribuição de carga f . O princípio generalizadode Torricelli preconiza que o estado estacionário estável da membrana se dá a umaenergia potencial mínima, o que nos leva a concluir que sua posição de equilíbrioserá a função admissível v, dentre todas, que minimize o funcional J . Portanto, nestecaso, como em muitos outros, o modelo matemático é derivado de um problema va-riacional.

Para argumentar sobre a conexão entre este princípio variacional e as equaçõesde Euler-Lagrange correspondentes, suponha que u0 ∈C 2(Ω ) seja um minimizantedeste funcional. Então, para qualquer função h ∈ H 0, temos J (u0 + h) ≥ J (u0), ou,

J (u0 + h) − J (u0) =

Ω

∑∂ u0

∂ xk

∂ h∂ xk

+ 12 ∇h 2 − f h

dx =

= Ω (∆u0 − f )h +

12 ∇h 2≥ 0,

onde utilizamos o Teorema de Gauss (divergência) para passarmos do segundo parao último termo. Mas, observando a expressão acima, vemos que se o termo de pri-meira ordem em h (isto é, (∆u0 − f )), não for nulo, o sinal desta expressão é determi-nado por ele quando h for suficientemente “pequeno”. Em outras palavras, podemosconstruir uma função h ∈ C ∞0 (Ω ,R) que faça a última integral negativa (verifique).Portanto, concluímos que, necessariamente, se u0 minimiza o funcional J no es-paço em questão, então u0 é solução do problema de Dirichlet. Reconstituindo adesigualdade, podemos também concluir que as equações de Euler-Lagrange, nocaso acima, são condições suficientes para que u0 seja um elemento minimizante,mostrando assim a equivalência das duas formulações.

Em geral, um problema de equações diferenciais lineares é considerado sobcondições de fronteira homogêneas, isto é, uma função satisfaz a condições de fron-teira homogêneas se estiver no núcleo de operações lineares definidas na fronteira.No caso de condições de Dirichlet, a operação de fronteira consiste simplesmenteem restringir a função à fronteira ; no caso de Neumann consiste em calcular a suaderivada normal e restringí-la à fronteira, e etc. Portanto, uma equação diferencial Lu = f , (onde L é um operador diferencial linear e f uma função dada), sob taiscondições de fronteira, implica em considerá-la no espaço de funções que formamo núcleo da operação de fronteira, além de satisfazerem às condições adequadasde diferenciabilidade. Considerando-se agora um espaço auxiliar, chamado de fun-ções teste, multiplicamos a equação por estas funções, para transformá-la em umproblema do tipo Lu, h = f ,h, onde o termo à esquerda é uma forma bilinear B(u,h) = Lu, h, e o termo à direita, um funcional linear λ (h) = f ,h. Sob este

novo ponto de vista, o problema consiste em, dados o funcional linear λ e a formabilinear B, obter uma representação da primeira em termos da segunda, ou seja, ob-ter um u tal que ∀h, B(u, h) = λ (h). Neste caso u é denominada de solução fraca do

Page 238: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 238/371

232 5 Espaços de Hilbert

problema, que naturalmente depende do espaço de funções teste escolhido; quanto“menor” este espaço, mais “fraca” é a solução.para indicar o alcance que uma Teoriade Representação de Riesz-Fréchet generalizada tem para as aplicações.

O problema da escolha dos espaços funcionais, onde este problema pode ser

bem definido e resolvido, foi uma das questões básicas para o desenvolvimento daAnálise Funcional. Neste texto, abordaremos basicamente a questão abstrata e seusaspectos geométricos ; o estudo mais detalhado dos espaços funcionais relevantesficará para um outro volume.

Trataremos agora de algumas generalizações da teoria de Riesz-Fréchét parafuncionais quadráticos que abrangem uma vasta classe de problemas em equaçõesdiferenciais. Em capítulos seguintes, voltaremos a estas questões, e no último capí-tulo, abordaremos problemas variacionais com funcionais mais gerais.

A teoria a ser apresentada aqui em suas linhas mais elementares, mas essen-ciais, é devida aos trabalhos de Peter Lax (outro extraordinário matemático húngaro-americano) que é “neto” matemático de Hilbert, via Courant, e à escola franco-italiana liderada por Jacques-Louis Lions (~†2003) e Guido Stampacchia (†1994),que estão entre os principais construtores da moderna teoria aplicável de equações

diferenciais parciais.A peça fundamental para definirmos os funcionais com as diversas propriedades

desejadas, são as funções bilineares, que passaremos a descrever.

Definição 5.34 (Funções Bilineares).Se ( H ,,) for um espaço real com produto interno, uma função B : H × H →R é bilinear, se for linear em ambas as variáveis, isto é, se

B(c1u + c2v, w) = c1 B(u, w) + c2 B(v,w) e B(w,c1u + c2v) = c1 B(w, u) + c2 B(w,v).

Além disso, sendo ela bilinear,

1. Ela é bilinear simétrica se B(u,w) = B(u, w).

2. Ela é bilinear limitada se existir um número M > 0 tal que, ∀h1, h2 ∈ H, tenha-mos | B(h1,h2) |≤ M h1 h2 , ou seja, se for limitada em S 1 ×S 1.

3a. Ela é bilinear positiva se, ∀h ∈ H −0 , tenhamos B(h,h) ≥ 0.

3b. Ela é bilinear positiva definida se, ∀h ∈ H − 0 , tenhamos B(h,h) > 0 , ouequivalentemente, se ∀h ∈ S 1 , tenhamos B(h,h) > 0.

4. Ela é bilinear coerciva se existir um número m > 0 , tal que, ∀h ∈ H, tenhamos B(h, h) ≥ m h 2 , ou equivalentemente, ∀h ∈ S 1, B(h, h) ≥ m.

5. Denominamos simetrização de B, e denotamos por Bs , à forma bilinear definida por Bs = 1

2 ( B + BT ), Bs(u, v) = 12 ( B(u, v) + B(v, u)) , onde a forma bilinear BT é

chamada de transposta de B e definida por BT (u,v) = B(v, u). À forma bilinear Ba = 1

2 ( B − BT ) denominamos de antisimetrização de B. Estas definições sãoanálogas às da álgebra linear de dimensão finita.

6. Se λ : H → R for um funcional linear, dizemos que o funcional J : H → R , J (h) = B(h,h) +λ (h) , é um funcional quadrático.

Page 239: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 239/371

5.5 Apêndice I 233

Definição 5.35 (Operador Monotônico). Dizemos ainda que um operador linear T : H → H é :

a) Monotônico, se T h,h ≥ 0 , ∀h ∈ H.

b) Estritamente monotônico, seT h, h

> 0 ,

∀h

∈ H, h

= 0.

c) Uniformemente monotônico, se existe m > 0 tal que T h,h ≥ m h 2.

Observação 5.36. 1. Em particular, uma função bilinear, simétrica, e positiva de-finida é um produto interno em um espaço vetorial real.

2. Em um espaço vetorial complexo, uma função B : H × H →C é dita forma qua-drática hermitiana se for linear na primeira variável e admite simetria conju-gada, isto é, B(u, w) = B(w,u). Um produto interno é uma forma hermitianapositiva definida.

3. Todas estas definições prescindem da estrutura de produto interno e, portanto,podem ser repetidas literalmente para um espaço vetorial normado. Na verdade,

apenas a definição de continuidade e coercividade exigem o conceito de norma.

Para adquirir um pouco de familiaridade com estas funções, analisemos algumasde suas propriedades por intermédio dos exercícios abaixo.

Exercícios :

5.78. Mostre que toda função bilinear B : E × E → R é contínua se, e somente se,for limitada na esfera unitária S 1 ×S 1, ou na bola unitária B1 × B1.

5.79. Mostre que em um espaço normado de dimensão finita, (E , . ), todas asfunções bilineares são contínuas, e as positivas definidas são coercivas, e que todasas funções bilineares são da forma B(g, h) =

Ag,h

, onde

,

é o produto interno

usual e A é uma transformação linear de E .

5.80. Mostre que qualquer função linear T : Rn→Rn produzirá uma função bilinear ,contínua do tipo B(u,v) = Tu, v (produto interno usual), e se B for coerciva, istoé, se T for uniformemente monotônica, então T será um isomorfismo.

5.81. Por outro lado, sugira um exemplo de T isomorfismo que não seja estritamentemonotônico ; de fato, sugira uma T : Rn→Rn linear, bijetiva, tal que T h, h. =0,∀h ∈ H . Interprete geometricamente o conceito de monotonicidade para T .

5.82. Mostre que um operador linear limitado é necessariamente radialmente limi-tado (no sentido que existe uma constante positiva C tal que | T h,h |≤ C h 2

, ∀h ∈ H ), mas a recíproca nem sempre é verdadeira. Sugestão : considere o opera-dor T = ∂ x = d

dx

no espaço C ∞

0 (R,R), com produto interno

h, g

= h( x)g( x)dx,

para o qual T h, h = 0, mas, é fácil construir hn( x) = cos nx, −π + ε ≤ x ≤ π -ε , ehn( x) = 0, x /∈ (−π − ε ,π +ε ), hn ∈C ∞0 (R,R), com T hn ≥ n.

Page 240: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 240/371

234 5 Espaços de Hilbert

5.83. Mostre que em um espaço de dimensão finita, se T for estritamente monotô-nica, ela também será uniformemente monotônica e, portanto, um isomorfismo.

5.84. Mostre que se H for um espaço com produto interno qualquer e B : H × H →Rfor uma função bilinear e contínua, então, para cada w

∈ H , a função Bw : H

→ H , Bw(h) = B(w,h), é linear e contínua (limitada), ou seja, Bw ∈ H ∗.

5.85. Mostre que, de acordo com o exercício anterior, se H for espaço de Hilbert,podemos definir uma função β : H → H ∗, β (w) = Bw, que é linear e contínua (limi-tada), e que pelo teorema de representação de Riesz, podemos definir uma funçãolinear limitada A : H → H , tal que h, A(w) = β w(h) = B(w, h),∀h ∈ H .

5.86. Demonstre o seguinte Lema de Lax-Milgram em dimensão finita :“Se B : H × H →R for uma função bilinear, contínua e coerciva em um espaço deHilbert H de dimensão finita, então para todo funcional linear λ ∈ H ∗ existe umúnico elemento w ∈ H tal que λ (h) = B(w,h), ou seja, existe uma função linearbijetora A : H → H tal que B(w,h) = h, Aw, ∀h, w ∈ H ”.

5.87. Considere o espaço (pré) Hilbert C ∞0 (R,R),

g,h

=

+∞

−∞g( x)h( x)dx, e o ope-

rador linear L : C ∞0 (R,R) → C ∞0 (R,R), onde Lu = −∂ ( p( x)∂ u) + q( x)u, com p,q ∈C ∞(R,C) e p( x) > 0. Mostre que L não é limitada, mas B[g,h] = Lg,h é uma fun-ção bilinear. Se q( x) > 0 para todos x ∈ R, mostre que B[, ] é positiva definida, (istoé, B[h, h] ≥ 0 e B[h,h] = 0 ⇐⇒ h = 0), usando integração por partes. Neste caso,então, B[, ] é um produto interno, que pode ser descrito como :

B[g,h] =

1 0

p( x)∂ g( x)∂ h( x) + q( x)g( x)h( x)dx.

Obtenha a desigualdade de C-B-Schwartz neste contexto.

5.88. Mostre que em um espaço com produto interno, uma função bilinear, simé-

trica, coerciva, define um novo produto interno, cuja topologia é mais forte do que ado produto interno nativo. Mostre que se esta função bilinear for também contínua,as duas normas são equivalentes.

5.89. Considere um funcional quadrático do tipo J : H → H , J (h) = B(h,h) +λ (h),onde B é um funcional bilinear e λ um funcional linear. Mostre que se w minimizao funcional J então para qualquer h ∈ H temos, pelo Teorema de Fermat (o útil),

d dt

J (w + th) |t =o= B(h, w) + B(h,w) +λ (h) = 0.

Em vista do exercício acima, definiremos a derivada variacional de um fun-cional quadrático, o que nos dará uma confortável e útil semelhança formal como Teorema de Fermat para mínimos. O desenvolvimento completo do conceito de

derivadas variacionais (ou simplesmente derivadas) de funcionais não lineares emgeral será feito no último capitulo.

Page 241: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 241/371

5.5 Apêndice I 235

Definição 5.37 (Derivada variacional de um funcional quadrático).Se B : H × H →R for uma função bilinear em um espaço com produto interno H, eλ : H → R, um funcional linear, definimos como derivada variacional do funcionalquadrático J (h) = B (h) +λ (h) em w ∈ H, à operação linear denotada por δ J (w)

ou ∂ J (w) : H → H, ∂ J (w)h = B(w, h) + B(h,w) +λ (h) , isto é, em geral, ∂ J (u0)h =2 Bs(u0,h) +λ (h) , também denotada por ∂ J (u0) = 2 Bs(u0, ·) +λ .

Observação 5.38. 1. Se B for simétrica, é claro que ∂ J (w)h = 2 B(w,h) +λ (h).

2. Se J 1 e J 2 forem dois funcionais quadráticos, é claro que ∂ (cJ 1 + J 2) = c∂ J 1 +∂ J 2.

3. A derivada variacional reproduz exatamente o conceito de derivada direcional,isto é, ∂ J (w)h = d

dt J (w + th) |t =0.

4. Também podemos dizer que, no caso em que B e λ forem contínuas (limitadas),a derivada variacional reproduz exatamente o conceito de derivada no seguintesentido :

J (w + h) = J (w) +∂ J (w)h + o( h )

onde o símbolo o(r ) representa uma função qualquer ε (r ) que se aproxima dezero mais rápido do que r → 0, ou seja, é de ordem menor do que r quandor → 0, e significa que limr →0

ε (r )r = 0.

5. A derivada direcional de um funcional quadrático nemdimensão finita, a de-rivada de um funcional quadrático (isto é, uma função quadrática), tambémsempre existe. Entretanto, em dimensão infinita, a não uniformidade do limiteque caracteriza a derivada direcional com a variação da “direção”, pode impe-dir a existência da derivada. Isto já acontece no plano para funções não qua-dráticas. Para que exista a derivada do funcional quadrático, é necessário e su-ficiente que a função bilinear seja radialmente limitada na esfera, isto é, que

B(h, h) ≤ M h 2

para algum M e todos os h ∈ H .6. A definição de derivada variacional pode ser literalmente repetida para espa-ços vetoriais quaisquer, mesmo sem topologia. Entretanto, como veremos maisadiante, nos interessa de fato o caso em que a derivada variacional é uma aproxi-mação no sentido J (w + h) = J (w) +∂ J (w)h + o( h ), em que o conceito denorma é indispensável. No último capítulo, trataremos destas derivadas parafunções mais gerais em espaços normados.

Exercícios :

5.90. Verifique todas as afirmações acima.

5.91. Obtenha as derivadas variacionais dos seguintes funcionais quadráticos :

a) B[g,h] =1

0 p( x)∂ g( x)∂ h( x) + q( x)g( x)h( x)dx,

Page 242: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 242/371

236 5 Espaços de Hilbert

b) B(u, v) = Ω ∑i, j

Ai j( x)(∂ iu)(∂ jv) + q( x)uv, onde Ai j( x1,... xn) é uma matriz si-

métrica e ∂ k = ∂ ∂ xk

.

5.5.2 O problema variacional para funcionais quadráticos

Desenvolveremos agora um programa semelhante ao que foi apresentado naTeoria de Riesz-Fréchet, para analisar os problemas variacionais com funcionaisquadráticos, isto é, analisaremos os seguintes itens :

1. Existência de valor mínimo do funcional,

2. Unicidade do elemento minimizante (via convexidade estrita),

3. Condições necessárias para um elemento minimizante,

a) Funcional definido em subespaços (teorema de Fermat) - representação de funcionais lineares,

b) Funcional definido em convexos (inequação variacional de Stampacchia),

4. Condições suficientes para que um elemento minimizante : representação de funcionais lineares (Fermat e Stampacchia),

5. Existência de elemento minimizante e sua conexão com o problema de repre-sentação : Teorema de Lax-Milgram,

6. Teorema de Stampacchia para existência de minimizantes de funcionais emconvexos.

Para que um problema variacional possa ser bem definido com um funcional J : K → R, a primeira condição necessária, e óbvia, é que exista o inf h∈ A J (h), ouseja, que o funcional tenha limitação inferior e exista um número m0 tal que J (h)

≥m0,∀h ∈ K , onde K é subconjunto convexo de um espaço com produto interno H .

Teorema 5.39 (Existência de limitação inferior).Seja J : A ⊂ H → R um funcional quadrático, J (h) = B(h, h) + λ (h) , onde A é um subconjunto convexo do espaço com produto interno H. Se B for uma funçãobilinear positiva e coerciva e λ um funcional linear limitado, então, existe limitanteinferior m0 para J, isto é, existe m0 , tal que J (h) ≥ m, ∀h ∈ H.

Prova. Basta escrever a desigualdade J (h) = B(h, h) +λ (h) ≥ m h 2 − λ 0h ≥ − (λ 0)2

4m = m0.

Este teorema pode ser repetido literalmente para funcionais quadráticos em es-paços normados.

Page 243: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 243/371

5.5 Apêndice I 237

Teorema 5.40 (Unicidade do minimizante - Solução do problema variacional).Seja J : A ⊂ H →R um funcional quadrático, J (h) = B(h, h) +λ (h) , onde A é umsubconjunto convexo do espaço com produto interno H. Se B for positiva definida,então J é estritamente convexo e, portanto, se existir um minimizante, ele é único.

Prova. Considere h,δ ∈ H ,δ = 0, e o polinômio de segundo grau em t ,

p(t ) = J (h + t δ ) = B(h + t δ , h + t δ ) +λ (h + t δ )

= B(h, h) +λ (h) + t ( B(h,δ ) + B(δ ,h) +λ (δ )) + t 2 B(δ ,δ ).

Como δ = 0, temos que B(δ ,δ ) > 0, de onde concluímos que o polinômio p(t )é uma função estritamente convexa (uma parábola com as mãos para cima !), e,portanto, para t ∈ (0,1), temos p(t ) < p(0) + t ( p(1) − p(0)). Ora, mas esta é exa-tamente a desigualdade que desejávamos provar. Que um funcional estritamenteconvexo pode ter apenas um minimizante, pode ser verificado pelo leitor.

Teorema 5.41 (Condições necessárias para o minimizante : Fermat & Stampac-chia).Sejam,

a) J : H →R um funcional quadrático, J (h) = B(h, h) +λ (h) , ou,

b) J : A ⊂ H → R um funcional quadrático, J (h) = B(h, h) +λ (h) , onde A é umsubconjunto convexo do espaço com produto interno H.

Se existir um minimizante u0 do funcional, então, respectivamente,

a) Ele satisfaz à equação variacional : ∂ J (u0) = 0 (condição de Fermat).

b) Ele satisfaz à inequação variacional : ∂ J (u0)(a−u0) ≥ 0 (condição de Stam- pacchia).

Prova. a) Basta desenvolver a perturbação do mínimo e fazer uso do argumento

de Fermat. Portanto, se δ for um elemento qualquer de H , escrevemos J (h + t δ ) = B(h + t δ ,h + t δ ) +λ (h + t δ )

= B(h,h) +λ (h) + t ( B(h,δ ) + B(δ ,h) +λ (δ )) + t 2 B(δ ,δ ),

e daí,

0 ≤ J (h + t δ )− J (u0) = t ( B(u0,δ ) + B(δ , u0) +λ (δ )) + t 2 B(δ ,δ ) = p(t )

e observamos que o polinômio quadrático à direita só poderá ser positivo parat ∈ (−ε ,ε ) se o coeficiente do termo linear for nulo para qualquer δ ∈ H , isto é,∀δ ∈ H , ∂ J (u0)δ = B(u0,δ )+ B(δ ,u0)+λ (δ ) = 0, o que significa ∂ J (u0) = 0.

b) Repetindo a expansão acima com δ tal que a = u0 +δ ∈ A, e, portanto u0 +t δ ∈ A se t ∈ (0, 1), concluímos, de maneira análoga, mas agora utilizando apenasvalores positivos de t , que, necessariamente, devemos ter B(u0,δ ) + B(δ , u0) +λ (δ ) = ∂ J (u0)(a−u0) ≥ 0, ∀a ∈ A.

Page 244: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 244/371

238 5 Espaços de Hilbert

Observação 5.42. A equação variacional de Fermat pode, e em muitos casos deve,ser interpretada sob o ponto de vista do Teorema de Representação de Riesz-Frechet,isto é, u0 é de fato a representação do funcional linear −λ , “dado” por meio da fun-ção bilinear simetrizada Bs(u,v) = 1

2 B(u, v) + B(v, u), como −λ (h) = 2 Bs(u0,h).

Exercício :

5.92. Interprete geometricamente a inequação variacional de Stampacchia em ter-mos de hiperplanos.

Teorema 5.43 (Condição suficiente para caracterização do minimizante - Fer-mat e Stampacchia).Sejam, B : H × H →R uma função bilinear positiva e,

a) J : H →R um funcional quadrático, J (h) = B(h, h) +λ (h) , ou,

b) J : A⊂

H →R um funcional quadrático, J (h) = B(h, h) +λ (h) , onde A é um

subconjunto convexo do espaço com produto interno H.

Se o elemento u0 ∈ H, satisfizer à

a) Equação variacional de Fermat : ∂ J (u0) = 0 , ou à

b) Inequação variacional de Stampacchia : ∂ J (u0)(a−u0) ≥ 0 ,

Então, respectivamente, u0 será uma solução do problema variacional (minimi- zante) para o funcional J a) em H ; ou, b) em A.

Prova. a) Reconstituindo a expansão para J (u0 +t δ ) como no caso anterior, agorasob as hipóteses de que J (u0)δ = 0 e que B(δ ,δ ) ≥ 0, concluímos imediata-mente que, neste caso, u0 será um minimizante. Observe que se B for posi-tiva definida, o minimizante será também único, o que já foi demonstrado porconvexidade.

b) Argumento análogo pode ser apresentado para este caso também.

Observação 5.44. As condições de Fermat e Stampacchia podem ser literalmenterepetidas em espaços normados. Aliás, até este ponto, todos os conceitos e resul-tados desta seção poderiam ser literalmente repetidos no contexto geral de espaçosnormados, e alguns em espaços vetoriais simplesmente. De agora em diante, entre-tanto, usaremos de maneira crucial a estrutura geométrico-topológica (de produtointerno e de completude) de um espaço de Hilbert.

Antes de abordarmos o teorema seguinte, é interessante analisar geometrica-

mente a seguinte questão :

Exercícios :

Page 245: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 245/371

5.5 Apêndice I 239

5.93. Considere o funcional quadrático J (u) = u 2 +α , u, onde a forma bilinearé o próprio produto interno, e a parte linear é representada (sob o aval de Riesz-Fréchet) por um produto interno com um vetor unitário fixo α . Interprete e analisegeometricamente o problema variacional para este funcional, obtenha a sua solução

u0, e mostre que inf h∈ H J (h) = −14 = J (u0) = − u0

2

.5.94. Mostre que se uma função bilinear em um espaço com produto interno, B : H × H → R, for contínua (| B(u,v) |≤ M u v ) e coerciva (| B(h, h) |≥ m h 2), então ela será necessariamente positiva definida ou negativa definida, ou seja, B(h,h) não pode trocar de sinal na esfera unitária. Sugestão : use geometria analíticaplana, as funções trigonométricas e o teorema de valor intermadiário.

Lema 5.45 (Lema de Lax-Milgram - Representação de funcionais lineares porformas bilineares).Sejam ( H ,,) um espaço de Hilbert, B : H × H →R uma função bilinear, contínuae coerciva, e λ

∈ H ∗. Então, existe um único elemento u0

∈ H que representa λ

como um funcional linear pela forma bilinear B, isto é, B (u0, h) = λ (h),∀h ∈ H.

Prova. Observemos inicialmente que a forma bilinear simetrizada Bs é igualmentecontínua e coerciva, e simétrica, claro. Além disso, Bs tem sinal definido (peloexercício acima), e iremos supor que seja positiva definida. Caso contrário, consi-dere − B. Portanto, podemos definir um novo produto interno em H por meio de Bs(u, v) = u, vs, e a norma correspondente será u s=

Bs(u, u) =

B(u,u).

Observemos em seguida que, pela continuidade de B de um lado, e pela coercivi-dade de outro, podemos concluir que as duas normas são equivalentes. De fato, porestas hipóteses, existem números positivos m e M , tais que ∀h ∈ H , m h 2≤h 2

s =| B(h,h) |≤ M h 2, e portanto, λ é igualmente contínua neste novo produtointerno. Apelando para o Teorema de Riesz-Fréchét neste contexto, podemos garan-tir que existe um único elemento u0 que representa

−λ neste produto interno, ou

seja, ∀h ∈ H temos 2 Bs(u0,h) +λ (h) = B(u0, h) + B(h, u0) +λ (h) = ∂ J (u0)h = 0.

Finalmente, estamos em condições de demonstrar um teorema que realiza o pro-grama de Riesz para funcionais quadráticos.

Teorema 5.46 (Teorema de Lax-Milgram - Existência de minimizante).Sejam ( H ,,) um espaço de Hilbert, B : H × H →R uma função bilinear, contínua, positiva, coerciva, λ ∈ H ∗ , e o funcional quadrático

J : H →R, J (h) = B(h,h) +λ (h).

Então,

1. Existe um limitante inferior para J, isto é, existe inf h∈ H J (h) ,

Page 246: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 246/371

240 5 Espaços de Hilbert

2. Se existir, a solução do problema variacional é única,

3. A solução u0 do problema variacional satisfaz necessariamente à condição deFermat, ou seja, é solução da equação ∂ J (u0) = 0 , ou, equivalentemente, u0 é um elemento representante do funcional linear

−λ na forma bilinear simetri-

zada Bs = 12 B + BT .4. A condição de Fermat é também suficiente, isto é, ∂ J (u0) = 0 ⇒ J (u0) =

inf h∈ H J (h).

5. Existe uma solução do problema variacional inf h∈ H J (h) , isto é, existe umminimizante, u0 , e inf h∈ H J (h) = J (u0) = − B(u0, u0).

6. Se un for uma se´ quência minimizante para o funcional J, isto é, limn→∞ J (un) =inf h∈ H J (h) , então un converge para a solução do problema variacional u0 , e aconvergência se dá na forma un − u0 = 1

m | | J (un)− J (u0) | , ou seja, aaproximação da solução se dá na ordem da raiz quadrada da aproximação dovalor mínimo.

Prova. Os itens 1-2-3-4 são os resultados dos respectivos últimos 5 teoremas acima,

uma vez que a função bilinear satisfaz a todos os requisitos exigidos.Para demonstrarmos o item 5, apelamos para o Lema de Lax-Milgram, deonde nos vem o elemento u0 que representa −1

2λ na forma bilinear Bs, e forneceuma solução da equação de Fermat, ou seja, ∀h ∈ H , temos 2 Bs(u0,h) +λ (h) = B(u0,h) + B(h,u0) +λ (h) = ∂ J (u0)h = 0. Portanto, pelo item 4, concluímos queesta é a solução única do problema variacional. Calculando J (h) por meio da re-presentação de λ , λ (h) = −2 Bs(u0,h), λ (u0) = − B(u0, u0), obtemos que J (u0) =inf h∈ H J (h) = B(u0,u0) + (−2 B(u0,u0) = − B(u0,u0).

O item 6 provêm da coercividade : J (un) − J (u0) = B(un, un) − 2 Bs(u0, un) −(− B(u0, u0)) = B(un −u0,un −u0) ≥ m un −u0 2, de onde tiramos

un −u0 = 1m

|

| J (un) − J (u0) | = O (

| J (un) − J (u0) |).

Observação 5.47. 1. Devido à enorme importância do Teorema de Lax-Milgram edos próprios argumentos utilizados na sua demonstração, optamos por dissecá-la em partes menores, para que pudéssemos realçar cada um destes argumentosperante a atenção do leitor, que certamente os encontrará em outras inúmerassituações. Este é um caso antológico em que a demonstração chega a ser quasetão importante quanto o teorema.

2. É claro que poderíamos ser muito mais concisos se o nosso único objetivo fosseo enunciado do resultado, como aliás é feito com frequência em textos maisbourbakistas. O leitor pode escrever o Teorema de Lax-Milgram e demonstrá-lo em duas páginas ou menos se assim o desejar, e se tiver uma compreensão

completa dos argumentos.3. A aplicação primordial deste teorema e a sua motivação inicial está no estudode problemas de fronteira para equações diferenciais parcias do tipo elíptico.

Page 247: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 247/371

5.5 Apêndice I 241

Historicamente, o protótipo destas questões é o problema de Dirichlet para aequação de Laplace não homogênea (Poisson), que já introduzimos no iníciodesta seção. Não desenvolveremos estas aplicações no texto principal destas no-tas para não sobrecarregá-las com material exterior ao programa do curso, mas

convidamos o leitor para chegar até ao apêndice, onde encontrará um exemplorepresentativo do assunto.

4. O Lema de Lax-Milgram e suas consequências são particularmente importantesna produção de soluções de equações lineares do tipo Lu = f . O procedimentoneste caso consiste em definir uma função bilinear

B(u,v) = Lu, v

e uma função linear λ (h) = f ,h. Se o operador L satisfizer a certas condi-ções que tornam a função bilinear apropriada ao uso do Lema de Lax-Milgram,podemos então assumir a existência de um w0 ∈ H tal que B(w0, h) = f ,h,ou seja, Lw0 − f ,h = 0,∀h ∈ H , o que torna naturalmente o elemento w0

um candidato natural a solução da equação linear. Este tipo de solução é de-

nominada de solução fraca e depende, claro, do espaço H , que é tomado, depreferência, “pequeno e bem administrável”. Se H for o espaço de Hilbert ondese procura a solução, e Lw0 − f ,h = 0,∀h ∈ H , então, necessariamente deve-mos ter Lw0 = f , (pois podemos em particular tomar h = Lw0 − f ), ou seja, w0

será uma solução de fato. Em geral, esta não é a situação.

5. O problema variacional convexo pode ser também tratado sob o ponto de vistada inequação variacional de Stampacchia de maneira análoga ao Teorema deLax-Milgram, mas optamos por não apresentá-lo no texto principal das notas.Veja o apêndice ou as notas de Stampacchia citadas abaixo.

6. Referências :

Históricos :

A. Monna, Dirichlet’s Principle : A Mathematical Comedy of Errors and its Influence on the Development of Analysis, North-Holland, 1975.L. Garding, The Dirichlet Problem, Math. Intell. 2(1), 1979, 43-53.

Histórico-Clássico :R. Courant, Dirichlet’s Principle, Conformal Mapping and the Minimal Sur- faces, J. Wiley 1948.

Clássico :R. Courant, D. Hilbert, Methods of Mathematical Physics, vol I., Springer-Verlag.

Clássicos-Modernos :L. Bers, F. John, M. Schechter, Partial Differential Equations, J.Wiley, 1959.S. Mikhlin, The Problem of the Minimum of a Quadratic Functional , Holden-Day, 1965.

Page 248: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 248/371

242 5 Espaços de Hilbert

S. Mikhlin, Advanced Mathematical Physics, North-Holland, 1968.

Modernos :G. Folland, Partial Differential Equations, Princeton U.P., 1975.

R. Dautray, J. L. Lions, Analyse Mathématique et Numerique, Masson, 1980.G. Stampacchia, Introducción a las Ecuaciones en Derivadas Parciales e In-ecuaciones Variacionales, Inst. “Beppo-Levi”, Univ. Rosário, Argentina, 1971.E. Zeidler, Applied Functional Analysis, Springer, 1996.

Exercícios :

5.95. Considere o funcional quadrático Q(h) = 12 B(h,h) −λ (h), onde B é bilinear,

simétrica, contínua e coerciva. Para cada h ∈ H − 0, tomemos os valores de Qsobre a reta th, Q(th) = 1

2 B(th, th) −λ (th) = p(t ). Mostre que o valor mínimo deQ(th) se dá em t 0(h) e vale m(h), onde,

t 0(h) = λ (h)

B(h,h), m(h) =

−12

(λ (h))2

B(h,h) .

5.96. Mostre que o valor mínimo depende apenas da “direção” do vetor h e não desua magnitude, isto é, se h =| h | h0 onde h0 ∈ S 1 = esfera unitá ria, então, m(h) =m(h0).

5.97. Mostre, com base no exercício anterior, que o problema variacional para o fun-cional J em todo o espaço H pode ser escrito equivalentemente como um problemavariacional para o funcional J ∗(v) = (λ (v))2 na “elipse” unitária, isto é,

minh0∈h, B(h,h)=1

J ∗(h0) = inf h∈ H

J (h).

5.6 Apêndice II : Espaços funcionais de Hilbert-Sobolev

Consideraremos aqui espaços completados com as normas de Sobolev emconjuntos limitados. Nos restrigiremos à funções na reta para simplificar questõestécnicas, mas argumentos semelhantes podem ser aplicados a funções com domínioem Rn.

Em C N ([0,1],C), definiremos os produtos internos

g,h

0 =

1

0

g(s)h(s)ds

e

Page 249: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 249/371

5.6 Apêndice II : Espaços funcionais de Hilbert-Sobolev 243

g, hm =k =m

∑k =0

∂ ng,∂ nh0 =k =m

∑k =0

1 0

∂ ng(s)∂ nh(s)ds,

para 0

≤m

≤ N , suas respectivas normas

h

2,m, e os espaços de Hilbert-Sobolev :

1. H m0 ([0,1]) = C ∞0 ((0,1),C).2,m

.

2. H m per ([0,1]) = C ∞ per ([0,1],C).2,m

.

3. H m([0,1]) = C ∞([0,1],C).2,m

.

Observação 5.48. 1. H m0 ([0,1]) ⊂ L 2([0, 1]) = H 00 ([0,1]) = H 0([0, 1]), pois se-quências de Cauchy em C ∞0 ((0, 1),C), na norma . 2,m, são obviamente se-quências de Cauchy na norma

.

2, mas o inverso não vale. (Imagine um exem-plo com m = 1 ! !). Além disto, temos H m+10 ([0, 1]) ⊂ H m0 ([0,1]), H m+1([0,1]) ⊂ H m([0,1]), e estas continências são estritas, e não, igualdades.

2. H m0 ([0,1]) ⊂ H m per ([0,1]). A inclusão é clara por conta da continência dos espa-ços base. Para mostrar que, na verdade, são distintos, tomamos m = 1. Considere

agora, a função constante g ∈ H 1([0,1]) = C ∞([0, 1],C).2,1 , onde g( x) = 1.

Suponha agora que hn seja uma sequência de Cauchy de C ∞0 ((0,1),C).2,1 ,

equivalente a g. Mas então, hn − 1 2→ 0, assim como ∂ hn − ∂ g 2=∂ hn 2→ 0. Desta última, concluímos que

hn ∞≤ sup | hn( x) |= sup | x

0

∂ hn(s)ds |≤ ∂ hn 22,

usando a desigualdade de Schwartz para integrais no penúltimo termo. Masentão, hn ∞→ 0 e isto é incompatível com hn − g 2→ 0. Este espaço échamado espaço das funções generalizadas com condições de fronteira nulas,ou com traço nulo.

3. H m per ([0,1]) ⊂ H m([0, 1]). Mais uma vez, a continência é óbviamente herdadada mesma relação dos espaços base, C ∞ per ([0, 1],C) ⊂ C ∞([0,1],C). Para provarque são distintos tomemos agora g ∈ C ∞([0, 1],C),g( x) = x. Suponhamos que

hn seja uma sequência de Cauchy de C ∞ per ((0, 1),C).2,1

equivalente à g.Mas então, hn − x 2→ 0, assim como ∂ hn −∂ g 2= ∂ hn −1 2→ 0. Então

sup

|hn( x)

− x

|≤|hn(0)

|+sup

|

x

0

∂ hn(s)

−1

|ds

≤|hn(0)

|+

∂ hn

−1

2 .

Mas, hn(0) = hn(1) e, portanto, da desigualdade acima vem

Page 250: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 250/371

244 5 Espaços de Hilbert

| hn(0) −1 |=| hn(1)− 1 |≤ sup | hn( x) − x |≤| hn(0) | + ∂ hn −1 2 .

Mas a desigualdade entre os termos extremos é insustentável quando ∂ hn −1 2→ ∞.

O espaço de Sobolev H m per ([0,1]) é denominado espaço das funções generaliza-das com condições periódicas na fronteira e, H m([0,1]) é o espaço de Sobolev-Hilbert de ordem m.Analisaremos mais adiante estas inclusões com respeito à isometria que existeentreL 2([0, 1],C) e l2(C) por meio da base de Fourier.

Exercícios :

5.98. Mostre que se um espaço de Hilbert H contêm um subespaço fechado H 0 ⊂ H ,(logo, também de Hilbert), então, uma isometria i : H → l2(C) deverá levar H 0 emum subespaço fechado (de Hilbert) de l2(C).

5.99. Mostre que a base de Fourier ek ( x) = exp(2π ikx)k ∈Z para L 2([0,1],C) éum sistema ortogonal nos espaços de Sobolev-Hilbert de ordem m ≥ 1 e, E k ( x) =

1√ 1+(2π n2)

exp(2π ikx), é um sistema ortonormal em H 1([0,1]).

5.100. Mostre que se g ∈ C m per ([0,1],C), então, S m N (∂ ng) = ∂ nS m N (g), 0 ≤ n ≤ m,

onde S m N (g) agora é a série de Fourier para g, com respeito ao sistema ortonormalE k , no produto interno de H m([0, 1]). (Nesta notação, S 0 N (g) é a série de Fourierusual !).

5.101. Mostre que S 1 N (g) =k = N ∑

k =− N 1 + (2π k )2 gk ek =

k = N ∑

k =− N 1 + (2π k )−2 gk ek .

5.102. Mostre que E k ( x) = 1√ 1+(2π n2)

exp(2π ikx) é uma base de Hilbert para H 1([0,1]).

Convidamos o leitor a seguir adiante sozinho no estudo de bases ortonormais emespaços de Sobolev-Hilbert ; nós, paramos por aqui.

Consideremos agora a base de Fourier ek ( x) = exp(2π ikx)k ∈Z para H =

L 2([0, 1],C), e a isometria canônica i : H → l2(C), onde i(h) = h,ek = hk .Observemos que, no subespaço C m per ([0, 1],C), dispomos da seguinte propriedadeoperacional :

∂ g,ek = ( ∂ g)k = (2π ik ) gk = (2π ik )g, ek , e∂ mg,ek = (∂ mg)k = (2π ik )m

gk = (2π ik )mg,ek ,

e, como ∂ m

g ∈ C 0 per ([0,1],C), concluímos que (2π ik )

m gk ∈ l2

(C ), ou seja, gk =

i(g) ∈ hm(C) = u : Z→ C : k = N ∑

k =− N (1 + k 2)m | u(k ) |2< ∞. Observe, entretanto,

Page 251: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 251/371

5.7 Apêndice III 245

que C m per ([0,1],C) é um subespaço não completo de H = L 2([0, 1],C). Por ou-tro lado, hm(C) é um subespaço completo de l2(C). Portanto, o completamento

C m per ([0, 1],C).2

= H m per ([0,1],C) é isométrico a hm(C). Com isto, podemos entãorepresentar os elementos deste espaço de funções generalizadas H m per ([0, 1],C) com

as séries de Fourier cujos coeficientes satisfazem a estas condições.

Para o estudo de funções generalizadas por meio desta representação, consulteem particular os clássicos modernos : L. Bers, F. John, M. Schechter, Partial Diffe-rential Equations, J. Wiley, 1964 ; capítulo 3 ; ou, R. Kress, Linear Integral Equa-tions, Springer, 1989; capítulo VIII.

5.7 Apêndice III

5.7.1 Anotações

Bases emL 2([0,1])Funções de WalshFunções SincSplinesReferências :J. P. Keener, Principles of Applied Mathematics, Addison-Wesley, 1988.K. G. Beauchamp, Applications of Walsh and Related Functions, Academica

Press, 1984.H. Harmuth, Transmission of Information by Orthogonal Functions, Springer,

1972.E. W. Cheeney, Multivariate Approximation Theory, SIAM, 1986.J. Lun, K. Bowers, Sinc Methods for Quadrature and Differential Equations,

SIAM, 1992.

C. de Boor, A Practical Guide to Splines, Springer, 1978.P. Prenter, Variational Methods and Splines,Reed-Simon-1) pg 44 - Dada uma função bilinear em Esp. Hilbert, sesquilinear, contínua

então existe unica tansf. lin. que a realiza : B( x, y) = Ax, y2) Teorias ergódica Koopman - Capit. II (RS) Recorrência de Poincare pg.64-65

problemas.Os conceitos de bases duais e de “frames” de Riesz (molduras, arcabouços), são

extensões do conceito de base que são tratados em Strang, Nguyen, pg.69 ; Riesz, Nagy, pg.208 ; Mallat, Christensen, AMS ( ? ?).

Teorema de Krein-Rutman-Milman - Existência de Base de Schauder polino-mial para espaço de funções contínuas norma uniforme. (Cheney?).

Referências :L. Bers, F. John, M. Schechter, Partial Differential Equations, J. Wiley, 1964.

Page 252: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 252/371

246 5 Espaços de Hilbert

A. J. Chorin, O. H. Hald, Stochastic Tools in Mathematics and Science, Springer,2006.

P. Civitanovic, editor, The Chaos Book , Niels Bohr Institute, Copenhagen, on-line.

P. Deuflhard, C. Schutte, W. Huisinga, http ://www.math.fu-berlin.de/~biocompV. Galakhtionov, Invariant subspaces and ..., CRC, 2006.A. N. Gorban, I. V. Karlin, Invariant Manifolds for Physical and Chemical Ki-

netics, Springer, 2005.B. K. P. Horn, Robotic Vision, MIT Press, 1990.I. T. Jollife, Principal Component Analysis, Springer, 1986.M. Kirby, Geometric Data Analysis, 1994.R. Kress, Linear Integral Equations, Springer, 1989.A. Lasota, M. C. Mackey, Chaos, Fractals, and Noise : Stochastic Aspects of

Dynamics, Springer, 1994.D. Luenberger, Vector Space Methods in Optimization.I. Mezic, Spectral Properties of Dynamical Systems Model Reduction and Re-

construction, Nonlinear Dyn. 41(1-3) (2005), 309-325.

G. Mézard,S. G. Mikhlin, Variational Methods in Mathematical Physics, Pergamon Press,

1964.S. G. Mikhlin, Mathematical Physics ; An advanced course, North-Holland,

1970.A. J. Majda, R. Abramov, M. Grote, Information Theory and Stochastics for

Multiscale Nonlinear Systems, AMS, 2005.J. O. Ramsay, B. W. Silverman, Functional Data Analysis, Springer, 1997.B. Scholkopf, A. Smola, Learning with Kernels, MIT Press, 2002L. SirovichL. SirovichR. Temam, Infinite-dimensional dynamical systems, Springer, 1997.K. van Rijsbergen, The Geometry of Information Retrieval, Cambridge U.P,

2004.V. N. Vapnik, Statistical Learning Theory, J. Wiley, 1998.C. Reid, Hilbert , Springer-Verlag.C. Reid, Courant, from Göttingen to New York , Springer -Verlag.G. Stang, T. Nguyen, Wavelets and Filter Bands, Wellesley Press 1997.L. Garding, Some Points of Analysis and Their History, AMS, 1997.E. W. Packel, Hilbert space operators and Quantum Mechanics, Am. Math.

Monthly, 81 (1974), 863-873.G. M. Wing, A Primer on Integral Equations of the first kind : The problem of

deconvolution and unfolding, SIAM, 1991.

Page 253: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 253/371

6

Operadores Lineares em Espaços Normados

6.1 Introdução

Neste capítulo, trataremos de algumas propriedades gerais importantes dos ope-radores lineares em espaços normados, com uma atenção especial aos espaços deHilbert, em cujo contexto ocorrem as interfaces mais interessantes com os tópicosque pretendemos apresentar como aplicações neste texto introdutório.

É interessante observar que, se para a mentalização dos conceitos e métodosbásicos da teoria de espaços vetoriais normados e com produto interno, fizemos umforte apelo intuitivo à Geometria Analítica elementar, agora, no desenvolvimento dateoria e, principalmente dos métodos, de operadores lineares, passaremos a utilizartambém o próprio Cálculo Clássico, cujos conceitos básicos serão analogamenteestendidos para um cenário muito mais abstrato, mas com um notável impacto noque diz respeito às suas aplicações em outros ramos da Matemática ou em suasinterfaces.

As equações lineares, Lu = f , com incógnitas funcionais u, sejam elas equa-

ções diferenciais ordinárias e parciais, ou integrais (Courant-Hilbert[], Sobolev[],Lax[2004], Evans[], Bers&al.[1959], Kress[]), se constituíram sempre na principalmotivação matemática clássica para o desenvolvimento da teoria de operadores li-neares e assim, por certo, continuarão sendo. Sob um ponto de vista da estruturamatemática, a teoria dos operadores lineares é o fundamento sobre o qual se assentatambém o desenvolvimento das teorias e métodos da Análise de Fourier, da Aná-lise Funcional Não-Linear, e da Análise Numérica (Atkinson[], Dautray-Lions[],Marchuk[]), que, de uma forma ou de outra, têm a sua importância medida pelasconexões que apresentam com as equações diferenciais e integrais.

Por outro lado, é indispensável lembrar que o estudo desta teoria, desde a sua ori-gem, sempre esteve fortemente associado a questões exteriores à Matemática e quenão versavam diretamente sobre equações funcionais. Dentre estas, notadamenteaquelas decorrentes dos históricos trabalhos de Werner Heisenberg, Paul Dirac e

John von Neumann, que estabeleceram um modelo matemático para a MecânicaQuântica inteiramente formulado dentro de uma estrutura de operadores linearesem espaço de Hilbert.(von Neumann[1932], Dirac[.],.....)

Page 254: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 254/371

248 6 Operadores Lineares em Espaços Normados

Observação 6.1. É interessante citar aqui a famosa história da gênese desta revolu-ção científica. Por volta de 1920, Heisenberg, um mero adolescente à época, desen-volveu uma série de regras para descrever operacionalmente os princípios básicosexperimentais do que seria a Física Quântica, mas se debatia com a incapacidade de

sistematizá-los em uma teoria matemática razoável, especialmente porque as suasoperações não eram comutativas ! Em conversa sobre o assunto com seu amigo, maisvelho e experiente, Max Born, este imediatamente identificou tais operações comomatrizes de ordem infinita, assunto que ele havia aprendido no seu nascedouro, eum pouco antes, em aulas com ninguém menos do que David Hilbert. Assim nasceua Mecânica Quântica matricial de Heisenberg-Born, pela qual ganharam seus prê-mios Nóbeis, e que na década seguinte seria sistematizada, na forma como hoje sepratica, pelo histórico trabalho de von Neumann e Dirac. Sobre o aspecto históricodeste período único da ciência, consulte Reid[...,...], Dawson[].

A análise de sinais e dados funcionais por intermédio de operações lineares, es-pecialmente transformações integrais, tal como a Transformação de Fourier, é umaoutra vasta e vigorosa interface de motivação e aplicação da teoria de operadores in-tegrais, principalmente em decorrência das variadas e profundas questões matemáti-cas originadas da recente aceleração do desenvolvimento tecnológico da informação(Wiener[], Mallat[], Flandrin[], Prestini[], ...).

A teoria de operadores lineares teve, em seu início, como é de esperar, o cará-ter de uma extensão dos métodos matriciais para dimensão infinita, embora, poroutro lado, o próprio estabelecimento da teoria de matrizes se deva também, e emgrande parte, a esta mesma generalização. Estes aspectos são visíveis nos trabal-hos pioneiros de David Hilbert, Ivar Fredholm, Frigyes Riesz, Eberhard Schmidt,Vito Volterra, Henri Poincaré, e muitos outros. O interesse e o foco principal de taistrabalhos era o estudo de equações integrais lineares provenientes de problemas re-lacionados a equações diferenciais resultantes da aplicação dos métodos de Green(Garabedian[], Bergman[], Courant-Hilbert[], Evans[,], Ber&al[], ...). A partir daí,desenvolveu-se um campo de pesquisa que dominou grande parte da atividade em

Análise Matemática na virada do século XIX, principalmente em decorrência dotrabalho do matemático sueco Ivar Fredholm, levado adiante pela escola de Hilbert,e que demonstrou a possibilidade de um tratamento rigoroso do problema de Diri-chlet por intermédio das equações integrais lineares, problema este cuja abordagempelo método variacional esteve sob quarentena matemática desde a crítica terminalde Weierstrass (Kline[], Mona[], Reid[], ...). A abstração da teoria de Operadores In-tegrais Lineares foi um passo imediatamente posterior, liderado pelos trabalhos deRiesz, Schmidt, Julius Schauder e Stefan Banach, dentre vários outros. Mais tarde,devido à reabilitação do método variacional pelo próprio Hilbert, os métodos deequações integrais perderam um pouco da sua antiga proeminência, que foi aindamais diminuída com a introdução do conceito de funções generalizadas (~1940)por Kurt-Otto Friedrichs, Sergei L. Sobolev e Laurent Schwartz, com as quais asequações diferenciais lineares passaram a ser tratadas diretamente como equações

operacionais, sem a necessidade de transformá-las em equações integrais. Assim,as equações integrais tornaram-se um ramo relativamente à margem da correnteprincipal da Matemática por várias décadas do século XX. Mais recentemente, a

Page 255: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 255/371

6.2 Propriedades e definições básicas de operadores lineares 249

necessidade e o desenvolvimento de novos métodos de análise de sinais e de dados,e outras questões relativas à teoria da informação, determinou uma retomada vi-gorosa da teoria de operadores integrais (Scholkopf-Smola[2002], Wing[], Kress[],Baumeister-Leitão[], Tikhonov-Arsenin[], Natterer[]). Ao contrário dos operadores

diferenciais, os domínios funcionais mais comuns e apropriados para estes opera-dores são os espaços de funções contínuas e os seus completamentos na métrica.2, isto é, osL 2, onde a teoria de espaços de Hilbert pode ser vantajosamente uti-lizada. Portanto, dentro do contexto deste curso, que focaliza sua ênfase nestes espa-ços de funções, daremos uma atenção preferencial à teoria dos operadores linearesque possa ser aplicada ao estudo de equações integrais. Abordaremos preferencial-mente os operadores integrais como objetos e modelos matemáticos importantes porsi mesmos, e não apenas como uma ferramenta intermediária para o estudo de equa-ções diferenciais. O estudo geral de operadores diferenciais, não limitados, exigea abordagem de espaços funcionais e métodos que não serão tratados com ênfaseespecial neste texto, mas poderá ser encontrado em diversas fontes, (Evans[], Lax[],Brezis[], Maurin[]), e, possivelmente, em um segundo volume destas notas.

Iniciaremos com algumas propriedades gerais de operadores lineares em espa-

ços normados para em seguida apresentarmos exemplos importantes para o desen-volvimento futuro.

6.2 Propriedades e definições básicas de operadores lineares

Diversas definições e propriedades dos operadores lineares em espaços norma-dos já foram introduzidas e serão agora apenas revistas com alguns pequenos acrés-cimos.

Definição 6.2. Se E e F são espaços normados, designamos o espaço vetorial das

funções lineares contínuas h : E → F por L(E ,F ) , e se E = F, por L(E ). Em parti-cular, se F = R (ou F = C) for o campo de escalares, denotamos E ∗ = L(E ,R) (ouE ∗ = L(E ,C)), chamado dual de E.

Teorema 6.3 (Caracterização de funções lineares entre espaços normados).Se E e F são espaços normados e h : E → F for linear, então as seguintes afirmaçõessobre h são equivalentes :

1. h é contínua em algum ponto de E,

2. h é contínua em todo o espaço E,

3. h é Lipchitsziana, portanto, uniformemente contínua,

4. h é limitada na bola unitária.

Prova. Exercício.

Page 256: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 256/371

250 6 Operadores Lineares em Espaços Normados

Observação 6.4. Em virtude do teorema acima usamos também a designação limi-tada para nos referirmos a uma transformação linear contínua. Observe que estanomenclatura está de acordo com a definição de função b-limitada, ou limitada embolas, introduzida no capítulo de espaços métricos. Entretanto, não é costume es-

pecificar este fato no caso de funções lineares, uma vez que a única função linearlimitada no sentido usual é a função nula.

Teorema 6.5 ( L(E , F ) pode ser feito um espaço normado). No espaço vetorial L(E , F ) podemos definir uma norma, chamada norma uniforme,da seguinte maneira :

h 0 = sup xE ≤1

h( x) F = sup xE =1

h( x) F = sup x∈E −0

h( x) F

x E .

Em particular, se E = F, a álgebra com produto por composição L(E ) será umaálgebra normada.

Prova. Observe que uma função linear tem a peculiaridade de ser completamentedeterminada pelos seus valores na bola unitária, ou mesmo pelos seus valores naesfera unitária. Basta agora lembrar que a expressão acima definida é uma normapara o conjunto das funções contínuas limitadas na bola unitária.

Em geral, não utilizaremos os índices nos símbolos de normas, a menos que sejanecessário explicitá-los.

Observe que a designação norma uniforme, assim como o termo limitada paraoperações lineares, somente estará de acordo com o mesmo termo utilizado parafunções limitadas, se restringirmos os domínios das operações lineares à bola unitá-ria, ou a qualquer bola. A justificação para o uso do mesmo termo, de maneira

aparentemente conflitante, deve-se ao fato de que os valores de uma função linearsobre a bola unitária (ou mesmo sobre a esfera unitária) definem completamente osseus valores em todo o espaço, por conta, obviamente, da propriedade homotética.

Teorema 6.6 (F Banach ⇒ L(E , F ) Banach).Se E for um espaços normado e F for um espaço de Banach, então L (E ,F ) será umespaço de Banach com a norma uniforme. Em particular, se E = F são de Banach,então L(E ) será uma álgebra de Banach, e se F = R (ou F = C) for o campo deescalares, E ∗ = L(E ,R) (ou E ∗ = L(E ,C)), será um espaço de Banach.

Prova. Ainda utilizando o argumento do teorema anterior, sabemos que o espaçodas funções contínuas limitadas com valores em espaços completos, é também com-pleto com a norma uniforme. Como a linearidade é mantida no limite, concluímos

facilmente o desejado.

Page 257: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 257/371

6.2 Propriedades e definições básicas de operadores lineares 251

Definição 6.7 (Operador Adjunto).Um operador linear A (não necessariamente contínuo) entre espaços normados, A : E → F, dá origem a um operador A∗ , denominado adjunto de A, que atua entreos respectivos espaços dos funcionais lineares (não necessariamente contínuos),

A∗ : F → E , de uma maneira muito natural, com uma composição : A∗ϕ = ϕ A,isto é, ponto a ponto : ( A∗ϕ ) ( x) = ϕ ( Ax) , para ϕ : F →R.

Observação 6.8. Este procedimento matemático, composição, é tão comum queexistem até termos específicos para denotá-lo : “ pullback ” , ou, “retrocesso”.

Por enquanto, nos interessaremos apenas pelos operadores limitados, e paramostrar que a definição correspondente tem sentido neste contexto, consideraremoso seguinte

Teorema 6.9 (Operador Adjunto Limitado).

Se E e F são espaços normados, então1. Para cada A ∈ L(E , F ) existe um operador A∗ ∈ L(F ∗,E ∗) , denominado adjunto

de A, definido pela composição A∗ϕ = ϕ A.

2. Se H for um espaço de Hilbert e A ∈ L( H ) , então temos a igualdade Ax, y = x, A∗ y válida para ∀ x, y ∈ H.

Prova. Exercício.

Teorema 6.10 (Propriedades da Conjugação).Seja H um espaço de Hilbert e A, B ∈ L( H ). Então,

1. A∗ = A .

2. A∗∗ = A.3. ( A +λ B)∗ = A∗ +λ B∗.

4. ( AB)∗ = B∗ A∗.

5. A∗ A = A2.

6. A operação a : L( H ) → L( H ∗) , definida por a( A) = A∗ é linear, limitada denorma unitária, e bijetiva, isto é, a é uma isometria.

Prova. Exercício.

Definição 6.11 (Álgebra Involutiva).Uma álgebra A sobre os números complexos, que admite uma função a :A → A ,

satisfazendo às propriedades 1 a 4 acima, é chamada de uma álgebra involutiva, ea é denominada uma involução. Observe que a involução representa uma generali- zação da operação conjugação da álgebra dos números complexos.

Page 258: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 258/371

252 6 Operadores Lineares em Espaços Normados

Uma outra aplicação simples do conceito de operador adjunto, mas de extremaimportância nas aplicações, é a decomposição do espaço imagem que de certa formase assemelha à do teorema do posto em dimensão finita. Este teorema será usado nocapítulo seguinte como um argumento fundamental da teoria de Riesz-Fredholm.

Teorema 6.12 (Fatoração de Operadores).Se A ∈ L( H ) , onde H é um espaço de Hilbert, e se A( H ) for fechado, então, A( H ) = N ( A∗)⊥ , e podemos escrever

H = A( H ) ⊕ N ( A∗),

ou, na notação de espaços quocientes, H / A( H ) = N ( A∗). Em outras palavras, Ax = y tem solução, isto é, y ∈ A( H ) , se, e somente se, para qualquer h ∈ N ( A∗) , temos y,h = 0. Em particular, se A também for auto-adjunto, isto é, se A∗ = A, entãovale o “teorema do posto” : H = A( H )⊕ N ( A).

Prova. A necessidade é quase óbvia. Para demonstrar a suficiência, observamos

que, sendo A( H ) fechado, a decomposição de Riesz-Beppo-Levi pode ser aplicadaem H , de onde seguirá facilmente a conclusão.

Exercício :

6.1. Mostre que se H 0 for um subespaço de H invariante por A, isto é, A( H 0) ⊂ H 0,então H ⊥0 também é invariante por A∗.

6.3 Exemplos de operadores lineares

1. Operadores Matriciais (Infinitos) em l1,

E = l1(C) = h : N→ C,∞

∑0

| h(k ) |<∞.

Mostraremos que se A : N×N→ C, for uma matriz de dimensão infinita, e talque

supk

j=∞

∑ j=0

| A jk |

= C < ∞, (6.1)

então podemos definir o operador linear A : l1(C) → l1(C), ( Ax)i =k =∞∑

k =0 Aik xk ,

contínuo. Observe que a condição sobre a matriz A pode ser interpretada daseguinte maneira : A tem sua colunas formadas por sequências equilimitadasde l 1(C). Pela desigualdade (6.1), concluímos que | A jk |≤ M para algum M

Page 259: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 259/371

6.3 Exemplos de operadores lineares 253

e todos os k , j. Então, k =n∑

k =m| Aik xk |≤ M

k =n∑

k =m| xk |, o que prova a existência do

valor anunciado para ( Ax)i =k =∞∑

k =0 Aik xk para todos os i’s. A questão é se esta

sequência está de fato em l1. Para verificar isto, tomamosi=m

∑i=0

k =n

∑k =0

| Aik xk |≤k =n

∑k =0

i=m

∑i=0

| Aik |

| xk |≤k =n

∑k =0

C | xk |≤C ∞

∑k =0

| xk |<∞,

e, portanto, temos o desejado.

2. Operadores Matriciais em l2− Operadores de Hilbert-Schmidt ,

E = l2(C) = h : N→ C,∞

∑k =0

| h(k ) |2<∞.

Mostre que se A : N×N

→C, for uma matriz de dimensão infinita, e tal que

∑k , j

| A jk |2

<∞, então podemos definir o operador linear A : l2(C) → l2(C),

( Ax)i =k =∞∑

k =0 Aik xk , que é contínuo. Observe que a condição sobre a matriz A

pode ser interpretada da seguinte maneira : A ∈ l2(N×N,C).

3. Operadores Integrais com Núcleos Contínuos,

E =C 0(Ω ,R), . ∞

,

ondeΩ ⊂Rn é uma região compacta. Considere K ∈C 0(Ω ×Ω ,R). Definimosentão o operador linear K : E

→E por :

K (g)( x) = Ω

K ( x, z)g( z)dz.

A função K (g) é contínua, ou seja, K (g) ∈ E , e K é linear, em resumo, K ∈ L(E ).Para mostrar que o operador K é contínuo observamos que :

| K (g)( x) |≤ Ω

| K ( x, z)g( z) | dz ≤sup

x∈Ω

Ω

| K ( x, z) | dz

g ∞

Portanto, K é limitado (contínuo), e K 0 ≤ sup x

Ω | K ( x, z) | dz.

Na verdade, podemos provar que K 0 = sup x Ω

| K ( x, z) | dz. Para isto, ve-

rifique que podemos supor a existência de algum ponto x0 ∈ Ω , para o qual,

Page 260: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 260/371

254 6 Operadores Lineares em Espaços Normados

sup x Ω

| K ( x, z) | dz = Ω

| K ( x0, z) | dz, e considere a função hε ( z) = K ( x0, z)|K ( x0, z)|+ε .

Observamos que hε ∞≤ 1 e, portanto,

K 0 ≥ K (hε ) ∞= sup x Ω

K ( x, z) K ( x0, z)| K ( x0, z) | +ε dz≥ Ω

K ( x0, z) K ( x0, z)

| K ( x0, z) | +ε dz

,e agora fazendo o limite à direita da desigualdade, obtemos que

K 0 ≥ Ω

| K ( x0, z) | dz = sup x

Ω

| K ( x, z) | dz,

o que, com a desigualdade oposta obtida inicialmente, nos fornece o resultado

anunciado.

Exercício :

6.2. Obtenha o operador adjunto de K .

4. Operadores Integrais com Singularidades FracasEsta classe inclui diversos operadores integrais que são utilizados para a repre-sentação de soluções de equações diferenciais parciais lineares L u = f , pormeio do principio de superposição com as chamadas soluções fundamentais,isto é, soluções g( x,ζ ) de L g = δ ( x−ζ ), na forma : u( x) =

g( x,ζ ) f (ζ )d ζ .

A solução fundamental para o operador de Laplace no planoR2

tem uma singu-laridade do tipo g( x,ζ ) ≈ log x−ζ , e e mRn>2,dotipo g( x,ζ ) ≈ x−ζ n−1.Para n = 1, isto é, para equações diferenciais ordinárias lineares de ordem m, asolução fundamental tem todas as derivadas contínuas até ordem m − 2 e umadescontinuidade de choque na (m− 1)-ésima derivada.Seja então E =

C 0(Ω ,R), . ∞

, onde Ω ⊂ Rn é uma região compacta.

Considere agora K ∈ C 0(Ω ×Ω − ∆ ,R), isto é, K é uma função contínuade duas variáveis no produto cartesiano Ω ×Ω , excetuada a diagonal ∆ =( x, x); x ∈ Ω . Admitiremos que nas imediações da diagonal, a função K ( x, y)tem um comportamento singular (descontínuo), controlado na forma | K ( x, y) |≤C x− y α , onde x = y, C é uma constante positiva e α > −n = dimRn. Defi-nimos então o operador linear K : E → E por :

K (g)( x) = Ω

K ( x, z)g( z)dz.

Page 261: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 261/371

6.3 Exemplos de operadores lineares 255

Estes casos incluem as soluções fundamentais descritas acima. A primeiraquestão que surge é se o operador é bem definido, ou seja, se podemos pro-duzir uma função contínua K (g), pela receita sugerida. Observe que a funçãonão está definida na diagonal, onde talvez tenha uma singularidade infinita, e

portanto, a integral da definição deve ser encarada como uma integral de Rie-mann imprópria (razão da barra superior no sinal de integração), Ω

K ( x, z)g( z)dz = limε →0

Ω − B( x,ε )

K ( x, z)g( z)dz

Para mostrarmos que esta integral tem sentido, comecemos pelo seguinte lema,simples e importante :

Lema 6.13 (Singularidades integráveis). A integral imprópria

B(r ) x

α dx = lim

ε →

0 B(r )− B(ε ) x

α dx

existe para α > −n, onde B(r ) = x ∈Rn; x ≤ r e dx = elemento de volume.

Prova. Basta representar a integral em coordenadas polares (r ,ω ), dx = r n−1drd ω ,para n > 1 :

B(r )− B(ε )

x α dx =

S (1)

r ε

r α r n−1drd ω = Área(S (1))

r ε

r α +n−1dr

= A(S (1)) 1α + n

r α +n − ε α +n

,

de onde tiramos imediatamente a conclusão almejada.

Com o lema acima, é fácil concluir que a integral que define K existe, pois

B( x,δ )− B( x,ε )

| K ( x, z)g( z) | dz ≤ g ∞

B(δ )− B(ε )

C y α dy

→ 0

quando δ > ε → 0. Com isto, verificamos que a convergência das funções contí-nuas

K ε (g)( x) =

Ω − B( x,ε )

K ( x, z)g( z)dz

é uniforme. Referências : Widom[], Kress[], Mikhlin[].

Exercícios :

Page 262: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 262/371

256 6 Operadores Lineares em Espaços Normados

6.3. Mostre que

a) K (g)( x) é contínua.

b) A função

ϕ ( x) = limε →0

Ω − B( x,ε )

| K ( x, z) | dz = Ω

| K ( x, z) | dz

é contínua e atinge um máximo em Ω , digamos,

max x∈Ω

Ω

| K ( x, z) | dz =

Ω

| K ( x0, z) | dz = M .

c) K é contínua, com K 0≤ M , e na verdade, tal como no caso anterior, K 0= M .

6.4. Mostre que se An for uma sequência de Cauchy de operadores lineares em( L(E ), . 0), então, podemos interpretar que An ∈ L(E , E ) e estendê-los para

An ∈ L(E ), . 0, que também formarão uma sequência de Cauchy conver-gente para um A. Observe que não estamos supondo que E seja completo, e portanto, o mesmo acontece para ( L(E ), . ), mas, por outro lado, L(E , E ) e,naturalmente, L(E ) , são completos.

5. Operadores Integrais em L 2(Ω ,R)

Consideremos Ω ⊂ Rn uma região aberta, e lembremos que E = L 2(Ω ,R) =

C ∞0 (Ω ,R).2 e seja K ∈L 2(Ω ×Ω ,R). Para definir o operador integral K :E →

E , como K (g)( x) = Ω

K ( x, z)g( z)dz utilizaremos os teoremas de extensão de

funções contínuas, lembrando que podemos escrever K = K n onde K n éuma sequência de Cauchy em (E = C ∞0 (Ω ×Ω ,R), . 2). Portanto, iniciare-

mos analisando os operadores integrais K :E → E = (C ∞

0 (Ω ,R), . 2), ondeK ∈C ∞0 (Ω ×Ω ,R). Se g ∈ E , então

(K (g)( x))2 =

Ω

K ( x, z)g( z)dz

2

≤CBS

Ω

K 2( x, z)dz

Ω

g( z)2dz

=

Ω

K 2( x, z)dz

g 22 .

Integrando a desigualdade com relação à variavel x (e usando o teorema deFubini para funções C ∞0 ), concluímos que

K 0≤ Ω ×Ω

K 2( x, z)dzdx = K 2 .

Page 263: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 263/371

6.4 Transformações integrais 257

Portanto, podemos concluir imediatamente que se K = K n, onde K n é umasequência de Cauchy em E = (C ∞0 (Ω ×Ω ,R), . 2) então, K n é uma sequênciade Cauchy, já que K m − K n 0≤ K m − K n 2, e podem ser estendidos, no

limite, para o fecho de E , E = L 2(Ω ,R) = C ∞0 (Ω ,R).2 (exercício acima). A

extensão é exatamente o operador K ∈ L(E ) que procurávamos. A linearidadede K é óbvia, e a sua continuidade (limitação) é consequência da estimativaacima.

6. Operadores Integrais de CauchyA teoria de funções de variável complexa clássica é fundamentalmente desen-volvida por dois métodos “rivais” : A teoria de Weierstrass, que enfatiza a re-presentação de funções analíticas por intermédio de séries de potências, e ateoria de Cauchy. Neste segundo caso, as funções complexas são descritas porintegrais de contorno que podem ser utilizadas para exibir explicitamente assoluções de equações diferenciais parciais fundamentais resolvidas pelas suaspartes real e imaginária. Este método genérico teve seu desenvolvimento inicial

motivado por aplicações importantes à Mecânica do Meio Contínuo, mas quese expandiu consideravelmente para outros campos. A transformação de Hil-bert, em particular, que será tratada mais adiante, e tem aplicações importantesna teoria de sinais, é parte deste métodos. Referências : Muskhelishvili[...,...],Henrici[], Kress[], Mikhlin[], Widom[].

6.4 Transformações integrais

As transformações integrais são operadores lineares que desempenham um pa-pel fundamental como ferramentas analíticas nos mais variados contextos da ma-temática e de suas aplicações, e especialmente, no estudo de equações diferenciais.

Estes operadores integrais são singulares no sentido de que os seus núcleos, em ge-ral, não são funções integráveis por motivos de singularidades ou pela extensão dodomínio. O exemplo mais notável e importante desta classe é, sem dúvida, repre-sentada pela transformação integral de Fourier que, de certa maneira, estende paraa reta o que já foi feito em um intervalo finito por meio das séries de Fourier.

6.4.1 Transformação integral de Fourier

Este operador integral é uma das ferramentas mais importantes da análise deprocessos lineares desde que foi introduzido por Fourier no início do século XIX.A transformação de Fourier é também um operador integral singular no sentido queo seu núcleo N ( x, k ) = e−2π ixk não é integrável. O nosso objetivo será definir esta

operação no espaço de Hilbert L 2(Rn,R) = C ∞0 (Rn,R)

.

2

.Entretanto, por questões de conveniência operacional, utilizaremos o espaço deSchwartz (Laurent Schwartz), denotado por

Page 264: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 264/371

258 6 Operadores Lineares em Espaços Normados

S (Rn) = h ∈ C ∞(Rn,R), ∀α ,β ∈ Nn, xα ∂ β h( x) → 0, x →∞,

que é, obviamente, um pouco mais amplo do que C ∞0 (Rn,R), como base para a

construção de L 2(Rn,R) = S (Rn,R).2 .

Observe que se x = ( x1,..., xn) ∈Rn, e k = (k 1,...,k n) ∈Nn, então denotamos

|k | = k 1 + ... + k n,

x · k = x1k 1 + ... + xnk n = x,k ,

xk = xk 11 · · · xk n

n ,

∂ k = ∂ |k |

∂ k 1

x1 ···∂ k n xn

.

Definição 6.14 (Transformação de Fourier).Se g ∈S (Rn,R) , definimos a função

g(k ) =

Rn

g( x)e−2π ix·k dx = lim R→∞

x≤ R

g( x)e−2π ix·k dx = F [g](k ),

como a transformada de Fourier da função g.

Esta é apenas uma definição preliminar, pois, logo abaixo, veremos que atransformação de Fourier é uma operação linear contínua no espaço normado(S (Rn,R),.2), e, portanto, é extensível de forma única para o completamentodeste espaço, ou seja, ( L2(Rn,R), .2).

Para que possamos analisar as propriedades básicas da Integral de Fourier, ne-cessitamos de um lema que tem uma importância fundamental em diversas partesda análise de Fourier e das equações de difusão.

Lema 6.15 (Expansão dos Núcleos Gaussianos). As funções definidas pela integral

Gε ( z) = F ∗[e−ε k 2 ]( z) =

Rn

e2π iz·k −ε k 2 dk

são núcleos de Dirac para ε ↓ 0 , e podem ser escritas como

Gε ( z) = Rn

e2π iz

·k −ε k 2

dk = π ε n2

exp−π 2 z2

ε .

Page 265: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 265/371

6.4 Transformações integrais 259

Prova. Basta demonstrarmos a fórmula para n = 1 em vista da simetria radial dafunção. Para isto derivamos a integral com relação a z, o que é perfeitamente válidodevido à convergência uniforme rápida introduzida pelo parâmetro ε , de onde temos

Gε ( z) = R

(−2π ik )e2π iz

·k −ε k 2

dk ,

e integrando por partes

Gε ( z) =

2π 2 zε

Gε ( z).

Agora, levando em consideração que

Gε (0) = R

e−ε k 2 dk = 1√ ε

R

e−ζ 2 d ζ =

π

ε ,

integramos a equação acima para obtermos o resultado em vista. Estes núcleossão na verdade relacionados a solução fundamental da equação de difusão (calor)

fazendo-se t = ε .

Exercícios :

6.5. Mostre que as funções acima são de fato núcleos de Dirac, e, portanto, deacordo com o teorema de aproximação, temos a convergência uniforme :

g( x) = limε ↓0

Rn

J ε ( x−ξ )g(ξ )d ξ , para g ∈S (Rn,R).

6.6. Mostre que se h ∈S (Rn,R), então (1 + x2)nh( x) ∈S (Rn,R), para qualquer ne, tal como todas as funções de S (RnR), é integrável e quadrado integrável em Rn,

isto é, existem as integrais

lim R→∞

x≤ R

(1 + x2)n | h( x) | dx e lim R→∞

x≤ R

((1 + x2)n | h( x) |)2dx.

(Argumente para n = 1).

6.7. Mostre que se h ∈S (Rn,R), então hε ( x) = exp(−ε x2)h( x) ∈S (Rn,R), paraε > 0, e que h− hε 2−→ 0 quando ε ↓ 0. Sugestão : Escreva

h−hε 22=

∞ 0

(1− e−ε x2)2(1 + x2)−2(1 + x2)2h2( x)dx,

use a desigualdade de Schwartz, focalize a sua atenção no primeiro termo em umintervalo [0, R] onde se encontra todo o valor da integral (exceto por um δ ∼ 0), usea majoração (1− e−ε x2

)4 ≤ (1− e−ε R2)4, e corra pro abraço com ε −→ 0.

Page 266: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 266/371

260 6 Operadores Lineares em Espaços Normados

Teorema 6.16 (Teorema de Fourier). A operação transformação de Fourier

Rn

g( x)e−2π ix·k dx = lim R

→∞ x≤ R

g( x)e−2π ix·k dx = F [g](k )

a) É bem definida, linear, na forma F : S (Rn,R) −→S (Rn,R).

b) Satisfaz às propriedades operacionais

a) F ([∂ β

x h( x)](k ) = (2π ik )α F [h](k ) e

b) F [(−2π ix)α h( x)](k ) = ∂ α k F [h](k ).

c) Tem uma inversa na forma F −1[h]( x) = Rn

h(k )e2π ix·k dk.

d) F −1 = F ∗ , isto é, a inversa é a sua adjunta com respeito ao produto interno de

L2(Rn).

e) É uma isometria em (S (Rn,R), . 2) , e portanto, contínua.

f) F e sua inversa F ∗ podem ser estendidas continuamente para o espaço L2(Rn,R) =

S (Rn,R).2 .

Prova.

a, b) A integral de Riemann imprópria obviamente existe, uma vez que o produto éuma função de S (Rn,R) que pode ser majorada na forma

| g( x)e−2π ix·k |=| g( x) |≤ C

1 +

1 x m

,

para qualquer m > n. Portanto, é possível derivar internamente a integral, como que obtemos facilmente a fórmula operacional :

∂ α F [g](k ) = Rn

(−2π ik )α g( x)e−2π ix·k dx = F [(−2π ix)α g( x)](k ).

Integrando por partes, e lembrando-se que se g ∈S (Rn,R), temos, para qual-quer α ∈ N n, que ∂ α g ∈S (Rn,R), e daí

F [g](k ) =

Rn

g( x)e−2π ix·k dx

=

Rn

−12π ik 1∂ x1

g( x)e−2π ix·k

+

12π ik 1

(∂ x1 g( x))e−2π ix·k

dx

= Rn

12π ik 1

(∂ x1 g( x))e−2π ix·k

dx,

Page 267: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 267/371

6.4 Transformações integrais 261

utilizando o teorema fundamental do cálculo em x1 na integral da derivada eobtendo (2π ik 1)F [h](k ) = F [∂ x1 h( x)](k ). Assim, repetindo o mesmo processo,temos a fórmula operacional

F [∂ α

x h( x)](k ) = (2π ik )α

F [h](k ).

Multiplicando esta última fórmula por (2π ik )β e utilizando a primeira fórmulaoperacional, temos

(2π ik )β ∂ α F (g)(k ) = (2π ik )β F [(−2π ix)α g( x)](k ) = F [∂ β (−2π ix)α g( x)](k ),

o que implica, pelo termo da direita, que F [g] ∈S (Rn,R). A linearidade éóbvia.

c) Esboço da demonstração : Com manipulações formais, sem cuidados com aconvergência, podemos suspeitar fortemente que a transformação inversa deFourier F ∗ deveria ser dada por

F ∗[h]( x) = Rn

e2π ik · xh(k )dk .

Entretanto, estas manipulações não podem ser justificadas sem maiores elabo-rações. Para mostrar que a inversa é de fato dada pela fórmula proposta, utiliza-remos uma aproximação F ∗ε de F ∗, e faremos uso do Lema acima e o teoremade Fubini. Consideremos então a transformação aproximada

F ∗ε [h]( x) =

Rn

e2π ik · x−ε k 2 h(k )dk = Rn

e2π ik · x(e−ε k 2 h(k ))dk .

Observamos inicialmente que e−ε k 2 h(k ) ∈ S (Rn,R) e portanto F ∗ e F ∗ε :S (Rn, R)

→S (Rn, R) são bem definidas, e ainda, temos que para cada mul-

tiíndiceα ∈Nn, a majoração xα F ∗ε [h]( x) ≤ C x m, para qualquer m inteiro,independe de ε , por razões semelhantes às que apontamos para F . Também po-demos concluir que F ∗ε [h]−F ∗[h] 2→ 0, quando ε → 0.Analisemos agora a composição de F ∗ε com F na forma

F ∗ε [F (g)]( x) =

Rn

e2π ik · x−ε k 2

Rn

e−2π ik ·ξg(ξ )d ξ

dk

=

Rn

Rn

e2π ik ·( x−ξ)−ε k 2 dk

g(ξ )d ξ

= Rn

( J ε ( x−ξ ))g(ξ )d ξ ,

Page 268: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 268/371

262 6 Operadores Lineares em Espaços Normados

observando que pelo lema acima e pelo teorema de aproximação de Dirac,F ∗ε [F [g]] → g uniformemente quando ε → 0. Junto com as observações ante-riores temos que

F ∗[F [g]] −g 2≤ F ∗[F [g]] −F ∗ε [F [g]] 2 + F ∗ε [F [g]]− g 2→ 0quando ε → 0, o que nos mostra a igualdade desejada.

d, e) Mostremos inicialmente por uma aplicação simples do teorema de Fubini epor conjugação que F [h], g = h,F ∗[g] (exercício !). Portanto, vem imediata-mente que h,g = F [h], F [g] ou, em particular que F [h] 2= h 2.

f) A demonstração deste item é uma aplicação imediata do item anterior e doteorema de extensão de funções contínuas para o fecho.

Exercício :

6.8. a) Mostre que a operação de convolução e de produto ponto a ponto pode

ser definida em S (Rn

,R) : se h,g ∈ S (Rn

,R), então h ∗ g( x) = Rn h( x −ξ )g(ξ )d ξ ∈S (Rn,R), e h( x)g( x) ∈S (Rn,R), ou seja, em S (Rn,R) dispo-mos de duas estruturas de álgebra.

b) Mostre que se h,g ∈S (Rn,R), então F [ h ∗ g] = F [h] · F [g], ou seja, F é umisomorfismo entre a álgebra de convolução (S (Rn,R),∗) e a álgebra com oproduto ponto a ponto (S (Rn,R), ·). Esta propriedade é fundamental para ocálculo operacional com as transformações de Fourier.

Quando introduzimos os polinômios de Hermite e Laguerre como resultado deum processo de Gram-Schmidt aplicado às funções polinomiais nos espaços de in-tervalos infinitosL 2ρ ( I ,C) (respectivamente, I = R, ρ( x) = exp(− x2

2 ), e I = (0,∞),

ρ( x) = exp(− x)), não ficou claro que teríamos obtido bases ortonormais, já que oteorema de Weierstrass somente se aplica a intervalos compactos. Mostremos istoagora.

Teorema 6.17 (Completude das Bases de Hermite e Laguerre).Se h ∈S (R,R) for tal que 0 <| h( x) |≤ C exp(−δ | x |) , para constantes positivasδ e C, então, as funções xnh( x)n∈N , são densas em L 2(R,R) , onde I é um inter-valo qualquer da reta. Em particular, concluímos que os polinômios de Hermite e Laguerre formam bases ortonormais em seus respectivos espaços.

Prova. Na verdade, basta mostrar que hn( x) = xnh( x) é densa em (S (R, R),

. 2), já que S (R,R).2

= L 2(R,R). Consideremos então que o fecho do es-

paço gerado pelas funções hn( x) = xn

h( x) não contenha o espaçoS (R,R). Combase no Teorema de Riesz, tomemos gm ∈S (R,R), tal que g = gm ∈L 2(R,R)é não nula e perpendicular a todas as funções hn, isto é, limm−→∞

gm( x)hn( x)dx =

Page 269: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 269/371

6.4 Transformações integrais 263

limm−→∞gm,hn = g, hn = 0. Consideremos agora a sequência de funções defini-das por

ϕ m(k ) = F [gmh](k ) =

R

gm( x)h( x)e−2π ix·k dx,

e observemos que a integral pode ser estendida para k no plano complexo desdeque | Im(k ) |< δ , devido à estimativa exponencial assumida para h. Esta funçãoϕ m(k ) definida na faixa | Im(k ) |< δ do plano complexo é analítica ,e suas derivadaspodem ser calculadas como ∂ k ϕ m(k ) = F [gm( x)(−2π ix)h( x)](k ), e, pelo que assu-mimos, ∂ k ϕ m(k ) → 0, quando m → ∞. Por outro lado, como gm são de Cauchy nanorma . 2, podemos facilmente verificar que ϕ m é de Cauchy na norma uniformee portanto converge da mesma maneira, junto com as suas derivadas, para uma fun-ção analítica que terá assim todas as suas derivadas nulas. Mas isto implica queg, hn = 0, o que contradiz a hipótese. O teorema acima imediatamente nos leva aconcluir que os polinômios ortonormais de Hermite e Laguerre formam uma basenos seus respectivos espaços.

Exercícios :

6.9. Mostre que F 2[h]( x) = h(− x), ou seja, F 2 = S onde, S [h]( x) = h(− x), e por-tanto, F 4 = Identidade. Sugestão : para utilizar o teorema de Fubini, empregue aaproximação F ε para calcular F 2[h] = limF ε F [h].

6.10. Mostre que F [exp(−ε x2)](k ) = π ε exp(−π 2ε k 2) = G( x,ε ) é um núcleo de

Dirac.

6.11. Mostre que F [exp(−π x2)](k ) = π ε exp(−π k 2), ou seja, a função ϕ 0( x) =

exp(−π x2) ∈S (R,C) é um autovetor da transformação linear F .

6.12. Com base em uma das propriedades operacionais de F , mostre que as funçõesϕ n( x) = xn exp(−π x2), são autovetores de F . Sugestão : mostre que em geral seh for um autovetor de F , (Fh = λ h), então, hn( x) = xnh( x) deve ser também umautovetor, pois,

F [ xnh( x)](k ) = (−2π ik )nF [h](k ) = (λ (−2π i)n)k nh(k ).

6.13. Veja se é possível mostrar esta verdade : “Os polinomios de Hermite são auto-vetores ortonormais para a Transformação de Fourier ”. Referência : Kolmogorov-Fomin.

6.14. Fazendo uso da integral de Fourier e de suas propriedades discutidas acima,obtenha a expressão abaixo para a solução do problema de valor inicial para a equa-ção de difusão : Lu = (∂ t − ∂ 2 x )u = ∂ t u( x,t ) − ∂ 2 x u( x, t ) = 0 , u( x, 0) = u0( x). Su-

gestão : aplicando a transformação F (na variável x) a ambos os termos, e utilizandoas propriedades operacionais de F , obtemos uma equação diferencial ordinária navariável não-transformada t , da seguinte maneira :

Page 270: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 270/371

264 6 Operadores Lineares em Espaços Normados

d dt

F [u](k , t ) = −k 2F [u](k , t ), F [u](k ,0) = F [u0](k ),

que resolvida trivialmente nos dá F [u](k , t ) = F [u0](k )exp(−k 2t ). Escreva agora afunção (em k ) exp(

−k 2t ) = F [G](k ,t ) por meio de um acerto do exercício anterior,

e com base no fato de que F é um isomorfismo de álgebras, finalmente obtenha

u( x, t ) = (G∗u0)( x, t ) =

∞ −∞

G( x−ξ ,t )u0(ξ )d ξ =

∞ −∞

1√ 4π t

e− ( x−ξ)4t u0(ξ )d ξ ,

isto é, a solução geral deste problema. Este exemplo ilustra bem o emprego da in-tegral de Fourier como método operacional. Referências : Kolmogorov-Fomin[],Dym-McKean[], Henrici[], Körner[], Stein[], Maslov[].

6.4.2 Transformação integral de Laplace

A integral de Fourier só pode ser aplicada a funções que tenham um decaimentorazoavelmente rápido no infinito, uma vez que o núcleo é uma função oscilante. Emmuitas questões, as funções a serem tratadas não decaem suficientemente rápido, oumesmo crescem no infinito, especialmente se a variável é o tempo em problemasde equações diferenciais evolutivas. Observe que no exemplo em que utilizamoso método operacional de Fourier para a equação de difusão, a transformação foiaplicada na variável espacial, uma vez que na variável tempo a solução da equaçãotalvez não satisfaça às condições necessárias para a existência da integral de Fourier.Para que um procedimento análogo possa ser empregado em tais casos, introduz-sea transformação de Laplace, que é aplicável a funções definidas essencialmente nasemi-reta positiva (0,∞), e que se constitui em uma extensão da transformação deFourier com um núcleo exponencialmente decrescente.

Consideremos então o espaço das funções

L 1ρ ((0,∞),C) = h ∈ C ∞((0,∞),C), ∃λ < δ e C > 0 | h(s) |, ≤ Ceλ s.ρ

,

onde h ρ=∞ 0

| h(s) | e−δ sds, isto é, ρ(s) = e−δ s.

Então, podemos definir a seguinte função para valores complexos de z = x + iy,com Re( z) = x > −δ ,

L [h]( z) =

∞ 0

h(s)e− zsds =

∞ 0

h(s)e− xseiysds

L [h]( z) = 2π F ∗[h(s)e−λ s](Im z),

se considerarmos a função h como estendida com o valor zero para s ≤ 0.

Page 271: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 271/371

6.4 Transformações integrais 265

O fato da transformada de Laplace ser uma função de variável complexa e analí-tica em Re( z) = x > −δ tem consequências notáveis pois, com isto, são abertasinúmeras possibilidades para a aplicação dos poderosos métodos da Análise Com-plexa, o que se tornou uma característica desta teoria.

As propriedades da integral de Laplace, como podemos ver, tem ligações muitopróximas às da integral de Fourier. Referências : Kolmogorov-Fomin[], Widder[],Herici[], Ditkin-Prudnikov[].

6.4.3 Transformação de Hilbert

A transformação de Hilbert é uma operação integral com o núcleo singular deCauchy que associa funções reais a funções com valores complexos, e tem especialaplicação no estudo de sinais temporais. Referências : Henrici[], Kress[], Huang[].

6.4.4 Operadores integrais de Fourier e pseudodiferenciais

Os operadores integrais de Fourier, e os operadores pseudo-diferenciais, são ge-neralizações de operadores diferenciais lineares, e se constituem um ramo em desen-volvimento da moderna teoria de equações diferenciais parciais. Para termos umaideia superficial de como esta extensão é realizada, consideremos um operador di-ferencial parcial linear de coeficientes constantes L = ∑ Aα ∂ α , e observemos, pelaspropriedades operacionais de F que, FLu(k ) =∑ Aα F [∂ α u] =∑ Aα (2π ik )α F [u](k ).Portanto, F ∗FLu = Lu = F ∗(∑ Aα (2π ik )α F (u)(k )), isto é, os operadores L podemser vistos como transformadas inversas de produtos de polinômios em k pela trans-formada da função operada. Então, porque não considerar operadores integrais maisgerais em que as funções multiplicantes possam ser mais do que polinômios ? Estasfunções são chamadas de símbolos do operador integral em questão, que toma aforma

Φ u( x) = e2π ik · xa(k , x) u(k )dk .

Estas operações podem ser estendidas a espaços de funções mais amplos depen-dendo do símbolo a( x, k ), com a esperança fundamentada pela experiência que ope-radores deste tipo representem inversões de operadores diferenciais parciais, ou seja,operadores solucionadores de equações diferenciais parciais. Sobre o assunto, quetem especial interesse para várias áreas da Matemática Aplicada, consulte as refe-rências : Maslov[1980,1990,1987], Nazaikinskii&al[1996], Flandrin[], Lax[].

6.4.5 Outros operadores (transformações) integrais

Diversas outras transformações integrais têm um papel importante em várias

áreas da Matemática e suas aplicações.

Exercícios :

Page 272: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 272/371

266 6 Operadores Lineares em Espaços Normados

6.15. Considere a transformação C : (S (R+,R), . 2) → (S (R+,R), . 2),

C [h]( x) =∞ 0

cos(2πξ)h(ξ )d ξ . Obtenha a sua inversa.

6.16. Seja g ∈S

(R

,R

). Mostre que podemos definir uma função periódica na

forma h( x) =k =∞∑

k =−∞g( x + k ).

6.17. Mostre que ∞

∑−∞ hk = soma dos coeficientes de Fourier de h, = h(0) =

∑−∞

g(k ).

6.18. Mostre finalmente a Fórmula de Poisson : ∞

∑−∞

g(k ) =∞

∑−∞

F [g](k ).

6.19. Tomando g( x) = (2π t )− 12 exp(− x2

2t ), que é o núcleo Gaussiano de Dirac,aplique a Fórmula de Poisson e obtenha a famosa Fórmula de Jacobi para funções

teta, θ (t ) =∞

−∞

exp(−π n2t ), t > 0,θ (t −1) = t 12 θ (t ), que tem a sua importância na

Teoria dos números, Funções Elípticas, na Mecânica Estatística e etc.

6.20. Mostre que a convolução é bem definida no espaço L1(Rn,R) =C ∞0 (Rn,R).1

= S (Rn,R).1 , e faz deste espaço uma álgebra de Banach. Sugestão : tome hk

e gk sequências de Cauchy em (S (Rn,R), . 1). Para mostrar que a integral Rn

hk ( x − z)gk ( z)dz é de Cauchy em (S (Rn,R), . 1) = L1(Rn,R), basta integrá-

la com relação à variável x e inverter (Fubini) a ordem de integração.

6.21. Verifique a desigualdade de Heisenberg (Princípio da Incerteza) : se h ∈S (R,R), e h 2= 1, então

I =∞

−∞ x

2

| h( x) |2

dx∞

−∞ k

2

| F [h](k ) |2

dk ≥ 1

4π 2

,

que só ocorre quando h é uma gaussiana. Sugestão :

4π 2 I =

∞ −∞

| xh( x) |2 dx

∞ −∞

k 2 | 2π ikF [h](k ) |2 dk

=

∞ −∞

| xh( x) |2 dx

∞ −∞

| h(k ) |2 dk

,

usando a propriedade da derivada e a igualdade de Parseval-Plancherel. Usandoagora a desigualdade de Schwarz, continuamos,

Page 273: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 273/371

6.5 Equações lineares do segundo tipo, ou, Perturbações lineares da identidade 267

≥ ∞

−∞| xh( x)h( x) | dx

2

≥ ∞

−∞

x2h( x)h( x)dx

2

= 14

∞ −∞

x| h( x) |2dx = 14

∞ −∞

| h( x) |2 dx.

Na verdade, o princípio vale no limite do fecho de S (R,R), isto é, para funçõesh ∈ L2(R,R). Referências : Dym-McKean[], Henrici[], Akhiezer[], Polyakov[], Nat-terer[], Kress[], Frandrin[], Mallat[].

6.5 Equações lineares do segundo tipo, ou, Perturbações linearesda identidade

6.5.1 Séries de Neumann-Peano : A gênese da análise operacional

Em um trabalho de 1887, Giuseppe Peano escreveu a solução de um sistemade n equações diferenciais ordinárias lineares de coeficientes constantes na formamatricial

dudt

= Au + h,

(onde u : R→ Rn, h : R→Rn e ( Ai j) é uma matriz n ×n), e a sua solução como

u(t ) = e At u(0) +

t 0

e(t −s) Ah(s)ds,

definindo e At

como o operador (linear) que, quando aplicado ao vetor x0, produza solução u(t ) = e At x0 do problema de Cauchy dudt = Au, u(0) = x0. Desta forma,

um problema geral de equações diferenciais lineares é, pelo menos simbolicamente,re-escrito com o mesmo formalismo utilizado no tratamento de uma equação deprimeira ordem. Tornavam-se assim claras algumas técnicas que poderiam ser em-pregadas no estudo dos problemas n−dimensionais, em decorrência da experiênciaherdada do caso unidimensional, e mais, iniciava-se então uma nova etapa, ou, umnovo patamar conceitual, na Análise onde, não apenas os números e as funçõesassumiam status de objeto matemático, mas também os operadores funcionais. Adefinição de uma exponencial de uma matriz, ou seja o cálculo de f ( z) = e z para

z = A, na forma de uma série e A =∞

∑k =0

Ak !

k , seria um próximo passo, natural, mas

ousado, e que estabeleceu uma das origens da Análise Operacional, onde os opera-

dores tomam o lugar de variáveis.O mesmo problema seria estudado por seu conterrâneo Vito Volterra (...-...), naforma de uma equação integral (hoje, dita de Volterra),

Page 274: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 274/371

268 6 Operadores Lineares em Espaços Normados

u(t ) =

t 0

Au(s)ds + y(t )

onde y(t ) =

t 0 h(s)ds + u(0), e interpretada como um problema linear na forma u −

Lu = ( I − L)u = y.Carl Neumann (...-...), estudando as equações integrais decorrentes dos proble-

mas de fronteira para o operador de Laplace, também chegou a uma equação integralsemelhante, e, pelo método iterativo, escreveu a sua solução como uma série do tipo

u = ( I − L)−1 y =∞

∑k =0

Lk y.

Observando esta expressão, é impossível não se impressionar com a semelhança

formal entre ela e série numérica (1− z)−1 =∞

∑k =0

zk . Como coincidências sem conse-

quências não existem em Matemática, estavam assim, mais uma vez, despontandoos primeiros indícios da Análise Operacional, agora, com o significado operacional

f ( L) =∞

∑k =0

Lk y para a função f ( z) = (1− z)−1.

Estas semelhanças formais não passariam desapercebidas e nem seriam despre-zadas como coincidências inócuas por matemáticos de tal expressão. A simplifica-ção conceitual e formal na matemática, indispensável para o seu avanço a regiõesde maiores complexidades, encontrava assim um de seus caminhos mais profícuos.O que se seguiu foi uma mudança de foco, que privilegiaria o estudo dos operadoresem lugar das incógnitas, ou seja, a ênfase passa então a ser redirecionada para oestudo dos operadores das equações como objetos matemáticos, e sua consequente“coisificação matemática”. Isto significaria um segundo nível de abstração, já quea “coisificação” das funções era um fenômeno recente, ou quase simultâneo. Seo estudo de operadores lineares como objetos matemáticos ampliou os horizontesconceituais da Matemática, por outo lado, mais prático, abriu a oportunidade deestender a este contexto toda a experiência, técnicas e intuição adquiridas no de-senvolvimento do cálculo diferencial elementar, o que no futuro provou ser de umenorme sucesso. É interessante observar o paralelo deste desenvolvimento e o esta-belecimento das Teorias de Espaços Normados e de Produto Interno, que têm a suaorigem intuitiva e operacional em Geometria Analítica elementar.

Iniciaremos este capítulo com o estudo de uma classe de equações lineares, co-mumente denominada Equações (Integrais de Fredholm) do Segundo Tipo, que tema forma u− Au = ( I − A)u = h, onde A é um operador linear em um espaço normadoE , h ∈ E é um elemento dado, e u é a incógnita neste mesmo espaço. Esta denomi-nação provêm da antiga terminologia empregada para equações integrais, mas sobum ponto de vista operacional e mais geral, podemos interpretar o operador ( I − A)desta equação como uma perturbação da identidade I pelo operador (linear) A. Esteserá um ponto de vista crucial no desenvolvimento de técnicas para a sua solução.As chamadas Equações (Integrais de Fredholm) do Primeiro Tipo, Lu = h, com L

Page 275: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 275/371

6.5 Equações lineares do segundo tipo, ou, Perturbações lineares da identidade 269

linear, são formalmente mais gerais mas, de fato, só poderão ser tratadas vantajo-samente se submetidas a restrições severas sobre o operador L. Este será o tema dopróximo capítulo.

Suponhamos então que A ∈ L(E ) = “ Álgebra das funções lineares contínuas

h : E → E ”, e que E seja um espaço de Banach. Como uma equação de segundotipo, ( I − A)u = h, obviamente tem sempre solução, e única, quando a “perturba-ção” A é nula (isto é, para a equação trivial Iu = h), é razoável investigar se umaperturbação uniformemente “ pequena”, ε A, poderia preservar esta característica de-sejável. Esta questão será satisfatoriamente estudada por intermédio do teorema deBanach-Cacciopoli, reescrevendo a equação ( I − ε A)u = h como um problema deponto fixo parametrizado, u = ϕ (u, h) = ε Au+ h. Analisando as condições para queϕ seja uniformemente contrativa,

ϕ (u, h) −ϕ (w,h) = |ε | Au− Aw ≤ |ε | A0 u−w ,

verificamos que isto acontece se, e somente se, |ε | A 0< 1. Neste caso, o referidoteorema nos garante que existe uma e única solução do problema, e que ela varia

continuamente com h. Portanto, verificamos que é possível se desfazer do parâmetroε , e estabelecer a condição A 0< 1 paraque I − A seja inversível como operador li-near limitado. Mas o teorema do ponto fixo fornece ainda um método para o cálculoda solução. Fazendo u0 = h é fácil concluir (verifique) que a sequência convergentepara a solução é dada por

un+1 = Aun + h =k =n

∑k =0

( Ak h),

que pode ser escrita como un+1 =

k =n∑

k =0 Ak

h e, formalmente, no limite, como

u =

∑k =0

Ak

h = ( I − A)−1h. Como esta fórmula é válida para todo elemento h,

podemos escrever esta solução geral na forma operacional como

( I − A)−1 =∞

∑k =0

Ak .

O nosso objetivo agora será justificar estas manipulações formais dentro docontexto da Análise Operacional, e interpretar o seu resultado como solução opera-cional do problema geral.

Para isto, lembremos inicialmente que, sendo E um espaço de Banach, então L(E ) será uma álgebra de Banach onde é satisfeita a seguinte condição : se A, B ∈ L(E ), então AB 0≤ A 0 B 0, e, em particular, Ak 0≤ ( A 0)k (verifique).

Passaremos a utilizar a norma uniforme para os operadores lineares limitados,

.

0, sem o sub-índice 0 para simplificação da notação.

Como a série geométrica numérica ( I − z)−1 = ∞∑k =0

zk , converge para | z |< 1 (e

uniformemente para | z |< r , se r < 1), concluímos que ela é de Cauchy e, portanto,

Page 276: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 276/371

270 6 Operadores Lineares em Espaços Normados

limm,n→∞

k =n∑

k =m| z |k = 0. Mas então, a série geométrica na álgebra de Banach L(E )

também é de Cauchy, pois, como A < 1, temos

k =n

∑k =m

Ak ≤k =n

∑k =m

Ak ≤k =n

∑k =m

A k .

Assim, existe o limite B = limn→∞

n∑

k =0 Ak =

∑k =0

Ak . Para provarmos que, de fato, este

limite é o que realmente presumimos, isto é, B = ( I − A)−1, escrevemos

( I − A)n

∑k =0

Ak =n

∑k =0

Ak ( I − A) = I − An+1.

Fazendo o limite nas igualdades acima, e lembrando que An+1 ≤ A n+1→ 0quando n → ∞, e da continuidade do produto na álgebra L(E ), temos que

( I −

A) B = B( I −

A) = I ,

ou seja, B =∞

∑k =0

Ak = ( I − A)−1, como queríamos demonstrar.

Esta fórmula operacional nos possibilita resolver ”explicitamente” equações li-neares do segundo tipo com perturbações uniformes pequenas. Este resultado dáorigem a uma variedade de importantes teoremas a respeito de operadores lineareslimitados em geral, que passaremos a apresentar. A primeira observação sobre o mé-todo de Neumann provem de uma variação do teorema de Banach-Cacciopoli, queexige apenas a contratividade de uma potência da função para que a série convirja.Enfeixaremos o teorema acima no próximo enunciado.

Teorema 6.18 (Teorema : Neumann-Peano).

Seja E um espaço de Banach e A ∈ L(E ) tal que para algum inteiro p tenhamos A p < 1 . Então, ( I − A) é inversível continuamente e podemos escrever

( I − A)−1 =∞

∑k =0

Ak ,

com a estimativa exponencial( I − A)−1 −n

∑k =0

Ak

≤ ∞

∑k =n+1

Ak

≤∞

∑k =n+1

Ak = An+1

11− A

.

Além disso, a função f : B(0,1) ⊂A → A , A = L(E ) , f ( A) = ( I − A)−1 =∞

∑k =0

Ak ,

é contínua.

Prova. Basta recorrermos ao respectivo corolário do teorema de Banach-Cacciopolie aos argumentos desenvolvidos acima.

Page 277: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 277/371

6.5 Equações lineares do segundo tipo, ou, Perturbações lineares da identidade 271

Observemos que o Teorema de Neumann-Peano se constitui em uma respostacompleta quanto ao problema apresentado pelas Equações Lineares do tipo Peque-nas Perturbações Uniformes da Identidade, x − Ax = y, A < 1, pois,

1. Garante existência e unicidade da solução x.

2. Garante a estabilidade da solução com respeito aos dados do problema, y (istoé, continuidade de A−1).

3. Garante a estabilidade constitutiva do problema, ou seja, a solução dependecontinuamente do parâmetro constitutivo A.

4. Garante a estabilidade operacional do problema, isto é, o operador solução( I − A)−1 depende continuamente (na verdade, analiticamente) de A.

5. Fornece um método algorítmico para o cálculo da solução que faz uso apenasdas operações definidas na equação.

6. Exibe uma estimativa da aproximação da solução.

A menos do fato de que esta equação é específica (ainda que de importância fun-damental), este teorema tem qualidades que rivalizam com os teoremas de Banach-

Cacciopoli e de Riesz.

Exercícios :

6.22. Escreva cuidadosamente os detalhes da demonstração do Teorema de Neumann-Peano e argumente sobre as observações de 1-6 apresentadas acima.

6.23. Mostre que uma equação integral do tipo Volterra,

x(t ) =

t 0

A(t ,s) x(s)ds + h(t ),

onde h ∈

C 0([a, b],C), A ∈

C 0([a,b]2,C), pode ser escrita como ( I −

A) x = h noespaço de Banach (C 0([a, b],C), . ∞), e que o Teorema de Neumann-Peano éaplicável para a obtenção de uma solução x ∈ C 0([a,b],C).

6.24. Analise a continuidade da solução da equação acima como “dependente doparâmetro” h, na forma x : [a,b] ×C 0([a, b],C) → C, x(t , h).

6.25. Mostre como utilizar o resultado acima para concluir que a mesma equaçãode Volterra com funções h ∈ C 0(R,C), A ∈ C 0(R2,C), também dispõe de soluçãoúnica x ∈ C 0(R,C).

6.26. Aplique os resultados acima obtidos para analisar problemas de Cauchy li-neares do tipo :

dx

dt = A(t ) x + h(t ), x(t 0) = α

∈Rn,

onde A(t ) é uma matriz n ×n.

Page 278: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 278/371

272 6 Operadores Lineares em Espaços Normados

6.27. Considere o problema de Cauchy na álgebra de matrizes :

dU dt

= AU , U (0) = I ,

onde A é uma matriz n×

n, complexa, I = “ Matriz Identidade n×

n”, e a incógnita éuma função matricial U ∈C 0 (R, M n(C)), onde M n(C) é uma álgebra normada (Fro-benius). Observação : derivação e integração de funções matriciais de uma variávelreal são definidas da mesma maneira que funções de variável real e valor vetorial,termo a termo, ou seja,

dM dt

i j =

dM i jdt .

a) Reescreva esta equação na forma integral,

U (t ) −t

0

A U (s)ds = I ,

e aplique o Teorema de Neumann-Peano para obter uma única solução U (t ).

b) Mostre, utilizando a unicidade de soluções, queU (t )U (s) =U (s+t ) para quais-quer valores reais de r e s.

c) Com base no anterior, mostre que U (−t )U (t ) = I , ou seja, U (t )−1 = U (−t ).

d) Mostre que a sérieV (t ) = ∑k 0

t k

k ! Ak tem sentido, é derivável e dV

dt = AV , e V (0) =

I . Portanto, V = U .

6.28. Mostre que todo o procedimento acima pode ser repetido em qualquer álgebrade Banach, a começar pela definição do problema de Cauchy :

dudt

= au, u(0) = u0.

Em particular, podemos definir ea, para qualquer elemento a de uma álgebra deBanach.

Definição 6.19 (Exponencial de uma matriz).Considerando a equação diferencial e as propriedades anteriores, nada mais natu-ral do que definir :

U (t ) = exp(tA) = etA ,

e U (1) = exp( A) = e A , onde U (t ) é a solução do problema de Cauchy matricial :dU dt = AU , U (0) = I.

Com o objetivo de melhor apreciar a força e a extensão do ponto de vista da Aná-lise Operacional, convidamos o leitor a meditar na resolução dos seguintes exercí-cios, voltando a sua atenção para o aspecto formal das questões. A eficiência dométodo formal é uma, e a grande, motivação para o desenvolvimento da teoria quepossa fundamentar, não apenas as manipulações dos exercícios, mas que permita

também a sua extensão a outras áreas menos imediatas. Referência : Maslov([],[],....

Exercícios :

Page 279: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 279/371

6.5 Equações lineares do segundo tipo, ou, Perturbações lineares da identidade 273

6.29. Considere um modelo de difusão simples na reta representado pelo problemade valor inicial com a equação diferencial parcial :

∂ u

∂ t

= Lu = D ∂ 2

∂ x2 , lim

t ↓0

u = u0( x),

para funções u ∈S (R×R+,R), que decrescem rapidamente para | x| → ∞ (condi-ções de fronteira no infinito). Mostre que o operador integral (de Green) G :C 00(R,R) → C ∞(R×R+,R), definido por

(Gu0) ( x, t ) =

+∞ −∞

K ( x−ξ ,t )u0(ξ ) d ξ ,

com núcleo

K ( x,t ) = 1√

4π Dt exp

− x2

4 Dt

,

é operador solução deste problema, em analogia (operacional) com as equaçõesdiferenciais ordinárias. Por esta razão, nada mais natural (e proveitoso !) do queutilizar a seguinte notação exponencial :

G = e L = e D∂ 2 x .

6.30. a) Considere o problema de transporte de massa ao longo de um fluxo defi-nido por um campo vetorial em Rn : −→a ( x1,... xn) = (a1,.....,an) = Ax, onde Aé uma matriz real n × n), e representado pelo problema de valor inicial para aequação diferencial parcial de primeira ordem :

∂ u∂ t

= Lu , limt ↓0

u = u0( x)

onde L = −→a ( x)∂ x =k =n∑

k =1ak ( x) ∂ ∂ xk

. Mostre que o operador (de Perron-Frobenius)

P : C 0(R,R) → C 0(R×R+,R), definido pela composição

(Pu0)( x,t ) = u0 (exp[− At ] x) ,

produz a solução de tal problema e, portanto, nada mais natural do que escrever(definir) a notação exponencial :

P = exp( Lt ) = exp(−→a ∂ x).

b) Considere o problema

∂ u∂ t

= Lu , limt ↓0

u = u0( x),

Page 280: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 280/371

274 6 Operadores Lineares em Espaços Normados

onde L = ∂ ∂ x , x ∈ R. Mostre que u( x, t ) = u0( x + t ) = E t u0( x) é solução desteproblema, e, portanto, nada mais natural do que escrever o operador de deslo-camento E h (E hv( x) = v( x + h)) na forma exponencial :

E h = exp(h d dx ).

Levando mais adiante ainda as “coincidências” formais, analise um sentido daigualdade

exp

h

d dx

=

∑k =0

1k !

h

d dx

k

.

Definição 6.20. Denotaremos por

GL(E ) = A ∈ L(E ), tal que existe A−1 ∈ L(E ),

que é obviamente um grupo com a operação de produto (composição), o chamadode Grupo Linear das Transformações Lineares de E, ou simplesmente, Grupo Li-near de E.

Observe a exigência de que a inversa seja, não apenas algébrica mas, tambémtopológica. Isto é, para que uma A ∈ L(E ) seja de GL(E ), não basta que exista umafunção linear inversa A−1, mas é necessário também que esta seja contínua, o quenem sempre acontece em espaços de dimensão infinita. O teorema da inversão deBanach, a ser tratado logo abaixo, abordará esta questão.

Portanto, devido a esta sutileza, é importante analisar em que condições a inversade um operador linear limitado mantêm esta propriedade. O teorema de Neumann-

Peano nos dará uma resposta muito específica e útil a respeito desta questão. Oconjunto de operadores lineares limitados e inversíveis como tal, (isto é, seu inversoé um operador linear limitado), é de grande importância, uma vez que estes permi-tem obter a solução de equações lineares de forma única e contínua.

Exercícios :

6.31. Obtenha espaços normados E e F e um operador linear bijetivo e contínuo A ∈ L(E ,F ), cuja função linear inversa A−1 não é contínua. Sugestão : Consulteexemplo citado no capítulo de espaços métricos (Teorema de Tikhonov).

6.32. Mostre que se A, B ∈ GL(E ), então AB ∈ GL(E ) e que ( AB)−1 = B−1 A−1.Conclua que GL(E ) é um grupo mas não um subespaço vetorial de L(E ).

6.33. Se A ∈ GL(E ), B ∈ L(E ) então AB = C ∈ GL(E ) se, e somente se, B ∈ GL(E ).

Page 281: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 281/371

6.5 Equações lineares do segundo tipo, ou, Perturbações lineares da identidade 275

Teorema 6.21 (Pequenas perturbações uniformes de sistemas estáveis mantêmestabilidade).Se E for um espaço de Banach, então,

1. GL(E ) é um um conjunto aberto da álgebra L(E ).

2. Se A0 ∈ GL(E ) , então B( A0,r ) ⊂ GL(E ) se r < 1 A−1

0 .

3. A função inversão i : GL(E ) → GL(E ) , i( A) = A−1 , é contínua.

Prova.

1,2. Sejam A0 ∈ GL(E ), e uma perturbação A0 + H , onde H ∈ L(E ) tal que H < A−10

−1, e que escreveremos na forma

( A0 + H ) = A0( I + A−10 H ) = ( I + HA−1

0 ) A0.

Como A0 ∈ GL(E ), basta que ( I + HA−10 ) ∈ GL(E ) para que tenhamos o resul-

tado. Ora, mas pelo teorema de Neumann-Peano isto é verdade sob a condiçãode que H < 1

A−10 −1 , uma vez que assim teríamos HA−1

0 ≤ H A−10 <

1. Observe que ( A0 + H )−1 = A−10 ( I + HA−1

0 )−1.

3. Exercício.

Este teorema pode ter os seus argumentos melhor aproveitados com o conceitode analiticidade.

Definição 6.22.Se A for uma álgebra de Banach e U ⊂ A um conjunto aberto, dizemos que uma função f : U

→C é analítica em U se para cada ponto z0

∈U existe uma bola

B( z0, r ) ⊂ U, onde é possível representar os valores da função por intermédio deuma série de potências convergente, isto é,

f ( z) =∞

∑k =0

ak ( z− z0)k ∀ z ∈ B( z0,r ).

Esta definição faz uso de um análogo do critério de Weierstrass para analitici-dade de funções de variável complexa, e tem grandes aplicações no Cálculo Opera-cional, como veremos mais adiante, já a partir do teorema seguinte.

Teorema 6.23 (Analiticidade da inversão de Neumann-Peano).

Se E for um espaço de Banach, então a função (não-linear) i : GL(E ) → G( LE ) ,i( A) = A−1 , é uma bijeção, contínua, na verdade, localmente lipschitziana, e analí-tica (no sentido que pode ser expressa por meio de séries).

Page 282: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 282/371

276 6 Operadores Lineares em Espaços Normados

Prova. Utilizando a notação do teorema anterior escrevemos

i( A0 + H ) = ( A0 + H )−1 = A−10 ( I + HA−1

0 )−1

= A−10

∑k =0

(− HA−10 )k = A−10 +

∑k =1

(− HA−10 )k ,

de onde tiramos que

i( A0 + H ) − i( A0) ≤ ∞

∑k =1

(− HA−10 )k

≤∞

∑k =1

(− HA−10 )k

≤ H

A−10

∑k =0

H A−10 k

.

Como a última série é convergente para H < A−10 −1, concluímos que i é lo-

calmente lipschtziana, e da expansão anterior, que é analítica.

Observação 6.24. 1. Do acima exposto, podemos escrever

i( A0 + H ) = i( A0) + A−10 (− H ) A−1

0 + o( H ),

onde o símbolo o( H ) representa uma classe de funções que satisfazem à se-

guinte condição de “infinitesimalidade” : lim H →0 o( H ) H = 0, e se diz que é de

ordem menor do que H quando este se aproxima de zero. Por outro lado, ob-serve que o segundo termo da direita é uma operação linear com respeito ao“acréscimo” H , que depende do ponto base A0 onde está sendo calculada, istoé,L ( H ) = A−1

0 (

− H ) A−1

0 . Esta maneira de escrever tem por objetivo ressaltar a

sua semelhança formal com o conceito de derivada de uma função G :Rn→Rm,G( x0 + h) = G( x0) +∂ G( x0) · h + o(h). Esta semelhança não é apenas formale pode ser substanciada estendendo-se a noção de derivada com os mesmosconceitos utilizados nos espaços de dimensão finita. Neste caso, ∂ i( A0) é a de-rivada da função i no ponto A0 e desempenha um papel exatamente igual àda matriz jacobiana ∂ G( x0) naquele caso. A propósito, observe a semelhançadesta fórmula com a fórmula de derivação do cálculo elementar para a funçãorecíproca : d

da (a−1) = −1a2 . A diferença está na possível não-comutatividade do

produto em uma álgebra de Banach.

2. A analiticidade da inversão é crucial para a análise de dependência de soluçõescom relação a parâmetros de uma equação, e a expressão que o teorema deNeumann nos fornece para esta função nos possibilita o cálculo de fórmulas ex-plícitas para algumas situações importantes, como veremos no último capítuloque trata do Cálculo Diferencial em espaços normados.

Page 283: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 283/371

6.5 Equações lineares do segundo tipo, ou, Perturbações lineares da identidade 277

Os resultados acima têm os seus correspondentes em álgebras de Banach, e osexercícios abaixo demonstram isto.

Exercícios :

Seja A uma álgebra de Banach e U ( A) o grupo dos seus elementos inversíveis. De-monstre as seguintes afirmações :

6.34. Se a ∈ A tal que a < r e h ∈ H ( Dr ), então podemos definir h(a) =∞

∑k =0

h(k )(0)ak .

6.35. A função Φ : H ( Dr ) → A,Φ [h] = h(a), onde a ∈ B(0, r ) ⊂ A, é um homomor-fismo de álgebras, isto é, preserva as operações das estruturas de álgebra.

6.36. Em particular, vale o teorema de Neumann-Peano : se A tiver unidade e, então,

para todo a ∈ A tal que a < 1, temos (e− a) ∈ U ( A), e (e−a)−1 =∞

∑k =0

ak .

6.37. U ( A) é aberto em A.

6.38. i : U ( A) → U ( A), i(a) = a−1 é bem definida, localmente lipschitziana e analí-tica.

6.39. Se a ∈ A tal que a < r e h, g ∈ H ( Dr ), então g(a) e h(a) comutam.

Os teoremas sobre perturbação de operadores lineares inversíveis nos permitemobter aproximações de soluções de uma equação por meio de soluções de aproxi-mações da equação, isto é, as aproximações são obtidas por intermédio de uma“pequena” modificação das equações. A ideia básica é aproximar a solução x de umproblema linear Ax = y ( y dado e x incógnita) por meio das soluções xn de equações(esquemas de aproximações) An xn = y. Esta é exatamente a estratégia do Método de

Diferenças Finitas, onde se substitui as operações de derivação por operações de di-ferenças (que seriam aproximações daquelas em alguma norma), obtendo-se assimum problema “algébrico” cuja solução espera-se que aproxime a desejada (Mar-chuk[1985], Atkinson[], Kantorovich[]). Uma preocupação óbvia com respeito aestes problemas se refere à estabilidade de soluções com respeito aos dados doproblema, e estabilidade estrutural, já que aproximações, são “aproximações”, e éimportante saber se há uma continuidade da solução x com respeito a y, e, respecti-vamente, com respeito ao parâmetro constitutivo A. Estas questões de estabilidadepodem ser respondidas, em parte, por alguns teoremas que serão enunciados abaixo.

Teorema 6.25 (Esquemas suficientemente próximos (norma uniforme) de umproblema estável são estáveis).

Se A ∈ GL(E ) , An ∈ L(E ) e An −→ A em L(E ) , então1. Para n suficientemente grande, An é inversível, (isto é, a solução xn é estável);na verdade basta que A−1( An − A) < 1 ,

Page 284: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 284/371

278 6 Operadores Lineares em Espaços Normados

2. Vale a estimativa : A−1n ≤ A−1

1− A−1( An− A) .

Prova. Basta escrever

An = A− ( A− An) = A I − A−1

( An − A) + I ,

e utilizar o teorema de Neumann.

Em geral, não basta que um esquema de aproximações An, ( An xn = y), parauma equação linear com operador A, ( Ax = y), seja estável (isto é, que An seja in-versível) para que isto implique em uma aproximação de fato das soluções, xn → x.Para que a aproximação de soluções ocorra, algo mais é necessário, e uma dasmais úteis e fundamentais ferramentas deste cenário em Análise Numérica é umesquema de aproximações uniformemente estável, em um sentido especificado pelo(primeiro) Teorema de Kantorovich :

Teorema 6.26 (Teorema de Kantorovich I : Esquemas uniformemente estáveismantêm existência, unicidade e estabilidade no limite uniforme).Sejam A ∈ L(E ) , An ∈ GL(E ) com An → A em L(E ) , tais que A−1

n ≤ M, isto é,o esquema de aproximação An é uniformemente estável. Então A ∈ GL(E ) e A−1 ≤ M.

Prova. Basta escrever A = An + ( A − An) e utilizar o teorema de Neumann-Peano,lembrando que, se A−1

n ≤ M , então, basta que ( A− An) ≤ 1 M .

Os teoremas que permitem a inversão topológica de operadores são obviamentefundamentais para a resolução de equações funcionais. Para finalizarmos esta subse-ção, apresentaremos um destes teoremas, que tem um significado especial, uma vez

que relaciona condições específicas para operadores em espaços de Hilbert, que per-mitem uma importante adaptação do teorema de Neumann-Peano com todas as suasbenesses ; existência de uma inversa contínua e um método eficiente para calculá-la.

Definição 6.27 (Operadores Monotônicos).Uma função (em geral, não linear) ϕ : H → H, definida em um espaço com produtointerno H é dita monotônica (estritamente) se para quaisquer x = y ∈ H tenhamos,

ϕ ( x)−ϕ ( y), x− y ≥ 0,

(respectivamente, > 0). Se A : H → H for linear, dizemos que é uniformemente mo-notônica se existir um m > 0 tal que Ax, x ≥ m x2 (ou seja, As, s é uniforme-

mente positivo na esfera unitária : As, s ≥ m > 0 , ∀s ∈ S 1 ⊂ H).

Page 285: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 285/371

6.5 Equações lineares do segundo tipo, ou, Perturbações lineares da identidade 279

Teorema 6.28 (Inversão de Operadores Uniformemente Monotônicos em Espa-ços de Hilbert).Sejam H um espaço de Hilbert e A ∈ L( H ) um operador linear uniformemente mo-notônico. Então A ∈ GL( H ).

Prova. Devemos mostrar que a equação Ax = y tem sempre solução única e é estávelcom relação a y. Faremos uma modificação deste problema, que é comumente cha-mada de método de relaxamento, a transformá-lo em uma perturbação da identidade,como no teorema de Neumann (ou em uma contração linear). Multiplicamos a equa-ção por um parâmetro escalar não nulo λ e somamos a variável x a ambos os termosobtendo uma nova equação equivalente : x +λ Ax = λ y + x, que pode ser vista comouma equação do tipo ( I − ( I −λ A)) x = λ y. Mostraremos agora que sob a condiçãode monotonicidade uniforme, é possível escolher um λ tal que I − λ A < 1, oque nos permitirá então o uso da série de Neumann para a inversão de A. Para isto,calculamos

( I −λ A) x 2 = ( I −λ A) x, ( I −λ A) x = x 2 −2λ Ax, x+ λ Ax 2

≤ x 2 1−2mλ + A λ 2= p(λ ) x 2,

e agora basta verificar que é possível escolher λ 0 tal que p( λ 0) < 1. Assim, A−1 =

λ −10

∑k =0

( I −λ 0 A)k .

Observação 6.29. Observações sobre o conceito de monotonicidade :

1. A monotonicidade, obviamente, é uma extensão do conceito de função cres-cente (não-decrescente) de variável real, que se define por intermédio da es-trutura de ordem dos números reais, o que não se tem a disposição em ou-tros contextos. Portanto, para estendê-la, pelo menos parcialmente, é necessário

livrá-la do contexto específico dos números reais. Uma maneira mais geomé-trica e conveniente seria dizer que a função varia na mesma direção que a va-riável, o que pode ser formalmente descrito pela definição : “ϕ é estritamentecrescente quando (ϕ ( x) −ϕ ( y)) · ( x − y) 0”, um conceito que pode perfeita-mente ser reproduzido para funções definidas em espaços com produto interno.

2. Geometricamente, a monotonicidade para operadores lineares, que é o caso quenos interessa aqui, implica que Ax se encontra no mesmo semi-espaço que x, ea monotonicidade estrita significa que Ax se encontra dentro de um cone “cen-

trado” em x e ângulo ≤ α = arccos

m A

.

Exercícios :

6.40. Verifique as observações acima.

Page 286: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 286/371

280 6 Operadores Lineares em Espaços Normados

6.41. Enuncie o Lema de Lax-Milgram e demonstre-o fazendo uso do Teorema deInversão de Operadores Monotônicos. Sugestão : mostre que o operador A : H → H obtido pelo teorema de Riesz-Frechet para a representação dos funcionais linearesλ w(h) = B(w, h) = Aw,h é linear, limitado e do tipo uniformemente monotônico

e, portanto, pelo teorema acima, é sobrejetor, o que resolve a questão. (A propósito,esta é a demonstração clássica do Lema de Lax-Milgram).

Um teorema do mesmo tipo, que garante a inversão de perturbações da identi-dade é :

Teorema 6.30.Se H for um espaço de Hilbert e A ∈ L( H ) , então, ( I + A∗ A) ∈ GL( H ) , isto é, ( I + A∗ A) é bicontínua.

Prova. Exercício.

6.6 Teoremas de Banach

A aplicação de esquemas de aproximação exige que tratemos de processos deconvergência menos restritivos do que a convergência na norma operacional (uni-forme) que, em geral, é de verificação difícil, o que reduz muito a utilidade dométodo, ou, pior, pode não ser válida. Nesta seção obteremos, por exemplo, o teo-rema de Kantorovich II que enfraquece a exigência de convergência uniforme daversão I, e com isto, proporciona o mesmo importante resultado de estabilidade sobcondições mais amplas e muito mais úteis no contexto de aplicações. Por outro lado,convergências mais “fracas”, como ponto a ponto, embora resultem na obtenção desoluções particulares, talvez sejam insuficientes para descrever propriedades estru-turais das equações ; as vantagens e desvantagens de cada caso serão analisadasrapidamente.

Os teoremas básicos desta seção, o Princípio da Limitação Uniforme e o Teo-rema da Aplicação Aberta, são devidos principalmente a Stefan Banach e, junto como teorema de Hahn-Banach-Helly, são tradicionalmente considerados como os pi-lares fundamentais da Análise Funcional abstrata. Embora, sob o ponto de vista dasAplicações da Análise Funcional, poderíamos, e com grandes vantagens, substituí-los nesta classificação restrita por outros três (Banach-Cacciopoli, Riesz-Fréchét eHilbert-Schmidt), o lugar de todos eles está garantido em qualquer lista prioritáriados 10 mais.

Page 287: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 287/371

6.6 Teoremas de Banach 281

6.6.1 O Princípio da Limitação Uniforme (Ressonância) de Banach–Steinhaus

Os teoremas de Banach-Steinhaus introduzem algumas relações entre modosdistintos de convergência de uma sequência de operadores lineares limitados, uma

questão que será cada vez mais importante no desenvolvimento subsequente e queenvolve propriedades topológicas finas dos espaços em questão. Dentre os argumen-tos topológicos que surgem com grande frequência nas demonstrações destes teore-mas, e que têm também importância em outros contextos da Análise, estão o Lemados Magros de Baire (Renée Baire) e o Princípio de Limitação Uniforme de Banach-Steinhaus (ou Teorema de Ressonância), razão porque serão tratados em destaqueseparadamente nesta seção. Uma demonstração não topológica para o Princípio daLimitação Uniforme, devida ao famoso topólogo ( !) F. Hausdorff (~1933), tambémserá apresentada a título de informação, já que ela raramente é citada na literatura(v. J. Hennefeld, AMM1967) e esclarece um lado distinto da questão.

Lema 6.31 (Lema dos Magros de Baire).

Se M for um espaço métrico completo, e F k k ≥0 uma família enumerável deconjuntos fechados tal que M = ∪F k , então, nem todos estes conjuntos podem ser “magros”, isto é, algum destes conjuntos deve conter uma bola completa.

Prova. Suponha o contrário. Partindo do fato de que M = F 0, (pois caso contrariotodas as bolas de M já estariam em F 0) existe uma bola tal que B( x0, r 0)∩F 0 = / 0. Setambém F 1 não contem nenhuma bola, podemos tomar um ponto x1 ∈ B( x0, r 0

2 ) −F 1e d ( x1,F 0) > r 0

2 = r 1. Repetimos o argumento com a bola B( x1,r 1) e F 2, e obtemosum ponto x2 ∈ B( x1, r 1) − F 2 tal que d ( x2, F 1) > r 1

2 = r 022 , e daí por diante, obtendo

assim uma sequência encaixante de bolas B( xn, r n) com raios r n = r 02n , e tais que

d ( xn+1, F n) > r n2 , o que nos leva a concluir que os seus centros formam uma se-

quencia de Cauchy, portanto, convergente. Digamos que este limite seja x, xn → x, everemos imediatamente que o mesmo será o “pomo da discórdia”, pois não perten-

cerá a nenhum F k , uma vez que estará dentro de todas as bolas.

Teorema 6.32 (Teorema de Banach-Steinhaus I - Princípio de Limitação Uni-forme : Limitação Pontual ⇒ Equilimitação).Sejam E um espaço de Banach, F um espaço normado e Aα ∈ L(E ,F ) , uma famí-lia, não necessariamente enumerável, pontualmente equilimitada, (isto é, ∀ x ∈ E,∃ M x , tal que ∀α , Aα x ≤ M x). Então, Aα é uniformemente equilimitada, ouseja, ∃ M > 0 , tal que Aα 0< M, ∀α .Prova (Demonstração usual). Consideremos os conjuntos H N

α = x ≤ 1, Aα x ≤ N , e ∩α H N x

α = H N x , N ∈ N. Observe que a hipótese pode ser reescritacom estes conjuntos nos seguintes termos : B(0, 1) =

∪ N

≥1 ∩α H N α =

∪ N

≥1 H N ,

pois, pela limitação pontual, para cada x, existe um M x, de onde x ∈ H N , para todos N > M x. Observe ainda que os H N

α são fechados, e, portanto, H N é fechado.

Page 288: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 288/371

282 6 Operadores Lineares em Espaços Normados

O Lema de Baire então nos assegura que existe um índice N 0, para o qual H N 0

não é magro, ou seja, temos uma bola B( x0,r ) ⊂ H N 0 , com r > 0, de onde vemque Aα x ≤ N 0 para todo x ∈ B( x0,r ) e todo α . Finalmente, concluímos que,para todo z ∈ B(0,r ), e todo α , temos Aα ( z) = Aα ( x− x0) ≤ N 0+ Aα ( x0) ≤ N 0 + M x0 = M , o que significa uma limitação uniforme para a família de operadores.

Prova (Demonstração de Hausdorff). Suponha que seja falsa a implicação e que Ak sejam ilimitadas. Construiremos uma sequencia de elementos xn tais que xn = an, a < 1, de tal forma que a série ∑ xn = x convirja; x será o “pomo dadiscórdia”.

Para isto, suponha que x1,..., xn−1 tenham sido construídos e passemos a construir xn. Seja M n−1 = supk Ak ( x1 + .... + xn−1), um número finito, devido à limitaçãopontual. Analisando a desigualdade

An x An xn− M n−1 − An ( xn+1 + ...) An xn− M n−1 − an+1

1−a An ,

escolhemos agora xn de tal forma que An xn ≈ An xn, digamos An xn =γ An xn, para γ 1, (tomando xn = an, a < 1), de onde teremos

An x Anγ an − M n−1 − an+1

1− a An = Anan

γ − a

1−a

− M n−1

an An

.

Agora, com a liberdade restrita para a < 1 e γ < 1, o valor fixo para M n−1, e acompleta liberdade no valor An (por hipótse contraditória), podemos escolher esteúltimo de tal forma que An x > n, o que provará (por contradição) o teorema. Aúltima construção, deixaremos ao leitor.

Exercícios :

6.42. Mostre que um Princípio de Limitação Uniforme pode ser provado de ma-neira literalmente igual para famílias de funcionais : a) positivos, b) contínuos, c)subaditivos e d) homogêneos, isto é, respectivamente : a) ϕ : E →R+, b) ϕ limitadona bola unitária, c) ϕ ( x + y) ≤ ϕ ( x) +ϕ ( y), e d) ϕ (λ x) =| λ | ϕ ( x). Uma vez pro-vado para este caso, o Teorema de Banach-Steinhaus I é obtido bastando considerarϕ α ( x) = Aα ( x) . (Há vantagens para esta generalização, uma vez que pode seraplicada a seminormas).

6.43. Há também uma demonstração elementar do Principio de Limitação Uniformede B-S específico para espaços de Hilbert. Procure obter esta demonstração, comodesafio intelectual, não bibliográfico.

Page 289: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 289/371

6.6 Teoremas de Banach 283

Teorema 6.33 (Teorema de Banach-Steinhaus II : Convergência Pontual ⇒Convergência Uniforme em Compactos).Sejam An ∈ L(E ,F ) , onde E é espaço de Banach e F é espaço normado, e An( x)converge para todo x ∈ E.

1. Se Ax = lim An x, então A ∈ L(E , F ).2. A convergência An → A é uniforme em compactos.

Prova. 1. Pelo Teorema de Banach sobre o Princípio de Limitação Uniforme,existe M > 0 tal que An x ≤ M , para quaisquer x ∈ B1 e n. A função definidacomo o limite pontual, Ax = lim An x é obviamente linear e, pelo que acabou deser visto, Ax ≤ M , para quaisquer x ∈ B1, ou seja, é limitada.

2. Seja K ⊂ E compacto. Considere a funções : ϕ n : K →R, ϕ n( x) = ∨k ≥n ( Ak − A)( x) = sup ( Ak − A)( x) , k ≥ n, que são bem definidas, em virtude daexistência dos limites, monotonamente decrescentes, e cujo limite pontual é afunção contínua nula. A conclusão do teorema (isto é, que a convergência de ϕ né uniforme), vem pelo Teorema de Dini, se mostrarmos que as funções ϕ n sãocontínuas (v. exercício).

Exercícios :

6.44. Mostre que as funções ϕ n( x) definidas no teorema B-S-II são contínuas. Su-gestão : Mostre que

| An( x + h) − A( x + h) − An( x) − A( x) |≤ An(h)− A(h) ≤ 2 M h ,

de onde vem a conclusão.

6.45. Usando a caracterização topológica de um compacto e a equicontinuidade da

sequência An, obtenha uma outra demonstração do teorema B-S-II.

Teorema 6.34 (Teorema de Banach-Steinhaus III : Convergência Pontual DensaEquilimitada ⇒ Convergência Uniforme em Compactos).Sejam An ∈ L(E ,F ) , onde E e F são espaços de Banach, An ≤ M (equilimitada),e An( x) converge em um subconjunto denso de E. Então existe A ∈ L(E , F ) , tal que An → A uniformemente em compactos.

Prova. Seja S ⊂ E o conjunto denso onde se dá a convergência. Fazendo uso dalinearidade e da equilimitação na triangulação :

An x

− Am x

≤ An x

− Ans

+

Ans

− Ams

+

Ams

− Am x

,

podemos provar que An x é de Cauchy em F e, portanto converge pontualmente.Verifique. Com isto voltamos ao teorema anterior.

Page 290: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 290/371

284 6 Operadores Lineares em Espaços Normados

O Teorema de Kantorovich que apresentaremos a seguir tem uma importânciafundamental em Análise Numérica, especialmente com respeito a análise de aproxi-mações de soluções de equações diferenciais por diferenças finitas, uma vez quefornece um critério para verificar se as soluções de um esquema de aproximação

converge para a solução do problema exato. É importante ressaltar as duas condi-ções cruciais para que isto aconteça :

1. Que o esquema de aproximação seja uniformemente estável (exigência tambémdo Teorema de Kantorovich I) e,

2. A equação Ax = y tenha solução única para todo y ∈ F , ou seja, que a inversaalgébrica (não necessariamente contínua) de A exista.

Teorema 6.35 (Teorema de Kantorovich II : Equivalência entre estabilidadeuniforme e convergência de soluções para um esquema de aproximações deum problema que admita existência e unicidade de soluções).Sejam E e F espaços de Banach, An ∈ L(E , F ) tais que existem A−1

n ∈ L(F , E ) , e

A : E → F, bijetiva (não necessariamente limitada), limite pontual da sequência Anna forma Ax = lim An x.Então, A−1

n z → A−1 z se, e somente se, A−1n são equilimitadas e, neste caso,

A ∈ L(E , F ) , A−1 ∈ L(F ,E ) e a convergência A−1n → A−1 se dá uniformemente em

compactos.

Prova. Suponha A−1n ≤ M . Então

A−1n z− A−1 z = A−1

n ( z− An A−1 z) ≤ M A( A−1 z) − An( A−1 z) −→ 0,

uma vez que An x → Ax, ∀ x ∈ E . As outras conclusões são provenientes dos teoremade Banach-Steinhaus. Se agora A−1

n z −→ A−1 z, basta utilizar o teorema de B-S-I.

Observação 6.36. 1. Observe que o teorema de Kantorovich equivale a possibili-dade de aproximar a solução x de Ax = y por soluções xn de An xn = y à es-tabilidade uniforme do esquema de aproximações, isto é, à condição de equi-limitação dos operadores inversos A−1

n . Este é um resultado fundamental paraa análise numérica de esquemas de aproximações de diferenças finitas, dentreoutras questões. A respeito deste assunto, consulte o clássico R. D. Richtmeyer,K. W. Morton, Difference Methods for Initial-Value Problems, J. Wiley, 1967,ou o próprio Kantorovich-Akilov[].

2. Uma consequência importante dos teoremas de Banach-Steinhaus está na pos-sibilidade de construir operadores lineares limitados por meio apenas de umaconvergência pontual, e que na verdade significa convergência uniforme emcompactos. Observe que em dimensão infinita, onde uma bola não é compacta

(Riesz), este tipo de convergência não significa necessariamente uma conver-gência na norma . 0 de L(E , F ), o que exigiria convergência uniforme embolas.

Page 291: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 291/371

6.6 Teoremas de Banach 285

3. Verificamos assim que a convergência na norma uniforme . 0 não é o únicoprocesso construtivo de operadores lineares limitados. Na próxima seção, consi-deraremos alguns outros tipos de convergência em E e, especialmente em L(E , F ) com F = R (ou C), úteis em Análise e, em grande parte, decorrentes

dos teoremas acima apresentados.

Exercício :

6.46. Mostre que se A : E → E for uma operação linear biunívoca (não necessaria-mente contínua) no espaço de Banach E , limite pontual de um esquema uniforme-mente estável An ∈GL(E ), então A ∈ GL(E ), ou seja, é estável, e é limite uniformeem compactos de An.

6.6.2 Teoremas de Banach para a inversão de operadores lineares

Em dimensão finita, sabemos que todas as transformações lineares entre espa-ços normados são contínuas. Entretanto, o mesmo não acontece entre espaços dedimensão infinita. Mais ainda, há operadores lineares limitados entre espaços nor-mados que são bijeções mas que não tem uma inversa contínua. E como já observa-mos, a existência e unicidade de soluções para uma equação do tipo Ax = y, (isto é,o fato de que A é uma bijeção), tem pouco significado prático se não houver estabili-dade da resposta x em função da variação dos dados y, o que significa continuidadeda inversa. Os teoremas de Banach que serão abordados nesta seção nos fornecem ascondições para que um sistema linear, que tem garantidas a existência e a unicidadede soluções, também apresente estabilidade destas soluções com respeito ao termonão-homogêneo. Lembre-se que o teorema de Neumann nos garante que equações Ax = y em um mesmo espaço E , que são estáveis no sentido acima, (isto é, A e

A−1

∈ L(E )), continuam sendo estáveis para pequenas perturbações na norma dooperador, (isto é, A + H e ( A + H )−1 ∈ L(E ) para H pequeno). Observe que oconceito de estabilidade é empregado nesta última afirmação em dois sentidos dife-rentes ; um com respeito à aplicação A em E e outro com respeito à invertibilidadede A. Podemos reformular esta questão de outra maneira mais prática : Uma equação Ax = y, (isto é, A e y dados, e x incógnita), é estável quanto à propriedade de admitiruma única solução x, para pequenas perturbações em y, ou, respectivamente, em A ?A primeira questão é respondida com a continuidade de A−1, e a segunda com o fatode que GL(E ) é aberto. Uma vez que este conceito será frequentemente empregado,é interessante formalizar sua definição de uma maneira abstrata que possa abrangermuitas das diversas situações em que ocorrerá.

Definição 6.37 (Estabilidade Topológica).Se M for um espaço topológico (métrico, por exemplo), dizemos que uma determi-nada afirmação (quantitativa ou qualitativa) a respeito de seus elementos é estável

Page 292: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 292/371

286 6 Operadores Lineares em Espaços Normados

se o conjunto dos elementos que a satisfazem é aberto em M, isto é, se a ∈ M sa-tisfizer à afirmação, então existe uma vizinhança de a (uma bola aberta no caso deum espaço métrico), em que todos os elementos também satisfazem à afirmação.

Em outras palavras, a característica definida pela afirmação não é destruída porvariações suficientemente pequenas segundo a topologia de M . É claro que esteconceito é intimamente dependente da topologia considerada em M . Quando a afir-mação em questão for quantitativa, o conceito de estabilidade está associado aoconceito de continuidade, mas em muitos contextos as afirmações são de carátercategórico e não numérico.

Exercícios :

6.47. Mostre que o operador linear abaixo definido é contínuo, bijetor (e portantotem uma inversa linear), entre dois espaços normados F e E , mas a sua inversa nãoé limitada. E = (h ∈ C 1([0,1],R), h(0) = 0, . ∞), F = (C 0([0,1],R), . ∞) e

A : F

→E , Ag( x) = h( x) =

x

0 g(s)ds, e, naturalmente, A−1h = h.

6.48. Sejam E = h : N→ C, existe N h tal que h(k ) = 0 se k > N h = Espaço dassequências quase-nulas, h ∞= max | h(k )|. Defina A : E → E como A[h](k ) =h(k )k +1 . Mostre que E não é espaço de Banach, A é contínua, linear e algebricamenteinversível, mas que sua inversa A−1 não é limitada.

6.49. Mostre que se uma função linear entre espaços normados h : E →F é limitadaem uma bola qualquer B( x0, r ) ⊂ E , então h é contínua.

Como já afirmamos, os teoremas de Banach para dimensão finita são relativa-mente triviais e apenas adquirem a sua extraordinária importância e impacto paraespaços de dimensão infinita. Portanto, todo o contorcionismo topológico que fare-

mos para as demonstrações abaixo ficarão por conta desta generalização.

Teorema 6.38 (Teorema da Inversão de Banach : Inversão Algébrica (opera-dores lineares entre espaços de Banach) ≈ Inversão Topológica).Sejam E e F espaços de Banach e A ∈ L(E ,F ) um isomorfismo algébrico entre espa-ços vetoriais. Então a sua inversa algébrica A−1 é também uma inversa topológica,isto é, A−1 ∈ L(F , E ).

Prova. O objetivo será demonstrar que A−1 é limitada em alguma bola de F . Paraisto, mostraremos que a imagem de alguma bola B N = x ∈ E , x < N ⊂ E pela aplicação A, A( B N ) = Ax, x ∈ B N ⊂ F , contêm uma bola inteira B( y0, r ) ⊂ A( B N ) (v. exercício acima). Começaremos modestamente mostrando que o fecho de

alguma delas, A( B N ), contêm uma bola.Ora, observe que pela linearidade e pela sobrejeção de A, podemos facilmentever que ∪ N ≥1 A( B N ) = F = ∪ N ≥1 A( B N ). Como F é de Banach, pelo Lema de Baire,

Page 293: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 293/371

6.6 Teoremas de Banach 287

podemos concluir que algum destes conjuntos fechados A( B N ) deve conter umabola, digamos, B( y0, r ) ⊂ A( B N 0 ). Faça um esboço geométrico e conclua por umargumento de homotetia e continuidade que B(0, r ) ⊂ A( B2 N 0 ). De fato, sejam y ∈ B( y0, r ) e xn, x0

n

∈ B N , tais que Ax0

n = y0n

→ y0 e Axn = yn

→ y. Então, A( xn

− x0

n)

→ y− y0, e vemos que xn − x0n ≤ 2 N onde y− y0 = z pode ser qualquer elemento de B(0,r ). Concluímos daí, também por homotetia, que existe uma bola Bδ (0,δ ) ⊂ F ,na qual A( B1) é densa, e, consequentemente, que A( Bλ ) é densa em Bλδ ⊂ F . Estaúltima afirmação pode ser traduzida de forma mais prática da seguinte maneira :para todo y ∈ B(0,λδ ) ⊂ F , a equação Ax = y pode ser resolvida tão acuradamentequanto desejado por um xε ∈ B(0,λ ) ⊂ E , isto é, Axε − y ≤ ε . A conclusãodo teorema será obtida pela demonstração do seguinte lema, que apresenta umaconstrução interessante por si mesma.

Lema 6.39. Se E e F são espaços de Banach, A ∈ L(E , F ) , e existe uma bola Bδ = B(0,δ ) tal que ∀ y ∈ Bδ e ∀ε > 0 , a equação Ax = y tem uma solução aproximada xε

∈ B(0,1)

⊂ E (isto é,

Axε

− y ≤ ε ), então, existe solução exata x

∈ B1 da

equação.

Prova. Construímos a seguinte sequência : seja y0 ∈ Bδ , e tomemos x0 ∈ B1 ⊂ E ,tal que y0 − Ax0 ≤ 1

2δ = 2−1δ , e chamemos y1 = y0− Ax0, onde y1 ∈ B 12 δ

. Porhomotetia sabemos que podemos resolver a equação Az = y1 em B 1

2⊂ E tão acura-

damente quanto desejarmos. Tomemos então x2 ∈ B 12

tal que y1 − Ax2 ≤ 2−2δ ,denominamos de y2 = y1 − Ax2, e assim sucessivamente. Somando as igualdades yk +1 = yk − Axk +1, temos

k =n+1

∑k =0

Axk = A

k =n

∑k =0

xk

= y0 + yn+1.

Por outro lado, observe que pela construção recursiva temos xn ≤ 2−n+1 e yn ≤2−nδ .

A estimativa k =n∑

k =m xk ≤

k =n∑

k =m xk ≤

k =n∑

k =m2−k mostra que a sequência

k =n∑

k =0 xk é de

Cauchy, e portanto converge em F , e ainda que a sua soma está na bola unitária B1.

Então, se k =n∑

k =0 xk →

∑k =0

xk = x ∈ B1, e como yn+1 ≤ 2−(n+1)δ → 0, concluímos

que Ax = y0.

Observação 6.40. O teorema de Banach pode ser reformulado também da seguintemaneira : “Um problema linear contínuo entre espaços de Banach, Ax = y, queadmite solução x única para todo y, é estável, ou seja, x é estável com relação a y ”.

Exercício :

Page 294: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 294/371

288 6 Operadores Lineares em Espaços Normados

6.50. Demonstre o seguinte teorema sobre equivalência de normas em espaços deBanach : “Se o espaço vetorial E for de Banach com as duas normas, . i, i = 1, 2,e existir um m > 0 tal que x 1≤ m x 2,∀ x ∈ E , então as duas normas sãoequivalentes”.

O teorema de inversão de Banach é frequentemente apresentado com dois outrosteoremas equivalentes e muito úteis em diversas situações ; o teorema da aplicaçãoaberta e o teorema do gráfico fechado, que passaremos a apresentar em seguida.

Teorema 6.41 (Teorema da Aplicação Aberta de Banach).Se E e F são espaços de Banach e A ∈ L(E , F ) é sobrejetiva, isto é, A(E ) = F, então A é uma função aberta, isto é, todo conjunto aberto U ⊂ E é levado em um aberto A(U ) ⊂ F.

Prova. A demonstração do teorema de inversão de Banach pode ser literalmenterepetida aqui. Verifique. Mas, é interessante mostrar que as duas afirmações são

equivalentes e por este motivo utilizaremos uma demonstração que parte da vali-dade do teorema da inversão, embora seja muito técnica. Como A é contínua, entãoKer ( A) = núcleo de A, é fechado, e podemos então definir o espaço de Banach quo-ciente E

Ker ( A) = E 0 e aplicação A0 : E 0 → F , A0([ x]) = A( x), que é contínua e bije-tiva. Então, pelo teorema de inversão de Banach concluímos que existe uma inversacontínua A−1

0 . Portanto, pela caracterização topológica de continuidade, temos que( A−1

0 )−1 = A0 deve levar abertos em abertos. Mas, se U for um aberto de E então[U ] = [ x], x ∈ U , é aberto em E 0, e A0([U ]) = A(U ) que é então aberto!

É claro que o Teorema de Aplicação Aberta implica imediatamente no Teoremada Inversão!

O Teorema do Gráfico Fechado tem uma importância muito maior do que oTeorema da Aplicação Aberta, em parte porque introduz um novo conceito na teoriade operadores lineares e mesmo não-lineares, que é de grande utilidade no estudode operadores não-limitados, especialmente operadores diferenciais. O conceito deoperador fechado nos possibilita desenvolver um método de extensão do domíniopara operadores diferenciais não-limitados, devido a K. O. Friedrichs, que substituio método de extensão por continuidade uniforme utilizado no estudo de operadoreslimitados. Esta teoria é essencial para o tratamento de equações diferenciais parciaispor métodos de Análise Funcional especialmente em aplicações à física quântica,mas não será abordada aqui. Para referências a respeito consulte Reed-Simon[],Mikhlin[1970].

Iniciaremos por uma definição que estende naturalmente o conceito de gráficode uma função do cálculo elementar para situações bem gerais.

Page 295: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 295/371

6.6 Teoremas de Banach 289

Definição 6.42. Se M e N são conjuntos quaisquer e ϕ : M → N for uma funçãoqualquer, o subconjunto do produto cartesiano, definido e denotado por

G(ϕ ) = (a,ϕ (a)) ∈ M × N , a ∈ M ,

é, naturalmente, denominado de gráfico de ϕ . Se M e N são espaços métricos, entãodizemos queϕ é uma função de gráfico fechado se G(ϕ ) for um subconjunto fechadode M × N, isto é, se α n = (an,ϕ (an)) ∈ M × N é tal que α n −→ β = (a,b) ∈ M × N,na métrica do produto (ou seja, an → a e bn → b), então β = (a,b) ∈ G(ϕ ) , ou seja,ϕ (a) = b.

Exercícios :

6.51. Mostre que se M e N são espaços métricos e ϕ : M → N for uma funçãocontínua, então G(ϕ ) é fechado.

6.52. Mostre que se E e F são espaços vetoriais e A : E →

F for linear, então, G( A)

é um subespaço do espaço produto E ×F .

6.53. Considere os espaços normados E = (C 1([0,1],R), . ∞) e F = (C 0([0,1],R),. ∞), e a operação linear ∂ : E → F , onde ∂ h( x) = d

dx h( x). Mostre que o operador∂ é não-limitado e fechado

6.54. O que dizer de um operador L : E → F , onde (E = C 2([0, 1],R), . ∞), F =(C 0([0, 1],R), . ∞) e L[u]( x) = ∂ 2u( x) + p( x)∂ u( x) + q( x)u( x), sendo as funções p,q ∈ C 0([0,1],R) ?

O Teorema do Gráfico Fechado nos dá uma condição necessária e suficiente paraque o gráfico de um operador linear entre espaços de Banach seja fechado

Teorema 6.43 (TEOREMA DO GRÁFICO FECHADO (BANACH)).Sejam E ,F espaços de Banach e A : E −→ F uma função linear. Então,

A ∈ L(E , F ) ⇐⇒ G( A) for fechado em E ×F.

Prova. ⇐) Suponha que G( A) seja fechado em E × F . Observe inicialmente queE ×F é um espaço de Banach e que G( A) é um subespaço fechado de E ×F , e, por-tanto, também é um espaço de Banach. Consideremos agora as funções projeção :P1 : E ×F → E , P1( x, y) = x, e P2 : E ×F → F , P2( x, y) = y, que são obviamente li-neares e contínuas (verifique). É fácil ver que a primeira projeção restrita ao gráfico :P1 : G( A) ⊂ E ×F →E , P1[( x, Ax)] = x, é contínua e bijetiva (verifique). Então, peloTeorema de Inversão de Banach, concluímos que ela é continuamente inversível e,

portanto A = P2 P−11 : E → F , é contínua.⇒) Exercício acima.

Page 296: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 296/371

290 6 Operadores Lineares em Espaços Normados

É interessante observar que a questão topológica fundamental na demonstraçãodos três teoremas acima é comum a todos eles, e foi resolvida na demonstração doTeorema de Inversão. Isto é, uma vez conhecido um deles, os outros dois são rela-tivamente simples. Esta interrelação é mais uma curiosidade estrutural da matéria

mas, de qualquer maneira, vale a pena fechar o ciclo demonstrando o teorema dainversão com o uso do teorema do gráfico fechado.

Exercício :

6.55. Demonstre o teorema da inversão de Banach com base no teorema do gráficofechado. Sugestão : Mostre que G( A−1) é fechado!

Trataremos agora de uma questão relacionada à estabilidade da propriedade deexistência de soluções de uma equação linear Ax = y com respeito à variação dooperador A em L(E ,F ), isto é, dado A ∈ L(E ,F ) sobrejetor, então uma pequenaperturbação A+h ,segundo a norma uniforme, mantêm a sobrejetividade, ou seja, “ A propriedade de existência de soluções para a equação Ax = yé estável com relação

a pequenas perturbações (norma uniforme) no operador A”. Este teorema, até ondesabemos, não é devido a Banach, embora não estivesse fora do alcance de seusargumentos.

Teorema 6.44 (Estabilidade dos operadores lineares limitados sobrejetores).Sejam E e F espaços de Banach e denominemos de S (E , F ) = A ∈ L(E ,F ) , taisque A(E ) = F = conjunto dos operadores lineares limitados entre E e F, sobreje-tivos. Então, S (E , F ) é um conjunto aberto em L(E ,F ).

Prova. Devemos provar que dado A ∈ S (E , F ), existe δ ( A) > 0 tal que ∀h ∈ L(E , F ) tal que h < δ , tenhamos A + h ∈S (E , F ), ou, equivalentemente, queexiste uma bola Br ⊂ ( A + h)( B1) (verifique). Como A é sobrejetiva, pelo Teoremada Aplicação Aberta, existe uma bola Br

⊂ A( B1), de onde vem por homotetia (*)

que B2−nr ⊂ A( B2−n ) para qualquer n. Utilizaremos aqui um argumento recursivopara mostrar que a equação ( A + h) x = y tem solução para qualquer y ∈ Br , se h fortomado suficientemente pequeno.

Seja x0 ∈ B1 tal que Ax0 = y. Se agora o “erro” causado pela perturbação h for ( A + h) x0 − y = h( x0) ≤ r

2 , isto é, se tomarmos h < r 2 = δ , então podemos

resolver a equação Ax1 = −h( x0), onde x1 ∈ B2−1 de acordo com a observação dahomotetia (*). O novo “erro” será h( x1) ≤ h x1 = r

22 . Repetindo o processo,obtemos uma sequência de pontos xk com as seguintes propriedades : xk ≤ 2−k e h( xk ) = valor absoluto do k -ésimo erro ≤ r

2k +1 . Portanto, fazendo uso da majo-

ração com a série geométrica e o critério de Cauchy, concluímos que a série k =m∑

k =o xk

converge dentro da bola B1 e, como

Ak =m

∑k =o

xk

= y + h( xm),

Page 297: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 297/371

6.6 Teoremas de Banach 291

daí o resultado desejado.

6.6.3 Espectro e resolvente

O Teorema de Neumann nos garante que se perturbarmos a identidade com qual-quer operador limitado com norma uniforme menor do que a unitária, ainda teremosinvertibilidade topológica. Mas digamos que estejamos considerando uma perturba-ção apenas por meio de múltiplos de um determinado operador, isto é, I −µ A.

Certamente, pelo Teorema de Neumann, I −µ A será um operador inversível se| µ |≤ A . Entretanto, nada pode ser dito em geral para | µ | > A , uma vez quea “quebra da invertibilidade” pode acontecer em outra “direção operacional”. Paraanalisarmos estas questões introduzimos os conceitos abaixo.

Definição 6.45. Seja A : E → E um operador linear, não necessariamente imitado,

em um espaço normado E :1. Denominamos conjunto resolvente de A, denotado por ρ ( A) , ao subconjunto

de números complexos definido por ρ ( A) = λ ∈ C , tal que (λ I − A) seja umisomorfismo algébrico e que exista (λ I − A)−1 ∈ L(E ) , também chamado deconjunto dos valores regulares de A.Observe que na definição de conjunto resolvente, não estamos exigindo que A ou (λ I − A) sejam limitados, mas apenas (λ I − A)−1 ∈ L(E ). Escrevemossimplificadamente (λ I − A) = (λ − A).

2. Denominamos resolvente de A : E → E à função de variável complexa definidano conjunto aberto ρ( A) do plano complexo, com valores na álgebra L(E ) , daseguinte maneira : R A : ρ( A) ⊂C→ L(E ) , R A(λ ) = R( A,λ ) = (λ − A)−1. Emalguns textos escreve-se R( A,µ ) = ( I −µ A)−1.

3. Denominamos de espectro de A ao conjunto dos pontos σ ( A) que não estãono resolvente de A, isto é, C− ρ( A) = σ ( A) , também chamados de valoressingulares. Observe que para um número z esteja em σ ( A) (o que significa z /∈ ρ( A)), os motivos são : o operador zI − A não é algebricamente inversível,e portanto z é autovalor de A ; ou, mesmo que exista a inversa algébrica, elanão é contínua (limitada).

4. Denominamos de espectro pontual de A ao conjunto σ p( A) = λ ∈ C , existev ∈ E tal que Av = λ v = λ ∈C , Ker (λ − A) = 0 , isto é, o conjunto de autovalores de A. Observe que, neste caso, λ − A, falha de ter inversa algébrica, ouseja, o espectro pontual é uma falha algébrica e não topológica.

5. Se λ ∈ σ ( A) e (λ − A)nv = 0 então dizemos que v é um vetor principal de A, ese n = 1 , v é um autovetor.

6. Se λ ∈ σ ( A) − σ p( A) e existe uma sequência vn ∈ E tal que Avn − λ vn → 0então dizemos que λ é um quase-autovalor. Este fenômeno ocorre por motivos

Page 298: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 298/371

292 6 Operadores Lineares em Espaços Normados

topológicos, no caso em que a sequência vn não se aproxima de zero convenien-temente, pois indicaria que, embora tenhamos zn → 0 , por outro lado, o limitede suas imagens pelo resolvente (λ − A)−1 zn = vn não faria o mesmo ! Estasituação é especialmente comum no caso em que o domínio D ( A) de A não

é completo e vn → v /∈ D( A) (v. exercício abaixo). Este fenômeno não ocorreem dimensão finita, onde todo o espectro é formado de auto-valores, ou seja, oespectro em dimensão finita tem sua origem puramente algébrica.

7. Definimos o raio espectral de um operador linear como r ( A) = supλ ∈σ ( A)| λ |

As propriedades abaixo são consequências da teoria de Neumann-Peano.

Teorema 6.46. Se A ∈ L(E ) e E é um espaço de Banach, então

1. ( A ,∞) ⊂ ρ( A).

2. ρ ( A) é aberto, ρ( A) ⊂C.

3. R( A,λ ) = (λ −

A)−1 é uma função analítica definida no aberto ρ( A)⊂C.

4. σ ( A) ⊂ (0, A ) é fechado e limitado.

5. r ( A) ≥ A 6. σ ( A) = / 0.

7. σ ( A) = σ ( A∗).

Prova. 6. (Esboço) Seja ϕ ∈ E ∗ = L(E ,R) e x ∈ E . Se σ ( A) = / 0, então a funçãoϕ ( R(λ , A) x) = h(λ ) seria definida, analítica em todo o plano complexo e limitadapara λ → ∞. Mas então, pelo Teorema de Liouville da teoria de funções analíticas,concluiríamos que h(λ ) seria constante quaisquer que fossem x e ϕ . Pelo teoremade Hahn-Banach-Helly teríamos R(λ , A) constante e nulo (pois, R(λ , A) = λ −1( I − Aλ )

−1 → 0 quando λ → ∞), o que é um absurdo.

7. Exercício.

Teorema 6.47 (Teorema de Gelfand).Se A ∈ L(E ) e E é espaço de Banach, então

r ( A) = supλ ∈σ ( A)

| λ = limn→∞

An 1n .

Prova. Adiada.

Teorema 6.48. Se A

∈ L(E ) , então,

1. σ ( A) = / 0.

2. σ ( A) = σ ( A∗).

Page 299: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 299/371

6.6 Teoremas de Banach 293

Prova. Exercício.

Observação 6.49. 1. As definições e teoremas sobre espectro são importantes tam-

bém, e principalmente, para os casos em que o operador A for ilimitado e tivero seu domínio definido em um espaço E 0 = D( A) que é apenas denso em umespaço de Banach E =E 0, seu completamento. Esta é uma situação típica paraos operadores diferenciais. Observe entretanto que se R(λ , A) = (λ − A)−1 forcontínua em E 0, então podemos estendê-lo para E = E 0 e, pelo Teorema de In-versão de Banach, concluiremos que (λ − A) será também contínua e portanto, A ∈ L(E ), voltando assim à situação anterior.

2. Os conceitos acima podem ser desenvolvidos dentro da teoria de álgebras deBanach, e a abordagem da teoria espectral neste contexto mais geral e eleganteé resultado do trabalho do matemático soviético I. Gelfand. Referências : L.Loomis, An Introduction to Abstract Harmonic Analysis, V. Nostrand, 1953,I. Gelfand, D. Raikov, G. Shilov, Commutative Normed Rings, Chelsea, e M.Naimark, Normed Rings, Noordhoff.

Exercícios :

6.56. Demonstre as afirmações 1 a 5 do teorema acima.

6.57. Mostre que se E for um espaço de Banach, então pelo teorema de inversão, éclaro que a condição necessária e suficiente para que λ ∈ ρ( A) é que (λ − A) sejalimitada e bijetora, ou ainda, que λ não seja um auto valor de A e que (λ − A) sejasobrejetora.

6.58. Mostre que em dimensão finita, σ ( A)=σ p( A). Portanto, a distinção acima sótem sentido para dimensão infinita.

6.59. Considere o operador linear derivação nos seguintes espaços (não de Ba-

nach !), e em cada um destes obtenha seu espectro tal como anunciado :a) E = h ∈ C 1([0,1],R), h(0) = 0, σ ( A) = / 0.

b) E = C 1([0,1],R), σ ( A) = C.

c) E = h ∈ C 1([0,1],R), h(0) = h(1), σ ( A) = 2π ik , k ∈ Z.

6.60. Obtenha os espectros anunciados abaixo :

a) E = C ([0,1],R), Ah(t ) = th(t ), σ ( A) = [0, 1].

b) E = h ∈ C 1([0, 1],R), h(0) = 0, Ah(t ) = 1t h(t ). Mostre que o operador é bem

definido (Lema de Morse) e que σ ( A) = [1,∞).

c) E = C ([0,1],R), Ah(t ) = expit h(t ), σ ( A) = λ ∈C, λ = 1.

6.61. Mostre que para o operador integral de Volterra A : E → E , onde (E =

C ([0, 1],R), . ∞), e Ah(t ) = t 0

K (t ,s)h(s)ds, com K ∈ C ([0, 1] × [0,1],R), temos

as seguintes informações espectrais :

Page 300: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 300/371

294 6 Operadores Lineares em Espaços Normados

a) ρ ( A) = C−0,

b) 0 ∈ σ p( A),

c) A(E ) = E .

Sugestão : Para a), utilize o teorema de Neumann (ou Banach-Cacciopoli iterado)para concluir que (λ − A) ∈ GL(E ) sempre queλ = 0, mostrando que existe n inteirotal que An ≤ 1

λ nn! < 1. Para b), use 6 do teorema anterior. Para c), observe que asfunções g = Ah tem valores fixados para t = 0 e não podem varrer todo o E .

6.62. Considere o espaço (C ∞0 (R,R), . ∞). Mostre que o operador derivação A : C ∞0 (R,R) → C ∞0 (R,R), Ah = ∂ h, Ah( x) = h( x), é linear, ilimitado, não possuiautofunções e ρ( A) = C.

6.63. Considere o espaço de SchwarzS (R,C),comanorma h 2= R

| h( x) |2 dx.

Mostre que a derivada é um operador linear bem definido na forma A = ∂ :S (R,C) →S (R,C) e não é limitado (sugestão : hn( x) = exp( −1

x2 + inx)), e nãotem autovalores (sugestão : considere as funções gα ( x) = exp(α x), para α

∈C, que

seriam os únicos candidatos a autovetores de A, mas não pertencem a S (R,C)).

6.64. No mesmo espaço de Schwarz (S (R,C), . 2), mostre que o operadorderivada tem quase-autovetores na forma vn( x) = hn( x) exp(λ x), onde hn( x) =1n exp(−nx2) para todo λ ∈ C, ou seja, C⊂ σ ( A) −σ p( A).

6.7 Modos de convergência

Como já vimos pelos teoremas de Banach Steinhaus, não é necessário que umasequênciade operadores limitados convirja na norma uniforme ( isto é, convergênciauniforme na bola ou esfera unitária), para que possamos construir novos operadoresde interesse. Nesta subseção, abordaremos novos métodos de convergência que re-laxam um pouco as exigências estritas da norma uniforme de L(E ). Estes modosde convergência não serão tratados dentro da estrutura das famílias de seminormasou de topologias formais ; apenas utilizaremos o conceito de convergência por se-qüências que é mais útil neste contexto e, na verdade, o mais comum na literatura.Assim, definiremos também os conceitos de completude, compacidade e limitaçãona linguagem sequencial.

A primeira e mais básica questão que surge com a introdução de um novoconceito de convergência se refere à unicidade dos limites, um assunto já abordadono contexto mais geral de espaço métrico. Sem esta propriedade, o processo constru-tivo infinito, que é a razão de ser de uma convergência, perde o seu significado. Esta

questão é respondida pela positividade definida da norma, pela propriedade de se-paração de uma família de seminormas e pelo teorema de Hahn-Banach-Helly.

Page 301: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 301/371

6.7 Modos de convergência 295

Definições de Modos de Convergência :

Seja (E , . ) um espaço normado.

Definição 6.50 (Convergência em espaços normados - E ).1. Denominamos de convergência forte em um espaço normado à convergência

pela norma deste espaço, e indicamos o processo com uma seta na forma xn → x, isto é, quando xn − x → 0 , e também escreve-se x = s − lim xn , (“stronglimit”).

2. Dizemos que uma sequência xn ∈ E tem convergência fraca para x ∈ E , edenotamos pela seta parcial xn x, ou escrevemos x = w − lim xn (“weak-limit”), se para todo funcional linear λ limitado de E (isto é, λ ∈ E ∗), tenha-mos λ ( xn) → λ ( x). (Esta convergência pode ser tratada por meio da família deseminormas pλ λ ∈E ∗ , onde pλ ( x) = λ ( x)).

Definição 6.51 (Convergência de operadores - L(E ,F )).

1. Dizemos que An ∈ L(E , F ) converge uniformemente para A ∈ L(E ,F ) se aconvergência se der na norma uniforme de L(E , F ) , isto é, se An − A 0→ 0.

2. Dizemos que An ∈ L(E ,F ) converge fortemente para A ∈ L(E , F ) se ∀ x ∈ E, Ax = s− lim An x, isto é, se a convergência de An x for pontual e forte em F, istoé, se An( x) − A( x) F → 0 para qualquer x ∈ E. Frequentemente escreve-ses− lim An = A (“strong limit”).

3. Dizemos que An ∈ L(E ,F ) converge fracamente para A ∈ L(E ,F ) se ∀ x ∈ E, Ax = w − lim An x, isto é, se a convergência de An x for pontual e fraca em F,isto é, ∀λ ∈ E ∗, ∀ x ∈ E, temos λ ( An x) → λ ( Ax).

Definição 6.52 (Convergência de funcionais - E ∗).

1. Como E ∗ = L(E , F ) , com F = R (ou C) , podemos igualmente definir a conver-gência .

2. Observe entretanto que o conceito de convergência fraca e forte em R (ou C),são idênticas o que tornariam iguais as duas definições correspondentes acima.Em geral opta-se por designá-la de convergência fraca, isto é, ϕ = w − limϕ nse ∀ x ∈ E, tenhamos ϕ ( x) = limϕ n( x). Em alguns textos usa-se o termo conver-gência fraca-* para este tipo, o que não adotaremos (v. observação 3 abaixo).

Page 302: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 302/371

296 6 Operadores Lineares em Espaços Normados

Observação 6.53. 1. A convergência fraca pode ser interpretada como convergên-cia coordenada a coordenada, ou seja, pelo critério da família de seminormasgeradas por funcionais lineares. A convergência forte pode ser interpretadacomo convergência uniforme em todas as coordenadas. Obviamente a conver-

gência forte implica na fraca, mas não o recíproco se em espaços de dimensãoinfinita (v. exercícios abaixo). Os funcionais lineares contínuos λ podem serpensados como projeções unidimensionais ; o que eles de fato o são em espa-ços de Hilbert devido ao teorema de Riesz-Fréchét. Em espaços normados, paracada v tomamos um funcional λ ∈ E ∗ tal que λ (v) = 1 (Hahn-Banach-Helly) eteremos E = v⊕ N (λ ) . Portanto, convergência segundo λ pode ser pensadacomo convergência segundo a componente na direção de v.

2. Observe que há uma discrepância de nomenclatura se pensarmos que L(E ,F )é um espaço normado, pois neste caso, convergência forte de acordo com adefinição anterior, deveria ser convergência pela norma deste espaço, isto é, . 0 e não a pontual. É necessário portanto sempre especificar se a convergênciase refere a operadores ou a elementos de um espaço.

3. As convergências forte e fraca para funções lineares com valores em espaçosde dimensão finita são idênticas. Portanto, para os funcionais lineares, se vistoscomo operadores lineares, os dois tipos de convergência são iguais à convergên-cia pontual que foi exatamente aquela definida como fraca emC. Por outro lado,visto como um espaço vetorial, a convergência fraca em E ∗ inclui a conver-gência pontual, uma vez que cada elemento x ∈ E pode ser pensado como umelemento de (E ∗)∗ na forma x(λ ) = λ ( x). Se o espaço E for reflexivo, isto é,E = (E ∗)∗ = E ∗∗ (ou seja, se todos os funcionais lineares de E ∗ provêm deelementos de E ), então estes dois conceitos se equivalem. Isto acontece em es-paços de Hilbert onde H ∗ = H . Nos outros casos não-reflexivos (E ⊂ E ∗∗, masE = E ∗∗), relativamente raros, esta convergência é chamada fraca-*.

Exercícios :

6.65. Mostre que o limite definido por cada respectivo método de convergência éúnico.

6.66. Mostre as implicações sobre convergências em E , L(E ,F ) e E ∗ : uniforme ⇒forte ⇒ fraca.

6.67. Mostre que em espaços de dimensão finita (Rn,Cn), a convergência forte efraca são idênticas. Interprete a convergência fraca como convergência coordenadaa coordenada.

6.68. Mostre que em l2(C), os elementos da base ek ) são fracamente conver-gentes para zero mas obviamente não convergem fortemente. A não uniformidadeda convergência das coordenadas é a razão do problema.

6.69. Mostre que, em um espaço de Hilbert, se uma sequência hn converge fra-camente para h, e além disto, hn → h , então hn converge fortemente para

Page 303: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 303/371

6.7 Modos de convergência 297

h. Sugestão : Lembre-se do Teorema de Riesz-Frechet e considere todo funcionalλ ∈ H ∗ na forma de um produto interno,λ ( x) = x,α . Escreva agora h−hn 2=hn 2 −2hn, h+ h 2 e conclua o desejado. Este resultado mostra que um poucomais do que a convergência fraca nos devolve a convergência forte, pelo menos em

espaços de Hilbert.6.70. Mostre que em espaços L(E ,F ) onde F é de dimensão finita (Rn,Cn), aconvergência uniforme, forte e fraca de operadores lineares são idênticas.

O objetivo final da introdução de novos conceitos de convergência é estendera utilidade de processos construtivos infinitos, e, para tanto, é indispensável dispordas estruturas correspondentes tais como compacidade, sequências de Cauchy, com-pletude, limitação e etc. Passaremos portanto a defini-los.

Definição 6.54. 1. Dizemos que um conjunto A⊂ E é fracamente limitado se paratodo λ

∈E ∗ , o conjunto λ ( A)

⊂R (ou C), for limitado.

2. Dizemos que uma sequência xn ⊂ E é fracamente de Cauchy se, para ∀λ ∈E ∗ , a sequência numérica λ ( xn) for de Cauchy.

3. As definições de compacidade e completude seguem naturalmente dos conceitosacima.

4. Dizemos que λ n ∈ E ∗ é fracamente de Cauchy se, para cada x ∈ E, λ n( x) é deCauchy.

Vejamos agora alguns teoremas fundamentais sobre convergência fraca que pos-sibilitam, vez por outra, nos livrarmos da “ praga de dimensão infinita” (uma famosaexpressão inventada por Richard Bellman (...-...) para designar os, enormes, proble-mas que altas dimensões usualmente acarretam).

Teorema 6.55 ((Limitação fraca em E significa limitação na norma)). Seja (E ,. ) um espaço normado e A ⊂ E um conjunto fracamente limitado. Então A é limi-tado na norma de E.

Prova. Consideremos A como um subconjunto do espaço duplamente dual E ∗∗.Neste caso podemos pensar que A é um conjunto de funcionais lineares em E ∗pontualmente limitado. Lembrando-se que E ∗ é um espaço de Banach na normauniforme, concluímos pelo teorema de Banach-Steinhaus (Principio de LimitaçãoUniforme), que A é uniformemente limitado como subconjunto de E ∗∗, ou seja,| a(λ ) |=| λ (a) |≤ M , ∀a ∈ A, ∀λ , λ ≤ 1. Devemos concluir que A é limitado,pois, caso contrário, ∀ M > 0 existiria a ∈ A, com a > M , e, pelo Teorema de

Hahn-Banach-Helly, poderíamos construir um funcional λ 0 de norma λ 0 = 1 talque λ 0

aa

= 1 e, portanto, λ 0(a) = M .

Page 304: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 304/371

298 6 Operadores Lineares em Espaços Normados

Observação 6.56. Dizer que A ⊂ H ( H um espaço de Hilbert), é fracamente limi-tado significa, pelo teorema de representação de Riesz-Fréchét, que ∀ x ∈ H , existeum número positivo C ( x), tal que ∀a ∈ A, temos | x, a |≤ C ( x), isto é, o conjuntonumérico das projeções dos elementos de A em qualquer direção x é limitado. Neste

caso, o teorema acima implica que o conjunto A tem que ser necessariamente limi-tado.

Teorema 6.57 (Teorema de Alaoglu - Em espaços separáveis e reflexivos, a bolaunitária é fracamente pré-compacta).Seja (E , . ) um espaço normado separável e reflexivo. Então, a bola unitária deE, B1 = x ∈ E , x ≤ 1 , é fracamente pré-compacta.

Prova. Consideremos B1 ⊂ E ∗∗, pela reflexividade, e seja xn ⊂ B1 ⊂ E ∗∗. Estaseqüência xn de funcionais em E ∗ é equilimitada na norma uniforme, pois x 0= sup| λ ( x) = x(λ ) |, λ ≤ 1 = 1. Concluímos ainda que, sendo lineares,são equicontínuas na bola unitária de E ∗. Levando em conta que E ∗ é separável,podemos usar um teorema de Arzelá-Ascoli para concluir que existe uma subse-quência xnK que converge uniformemente na bola unitária de E ∗, para um Φ ∈ E ∗∗,e, portanto, pontualmente em E ∗. Como E ∗∗ = E , concluímos que existe a ∈ E tal que xnK (λ ) = λ ( xnK ) → Φ (λ ) = a(λ ) = λ (a). Mas isto significa que xnK a(convergência fraca).

Corolà ario 6.58. 1. Todo conjunto fracamente limitado em um espaço normadoreflexivo separável é fracamente pré-compacto.

2. Em um espaço normado, todas as seqüências fracamente convergentes são li-mitadas.

3. Em um espaço de Hilbert, um conjunto é limitado se, e somente se, for fraca-mente pré-compacto.

4. Seja (E , . ) um espaço normado. Então E ∗ é fracamente completo.5. Em um espaço normado, se xn ∈ E for limitada na norma e ϕ ( xn) → ϕ ( x) para

todos os funcionais lineares limitados ϕ ∈ S, onde S é um conjunto denso emE ∗ , então xn converge fracamente para x.

Prova. 1. Basta usar os dois teoremas acima.

2. Exercício.

3. ⇒) Basta usar o fato de que um espaço de Hilbert H é sempre isomorfo ao seudual H ∗, que por sua vez será então isomorfo ao seu H ∗∗, e é separável, umavez que dispõe de uma base ortonormal.⇐) Seja K ⊂ H fracamente pré-compacto. Se não fosse limitado, existiria umasequência hn ∈ K tal que hn ≥ n. Mas então existe uma subsequência hnK que converge fracamente. Portanto esta subsequência forma um conjunto fraca-mente limitado, que, pelo já visto, deve ser limitado. A contradição nos mostraque K deve ser limitado.

Page 305: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 305/371

6.8 Cálculo operacional elementar 299

4. Se a sequência λ n ∈ E ∗ for de Cauchy, concluímos que converge pontualmentee define uma função linear ϕ : E → R. Pelo Teorema de Banach-Steinhaus,concluímos que esta função ϕ é de fato limitada, isto é, contínua, e portanto,ϕ ∈ E ∗, e está provado o resultado.

5. Exercício.

Os resultados seguintes tem uma importância especial em vários contextos.

Teorema 6.59.Sejam E e F espaços normados e xn ⊂ E fracamente convergente para x em E (xn x).

a) Se A ∈ L(E ,F ) , então Axn Ax (operadores limitados (fortemente contínuos),levam convergência fraca em convergência fraca, isto é, são fracamente contí-nuos!).

b) Se A∈

L(E ,F ) for um operador compacto (isto é, leva bolas em pré-compactos),então Axn −→ Ax (operadores compactos levam convergência fraca em conver-gência forte).

Prova. a) Seja λ ∈ E ∗. Então, a composição λ A = λ 0 ∈ E ∗, e portanto, λ 0( xn) =λ ( Axn) → λ 0( x) = λ ( Ax).

b) Como xn converge fracamente, então xn é fracamente limitada e portanto li-mitada na norma. Então Axn está em um compacto, e deve ter subsequênciaconvergente na norma AxnK → z. Mas do item anterior, temos que AxnK Axe portanto z = Ax. Se agora a sequência toda não convergisse para Ax, podería-mos construir uma subsequência de Axn tal que AxnP − Ax ≥ ε > 0. Mas aesta subsequência poderíamos aplicar o mesmo argumento inicial e obter umasub-sub-sequência que convergiria fortemente para Ax, o que é contraditório.

6.8 Cálculo operacional elementar

A estrutura de álgebra de Banach para L(E ) nos possibilita definir e aplicar umaenorme variedade de processos analíticos nestes espaços que tomam o nome de cál-culo operacional. A extensão do cálculo operacional para alguns tipos de operadoresnão limitados é um dos grandes triunfos da análise do século XX, e resultou de umaconfluência entre o desenvolvimento natural da teoria matemática empreendida porHilbert, Schmidt, Riesz e o modelo matemático para a física quântica iniciado porJ. von Neumann, Hermann Weyl (1885-1955) dentre muitos outros. Sobre este as-

sunto atribui-se a Weyl o comentário : “Não é nosso mérito, mas um favor da sorte,a descoberta, no início de 1923, de que a teoria de espaços de Hilbert se constituíano instrumento adequado para a descrição da física quântica”. O desenvolvimento

Page 306: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 306/371

300 6 Operadores Lineares em Espaços Normados

da teoria espectral e do cálculo operacional tem suas expressões contemporâneasnos trabalhos de I. Gelfand sobre álgebras de Banach, de K. Yosida e E. Hille noestudo de equações de evolução, de R. Feynman na invenção do cálculo operacionalnão-comutativo e de V. P. Maslov no desenvolvimento atual desta teoria e de suas

aplicações, dentre outros.O objetivo geral do cálculo operacional é desenvolver uma teoria que permitaestender as técnicas e os conceitos do cálculo de funções de variável real e/ou com-plexa a funções com o domínio em subconjuntos de operadores lineares. Não épossível a definição de todas as funções para todos os operadores e, portanto, é ne-cessário restringir uma e outra coisa. No presente contexto, trataremos de funçõesanalíticas definidas em uma vizinhança da origem no plano complexo, (isto é, que podem ser escritas por meio de uma série de potências da sua variável), estendidasaos operadores limitados pertencentes a uma bola correspondente da origem. A teo-ria espectral (e o cálculo operacional), para operadores autoadjuntos compactos seráapresentada no próximo capítulo, e foi desenvolvida por Hilbert e Schmidt. A teo-ria espectral de operadores autoadjuntos não limitados foi desenvolvida por Weyl,Riesz, von Neumann e outros, e não será tratada neste curso. Portanto, infelizmente

somente poderemos abordar aqui os elementos iniciais desta importante e útil teo-ria. Todavia, o leitor persistente desta notas estará preparando o seu caminho parainiciar-se no estudo desta área, dentre muitas outras coisas interessantes.

Observemos que os argumentos que nos possibilitaram definir um sentido paraa função g( A), onde g( z) = 1

1− z = (1 − z)−1, podem ser aplicados igualmente para

qualquer função analítica ϕ ( z) =∞

∑k =0

ak zk , definida em um disco Dr = z ∈C, | z |<r do plano complexo. Reuniremos estas observações e algumas de suas conseqüên-cias nos teoremas seguintes.

Teorema 6.60 (Neumann-Peano).Seja E um espaço de Banach e consideremos a álgebra de Banach H ( Dr ) = ϕ função analítica (holomorfa), ϕ ( z) =

∑k =0

ak zk , definida no disco Dr = z ∈C, | z |<r , com produto pontual e norma uniforme. Então, é possível definir um cálculooperacional da seguinte maneira :

1. Se ϕ ∈ H ( D1) e A ∈ L(E ) , podemos definir ϕ ( A) =∞

∑k =0

ak ( A)k para todo A ∈ B(0, 1).

2. Se A ∈ L(E ) e A < 1 , a correspondência i A : H ( D1) → L(E ), i A(ϕ ) =ϕ ( A) é um homomorfismo de álgebras de Banach, isto é, uma aplicação contínua que preserva as operações de álgebra ; em particular, se ϕ , ψ ∈ H ( D) e ρ ( z) =ϕ ( z)ψ ( z) , então, ρ( A) = ϕ ( A)ψ ( A).

3. Os operadores ϕ ( A) e ψ ( A) permutam.

4. Se ϕ ∈ H ( Dr ) e A ∈ L(E ) , podemos definir ϕ ( zA) =∞

∑k =0

ak ( zA)k para todo z ∈C ,

tal que | z |< r A −1= δ , em particular para z = t ∈ (−δ ,δ ).

Page 307: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 307/371

6.8 Cálculo operacional elementar 301

Prova. Exercício. Sugestão : observe que, pelo teste da razão (divisão!), uma série

de potências ∞

∑k =0

ak zk converge no disco unitário se, e somente se, lim |ak +1||ak | ≤ 1, e,

neste caso, ∞

k =0 |ak

|r k converge para todo 0

≤r < 1. A demonstração do teorema

segue então da aplicação do mesmo método de majoração de Cauchy utilizado paraa demonstração da série de Neumann.

Observação 6.61. 1. O teorema de Neumann-Peano é literalmente válido parauma álgebra de Banach qualquer A , com identidade, no lugar de L(E ).

2. Se uma função ϕ for inteira, isto é, se ϕ ∈ H ( D∞), então ϕ ( A) está definidapara qualquer A ∈ L(E ). Este é o caso naturalmente dos polinômios.

3. A função exponencial ϕ ( z) = e z é a função inteira mais importante, e ϕ ( A) = e A

é definida para qualquer A ∈ L(E ).

4.

etA

≤et A.

5. Mostre que e0 = e, onde e é a identidade da álgebra A .

6. Mostre que e(t +s)a = eta · esa, para quaisquer s, t ∈R.

7. Estas funções U : R−→ A , U (t ) = eta , são chamadas grupos exponenciais, etem grande importância na solução de equações diferenciais.

Para o desenvolvimento do cálculo operacional, é necessário definir e estenderalguns conceitos e técnicas básicas originários do cálculo elementar que serão úteistambém em outros contextos, especialmente na abordagem da análise não-lineardo último capítulo. Iniciaremos por definir funções de variável real e valores emespaços normados que são diferenciáveis e depois integráveis.

Definição 6.62 (Derivação de funções de variável real com valores em espaçosnormados).Se (E , . ) for um espaço normado, dizemos que uma função h : (a,b) ⊂ R→ E

tem derivada em um ponto t 0 ∈ (a,b) se existir o limite limδ →0h(t +δ )−h(t )δ

, que de-nominaremos derivada de h em t 0 , tal como no cálculo elementar, e denotaremos por um dos símbolos : h (t 0) = dh

dt (t 0) = ∂ h(t 0) , etc. Observe que o limite está de- finido com base na norma . , e portanto, o conceito de derivada é intimamentedependente da norma utilizada, ao contrário do cálculo elementar ! Em particular,a definição significa que existe um elemento u ∈ E tal que h(t +δ )−h(t )

δ − u → 0 ,quando δ → 0 , isto é, u = h(t 0). Se a função h tem derivada em todos os pontos,então a função h : (a,b) ⊂R→ E será denominada função derivada de h. Podemosassim definir, além dos espaços C ((a, b), E ) já considerados no estudo de espaços

métricos, também C m((a,b), E ) , C ∞

((a, b),E ) e C ω ((a,b), E ) = funções analíti-cas, no sentido que podem ser representadas por séries convergentes de potênciasinteiras na variável.

Page 308: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 308/371

302 6 Operadores Lineares em Espaços Normados

Exercícios :Demonstre as propriedades elementares abaixo :

6.71. ∂ : C m(R, E ) → C m−1(R, E ) é linear.

6.72. Se A for uma álgebra normada, então a operação derivada ∂ em C 1(R, A)satisfaz à regra de Leibniz : ∂ (h · g) = (∂ h) ·g + h · (∂ g).

6.73. Com base no exercício anterior, seU ⊂ A for o conjunto dos elementos inversí-veis em A e h ∈ C 1(R,U ), então a função recíproca (não a inversa !) h−1(t ) = 1

h(t ) é

bem definida, diferenciável e ∂ (h−1)(t ) = −h−1(t )(∂ h(t ))h−1(t ). Observe a semel-hança e também a distinção com a fórmula correspondente do Cálculo elementar.

6.74. Regra da Cadeia 1 : se ϕ ∈ C 1(R,R) e h ∈ C 1(R, E ), então vale a regra dacadeia : ∂ (hϕ )(t ) = ϕ (t )∂ h(ϕ (t )).

6.75. Regra da Cadeia 2 : se T ∈ L(E ) e h ∈ C 1(R,E ), mostre que d dt T h(t ) =

T d dt h(t ). (A derivada “comuta” com qualquer operação linear contínua).

6.76. Regra de Leibniz : se B : E ×E →R for uma função bilinear contínua e h, g ∈C 1(R,E ), mostre que B(h(t ),g(t )) ∈C 1(R,E ), e obtenha uma fórmula para o cálculode d

dt B(h(t ),g(t )).

6.77. Especialize para o caso em que B é um produto interno em um espaço deHilbert e aproveite para calcular d

dt h(t ) neste caso.

6.78. Se ϕ ∈ H ( D) e A ∈ L(E ), e se definimos ϕ (tA) =∞

∑k =0

ak (tA)k para todo | t |<r A −1, então a função h(t ) = ϕ (tA) é tal que

h ∈ C ∞

−r A −1, r A −1

, L(E )

,

e dh(t )dt = Aϕ (tA), onde ϕ ( z) =

∞∑

k =0kak zk é a derivada complexa de ϕ .

6.79. d dt e

at = aeat , onde a ∈A , uma álgebra de Banach.

6.80. Mostre que se h ∈ C 1((a,b), E ), então, h(t ) = 0 ∀t ∈ (a,b) ⇐⇒ h(t ) =constante. Sugestão : utilize o exercício 6.75 (Regra da Cadeia 2) com um funcio-nal linear genérico λ ∈ E ∗, aplique o teorema correspondente do cálculo elementara λ h(t ) = ϕ (t ), e, com base no teorema de Hahn-Banach-Helly, conclua o dese- jado. Esta técnica de reduzir problemas de cálculo operacional ao cálculo elementarvia funcionais lineares e a obtenção da igualdade resultante pelo teorema de Hahn-Banach-Helly é muito útil.

Uma vez introduzida a diferenciação, o passo natural seguinte será introduziro conceito de integral de funções de variável real e valores em espaços normados,

Page 309: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 309/371

6.8 Cálculo operacional elementar 303

o que pode ser feito sem nenhum acréscimo de dificuldade conceitual ou técnicacom respeito ao que já foi feito anteriormente. É importante observar que sendo asconstruções sempre dependentes de convergência de seqüências de Cauchy, todasas definições abaixo serão restritas a funções com valores em espaços de Banach.

Definição 6.63 (Integral de Riemann de funções de variável real e valores emespaços de Banach).Seja E um espaço de Banach. Definimos inicialmente o espaço normado das fun-ções escada E ([a, b],E ) da maneira habitual, dotados com a norma sup . ∞. De- finimos então a operação linear contínua dada pela integral I : E ([a,b], E ) → E,

I [h] =k =m∑

k =0h(t k )(t k +1 − t k ). Consideremos agora o espaço das funções reguladas

definidas da seguinte maneira : R ([a,b], E ) = E ([a, b],E ) e a extensão natural I : R ([a, b],E ) → E. A esta extensão denominamos de integral de Riemann. Acaracterização das funções reguladas apresentada pode ser igualmente repetidaaqui. Da mesma maneira, podemos definir a operação integral com o limite su-

perior variável, e a notação, obviamente é semelhante à do cálculo elementar : I [h](t ) =

t a

h(s)ds.

O conceito de integral pode ser estendido de maneira semelhante ao que foifeito para a definição de integrais de Lebegue, usando o completamento de espaçosde funções contínuas com normas . p definidas por integrais de Riemann. Estasintegrais de Bochner não serão abordadas aqui.

Exercícios :Algumas propriedades elementares da integral de Riemann. Seja E um espaço deBanach e I : R ([a,b], E ) → E a integral. Então,

6.81. I : R ([a, b],E ) → E é linear.

6.82. A operação integral I t : R ([a, b], E ) → C 0([a,b], E ) ⊂ R ([a, b],E ) é bem defi-

nida, onde I t [h](t ) =t

t 0h(s)ds é linear e contínua, e vale o teorema da desigualdade

do valor médio : t

t 0h(s)ds ≤ h ∞| t − t 0 |.

6.83. Na verdade, I t : C m([a, b],E ) → C m+1([a,b],E ) para m ≥ 0, e d dt

t a

h(s)ds =

h(t ), ou seja, a derivação é uma inversa à esquerda da integral.

6.84. Se T ∈ L(E , F ),onde F é um espaço de Banach, então T [ I t [h](t )] =

t a T [h(s)]ds.

(A integral “comuta” com qualquer operação linear).

Page 310: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 310/371

304 6 Operadores Lineares em Espaços Normados

6.85. Se para qualquer λ ∈ E ∗ = L(E ,C),t

aλ [h(s)]ds = 0, então

t a

h(s)ds = 0. E se

t

ah(s)ds = 0 para qualquer t ∈ [a, b], então h(s) = 0, ∀s ∈ [a,b]. Sugestão : use o

anterior e Hahn-Banach-Helly.

6.86. Se h ∈ C 1([a,b], E ), entãot

a∂ h(s)ds = h(t ) − h(a). Sugestão : Aplique um

funcional linear genérico na integral à esquerda e use resultados anteriores, o Teo-rema Fundamental do Cálculo e Hahn-Banach-Helly.

6.8.1 Princípio das coordenadas de Hahn-Banach-Helly

Os procedimentos utilizados nestes dois últimos exercícios podem ser considera-dos como o Princípio de Coordenadas de Hahn-Banach-Helly, que torna igualdadesvetoriais em espaços normados equivalentes a uma família de igualdades escalares

(reais ou complexas). O cálculo integral desenvolvido acima, bem como muitas desuas extensões e aplicações, pode ser feito por meio deste princípio que reduz estasquestões ao cálculo elementar.

Integral de Stieltjes

Nas aplicações do cálculo operacional, frequentemente é necessário admitir umaextensão do conceito de integral introduzida por T. Stieltjes, e chamada portanto deintegral de Stieltjes-Riemann (ou Stieltjes-Lebesgue se for o caso), que também temimportância fundamental em teoria da probabilidade. Basicamente, o objetivo destaintegral é dotar as regiões do intervalo na reta de um “peso” distribuído de tal ma-neira que a soma tenha um caráter de média ponderada. Para isto, consideremos umafunção de variação limitada, e contínua à esquerda, ϕ : [0,1] → R. Então, dada um

partição 0 = t 0 < t 1 < ... < t n = 1 do intervalo [0, 1], podemos definir um “peso” paracada sub-intervalo (t k , t k +1) na forma ϕ (t k +1) −ϕ (t k ), que eventualmente é distintodo seu comprimento t k +1 − t k e também pode ser não uniforme (isto é, varia entreintervalos de mesmo comprimento se em regiões diferentes). Desta maneira pode-mos também definir de forma semelhante a operação integral para funções escada

I ϕ : E ([0,1],R) →R, I ϕ [h] =k =n−1∑

k =0h(t ∗k )(ϕ (t k +1)−ϕ (t k )),onde t ∗k =

t k +1+t k 2 = ponto

médio do k −ésimo subintervalo. A notação para esta integral é I ϕ [h] =1

0h(s)d ϕ (s)

por motivos que serão desvendados nos exercícios abaixo. Não é difícil concluirque a operação é linear e limitada com respeito à norma uniforme. Portanto pode-mos estendê-la por limite uniforme para o espaço das funções regradas. Esta integraltem algumas propriedades semelhantes e outras que a distinguem da integral de Rie-

mann. Por exemplo :

Exercícios :

Page 311: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 311/371

6.8 Cálculo operacional elementar 305

6.87. Mostre que a integral de Stieltjes definida acima é linear e limitada, quando

estendida para I ϕ : R ([0, 1],R) = E ([0,1],R).∞ →R.

6.88. Se ϕ for uma função escada tal que ϕ ( x) = 0 para x ≤ 12 , e ϕ ( x) = 1 para

x ≥ 12 , calcule 1

0h(s)d ϕ (s).

6.89. Se ϕ for uma função continuamente diferenciável, mostre que1

0h(s)d ϕ (s) =

I ϕ [h] =1

0h(s)ϕ (s)ds, onde esta ultima é uma integral de Riemann normal.

Para um estudo mais detalhado desta integral consulte a referência Kolmogorov-Fomin capítulo VII.

Em vista do cálculo operacional desenvolvido, podemos agora definir equações

diferenciais ordinárias e integrais em espaços de Banach e, em particular, em álge-bras de Banach, que são objetos matemáticos já conhecidos no contexto particularde Rn e das matrizes, respectivamente.

Definição 6.64. 1. O Problema de Cauchy para Equações Diferenciais Ordináriasem um Espaço de Banach (E , . ),

dudt

= F (u, t ) , u(t 0) = u0,

é definido para uma função F ∈C 0(U × I ,E ) , onde t 0 ∈ I = (a,b) ⊂R , U é umaberto de E, e u0 ∈U, e se refere à existência de uma função u ∈ C 1( I ,U ) , talque u(t 0) = u0 e du

dt (t ) = F (u(t ), t ) para todo t ∈

I. Uma equação destas é dita

linear se U = E, F (u,t ) = P(t )u, onde P ∈ C 0( I , L(E )) ; e autônoma, se P(t ) for constante, P(t ) = P ∈ L(E ) , e I = R.

2. Podemos definir equações em álgebras de Banach A que são importantes parao estudo de equações lineares :

dudt

= a(t )u, u(t 0) = u0,

onde a ∈ C 0( I , A) , u0 ∈ A e a incógnita procurada é uma função u ∈ C 1( I , A) ,tal que u(t 0) = u0. Um caso particular importante se dá quando A = L(E ) paraum espaço de Banach E, e quando a(t ) = a constante, pois neste caso podemosescrever a sua solução por meio do cálculo operacional, que formalmente é semelhante ao problema elementar unidimensional.

Exercícios :

Page 312: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 312/371

306 6 Operadores Lineares em Espaços Normados

6.90. Mostre que a teoria de Picard sobre a existência de soluções do problema deCauchy para equações diferenciais ordinárias é aplicável da mesma forma para osmesmos problemas em um espaço de Banach.

6.91. Mostre que a função u(t ) = e

ta

é a solução do problema de Cauchy em umaálgebra de Banach A, com identidade e : dudt = au, u(0) = e.

6.92. Mostre que a função u(t ) = eta u0, é a solução do problema de Cauchy em umaálgebra de Banach A, com identidade e : du

dt = au, u(0) = u0.

6.93. Mostre que a solução do problema de Cauchy linear não homogêneo (nãoautônomo) em uma álgebra de Banach A com identidade, du

dt = au + h(t ), u(0) = u0,

onde h ∈ C 0( R, A), é dada por u(t ) = u0 +t

0e(t −s)ah(s)ds.

6.94. Utilize o teorema de Neumann para mostrar a existência e unicidade de solu-ção para o problema de Cauchy linear : du

dt = P(t )u, u(t 0) = u0, onde P ∈C 0( I , L(E )).Sugestão : transforme o problema em uma equação linear em um espaço de funções

contínuas com um operador integral.

6.95. Mostre que a funçãoU : (−∞,∞) → L(E ) definida por U (t ) = etP é a única quesatisfaz à equação diferencial operacional dU

dt = PU , com condição inicial U (0) = I ,e ainda, que satisfaz às seguintes propriedades :

a) U (t + s) = U (t )U (s).

b) U (−t ) = U (t )−1.

6.96. Usando os cinco exercícios acima, mostre que a solução de um problemado tipo du

dt = Pu + h(t ), u(0) = u0, onde h ∈ C 0( R,E ), é dada por u(t ) = u0 +t

0e(t −s)Ph(s)ds.

Observação 6.65. A teoria de funções analíticas pode ser desenvolvida por meio dasua caracterização como séries de potências (chamado método de Weierstrass), ouentão por meio de sua representação como integrais de contorno (método de Cau-chy). Até este momento, utilizamos a teoria de Weierstrass por meio do teoremade Neumann-Peano. Entretanto, com a introdução do cálculo integral, nada nos im-pede de desenvolvermos a teoria integral de Cauchy. Mostraremos a seguir apenasalguns passos neste sentido. A teoria de Cauchy é essencial na formulação da teoriaespectral de operadores não limitados.

Se tivermos funções com domínio U no plano complexo e valores em uma ál-gebra de Banach com identidade, isto é, ϕ : U ⊂C→A , podemos definir integrais

de linha C ϕ ( z)dz =

1 0 ϕ ( z(t )) z(t )dt , onde z : [0,1] → C é uma parametrizaçãoda curva C . Com isto podemos também estudar as integrais de Cauchy na forma

Page 313: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 313/371

6.9 Apêndice I - Resultados Topológicos 307 C ϕ ( z)( z− z0)−1dz, eventualmente por meio de funcionais lineares λ ∈A ∗ que as

transformam em integrais de funções usuais, isto é,

λ C

ϕ ( z)( z

− z0)−1dz= C

λ [ϕ ( z)]( z

− z0)−1dz,

a partir das quais podemos aplicar o teorema de Hahn-Banach-Helly. Este cálculo étambém amplamente utilizado no estudo analítico de matrizes e em suas aplicaçõesna teoria de equações diferenciais ordinárias.

Referências : O Cálculo Operacional é amplamente utilizado na teoria analí-tica de matrizes (Higham[2007, Gantmacher[], ...) e equações diferenciais, e umaferramenta fundamental para o desenvolvimento da teoria espectral. A extensão doconceito de uma equação diferencial ordinária para espaços de Banach permite otratamento de equações diferenciais parciais dependentes do tempo neste contexto(teoria de semigrupos), abrindo assim a possibilidade de uma igual e vantajosa ex-tensão dos conceitos, técnicas e modelos intuitivos oriundos da teoria elementar.

6.9 Apêndice I - Resultados Topológicos

Teorema 6.66 (Teorema de Baire).Seja M um espaço métrico completo. Se F k k ∈N for uma família enumerável deconjuntos fechados tais que ∪k ∈NF k = M, então, pelo menos um destes conjuntoscontem uma bola inteira. (Isto é, não é possível construir uma bola em um espaçométrico completo por meio de união enumerável de conjuntos “secos”, onde deno-minamos de seco um conjunto fechado sem pontos interiores).

Prova. Suponhamos que todos F k sejam secos, e que B0 = B( x0, r 0) ⊂ ∪k ∈NF k , comr 0 > 0. Construiremos então a seguinte sequência recursivamente (faça um esboçogeométrico da construção !). Seja x1 ∈ B0 −F 1, que existe em decorrência da secura

de F 1. Tomemos agora a bola B1 = B( x1,r 1) ⊂ B0 −F 1, tal que 0 < r 1 < r 0

2 , e repeti-mos o processo com o conjunto seco F 2, obtendo então x2 e B2 ⊂ B1 −F 2, e daí pordiante. É claro que a sequência construída é de Cauchy, uma vez que está contida embolas encaixadas Bk +1 ⊂ Bk de raios r n ≤ r 02−n → 0. Portanto, como M é completo, xk converge, digamos xk → a ∈ ∩k ∈N Bk . Mas, pela própria construção das bolas Bk

( Bk ∩ F k = / 0), concluímos que a /∈ F k para qualquer k , ou seja, a /∈ ∪k ∈NF k e, porabsurdo, está demonstrado o teorema.

Teorema 6.67 (Teorema de Rayleigh (Método de Lax)).Seja H um espaço de Hilbert e A um operador compacto, autoadjunto e considere-mos a forma quadrática contínua Q( x) = Ax, x. Então,

a) Q atinge máximo na esfera unitária.

b) Se x0

∈S 1 forumpontodemáximoparaQemS 1 , isto é,

Ax0, x0

= sup x

∈S 1

Ax, x

=µ , então x0 é autovetor de A e µ autovalor, Ax0 = µ x0.

Page 314: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 314/371

308 6 Operadores Lineares em Espaços Normados

6.10 Apêndice II - Definição alternativa de integral via Teoremade Hahn-Banach-Helly

A definição abaixo é baseada no teorema de HBH, mas inicialmente restringe

a espaços reflexivos, sem que isto de fato seja necessário. Mas é uma alternativainteressante cuja dificuldade pode ser contornada com argumentos no limite.Entretanto, faremos uso de outra estratégia que emprega o Princípio de Hahn-

Banach-Helly ,que equivale igualdades vetoriais a igualdades reais (como se fossemcoordenada a coordenada), por meio de funcionais lineares, e definiremos nova-mente o conceito de integral de uma forma geral para espaços reflexivos, isto é,espaços para os quais E ∗∗ = E , que inclui a maioria de interesse.

Teorema 6.68 (Definição de Integrais).Sejam E um espaço normado reflexivo, Ω ⊂Rn um conjunto compacto eC 0(Ω , E ).Então, para cada h ∈ C 0(Ω ,E ) , podemos definir os seguintes objetos :

1. O funcional linear Φ ∈ E ∗∗ , Φ : E ∗ →C , tal que Φ (λ ) =

Ω λ h( x)dx (integral

de Riemann).

2. A integral Ω

h( x)dx ∈ E, tal que λ

Ω

h( x)dx

=Φ (λ ) =

Ω

λ h( x)dx.

Prova. 1. Como λ ∈ E ∗, e h ∈ C 0(Ω , E ) temos que λ h ∈ C 0(Ω ,C) e é, portanto,integrável segundo Riemann. A verificação que Φ é linear e contínuo é imediatae provêm das propriedades fundamentais da integral de Riemann.

2. Sendo E reflexivo, concluímos que existe um elemento de E para o qual a igual-dade proposta vale, que é único em vista do Teorema de Hahn-Banach-Helly.

É necessário agora que as propriedades características básicas de uma operação

integral sejam determinadas.

Teorema 6.69 (Propriedades da Integral).Sejam E um espaço normado reflexivo, Ω ⊂Rn um conjunto compacto eC 0(Ω , E ).Então, para cada h ∈ C 0(Ω , E ) , a integral

Ω

h( x)dx ∈ E definida acima satisfaz às

seguintes propriedades :

1. Ω

∈ C 0(Ω , E )∗

, isto é, Ω

: C 0(Ω , E ) → E é um operador linear contínuo

considerando o espaço (C 0(Ω , E ), . ∞).

2. | Ω

h( x)dx |≤ Ω

| h( x) | dx ≤ vol(Ω ) h ∞.

3. Se F for um espaço normado reflexivo e A ∈ L(E , F ) , então A Ω h( x)dx = Ω

A (h( x))dx.

Page 315: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 315/371

6.11 Referências 309

Prova. 1 e 2. Exercícios.

3. Como A ∈ L(E , F ), então A h ∈ C (Ω ,F ), e portanto, existe Ω

Ah( x)dx. Se por

outro lado γ ∈ F ∗, então λ = γ A ∈ E ∗. Então, ∀γ ∈ F ∗,

Ω

γ A (h( x))dx = γ A Ω

h( x)dx

(por definição de Ω

h( x)dx), e também

Ω

γ A (h( x))dx = γ Ω

A (h( x))dx

(por definição de Ω

A (h( x))dx). Portanto, ∀γ ∈ F ∗, temos

Ω

γ A (h( x))dx = γ A Ω

h( x)dxγ Ω

A (h( x))dx,

de onde, pelo Teorema de Hahn-Banach-Helly, vem que

A

Ω

h( x)dx

= Ω

A (h( x))dx.

6.11 Referências

R. Courant, D. Hilbert, Methods of Mathematical Physics, vol. I, Springer. (Clás-sico).

F. Smithies, Integral Equations, Cambridge U. P.. (Clássico).R. Kress, Linear Integral Equations, Springer, 1989. (Texto moderno).C. Baker, The Numerical Treatment of Integral Equations, Oxford U.P..H. Brezis, Analyse Fonctionelle.F. Butzer, Fourier Analysis and Approximation, Birkhauser.K. Atkinson, The Numerical Solution of Integral Equations of the Second Kind ,

Cambridge U. P., 1997.K. Atkinson, Theoretical Numerical Analysis, Cambridge U. Press, 2002.F. Gantmacher, Theory of Matrices, AMS.W. Hackbush, Integral Equations : Theory and Numerical Treatment , Birkhau-

ser, 1995.K. Maurin, Methods of Hilbert Spaces, PWN, 1967.A.Polyanov, ... .

Page 316: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 316/371

310 6 Operadores Lineares em Espaços Normados

Pogorzelski, ... .N. Higham, Functions of matrices, SIAM, 2007.M. Krasnoselskii et al, Topological Methods in the Theory of Nonlinear Integral

Equations, Pergamon, 1964. (Avançado).

L. Bers, F. John, M. Schechter, Partial Differential Equations, J. Wiley, 1965.(Métodos Integrais em EDP).M. H. Stone, Linear Transformations in Hilbert Spaces and their applications

to Analysis, AMS, 1932.C. M. Wing, A Primer on Integral Equations of the First Kind , SIAM, 1991.

(Aplicações práticas).G. B. Folland, Introduction to Partial Differential Equations, Princeton U. P.,

1975.V. P. Maslov, M. V. Fedoryuk, Pseudo Differential Operators, Reidel, 1990.M. Taylor, Partial Differential Equations, 3vol., Springer, 1995.S. Mallat, A Wavelet Tour of Signal Processing, Academic Press, 1997.C. K. Chui, Wavelets : A Mathematical Tool for Signal Analysis, SIAM, 1997.J. S. Walker, S. G. Krantz, A Primer on Wavelets and Their Scientific Applica-

tions.F. John, Lectures on Ordinary Differential Equations, NYU Lect. - Gordon

Breach.E. Hille, Lectures on Differential Equations in the Complex Domain, Addison-

Wesley.M. Reed, B. Simon, Functional Analysis, vol I , Academic Press, 1974.N. I. Akhiezer, I. M. Glazman, Theory of Linear Operators in Hilbert Space,

Dover, 1993.S. G. Krein, Linear Differential Equations in Banach Spaces, AMS.J. Goldstein, Semigroups of Operators and Applications, Cambridge U.P..D. Henry, Geometric Theory of Parabolic Semilinear Equations, Springer Lect.

Notes in Math..V. E. Nazaikinskii, V. E. Shatalov, B. Yu. Sternin, Methods of Noncommutative

Analysis, W. de Gruyter, 1996.V. P. Maslov, Méthodes Opératorielles, Mir, 1987.V. P. Maslov, M. V. Fedoryuk, Pseudo differential Operators, Reidel, 1990.V. P. Maslov, M. V. Fedoryuk, Semiclassical Approximations, Reidel, 1980.M. Taylor, Partial Differential Equations, Springer, 1994.P. D.Lax, Functional Analysis, J. Wiley, 2002.P. Flandrin, Time Frequency Analysis.L. Cohen, Time Frequency Analysis.N. Akhiezer, Lectures on Integral Transforms, AMS.D. Widder, The Laplace Transform, Princeton University Press.H. Bremermann, Distributions, Complex Variables and Fourier Transforms,

Addison-Wesly, 1967.I. M. Gelfand, G. E. Shilov, Generalized Functions, 4 vol., Dunod/J. Wiley.V. S. Vladimirov, Equations of Mathematical Physics, MIR, 1984.V. S. Vladimirov, Generalized Functions in Mathematical Physics, MIR, 1979.

Page 317: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 317/371

6.11 Referências 311

S. G. Mikhlin, Mathematical Physics : An Advanced Course, North-Holland,1970.

E. Prestini, History of Applied Harmonic Analysis, Birkhauser.S. Bergman, M. Schiffer, Kernel Operators and its applications to Partial Dif-

ferential Equations, Acad. Press, 1959.P. R. Garabedian, Partial Differential Equations, AMS.Muskhelishvili,Some Mathematical Methods applied to Elasticity Theory, Noord-

hoff.Muskhelishvili, Singular Integral Equations, Noordhoff.P. A. M. Dirac, Principles of Quantum Mechanics, Oxford.J. von Neumann, Mathematical Foundations of Quantum Mechanics, Princeton,

1932.N. Dawson, John von Neumann, AMS.H. Dym, H. P. McKean, Fourier Series and Integrals, Acad. Press.P. Henrici- Applied and Computational Complex Analysis, 3 vol. J. Wiley 1974L. N. Trefethen, Pseudo Espectral Methods, SIAM.L. N. Tefethen, Spectral Methods ..., SIAM.

P. Schmid, D. Henningsen, Stability of Parallel Flows, Springer.H. Widom, Lectures on Integral Equations, Van Nostrand, 1969.S. Mikhlin, Linear Integral Equations, Pergamon Press, 1970.N. Huang &al, Empirical Mode Decomposition and Hilbert Transform, Proc.

Royal Sco. London, 1998.S. Mallat, A Tour ..., Academic Press.

Page 318: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 318/371

Page 319: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 319/371

7

Operadores Compactos : Teorias de Riesz-Fredholm eHilbert-Schmidt

7.1 Aspectos gerais : Teoria de Riesz-Fredholm

Os operadores compactos, ou completamente contínuos na nomenclatura de Hil-

bert, são o que de mais próximo se tem das matrizes no contexto de espaços nor-mados de dimensão infinita. Por outro lado, do ponto de vista funcional, eles sãoa generalização abstrata dos operadores integrais que ocorrem em diversas aplica-ções. Por esta coincidência, o seu estudo tem uma importância fundamental para ateoria e aplicações da análise funcional.

A teoria de operadores compactos foi iniciada por Ivar Fredhom (...-...), um ma-temático sueco importante pelas suas revolucionárias contribuições à teoria de equa-ções integrais, por David Hilbert (...-...) que foi atraído para esta área pelos trabal-hos de Fredholm, e por F. Riesz que expandiu e generalizou os resultados analíticospara o contexto abstrato da análise funcional. Esta teoria foi inicialmente desenvol-vida em espaços de Hilbert, e posteriormente estendida para espaços de Banach porJulius Schauder. Neste capítulo, apresentaremos a teoria de Riesz-Fredholm paraos espaços de Hilbert, onde pode ser desenvolvida com uma simplicidade técnicanotável, e onde também tem a sua maior importância com respeito às aplicações.Entretanto, algumas propriedades serão formuladas e demonstradas em espaços deBanach. A definição de operador compacto já foi apresentada de uma forma bemgeral no contexto de espaços métricos, sendo também importante no estudo de ope-radores não-lineares, entretanto, neste capítulo iremos focalizar a nossa atenção emoperadores lineares.

Definição 7.1.Sejam E e F espaços normados e A : E → F um operador linear. Dizemos que A é compacto se a imagem da bola unitária de E por A for um conjunto pré-compactoem F, isto é, se A( B1(0)) for compacto.

Denotamos por K (E ,F ) = A : E → F : A é linear e compacto.

A “finitude” implícita nesta definição provêm do teorema de Riesz, que carate-riza um espaço normado de dimensão finita pela compacidade da bola unitária, e

Page 320: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 320/371

314 7 Operadores Compactos : Teorias de Riesz-Fredholm e Hilbert-Schmidt

é a ferramenta conceitual básica desta teoria. Algumas propriedades imediatas sãorelacionadas a seguir :

Teorema 7.2.Sejam E e F espaços normados e A : E → F um operador linear. Então,

1. K (E , F ) ⊂ L(E ,F ) , isto é, um operador linear compacto é também limitado.

2. Se dimF < ∞ , então K (E , F ) = L(E ,F ).

3. Se dimF = ∞ , então K (E , F ) = L(E ,F ).

4. Se dim F = ∞ e A ∈ K (E , F ) , então A não pode ser sobrejetiva, e muito menoster inversa.

5. A ∈ K (E ,F ) ⇐⇒∀ xk k ∈ N ⊂ B1(0) ⊂ E, existe uma subseqüência de Axk queconverge em F .

6. K (E , F ) é um subespaço vetorial de L(E ,F ).

7. K (E , F ) é um ideal à esquerda (e à direita) da álgebra L(E , F ) , isto é, se T ∈ L(E , F ) e A

∈K (E ,F ) , então T A

∈K (E , F ) (e AT

∈K (E ,F )).

8. Se F for um espaço de Banach, então K (E ,F ) é fechado em L(E , F ).

9. Se A ∈ L(E ,F ) for um operador linear tal que A(E ) é um subespaço de di-mensão finita de F, isto é, se A for de posto finito, então A ∈ K (E ,F ).

10. Se An são de posto finito e An → A na norma uniforme de L(E ,F ) , então A ∈K (E , F ).

11. Se H for um espaço de Hilbert separável, isto é, que dispõe de uma base orto-normal, então A ∈ K ( H ) se, e somente se, for limite uniforme de operadores de posto finito.

12. Se E for espaço de Banach, então A ∈ K (E ) ⇐⇒ A∗ ∈ K (E ∗).

Prova. Exercício.

Exercícios :

7.1. Demonstrar 1-7 e 11 do teorema acima.

7.2. Considere E = F = C 0([0,1],R), com a norma uniforme . ∞ e o operador

integral K com núcleo dado por um polinômio K ( x, y) =m∑ai j xi y j. Mostre que o

operador K tem posto finito e, portanto, com base no teorema de Weierstrass, quetodos os operadores integrais com núcleos contínuos são compactos.

7.3. Mostre que se hk e gk ⊂ C 0([0,1],R), forem duas famílias de funções

contínuas, então os núcleos do tipo K ( x, y) =m∑hi( x)g j( y) dão origem a operadores

limitados de posto finito, e portanto compactos. Estes operadores são chamados de-generados e tem uma óbvia importância do ponto de vista da aproximação numéricauma vez que generalizam o procedimento anterior.

Page 321: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 321/371

7.1 Aspectos gerais : Teoria de Riesz-Fredholm 315

Observação 7.3. 1. Embora a imagem de uma bola unitária por um operador com-pacto não tenha interior em espaços de dimensão infinita (Teorema de Riesz),isto não nos garante que ela esteja toda situada em um espaço de dimensãofinita! ! Isto é fácil de verificar analisando-se o operador integral com núcleo

contínuo e o resultado do exercício anterior sobre este assunto.2. Apesar dos resultados do item 11 e do exercício sobre operadores com núcleos

contínuos, não é verdade que todos operadores compactos entre espaços de Ba-nach sejam aproximáveis por operadores de posto finito. Esta era uma suspeitae uma questão aberta que levou muito tempo para ser respondida negativamentepor Per Enflo em 1973. Portanto, o conceito de operador compacto em espaçosde Banach é mais geral do que o de operadores uniformemente aproximáveispor operadores de posto finito. Entretanto, nos espaços de Hilbert funcionaisusuais, estes dois conceitos são idênticos, o que tem uma grande importâncianas aplicações, especialmente no que diz respeito a aproximação numérica.

3. Por outro lado, operadores de posto finito não precisam ser contínuos. Exem-plo : A : l2(C) → l2(C), Aek = ke1. Compare este exemplo com o item 9 do

teorema acima.

A designação “completamente contínuo” que Hilbert usou para os operadorescompactos tem a sua explicação no seguinte teorema, que mostra como estes ope-radores mantêm a sua continuidade ainda que com o enfraquecimento da topologiano espaço domínio. Esta propriedade tem grande importância na construção de so-luções de equações pois relaxa consideravelmente as restrições sobre as sequênciasaproximantes.

Teorema 7.4.Sejam E e F espaços de Banach, E reflexivo, A ∈ K (E , F ) e xn ⊂ E tal que xn x(isto é, xn converge fracamente para x). Então, Axn

−→ Ax, ou seja, A é contínuo se

considerarmos a topologia fraca em E e forte em F.

Prova. É fácil ver que Axn Ax. Pelo teorema de Banach-Steinhaus, considerando xn como elementos de E ∗∗, concluímos que é uma sequência limitada. Suponha que Axn não convirja fortemente para Ax. Então, existiria uma subsequência xnk tal que Axnk − Ax > ε para todos k . Mas sendo A compacto e xn limitada, concluímos queexiste uma sub-subseqüência de xnk para a qual a imagem via A converge fortementepara um y ∈ F . Sendo o limite fraco único, devemos ter y = Ax, o que seria umabsurdo.

Observação 7.5. 1. Na verdade, o teorema acima é uma condição equivalente àcompacidade para operadores em espaços de Hilbert. Mostreo teorema de Riesza respeito : Se H for um espaço de Hilbert, então A

∈K ( H )

⇐⇒ A for fraco-

forte contínuo, isto é, toda sequência fracamente convergente é levada por A emum limite forte.

Page 322: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 322/371

316 7 Operadores Compactos : Teorias de Riesz-Fredholm e Hilbert-Schmidt

2. A definição de operador linear completamente contínuo introduzida por Hilbertsignificava continuidade fraca-forte. Hilbert definiu também funções bilineares(e multilineares) completamente contínuas no sentido de continuidade fraca-forte. Assim temos também o resultado : Uma função bilinear Ax, y = B( x, y)

é completamente contínua ⇐⇒ A for compacto.3. Referência : K. Maurin, Methods of Hilbert Space, PWN, 1967.

7.2 Exemplos de operadores compactos

Além dos operadores contínuos de posto finito (notadamente as projeções or-togonais em subespaços de dimensão finita em espaços de Hilbert, que são impor-tantes para os métodos de aproximação numérica do tipo Ritz-Galerkin), os exem-plos clássicos de operadores compactos são dados por operadores integrais, parti-cularmente por aqueles que de certa maneira representam a inversão de operadores

diferenciais. Em todos estes casos, os teoremas do tipo Arzela-Ascoli são ferramen-tas fundamentais para a determinação de compacidade de operadores.

Teorema 7.6.Se K ∈C 0(Ω ×Ω ) , onde Ω ⊂Rn é uma região compacta, então operador integralK : E → E, com E = C 0(Ω ,Rn) , definido por

K [g]( x) =

Ω

K ( x, y)g( y)dy,

é compacto tanto na norma . ∞ quanto na norma . 2.

Prova. Este teorema já foi demonstrado por meio do Teorema de aproximação deWeierstrass, e pode também ser demonstrado diretamente por meio da caracteriza-ção de Arzela-Ascoli para compactos em E .

Teorema 7.7.Um operador integral K : E → E, definido por

K [g]( x) = Ω

K ( x, y)g( y)dy,

fracamente singular (conforme nomenclatura do capítulo IV), onde E = (C 0(Ω ,Rn) ,

.

∞) , é compacto.

Prova. Exercício. Sugestão : Utilize a caracterização de operadores compactos porlimites de operadores de posto finito.

Page 323: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 323/371

7.3 Perturbação compacta da identidade : Teorema de Riesz-Fredholm 317

Estes exemplos mostram a grande importância do estudo de operadores daforma I − K , onde K é compacto, chamados de perturbação compacta da identi-dade, considerando-se a forma das equações integrais clássicas de segunda espéciede Fredhom e Volterra,

ϕ ( x) = h( x) + Ω

K ( x, y)ϕ ( y)dy,

assim como também das equações integrais de primeira espécie,

ϕ ( x) = Ω

K ( x, y)ϕ ( y)dy.

As equações de segunda espécie foram tratadas pelos métodos de Neumann-Peano no capítulo IV e são, em geral, representações de soluções de problemasde fronteira, valor inicial, ou mistos, para equações difererenciais ordinárias ouparciais. A inversão do operador I − K é o mesmo que a resolução da equação( I − K ϕ = h, para a incógnita ϕ , uma vez dada a função h. A possibilidade destainversão se torna razoável se considerarmos que o operador K , sendo compacto

em dimensão infinita, representa uma perturbação muito restrita da identidade, quetalvez não destrua a sua propriedade de invertibilidade. Estamos, de certa forma,substituindo o conceito de “pequena perturbação” no sentido da norma uniformeda teoria de Neumann-Peano por uma “pequena perturbação” no sentido topoló-gico, ou dimensional. A Teoria de Riesz-Fredholm se baseia em grande parte nesteargumento.

Por outro lado, exatamente o contrário ocorre com respeito às equações de pri-meira espécie. Neste caso podemos encarar o operador como uma perturbação com-pacta da aplicação nula, e portanto, a impossibilidade da inversão, ou seja, da re-solução do problema, se torna uma questão delicada. Obviamente, em dimensãoinfinita, o operador compacto não pode ter inversa no sentido usual. Como este pro-blema aparece em inúmeras situações de grande importância prática, especialmentecom respeito à reconstrução de funções (e sinais), será necessário que encontremosuma maneira de contornar esta dificuldade de maneira útil. Estas questões se consti-tuem o domínio da vasta e importante área denominada “Problemas mal-postos” e,em alguns casos, Problemas Inversos, que teve o matemático russo A. N. Tikhonov,(já citado), como um de seus iniciadores. Sobre estes problemas consulte : G. Wing, A Primer on Integral Equations of the First Kind , SIAM, 1991 ; A. Tikhonov, V. Ar-senin, Méthodes de Resolution des Problémes Mal Posées, Mir, 1976 ; C. Groetsch, Inverse Problems in the Mathematical Sciences, Vieweg, 1993 ; J. Baumeister, A.Leitão, Lectures on Inverse Problems, IMPA ; B. Scholkopf, A. Smola, Learningwith Kernels, MIT ; R. Kress, Linear Integral Equations, Springer.

7.3 Perturbação compacta da identidade : Teorema de

Riesz-FredholmAs equações integrais de Fredholm de segunda espécie são da forma

Page 324: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 324/371

318 7 Operadores Compactos : Teorias de Riesz-Fredholm e Hilbert-Schmidt

u( x) = f ( x) +

Ω

K ( x, y)u( y)dy,

que abstratamente podem ser representadas na forma

Au = ( I −K )u = f ,

onde K é o núcleo, u é a incognita e f é uma função dada.Estas equações integrais portanto são reduzidas à questão de invertibilidade de

um operador que pode ser interpretado como uma perturbação compacta da identi-dade. A teoria de Neumann-Peano nos garante que se K ∈ L(E ) e K < 1, entãoo operador A = I −K tem uma inversa limitada definida em todo o espaço E , isto é,que existe ( I − K )−1 ∈ L(E ). Entretanto, no caso presente não nos restringiremos apequenas perturbações da norma, mas a pequenas perturbações no sentido topoló-gico da imagem, isto é, a perturbação K é tal que sua imagem K (E ) não contemuma bola inteira, ou seja, é um conjunto “magro”.

Exercício :7.4. Mostre que se K : E → F , é um operador compacto entre dois espaços normadose dimF = ∞, então K (E ) não pode conter uma bola.

Por outro lado, não podemos esperar que uma inversa de A = I − K de maneirairrestrita, isto é, A = I − K pode não ser injetiva ; basta, e é necessário, que K tenhaautovalor unitário(onde K é sempre compacto !), o teorema do posto nos dá umpanorama muito completo sobre esta questão : dim A(E ) + dim N ( A) = dimE . Istosignifica que a equação Ax = y só terá solução se y ∈ A(E ), o que não será para todosos y, se N ( A) = / 0, e havendo solução, ela não será única. Observe que se tivermosum teorema semelhante em dimensão infinita, podemos esperar que a impossibi-lidade de solução da equação irá acontecer para um conjunto topologicamente pe-queno. A Teoria de Riesz-Fredholm trata exatamente desta questão. Prosseguiremosentão obtendo alguns resultados que nos levarão às conclusões desejadas.

Teorema 7.8.Se K ∈K (E , F ) , onde E e F são espaços normados, então dim N ( I − K ) < ∞ , e a perturbação compacta de um operador A ∈ GL(E ) , A − K, modifica o seu núcleono máximo por uma dimensão finita.

Prova. Exercício.

Teorema 7.9.Se K ∈K (E , F ) , onde E e F são espaços de Banach e dim N ( I −K ) = 0 , então,

1. ( I − K )(E ) = R é um subespaço fechado de F,

Page 325: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 325/371

7.3 Perturbação compacta da identidade : Teorema de Riesz-Fredholm 319

2. ( I − K ) : E → R é bicontínua, isto é, ( I −K )−1 ∈ L( R,E ).

Prova. Apêndice.

Estenderemos este resultado agora para o caso em que dim N ( I − K ) > 0. Paraisto, é razoável considerar o espaço quociente E / N ( I −K ), que é um espaço de Ba-nach, e verificar que K pode ser consistentemente definido ali como um compactoe voltar ao caso anterior. Não seguiremos este caminho, que é abstrato e tecnica-mente mais difícil do que no caso de um espaço de Hilbert, onde podemos fazer usoconveniente e simplificador da decomposição ortogonal de Beppo-Levi. Portanto,de agora em diante passaremos a tratar de espaços de Hilbert, e caracterizaremos oespaço quociente E / N ( I −K ) como N ( I −K )⊥, isto é, escreveremos :

H = N ( I −K ) ⊕ N ( I − K )⊥.

Exercício :

7.5. Se H for um espaço de Hilbert e H 0 ⊂ H for um subespaço fechado, então H / H 0 ≈ H ⊥0 .

Portanto, já sabemos onde estão as soluções representativas da equação ( I −K ) x = y, e que são obtidas continuamente por meio de ( I − K )−1 : R → H ; as ou-tras soluções são da forma x +h, h ∈ N ( I −K ). Agora nos resta determinar o espaço( I −K )( H ) = R onde se encontram os y para os quais existe uma solução da equação.A caracterização da imagem de um operador linear em espaços de Hilbert pode serfeita de forma muito conveniente e simples por meio do operador adjunto. A condi-ção necessária é quase óbvia : Se Ax = y, isto é, se y ∈ A( H ), então para qualquerh ∈ N ( A∗) temos y, h = Ax,h = x, A∗h = 0, ou seja, devemos ter necessaria-mente que A( H ) ⊂ N ( A∗). A importância desta condição está no fato de que ela

também é suficiente quando A( H ) for fechado.

Teorema 7.10 (Fatoração).Se A ∈ L( H ) , onde H é um espaço de Hilbert, e A( H ) for fechado, então podemosescrever

A( H ) = N ( A∗)⊥,

ou, na notação de espaços quocientes,

H / A( H ) = N ( A∗) e H = A( H )⊕ N ( A∗).

Portanto, Ax = y tem solução, isto é, y ∈ A( H ) , se, e somente se, para qualquer h ∈ N ( A∗) , temos y, h = 0.

Prova. A necessidade, como vimos, é quase óbvia. Para demonstrar a suficiência,observamos que, sendo A( H ) fechado, então a decomposição de Riesz-Beppo-Levipode ser aplicada em H , de onde seguirá facilmente a conclusão.

Page 326: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 326/371

320 7 Operadores Compactos : Teorias de Riesz-Fredholm e Hilbert-Schmidt

Observação 7.11. 1. É claro que a hipótese fundamental neste teorema é o fatode que A( H ) é fechado. Entretanto, se isto não acontecer, podemos igualmenteconcluir que A( H ) = N ( A∗)⊥, mas isto não nos fornece uma condição sufi-ciente.

2. Uma importante conclusão que podemos tirar desta fatoração é que, em parti-cular, se A for autoadjunto, isto é, se A∗ = A, então vale o “teorema do posto” : H = A( H )⊕ N ( A).

3. Também, como H = H / N ( A) ⊕ N ( A) = H / N ( A∗) ⊕ N ( A∗), e pelo teoremaacima, H / N ( A) e H / N ( A∗) são isomorfos via A, podemos concluir que N ( A) ≈ N ( A∗). Portanto, estes núcleos tem uma mesma dimensão quando um deles forde dimensão finita.

Com estes resultados podemos finalmente obter a importantíssima “Alternativade Fredholm” que é a extensão direta do teorema do posto para dimensão infinita.

Teorema 7.12 (Alternativa de Fredholm).Seja H um espaço de Hilbert K ∈ L( H ) um operador compacto e A = I − K uma perturbação compacta da identidade. Então,

1. dim N ( A) = dim N ( A∗) < ∞ ,

2. A( H ) é fechado e A : H / N ( A) −→ H / N ( A∗) é um isomorfismo.

Em outras palavras, a equação de Fredholm de segunda espécie ( I − K ) x = y, outem solução única para cada y, ou a equação homogênea ( I − K )h = 0 tem solu-ção não nula. No último caso há apenas um número finito de soluções linearmenteindependentes da equação homogênea e a equação ( I −K ) x = y tem soluções se, esomente se, y for ortogonal ao núcleo de A∗.

Prova. Basta coletar os resultados anteriores.

Observação 7.13. 1. A Alternativa é uma generalização para dimensão infinita doteorema do posto em dimensão finita, onde se escreve : dim N ( A) ⊕ dim A(Rn)= n = dim(Rn), que pode ser equivalentemente escrito como N ( A) ⊕ A(Rn)≈ Rn. No caso presente, temos este fato escrito na forma H ≈ N ( A)⊕ A( H ).

2. Em uma equação do tipo Fredholm de segunda espécie ( I −K ) x = y, a demons-tração da unicidade da solução implica imediatamente na existência de soluçõespara todos os y. Este é um argumente extremamente interessante herdado da ál-gebra linear de dimensão finita, onde sabemos que uma matriz n × n, A, temposto máximo se, e somente se, for não singular, ou, em uma outra linguagem, Ax = 0 tem solução única se, e somente se, Ax = y tem solução para todo y.

Page 327: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 327/371

7.3 Perturbação compacta da identidade : Teorema de Riesz-Fredholm 321

Teorema 7.14 (Espectro de Compactos I).Seja E um espaço de Banach e A ∈ K (E ). Então,

1. σ ( A) = / 0 , em particular se dim E = ∞ , 0 ∈ σ ( A).

2. σ ( A) é discreto e o único ponto de acumulação possível deste conjunto é λ = 0.

3. dim N ( A−λ I ) < ∞ se λ = 0 , isto é, existe apenas um número finito de autove-tores linearmente independentes para cada autovalor não-nulo.

Prova. 1. Exercício.

2. Suponha que Avn = λ nvn, vn = 0, e λ n →λ . Usando o teorema de Riesz (quaseortogonalização em espaços normados), obtenha uma sequência un tal que seE n = [v1,.......vn] = “espaço gerado pelos vetores v1,...vn”, então un+1 ∈ E n+1

e dist (un+1,E n) > 12 . Portanto, un+1 = cn+1

n+1vn+1 +n∑1

cn+1k vk e

Aun+1 = λ n+1cn+1n+1 +

n

∑1

cn+1k λ k vk ∈ E n+1,

de onde temos que,

Aun+r − Aun = λ n+r cn+r n+r vn+r +

n+r −1∑

n+1λ k c

n+r k vk +

n∑1λ k (cn+r

k − cnk )vk =λ n+r cn+r

n+r vn+r +n+r −1∑1

cn+r k vk

+

n∑1

(λ k −1)cn+r k vk +

n∑λ k (cn+r

k − cnk )vk

=

| λ n+r | un+r −ξ ≥| λ n+r | dist (un+r ,E n+r −1) ≥ |λ n+r |2 .

Como λ m → λ = 0, concluímos que A(un) não pode ter subsequência conver-gente, o que contradiz a compacidade de A.

3. Exercício.

Exercício :

7.6. Demonstrar simplificadamente o teorema acima em um Espaço de Hilbert como uso da Teoria da projeção ortogonal de Riesz.

Quando o espaço normado é um espaço de Hilbert, dispomos ainda de umaimportante informação extra.

Teorema 7.15 (Espectro de Compactos II).Sejam H um espaço de Hilbert e K ∈ K ( H ). Então, σ ( A) = σ p( A) , ou seja, o es- pectro de K é formado apenas por autovalores.

Prova. Se dim N (K −

I ) = 0, isto é, se λ /

∈σ p(K ), então, pela alternativa de Fred-

holm, K −λ é sobrejetora, e portanto K −λ ∈ GL( H ) =⇒ λ ∈ ρ(K ).

Page 328: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 328/371

322 7 Operadores Compactos : Teorias de Riesz-Fredholm e Hilbert-Schmidt

7.3.1 Exemplos e aplicações

7.4 Teoria espectral de operadores compactos autoadjuntos

(Hilbert-Schmidt)7.4.1 Introdução

Tal como nas matrizes de dimensão finita, o estudo do espectro de operadoreslineares é uma das maneiras pelas quais podemos conhecer melhor as suas proprie-dades. Um bom exemplo de como o o conhecimento do espectro de um operadorpode nos fornecer informações surpreendentemente profundas sobre o mesmo é ofamoso e histórico artigo de M. KAC, Can one hear the shape of a drum?, Am.Math. Monthly, 1966.

Neste caso, “ouvir” significa distinguir as frequências que constituem o somv( x,t ) = ∑exp(λ k t )uk ( x) emitido pela membrana vibratória do tambor que ocupa aregião Ω , e que, de acordo com o método de Fourier, são dadas pelo espectro do

operador laplaciano para o problema de Dirichlet uk = λ k uk em Ω , e uk = 0 em∂Ω . O título insinua que podemos responder algumas questões sobre a geometriada forma Ω da membrana (área, perímetro, etc.), a partir do conhecimento do es-pectro de . O estudo desta questão se constitui em uma vasta área da matemáticacontemporânea.

Questões sobre estabilidade e bifurcação também são intimamente ligadas à teo-ria espectral de operadores lineares. A mecânica quântica é fundamentada no conhe-cimento do espectro de operadores diferenciais. Aliás, o termo “espectro” foi dadopor Hilbert bem antes do advento da física moderna e, por uma das mais extraor-dinárias coincidências, a teoria espectral matemática seria exatamente a ferramentaadequada para explicar os fenômenos de espectroscopia que foram a origem ex-perimental da teoria quântica. Para referencias históricas a respeito consulte : C.Reid, Hilbert , Springer-Verlag, 1974 ; J. Dieudonné, History of Functional Analy-

sis, North-Holland, (notas de um curso ministrado pelo autor na UFRJ) ; L. Feuer,The Generation of Science, A. Knopf, 1974 ; L. Garding, nome? ?? ?.

No caso de dimensão finita, o espectro de um operador linear (matrizes) são osλ ∈ C , para os quais existem v = 0, e Av = λ v, e isto é equivalentemente caracteri-zado como os λ ’s tais que A −λ I é singular ; por conta da alternativa de Fredholm,ou seja, o teorema do posto. Entretanto, em dimensão infinita estas caracterizaçõesnão são equivalentes. Além disso, em Análise Funcional aplicada a operadores di-ferenciais, é importante também o estudo de operadores não limitados, onde estacaraterização é impossível. Vejamos algumas definições sobre espectro de opera-dores.

A teoria espectral de matrizes pode ser estendida de forma razoavelmente com-pleta para o caso de operadores compactos autoadjuntos em espaços de Hilbert dedimensão infinita. Esta teoria espectral foi desenvolvida por Hilbert no início do sé-culo XX e foi sucessivamente estendida, com as modificações necessárias, para ocaso de operadores autoadjuntos limitados não compactos e depois para operadores

Page 329: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 329/371

7.4 Teoria espectral de operadores compactos autoadjuntos (Hilbert-Schmidt) 323

autoadjuntos não limitados. Nesta seção nos limitaremos ao primeiro caso clássico,que é de grande importância para o estudo do Método de Fourier, Estabilidade, Re-gularização e outras aplicações analíticas. Iniciaremos com uma caracterização doespectro de operadores compactos em espaços de Banach em geral.

Sugerimos fortemente ao leitor que faça uma recordação dos argumentos utili-zados para a demonstração do teorema espectral para matrizes simétricas; se possí-vel, em um dos excelentes textos citados a seguir, com o objetivo de verificar asmodificações de caráter topológico que serão necessárias nestes argumentos parao tratamento do caso de dimensão infinita. Insistiremos neste paralelo ao longo detodo o capítulo : P. Lax, Linear Algebra, Wiley, 1996; G. Strang, Linear Algebra,Wellesley, 1990.

Como já vimos, os operadores compactos em geral não dispõem de uma quan-tidade suficientemente grande de autovalores linearmente independentes para geraro espaço de Hilbert adjacente ; o que não deve ser surpreendente, uma vez que éuma deficiência existente mesmo em dimensão finita. Portanto, se o nosso objetivofor a diagonalização do operador nos moldes da teoria de matrizes, teremos queadicionar alguma hipótese pelo menos tão restritiva quanto às que são usuais em

dimensão finita. Na álgebra de matrizes, uma condição necessária e suficiente paraque uma matriz A seja diagonalizável (isto é, que tenha uma base de autovetores),é que satisfaça à propriedade A∗ A = AA∗, pela qual é chamada matriz normal. Ogrande triunfo da teoria de Hilbert foi a demonstração de que, além da “finitude”representada pela compacidade, basta que consideremos a mesma hipótese clássicada teoria de matrizes, ou seja, a normalidade. Trataremos aqui apenas do caso parti-cular, que é também o mais importante em dimensão finita, quando a normalidade écumprida por conta da simetria do operador, no caso, representada pela autoadjun-ticidade A = A∗.

Diversas propriedades que enunciaremos (e utilizaremos) são satisfeitas por umamera questão de simetria algébrica independente do contexto topológico. Como es-tas situações são frequentes na teoria de operadores diferenciais em espaços de fun-ções independentemente da sua continuidade, é interessante ressaltá-las separada-

mente.

Definição 7.16.Se H for um espaço com um produto interno , e L : H → H for um operador linear,dizemos que L é simétrico se ∀ x, y ∈ H temos Lx, y = x, Ly. Frequentemente, H é subespaço de um espaço de Hilbert H 0 e neste caso escrevemos que o domínio de L em H 0 é H = D( L).

Exemplos :

1. Operadores Diferenciais Ordinários de Segunda Ordem Simétricos :

H = C 20([a,b]), u, v =b

au( x)v( x)dx, L = ∂ x( p( x)∂ x) + q( x) = L0 + q( x).

Page 330: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 330/371

324 7 Operadores Compactos : Teorias de Riesz-Fredholm e Hilbert-Schmidt

2. Fórmula de Green :

L0u,v =

b a

[∂ x( p∂ xu)]vdx =

b a

∂ x[( p∂ xu)v] − p(∂ xu)(∂ xv)dx

= p(∂ xu)v |ba −b

a

p(∂ xu)(∂ xv)dx =

=

b a

uL0vdx + p [v∂ xu−u∂ xv] |ba= u, L0v+ Q[u,v].

Se agora considerarmos um espaço H de funções duas vezes continuamentediferenciáveis em [a,b] tais que Q[u, v] = 0 para todos u, v ∈ H , então o operador L0, e consequentemente L, será simétrico. Por exemplo,

a) H = h ∈ C 2([a, b]), h(a) = h(b) = 0, condições de Dirichlet,

b) H = h ∈ C 2([a, b]), h(a) = h(b) = 0, condições de Neumann,

c) H = h ∈ C 2

([a,b]), h(a) = h(b), e, h(a) = h(b), condições de periodi-cidade, no caso em que p,q ∈ H .

3. Também é possível tomar a = −∞ e/ou b = ∞, com H = C 20 ((a, b)), por exem-plo.

4. Operadores Diferenciais Parciais Simétricos :

L =n∑i, j∂ xi Di j∂ x j + q( x) = L0 + q, D i j = Di j( x1, .. xn), q = q( x1,... xn), u,v =

Ω

u( x)v( x)dx, Ω ⊂Rn

L0u, v

=

u, L0v

+ Q[u, v],

onde, usando o teorema da divergência, temos que a forma quadrática é dadapor uma integral de superfície :

Q[u, v] =

∂Ω

∑(vDi j∂ x ju−uDi j∂ xiv) · d −→S

Tal como no caso do operador diferencial ordinário, podemos tomar comoexemplos

a) H = u ∈ C ∞(Ω ) ; u = 0 em ∂Ω , condição de Dirichlet, e

b) H = u ∈ C ∞(Ω ) ; ∇u ·−→ N = 0 em ∂Ω , condição de Neumann.

Naturalmente, nenhum destes operadores são contínuos nestes espaços, muito

menos compactos. Entretanto, operadores de Green (funções de Green), que decerta forma são inversos de operadores diferenciais, são operadores compactos,e portanto, acessíveis a esta teoria.

Page 331: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 331/371

7.4 Teoria espectral de operadores compactos autoadjuntos (Hilbert-Schmidt) 325

Referências :Peter D. Lax, Functional Analysis, J. Wiley, 2002.I. Gohberg, S. Goldberg, M. Kaashoek, Basic Classes of Linear Operators, Birkhau-ser, 2004.

N. Akhiezer, I. Glazman, Theory of Linear Operators in Hilbert Spaces, Dover.

Outras referências :S. Mikhlin, Advanced Course of Mathematical Physics, North-Holland, 1968.S. Mikhlin, The Minimum of a Quadratic Functional, Holden-Day, 1964.V. P. Maslov, Méthodes Opératorielles, Mir, 1986.Richard Courant, David Hilbert, Methods of Mathematical Physics, vol I, J. Wiley.R. Dautray, J. L. Lions, Mathematical Analysis and Numerical Methods for Scienceand Engineering, 6 vol., Springer.E. Zeidler, Applied Functional Analysis, Springer, 1997.

7.4.2 Aspectos algébricos do espectro de um operador simétrico e Princípio deRayleigh

Seja L um operador simétrico em um espaço com produto interno ( H ,,). Então

1. Os Autovalores de L são reais.

2. Os autovetores de L para autovalores distintos são ortogonais.

3. Se H 0 for invariante por L, isto é, L( H 0) ⊂ H 0, então H ⊥0 também é invariantepor L.

A existência de algum autovetor e autovalor para um operador simétrico é facil-mente interpretada geometricamente analisando-se as projeções Ax, x para todosos vetores da esfera unitária, x ∈ S 1. Observamos que x0 será um candidato a au-tovetor de A quando esta projeção atingir um máximo, e o importante teorema, ou

princípio, de Rayleigh nos garante exatamente isto no caso em que o operador forsimétrico.

Teorema 7.17 (Teorema de Rayleigh).Seja L um operador simétrico em um espaço com produto interno H. Se x0 ∈ S 1 for tal que R[ x] = Lx, x atinge um máximo (ou mínimo), na esfera unitária, então x 0 é autovetor de L com autovalor Lx0, x0.

Prova. Considere a função de Rayleigh R[ x] = Lx, x x2 em todo o espaço, exceto x = 0,

e observe que ela atinge máximo na esfera unitária. Portanto, x0 é um máximo de Rem H −0, e pelo teorema de Fermat, temos que a derivada de R[ x0 + th] = ϕ (t )se anula para t = 0. Fazendo os cálculos apropriados concluímos o desejado.

Page 332: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 332/371

326 7 Operadores Compactos : Teorias de Riesz-Fredholm e Hilbert-Schmidt

A demonstração do teorema espectral para matrizes simétricas fazia uso exata-mente das propriedades listadas acima, e da existência, no caso óbvia, deste pontode máximo, que nos proporciona o primeiro autovetor a partir do qual o processode construção da base é desenvolvido. Neste ponto a teoria de dimensão infinita é

um pouco mais delicada, uma vez que a existência deste máximo não é imediatapara uma bola não compacta neste espaço. Para resolver esta questão faremos usoda compacidade fraca desta bola (Teorema de Alaoglu), que nos será suficiente seestivermos tratando de operadores compactos. Portanto, de agora em diante neces-sitaremos fortemente das estruturas topológicas adequadas.

7.4.3 Teorema Espectral

Teorema 7.18 (Teorema de Alaoglu). A bola unitária em um espaço normado E é fracamente compacta.

Este teorema não seria de grande utilidade se não fosse o teorema que justificaa designação de completamente contínuo para os operadores compactos :

Teorema 7.19.Se A ∈ K (E ) , então xn x =⇒ Axn −→ Ax.

Com base nestes dois teoremas podemos demonstrar o importantíssimo

Teorema 7.20 (Princípio variacional de Rayleigh).Seja H um espaço de Hilbert A ∈ K ( H ) , tal que A = A∗ , isto é, A é um operador compacto e autoadjunto. Então,

1. A função de Rayleigh R[ x] = Lx, x atinge um máximo (e um mínimo) na esferaunitária, e se x0 for este ponto de máximo (ou mínimo), então x0 é autovetor de L com autovalor Lx0, x0.

2. Todos os autovalores λ de A são tais que m = minS 1

R[ x] ≤ λ ≤ maxS 1

R[ x] = M,

ou seja, ρ( A) ⊂ [m, M ] ⊂ [− A , A ].

Prova. 1. R[ x] é de fato uma forma quadrática limitada (contínua), pois | R[ x] |≤| Ax, x|≤ A x 2, e, portanto, existe M = sup Ax, x ; x ∈ S 1. Seja agora xn uma sequência em S 1 tal que R[ xn] → M . Pelo Teorema de Alaoglu, existeuma subsequência xnk x0 ∈ S 1. Mas então, sendo A compacto, temos

| Axnk − Ax0, x0|≤ Axnk − Ax0 xnk −→ 0.

Mas também, Axnk − Ax0, xnk = Axnk , xnk − xnk , Ax0, e o ultimo termo, pelaconvergencia fraca da subseqüência xnk , converge para x0, Ax0, que nos leva aconcluir que Axnk , xnk −→ x0, Ax0 = M .

Page 333: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 333/371

7.4 Teoria espectral de operadores compactos autoadjuntos (Hilbert-Schmidt) 327

2. Basta usar o argumento geométrico do teorema anterior e observar que semax

S 1 R[ x] é atingido para um autovetor x0 então min

S 1 R[ x] = Ax0 ≤ A .

Com estes resultados, estamos aptos a desenvolver argumentos semelhantes aosutilizados na teoria de matrizes simétricas finitas para obtermos a diagonalizaçãocompleta de operadores compactos autoadjuntos, que será expresso pelo importantee histórico

Teorema 7.21 (Teorema Espectral de Hilbert-Schmidt : Operadores Compac-tos Autoadjuntos).Seja H um espaço de Hilbert (separável) e A ∈ K ( H ) , A∗ = A. Então,

1. σ ( A) = σ p( A) é real, compacto e σ ( A) ⊂ [− A , A ].

2. Se λ = 0 , então dim N ( A−λ ) < ∞.

3. A−λ ∈ GL( N ( A−λ )⊥) , ∀λ ∈ C.

4. σ ( A) = 0 , isto é, o único ponto de acumulação do espectro de A é o zero.5. H = ⊕n∈N N ( A − λ n) , onde ⊕ significa uma soma direta ortogonal e λ 0 = 0 ,

λ nn>0 = σ ( A) no sentido de que todo x ∈ H pode ser escrito de uma única

forma como x =∞

∑n=0

vn , onde vn ∈ N ( A−λ n).

6. Existe uma base ortonormal de H formado por autovetores de A.

7. r ( A) = raio espectral de A = maxS 1

R[ x] = Ax0 para algum x0 ∈ S 1 tal que

Ax0 = Ax0, x0 x0.

Prova. As demonstrações dos itens 1 → 4 fazem parte da teoria de Riesz-Fredhom.

5. Tomemos H 0 = “Espaço gerado por todos autovetores de A”, isto é, o conjuntode suas combinações lineares finitas. Se H 0 = H nada mais há a provar. Se H 0

=

H ’, observamos que A preserva H 0 e, portanto, também preserva H ⊥0 . Nestecaso, o operador A restrito a H ⊥0 , A0, deve satisfazer à condição A0h, h = 0,∀h ∈ H ⊥0 , pois, caso contrário, pelo teorema de Rayleigh teríamos um autove-tor neste subespaço, o que é impossível. Mas então, 0 = A0( x − y), ( x− y) = A0 x, x − 2 A0 x, y + A0 y, y de onde Ao x, y = 0, ∀ x, y ∈ H 0, e finalmente(fazendo y = A0 x), concluímos que A0 = 0, ou seja, H 0 ⊂ N ( A), provando odesejado.

6. Tomando uma base ortonormal do subespaço de Hilbert N ( A) = H 0 e N ( A −λ n) = H n, obtemos o resultado, tal como no caso finito.

7. Teorema de Rayleigh.

O Princípio de Rayleigh não é apenas um argumento para satisfação teórica, ouum “lema” auxiliar para a demonstração do Teorema Espectral. Na verdade, a moti-vação de Lord Rayleigh surgiu do seu fundamental trabalho sobre a propagação de

Page 334: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 334/371

328 7 Operadores Compactos : Teorias de Riesz-Fredholm e Hilbert-Schmidt

ondas sonoras publicado no famosíssimo The Theory of Sound em 1894, que, dentreinúmeras outras áreas da matemática aplicada, deu origem aos chamados métodosvariacionais para o cálculo de espectros. De fato, um livro cuja leitura, agradável,ainda hoje muito ensinaria a um aspirante a matemático aplicado. Estes métodos de-

sempenharam um papel decisivo no sucesso inicial das aplicações da teoria espec-tral à física quântica e ainda são uma vasta e importante área de pesquisas. RichardCourant, o herdeiro intelectual de Hilbert, foi um dos grandes responsáveis pelo de-senvolvimento dos métodos variacionais, e o histórico “Courant-Hilbert” foi escrito,em grande parte, para a compilação e divulgação dos resultados obtidos pela escolade Göttingen no início do século. O Teorema, ou Princípio, de Courant-Fisher é oprimeiro passo clássico nesta direção. Consulte a biografia de Courant e o volume Ido “Courant-Hilbert” para maiores detalhes a respeito. Alguns resultados do métodovariacional serão abordados logo abaixo.

Algumas variações sobre o Teorema Espectral

1. Interpretação de Dirac - Resolução da IdentidadeSe x ∈ H , então podemos escrever x =

∑k =0

vn, xvn =∞

∑k =0

vnvn, x. Usando a

notação colchete de Dirac (ou, “bra-ket”, lembrando que, em inglês “bra” si-gnifica “soutien” em francês), onde o bra | x ∈ H representa os vetores e oket x |∈ H ∗ o funcional correspondente, escrevemos o operador identidade

da seguinte maneira diraqueana : I =∞

∑k =0

| vnvn | e os operadores projeção

E k : H → N ( A−λ k ), da forma E k = ∑vn∈ N ( A−λ k )

| vnvn |.O Teorema Espectral é frequentemente escrito na forma I = ∑E k , e se diz umaresolução da identidade segundo o espectro de A. Esta maneira é convenientepara a generalização do teorema espectral para os casos em que o espectro de A

não é discreto, quando a soma se transforma em uma integral operacional, e oconceito de autovalor e autovetor tem que ser generalizado.

2. Representação Espectral de AObserve que E 0 : H → N ( A), e portanto podemos escrever

A =∞

∑k =1λ k E k ,

pois N ( A−λ k ) é obviamente invariante com A, e se v ∈ N ( A −λ k ), então Av =λ k v ou, AE k = λ k E k , e pela resolução da identidade já obtida, concluímos oresultado.

3. Cálculo OperacionalUma das grandes vantagens da teoria espectral em geral é a possibilidade queela nos fornece para definir um cálculo operacional muito mais abrangente do

Page 335: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 335/371

7.4 Teoria espectral de operadores compactos autoadjuntos (Hilbert-Schmidt) 329

que aquele iniciado com a teoria de Neumann-Peano. Por exemplo, se g(ξ ) =ξ n, é “natural” associar a esta função o operador g( A) = An, que pode ser tam-

bém escrito como g( A) =∞

∑k =1λ nk E k =

∑k =1

g(λ k )E k , e se g for um polinômio, da

mesma forma g( A) =∞

∑k =0

g(λ k )E k . Observe que nesta última soma incluímoso autovalor 0, uma vez que em geral podemos ter g(0) = 0. Na verdade, se gfor uma função analítica em uma região que inclui o espectro σ ( A), podemos

definir de forma “natural” g( A) =∞

∑k =0

g(λ k )E k .

A definição destas funções só terá algum valor se for possível tratá-las operacio-nalmente tal como fazemos na álgebra de funções de variável numérica, isto é,isomorficamente. Ou seja, a grande vantagem de um cálculo operacional seriaa possibilidade de representar a sub-álgebra de operadores pela álgebra de fun-ções, com a qual temos um maior espaço de manobra conceitual e técnica. Esteseria o significado útil do termo “natural”. No caso, é fácil ver que a álgebra dasfunções analíticas em domínios que incluem o compacto σ ( A) (com operações

de soma e produto ponto a ponto e norma uniforme supσ ( A) g(ξ )), é isomór-fica à sub-álgebra de L( H ) gerada por todos os operadores da forma g( A). Érazoável esperar que este isomorfismo se estenda para funções contínuas, pormeio de Teorema de aproximação de Weierstrass, uma vez que é válido para asubálgebra dos polinômios em um compacto. De fato, isto é garantido pelo

Teorema 7.22 (Teorema Espectral de Riesz).Seja A um operador hermitiano limitado em um espaço de Hilbert H. Então,

1. A identificação C 0(− A , A ), . ∞

−→ R( A),

ondeR( A) =sub-álgebra dos operadores polinomiais p( A) , p = polinomio.0

,é um isomorfismo de álgebras de Banach.

2. Este isomorfismo preserva as ordens naturais destes espaços, ou seja, h ≥ 0 ⇔h( A) for um operador positivo, (isto é, h( A) x, x ≥ 0 , ∀ x ∈ H).

Prova. Referências : S. Lang, Analysis II , capítulo VII, A. Wesley (baseado em no-tas de aulas de um curso ministrado por J. von Neumann ! !) ; M. Reed, B. Simon,Functional Analysis I , Academic Press, 1974; V. P. Maslov, Méthodes Opérato-rielles, Mir.

A importância do cálculo operacional provêm da possibilidade de transpor-tarmos técnicas algébricas conhecidas e amplamente estudadas para o tratamento

de questões analíticas, especialmente da teoria de equações diferenciais. Nestecontexto, as funções exponenciais da forma e A = ∑eλ k E k , onde g(ξ ) = eξ , e etA =

∑et λ k E k , são de fundamental importância. Observe que a função U : R→ L( H ),

Page 336: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 336/371

330 7 Operadores Compactos : Teorias de Riesz-Fredholm e Hilbert-Schmidt

é a solução da equação operacional dU dt = AU com condições iniciais U (0) = I , e

U (t )v = x(t ), onde v ∈ H é a solução do problema de Cauchy : dxdt = Ax, x(0) = v.

Ainda, a solução da equação não-homogênea dxdt = Ax + h(t ), pode ser escrita na

forma x(t ) = etA

x(0) +

t

0 e(t

−s) A

h(s)ds, ou, via Teorema Espectral, na forma de Fou-rier :

x(t ) =∑et λ k x(0), vk vk +

t 0

∑e(t −s)λ k h(s),vk vk ds,

ou, coordenada a coordenada,

xk (t ) = x(t ), vk = et λ k x(0),vk +

t 0

e(t −s)λ k h(s), vk .ds

Esta solução pode ser interpretada como o método de Fourier abstrato para a reso-lução do problema ∂ u∂ t = u + h( y, t ), considerando-se x(t ) como uma função de

variável real e valores em um espaço de funções de y.Para um desenvolvimento desta teoria consulte : V. P. Maslov, Méthodes Opéra-torielles, MIR ; K. Maurin, Methods of Hilbert Space, PWN ; L. Garding, in Bers-John-Schechter.

7.4.4 Tópicos

1. Princípio de Courant-Fisher e outros princípios variacionais (Mikhlin, Courant-Hilbert, Dautray-Lions, Garabedian).

2. Equações Integrais Singulares e de Segunda Espécie : Problemas de Valor In-icial e Fronteira para EDP (Mikhlin (IntEq), Muskhelishvilli, Widom, Kress,Vladimirov-Garabedian-Smithies-Kress- Courant-Hilbert, Bers-John).

3. Teoremas de Hilbert (Mercer, Jentsch-Frobenius).4. Problemas Mal-Postos - Regularização - Equações Integrais de Primeira Espé-

cie (Baumeister-Kress, Arsenin-Tikhonov, Sirovich, Smithies, Cochrane, Wing).

5. Teoremas de Weyl - Valores Singulares (Stewart, Gohberg, Scholkpf).

6. Teorema Espectral : Teorema Espectral via álgebras de Banach - argumento deGelfand (ver observação Loomis pg. 27).

7. Teorema Espectral via argumento de von Neumann - ver Lang (Analysis II &Differentiable Manifolds).

8. Teoria Espectral via Cálculo Operacional : V. P. Maslov.

9. Teorema Ergódico Birkhoff-Krylov-Bogolyubov (Lax Lect. Notes Hilbert Sp. ;Reed-Simon, Bohr-Chaos).

10. Espaços de Hilbert com Núcleo Representativo - RKHS (Scholkpf, Aronszajn).

Page 337: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 337/371

8

Análise Não-Linear

8.1 Introdução : Inversão, perturbação, pontos fixos, estabilidade

Neste breve capítulo, estudaremos alguns métodos para a análise de operadoresnão-lineares ϕ (ou seja, simplesmente não iremos supor que o operador ϕ satisfaçaàs propriedades que caracterizam a linearidade), e que ocorrem em equações do tipo

ϕ ( x) = y,

ou seja, analisaremos a inversão de um operadorϕ : E → F , onde E e F são espaçosnormados. Em grande parte dos casos, teremos E = F , quando então transformare-mos a equação acima em um problema de ponto fixo na forma óbvia

ψ ( x, y) = x + A(ϕ ( x) − y) = x,

onde A é um operador injetivo (ou, pelo menos, tal que A−10 = 0), em ge-ral linear. Desta maneira, reunimos formalmente todas estas questões no estudo de

problemas de pontos fixos para funções

ψ : E ×F −→ E , ψ ( x,λ ),

onde a variável λ ∈ F ocorre conceitualmente como um parâmetro constitutivo doproblema. Em alguns casos, esta dependência do parâmetro λ é representada naforma ψ λ ( x), para enfatizar a diferenciação dos papéis entre as duas variáveis. Umaoutra maneira de representar estas questões é na forma de uma equação de fun-ção implícita ψ ( x,λ ) = 0, onde o problema se constitui em continuar uma soluçãopontual ( x0,λ 0), previamente existente, nas vizinhanças de λ 0 na forma de umafunção x(λ ), tal que ψ ( x(λ ),λ ) = 0. Enfim. trataremos de três tipos de proble-mas : inversão, função implícita, ponto fixo, e que serão colocados na forma desteúltimo. Mais adiante, retornaremos ao problema de funções implícitas, principal-

mente porque nos interessa analisar situações de não-unicidade da continuação, ouseja, problemas de bifurcação. Para uma introdução elementar a estas questões bemcomo a algumas de sua aplicações, consulte R. C. Bassanezi, W. C. Ferreira Jr.,

Page 338: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 338/371

332 8 Análise Não-Linear

Equações Diferenciais com Aplicações, Harbra, 1989. Referências mais específicasnesta área são : E. Zeidler, Applied Functional Analysis, Springer, 1995 ; A. Ambro-setti, G.Prodi, A Primer of Nonlinear Analysis, Cambridge U.P., 1993 ; H. B. Keller,The Numerical Treatment of Nonlinear Bifurcation Problems, Tata Lectures.

A referência seguinte é um interessante artigo sobre as equações no desenvol-vimento da matemática contemporânea e histórica : J. Kazdan, Solving Equations :..., Am. Math. Monthly, 105(1), jan. 1998, 1-21.

8.2 Teoremas de ponto fixo para operadores compactos

Nesta seção inicial, trataremos essencialmente da existência do ponto fixo. Tal-vez o teorema de ponto fixo mais famoso em matemática e certamente o mais útilneste contexto seja o seguinte :

Teorema 8.1 (Teorema de Brower-Bohl (1912)).Se ϕ : B1(0) −→ B1(0) = x ∈Rn; x ≤ 1 for contínua, então existe pelo menosum ponto fixo de ϕ em B1(0).

Prova. As demonstrações mais comuns deste teorema são de caráter topológico.Entretanto, enfatizaremos aqui uma abordagem mais analítica. Mostraremos inicial-mente que basta demonstrá-lo para funções infinitamente diferenciáveis. Este casoparticular será apresentado em um apêndice.

Os próximos teoremas nos fornecem informações de grande importância para ademonstração de existência e construção de pontos fixos. O primeiro deles pode serinterpretado como uma afirmação sobre a estabilidade da propriedade de existênciade pontos fixos para funções contínuas em compactos com respeito à métrica uni-forme, e o segundo produz um resultado surpreendentemente forte com respeito adependência do ponto fixo único com respeito aos parâmetros do problema.

Teorema 8.2 (Estabilidade da Existência de Pontos Fixos na Norma Uniforme).Se K for um espaço métrico compacto e ϕ n : K −→ K for uma sequência de funçõescontínuas, cada uma tendo um ponto fixo, ϕ n( xn) = xn , e se ϕ n converge uniforme-mente para ϕ , então, ϕ tem também pelo menos um ponto fixo. Em outras palavras,no espaço métrico (C 0(K ,K ),d ∞) , o conjunto das funções que admitem ponto fixo formam um conjunto fechado.

Prova. Como K é compacto, existe subsequência convergente em K , xnP → x.Mas como ϕ n converge uniformemente, é fácil concluir que ϕ ( x) = x (v.exercício

abaixo).

Page 339: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 339/371

8.2 Teoremas de ponto fixo para operadores compactos 333

Teorema 8.3 (Estabilidade do Ponto Fixo Único com Respeito a Parâmetros).Sejam K e M espaços métricos, sendo K compacto e ϕ : K × M −→ K uma fun-ção contínua tal que para todo λ ∈ M existe um único ponto fixo x(λ ) , isto é,ϕ ( x(λ ),λ ) = x(λ ). Então, a função x : M −→ K, x(λ ) , é contínua.

Prova. Inicialmente, mostramos que a funçãoΦ : M → (C 0(K , K ), d ∞), definida porΦ (λ )( x) = ϕ ( x,λ ) é contínua, o que significa dizer que ϕ ( x,λ ) é uniformementecontínua em x com relação a λ , um resultado clássico (v.exercício). Consideremosuma sequência λ n → λ . Então, pelo teorema anterior, uma subsequencia dos res-pectivos pontos fixos xn = x(λ n) converge para algum ponto fixo x da função limite(uniforme) ϕ λ 0 ( x) = ϕ ( x,λ 0). Mas, sendo este o único ponto fixo desta função, nãopode haver outra subsequencia xn = x(λ n) que convirja para outro ponto, ou seja,concluímos que lim

λ n→λ 0 x(λ n) = x(λ 0), demonstrando assim a continuidade de x(λ ).

Exercícios :

8.1. Verifique a afirmação acima analisando por triangulação

d (ϕ ( x), x) ≤ d (ϕ ( x),ϕ ( xnP )) + d (ϕ ( xnP ),ϕ nP ( xnP )) + d ( xnP , x).

8.2. Demonstre o Teorema de Brower-Bohl supondo válido o mesmo para funçõesC ∞. Sugestão : Faça uso do Teorema de Weierstrass para construir uma aproximaçãopolinomial pε ∈ C ∞( B1) −→ Rn tal que pε −ϕ ∞≤ ε , e tome ϕ ε ( x) =

pε ( x)1+ε ϕ ε :

C ∞( B1) → C ∞( B1), ϕ ε −ϕ ≤2ε . Utilize agora o lema de aproximação uniformede pontos fixos.

8.3. Mostre que se K for um subconjunto convexo-compacto em um espaço de Hil-bert então, para todo ε > 0 dado, existe um subespaço de dimensão finita E ε tal queK ε = K

∩E ε é um convexo-compacto e d (K

ε , K ) = “distância entre K

ε e K ”

≤ε . In-

terprete geometricamente este resultado. Sugestão : Utilize o teorema de coberturafinita, (Heine-Borel), e o teorema de projeção de Riesz.

8.4. Com base no exercício anterior, mostre que a identidade em um compacto-convexo K de um espaço de Hilbert pode ser uniformemente aproximada por fun-ções de dimensão finita ϕ ε : K → K (isto é, funções tais que a imagem ϕ ε (K ) estáem um subespaço de dimensão finita), e o mesmo para qualquer função contínuaϕ : K → K .

8.5. Mostre que a afirmação do Teorema de Brower-Bohl é válida para ϕ : K → K ,contínua, e qualquer conjunto convexo-compacto K ⊂Rn. Sugestão : Como existeuma bola B N (0) tal que K ⊂ B N (0), tome a função auxiliar ψ : B1(0) → K , ψ ( x) =“projeção na norma euclideana de Nx no convexo compacto K ”, que é bem definida

e contínua, e considere ϕ N ψ : B1 → B1, ϕ N ψ ( x) = 1 N ϕ (ψ ( x)).

Page 340: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 340/371

334 8 Análise Não-Linear

8.6. Demonstre que se K e M forem espaços métricos, sendo K compacto e ϕ :K × M −→ K uma função contínua, então ϕ ( xλ ) é uniformemente contínua em xcom relação a λ . Sugestão : use a caracterização de Heine-Borel para a compacidadede K , ou defina as funções de oscilação Oh( x) = supd (λ ,λ 0)≤hd (ϕ ( x,λ ),ϕ ( x,λ 0))e aplique o Teorema de Dini.8.7. Mostre como o teorema da continuidade do ponto fixo único pode ser usadopara demonstrar a dependência contínua de soluções do problema de Cauchy paraequações diferenciais ordinárias com respeito aos parâmetros do problema, quandose assume a unicidade de solução.

O significado especial deste teorema para a Análise Funcional deve-se à suautilização na demonstração do importante :

Teorema 8.4 (Teorema do ponto fixo de Leray-Schauder).Seja E um espaço de Banach, K

⊂E, um conjunto convexo e compacto. Então, se

Φ : K −→ K for contínua, então existe pelo menos um ponto fixo.

Prova. Usaremos novamente o lema de aproximação de funções com ponto fixopara trazer o problema para dimensão finita por meio do seguinte lema.

Lema 8.5 (Aproximação da Identidade em Compactos Convexos por Funçõesde Dimensão Finita).Se K ⊂ E, um conjunto convexo e compacto. Então, ∀ε > 0 , existe uma funçãocontínua ϕ ε : K → K, tal que ϕ ε (K ) está contido em um subespaço de dimensão finita e ϕ ε ( x) − x ≤ ε .Prova. Usando o Teorema de Heine-Borel, tomamos xi0≤i≤n um conjunto depontos de K tais que K ⊂ ∪ B( xi,ε ). Naturalmente, a geometria do problema nos

leva a procurar a projeção de K no conjunto convexo-compacto K n, obtido da in-terseção de K com o espaço E n de dimensão finita gerado pelos vetores xi. Seo espaço normado E for estritamente convexo, esta projeção é bem definida econtínua ; entretanto, no caso geral é necessária uma pequena adaptação. Defini-mos uma função real contínua α ( z) = maxε − z, 0 e uma “projeção” contínua

sobre o convexo K ε na forma ϕ ε : K → K ε , pε ( x) =k =n∑

k =1

α ( x− xk )k =n∑

k =1α ( x− xk )

xk . É fácil ver

que ϕ ε ( x) é bem definida e contínua, pois x − xk < ε para algum k , e portanto,k =n∑

k =1α ( x− xk )

> 0, e é também uma combinação convexa dos xi, ou seja,

ϕ ε ( x) ∈ K ε . É fácil ver agora que ϕ ε ( x) − x =k =n∑

k =1

α ( x− xk )

k =n∑

k =

1α ( x− xk )

( xk − x) ≤ ε

(verifique).

Page 341: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 341/371

8.3 Teoremas de Ponto Fixo 335

Prova. Para concluirmos a demonstração do teorema, basta considerarmos as fun-ções ϕ ε Φ : K n −→ K n, que, pelo teorema de Browder-Bohl, têm ponto fixo emK n ⊂ K , e observarmos que ϕ ε Φ ( x) −Φ ( x) = ϕ ε ( z) − z ≤ ε ( z = Φ ( x)),para em seguida aplicar o lema de aproximação de pontos fixos.

Este teorema foi originalmente demonstrado por Oliver D. Kellogg e GeorgeD. Birkhoff em 1922, e utilizado por Jean Leray(1906- ?) e Julius Schauder (1899-1940) na demonstração de existência de soluções para Equações Diferenciais Par-ciais em 1934. Os teoremas de Ponto Fixo se constituem em uma ampla área daAnálise Funcional com aplicações diversas, que teve o seu auge nas décadas de1960-70. Para maiores informações nesta linha consulte : L. Nirenberg, Topics in Nonlinear Functional Analysis, NYU Lect. 1974 ; E. Zeidler, Nonlinear Functional Analysis, Springer, 1989; A. Ambrosetti, G. Prodi, A Primer of Nonlinear Analysis,Cambridge U. P., 1993.

8.3 Teoremas de Ponto FixoNesta seção trataremos de métodos de resolução no sentido mais estrito da pala-

vra, uma vez que os métodos a serem abordados podem em princípio ser realizadosnumericamente, em geral por um processo iterativo que deriva em última análise doTeorema de Banach-Cacciopoli.

O teorema de Banach-Cacciopoli demonstrado no contexto de espaços métricoscompletos é naturalmente válido em espaços de Banach. A sua versão básica é :

Teorema 8.6 (Teorema de Banach-Cacciopoli (Básico)). Seja E um espaço de Ba-nach, A um subconjunto fechado de E, e ϕ : A → A uma contração uniforme, isto é,existe 0 < α < 1 tal que ∀ x, y ∈ A, ϕ ( x) −ϕ ( y) ≤ α x− y . Então;

1. Existe um ponto fixo x ∈ A para ϕ .2. x é o único ponto fixo de ϕ em A.

3. Para todo x0 ∈ A, a sequência construída recursivamente e iterativamente na forma xn+1 = ϕ ( xn) mantêm-se em A e converge para x.

4. A convergência da sequência iterativa xn se dá na seguinte forma : xk − x ≤α k

1−α x1 − x0 .

5. As mesmas conclusões 1-4 valem se ϕ for apenas uma função contínua e umade suas iteradas ϕ ( p)( x) = ϕ ... ϕ , for uma contração.

Prova. Ver capítulo I Espaços Métricos.

Como já foi mencionado acima, as equações semprecontêm parâmetros diversos

que determinam a estrutura do problema e que eventualmente podem ser modifica-dos, o que obviamente pode acarretar modificações na solução. Portanto, é interes-sante saber como variam as soluções de uma equação de ponto fixo com respeito

Page 342: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 342/371

336 8 Análise Não-Linear

aos parâmetros constitutivos da função. Para isto dispomos do seguinte importanteteorema :

Teorema 8.7 (Teorema de Banach-Cacciopoli II (com parâmetros)).Seja M um espaço métrico, A um subconjunto fechado de um Espaço de BanachE, e ϕ : A × M → A, ϕ ( x,λ ) , uma contração uniforme com respeito à variável xe ao parametro λ , isto é, existe 0 < α < 1 , tal que ∀ x, y ∈ A,∀λ ∈ M, ϕ ( x,λ ) −ϕ ( y,λ ) ≤ α x− y , e tal que ϕ ( x0,λ ) seja limitada para algum x0 ∈ A. Então,

1. Para cada λ ∈ M existe um único ponto fixo x(λ ) ∈ A de ϕ , isto é, ϕ ( x(λ ),λ ) = x(λ ).

2. A função x : M → A é contínua e limitada, isto é, x ∈ C 0 B( M , A).

3. A função x é aproximada uniformemente pela seqüência recursiva-iterada xn+1(λ ) = ϕ ( xn(λ ),λ ) , onde x0(λ ) é qualquer função de C 0 B( M , A).

4. xk − x ∞≤ α k

1−α x1 − x0 ∞.

Prova. Observemos inicialmente que qualquer função contínua limitada z ∈C 0 B( M , A)é levada em uma função do mesmo tipo por ϕ ( z(λ ),λ ) em vista da contrati-vidade e da limitação de ϕ ( x0,λ ) (verifique). Agora, basta considerar a funçãoΦ : C 0 B( M , A) −→ C 0 B( M , A) , onde Φ ( z)(λ ) = ϕ ( z(λ ),λ ), no espaço de Banach(C 0 B( M , A), . ∞) e aplicar um teorema básico de contração para Φ .

Um dos grandes problemas na aplicação do Teorema de Banach-Cacciopoli estána obtenção de um conjunto fechado A estável para a função ϕ que define a equação,isto é, obter um A fechado tal que∀ a ∈ A tenhamosϕ (a) ∈ A. O lemaabaixo é muitoútil para estes casos.

Lema 8.8 (Existência de Bola Estável sob Contração).Se ϕ for uma α −contração em uma bola fechada B R( x0) e ϕ ( x0) − x0 ≤ (1 −α ) R, então ϕ ( B R( x0)) ⊂ B( x0, ) , e portanto tem um único ponto fixo em B R( x0).

Prova. Ver capitulo I Espaços Métricos.

Se ϕ for um operador que não é uma contração mas comuta com uma função ψ que tem um único ponto fixo, temos :

Teorema 8.9.Se ψ : A → A tem um único ponto fixo em A, então todas as funções ϕ que comutamcom ψ , isto é, ϕ

ψ = ψ

ϕ , tem o mesmo ponto fixo.

Exercícios :

Page 343: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 343/371

8.3 Teoremas de Ponto Fixo 337

8.8. Demonstre o teorema acima.

8.9. Mostre também como este resultado simples pode implicar no fato de que umafunção ϕ tem ponto fixo único se, e somente se, alguma iterada sua tem esta mesma

propriedade (i.e., existência de um ponto fixo único). Este lema torna a demonstra-ção do item 5 do teorema básico uma trivialidade ! !

8.10. Mostre que funções em compactos que são apenas não-expansões (isto é, ϕ ( x) −ϕ ( y) ≤ x− y ) podem não ter pontos fixos. Sugestão : utilize o exemplodado por ϕ (expiθ ) = expi (θ + ε ), ϕ : S 1 → S 1.

8.11. Mostre também com um exemplo ϕ : R→R que existem funções contrativasestritas mas não uniformes (isto é, ϕ ( x) −ϕ ( y) < x − y ), que não possuemponto fixo.

O teorema abaixo nos dá a possibilidade de construir pontos fixos mesmo que afunção seja uma contração estrita não-uniforme.

Teorema 8.10.Se K for um espaço métrico compacto, então toda contração estrita ϕ : K → K (istoé, d (ϕ ( x),ϕ ( y)) < d ( x, y)), tem um único ponto fixo.

Prova. Basta considerar a função real, contínua e positiva h : K → R+, h( x) =d (ϕ ( x), x), que admite um mínimo no compacto K , digamos x0. Se ϕ ( x0) = x0,teríamos h(ϕ ( x0)) = d (ϕ (2)( x0),ϕ ( x0)) < d (ϕ ( x0), x0), o que seria um absurdo, jáque o mínimo foi atingido em x0. Pelo mesmo argumento, concluímos que o ponto x0 é único.

O teorema de Neumann-Peano para a inversão de operadores lineares do tipoperturbação da identidade ( I + H ) por métodos operacionais, pode ser estendidopara funções não lineares de uma maneira muito útil e sob o mesmo ponto de vista.Esta questão será abordada como um problema de estabilidade operacional não-linear da inversão topológica ou, em outras palavras, indagando-se se o grupo detodos os operadores (lineares e não lineares), que são homeomorfismos topológicosentre dois espaços de Banach, formam um conjunto aberto com respeito a algumatopologia. Esta importante questão será respondida em parte pelo :

Teorema 8.11 (Neumann-Peano Não-linear Global, ou, Estabilidade de Ho-meomorfismos Lineares sob Perturbações Contrativas).Sejam E um espaço de Banach e ϕ : E → E uma função lipchitziana, ϕ ( x) −ϕ ( y)

≤α

x−

y , α > 0. Então,

1. Se ϕ for uma contração, isto é, se 0 < α < 1 , a perturbação da identidade I −ϕ : E → E é um homeomorfismo, ou seja, ( I −ϕ )−1 existe e é contínuo.

Page 344: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 344/371

338 8 Análise Não-Linear

2. Se A ∈ GL(E ) e 0 < α < A−1 −1 , então a perturbação de A na forma A −ϕ :E → E também é um homeomorfismo, ou seja, ( A−ϕ )−1 existe e é contínuo.

Prova. 1. Basta escrever a equação x −ϕ ( x) = y na forma de uma equação de

ponto fixo com y interpretado como parâmetro, na forma : x = y + ϕ ( x) =ψ ( x, y), onde ψ : E ×E → E , e utilizar o Teorema de Banach-Cacciopoli apro-priado.

2. Para verificar isto, basta escrever, tal como no caso clássico, A − ϕ = A( I − A−1ϕ ) e aplicar o caso acima.

Observação 8.12. 1. Ao contrário da versão linear, não temos aqui uma expansãopara o cálculo operacional de ( I −ϕ )−1, que naquele caso se baseava na es-trutura de álgebra associativa de L(E ). A álgebra dos operadores (lineares enão-lineares) contínuos em E não é associativa, e o produto por escalar tambémnão comuta com o produto composição. O conjunto dos operadores bicontínuos

formam apenas um grupo com a operação de composição.2. Se A ∈ GL(E ), o teorema clássico de Neumann-Peano nos garante que pertur-bações lineares suficientemente pequenas mantêm a propriedade topológica dehomeomorfismo de A ; a versão não-linear estende a estabilidade, garantindoque mesmo perturbações não lineares são admissíveis, se forem lipschitzianasde constante menor do que A−1 −1 .

3. Como veremos mais adiante, os operadores não-lineares, ao contrário dos li-neares, nem sempre são definidos em todo o espaço vetorial. Portanto, a questãode inversão se torna um problema local. Esta questão já é notória em uma di-mensão, onde frequentemente somente podemos inverter uma função continua-mente, ou diferencialmente, em pequenos intervalos separados e não em geralem todo o seu domínio de definição. O teorema abaixo é de grande importânciasob este ponto de vista, e será basilar para a demonstração de diversos resultadosfundamentais da análise não linear diferencial.

Teorema 8.13 (Teorema de Kantorovich - Inversão Local da Perturbação daIdentidade ou, Estabilidade Homeomórfica da Identidade com repeito a pe-quenas Perturbações no Espaço das Funções Lipschitzianas).Sejam E um espaço de Banach, U ⊂ E um aberto e ϕ : U → E uma contração dotipo ϕ ( x) −ϕ ( y) ≤ α x − y , 0 < α < 1. Então, a perturbação da identidade N ϕ = I −ϕ : U → E

1. É injetiva, isto é, N ϕ é uma bijeção entre U e sua imagem N ϕ (U ) = V .

2. É uma aplicação aberta, em particular, B(1−α )r ( y0) ⊂ N ϕ ( Br ( x0)) , onde y0 =

x0 −ϕ ( x0) = N ϕ ( x0) , e V = N ϕ (U ) é aberto,3. A função I −ϕ = N ϕ é um homeomorfismo entre U e sua imagem V = N ϕ (U ).

Page 345: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 345/371

8.3 Teoremas de Ponto Fixo 339

Prova. 1. Suponha que y0 = x0 − ϕ ( x0) = x1 − ϕ ( x1). Daí tiramos que x0 − x1 = ϕ ( x0) −ϕ ( x1) ≤ α x0 − x1 , o que só pode acontecer para x0 = x1.

2. Consideremos x0 ∈ U , Br ( x0) ⊂ U , e y0 = N ϕ ( x0) = x0 − ϕ ( x0). Se agora y

∈ B(1

−α )r , a equação y = x

−ϕ ( x) = N ϕ ( x), pode ser escrita como um pro-

blema de ponto fixo na forma y +ϕ ( x) = ψ ( x, y) = x, em que a função ψ ( x, y)é uma α −contração, uniforme em y. Para aplicarmos o Teorema de Banach-Cacciopoli, resta apenas ser verificada a existência de um conjunto fechadoinvariante por ψ na vizinhança de x0. Façamos então as estimativas necessárias

ψ ( x, y) − x0 = y +ϕ ( x) − x0 = y− y0 + y0 +ϕ ( x) − x0 = y− y0 + x0 −ϕ ( x0) +ϕ ( x) − x0 ≤ y− y0 + ϕ ( x) −ϕ ( x0) ≤ (1−α )r +α x− x0 = r ,

para comprovarmos que, de fato, a bola fechada Br ( x0) é invariante pela contra-ção ψ ( x, y), e portanto tem um único ponto fixo x( y) em Br ( x0), para todos y ∈ B(1−α )r ( y0). Este resultado nos leva a concluir que N ϕ é uma aplicaçãoaberta, (isto é, que leva conjuntos abertos em conjuntos abertos). Portanto,

V = N ϕ (U ) é aberto.3. Naturalmente, N −1

ϕ ( y) = x( y), e o Teorema de Banach-Cacciopoli com parâ-metros nos garante que N −1

ϕ é contínua. O fato de que N ϕ é aberta apenas nosconfirma topologicamente que N −1

ϕ : V → U é uma função contínua.

O Teorema de Inversão local de perturbações da identidade é a ferramentaconstitutiva fundamental para os métodos de resolução de equações não-lineares quese baseiam na aproximação do operador não-linear por operadores mais simples, talcomo os lineares, que é o objetivo do cálculo diferencial a ser abordado em seguida.

O Teorema de Kantorovich tem uma interpretação operacional de grande im-portância que o situa como uma generalização não-linear natural do Teorema deNeumann-Peano, isto é, a propriedade homeomórfica da identidade foi preservadacom pequenas perturbações de funções lipschtzianas nulas na origem, segundo asua norma lipschitziana h L= sup x= y

h( x)−h( y) x− y , ou seja, a identidade é homeo-

morficamente estável segundo pequenas perturbações lipschitzianas.O teorema de inversão de operadores monotônicos uniformemente positivos

(coercivos) de Lax-Milgram também pode ser “não-linearizado” :

Teorema 8.14 (Operadores Uniformemente Monotônicos Lipchitzianos - VersãoNão-linear, Local).Sejam H um espaço de Hilbert, U ⊂ H um conjunto aberto, eϕ : U → H uma funçãolipchitziana e uniformemente monotônica, isto é, respectivamente,

a) Existe L > 0 tal que

ϕ ( x)

−ϕ ( y)

≤ L

x

− y

,

∀ x, y

∈U e,

b) Existe m > 0 tal que ϕ ( x) −ϕ ( y), x− y ≥ m x− y 2 , ∀ x, y ∈ U.Então,

Page 346: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 346/371

340 8 Análise Não-Linear

1. N é uma aplicação injetiva.

2. N é uma aplicação aberta, em particular V = N (U ) é aberto.

3. N é um homeomorfismo entre os abertos U e N (U ).

Prova. Exercício.

Exercícios :

8.12. Demonstre o Teorema de Inversão de Operadores Monotônicos Lipschitzia-nos Não Lineares. Sugestão : Utilize o mesmo argumento de relaxamento da versãolinear (isto é, escreva a equação Nx = y na forma x +λ ( N ( x) − y) = x e obtenha λ apropriado para que ψ λ ( x, y) seja uma contração), para em seguida aplicar o Teo-rema de Neumann-Peano Não-Linear Local.

8.13. Mostre que se A ∈ GL(E ), e ϕ : U ⊂ E −→ E for uma função lipschtziana talque ϕ ( x)−ϕ ( y) ≤ L x− y e L < A−1 −1, então, A+ϕ é um homeomorfismo

entre o aberto U e o aberto ( A +ϕ )(U ).

8.4 Aproximação por linearização local : O Cálculo Diferencialem Espaços Normados

8.4.1 Os conceitos de derivada : Newton-Cauchy, Fréchét e Gateaux

Os operadores lineares, apesar da sua definição restritiva, não podem ser estuda-dos com muito proveito sob um aspecto muito geral ; é necessário estreitar o nossofoco de trabalho em classes específicas. Se agora considerarmos os operadores em

geral, há uma necessidade muito maior em restringí-los. O termo “não-linear” é tãodescritivo para delimitar uma área de análise como o termo “não-elefantes” paradelimitar uma área de zoologia ! ! O que existem, de fato, são teorias específicas quepodem ser aplicadas a classes restritas de operadores e nas quais não se faz uso dalinearidade.

Uma das técnicas mais antigas e úteis para tratar destes problemas provêm dageneralização direta da ideia fundamental do cálculo diferencial elementar, queconsiste em aproximar “localmente” a função em questão por meio de uma transfor-mação linear. Sendo uma aproximação para efeito local, a função linear aproximantedeve variar com a vizinhança de interesse. Esta aproximação tem um caráter “óti-mo” que a determina univocamente. A definição elementar de derivada de funçõesreais de variável real, ou de variável complexa que poderíamos chamar de derivadade Cauchy (na verdade definida por Newton para funções de variáveis reais) é dada

porg( x0) = lim

h→0

g( x0 + h) −g( x0)

h ,

Page 347: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 347/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 341

como um limite de variações que produz o número g( x0), de certa forma encobrea ideia fundamental e não permite a sua generalização para funções de variávelvetorial.

Para introduzirmos este “novo” ponto de vista, iniciemos pelo conceito de conti-

nuidade. Uma função g pode ser definida como contínua em x0 quando a “melhoraproximação possível” de g nas vizinhanças de x0 por uma função constante é dadapelo seu próprio valor g( x0). Claro, se não houver nenhuma exigência com rela-ção ao erro r 0(h) cometido, qualquer função constante c pode ser considerada uma“aproximação” de g( x0 +h) : g( x0 +h) = c + r 0(h). Entretanto, sob o ponto de vista“dinâmico” (isto é, para h → 0), a melhor aproximação possível seria um valor y0

tal que r 0(h) → 0 quando h → 0. Se existir este valor, ele é obviamente único! ! (ve-rifique). Observe que não está em consideração aqui a melhor aproximação numé-rica mas sim o caráter “dinâmico”. Naturalmente, esta aproximação ótima é possívelquando existe o limite limh→0 g( x0 +h) e a função é contínua se este valor for exata-mente g( x0). Suponhamos então que g seja contínua em x0 e procuremos aperfeiçoaro processo.

O próximo passo para melhorar a aproximação de g( x0 + h) seria lançar mão

de uma nova função, simples, mas com um pouco mais de estrutura do que asconstantes, “que já deram o que tinham que dar”. As funções lineares são o próximopasso natural em termos de funções elementares. (Esta escolha é natural apenassob este ponto de vista, mas pode ser modificada em outros contextos, como no es-tudo de aproximações assintóticas). Portanto, o objetivo agora é aproximar o “erro”r 0(h) = g( x0 + h) − g( x0) por uma função linear em h. Novamente, se tomarmosqualquer função linear λ teremos uma aproximação

g( x0 + h)−g( x0) = λ h + r λ (h),

onde r λ (h) → 0 quando h → 0, o que não é nenhuma vantagem com respeito àprimeira etapa. Para que haja algum aperfeiçoamento sob o ponto de vista “dinâmi-co” é necessário que o erro r se aproxime de zero “mais rápido do que h”, que era

a medida na etapa anterior. Para melhor estabelecer este conceito, introduzimos adefinição de ordem de aproximação, que é a formalização do conceito de “infinite-simal” bem ao gosto de G. W. Leibniz (1646-1716) e que tem um importante papelem teoria de aproximação assintótica (referência : F. Olver, Special Functions and Asymptotics, A. Press). O conceito de derivada que iremos utilizar foi introduzidopor Maurice Frechet, o mesmo dos espaços métricos.

Definição 8.15 (Ordem de Aproximação).Sejam (E , . 1) e (F , . 2) dois espaços normados, U ⊂ E uma vizinhança daorigem em E, e duas funções ϕ : U → F, Φ : U → F.

1. Dizemos que “ϕ é de ordem no máximo igual aΦ no limite h → 0”, se existiremnúmeros positivos C e δ tais que ϕ (h) 2≤ C Φ (h) 2 para h ∈ B(0,δ ) ⊂ E,

e, neste caso, escrevemos ϕ = O(Φ ). Se Φ = O(ϕ ) , dizemos que ϕ e Φ sãoequivalentes no limite, e denotamos este fato por ϕ ∼Φ (h → 0). Se Φ (h) = h,então escrevemos respectivamente ϕ (h) = O(h).

Page 348: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 348/371

342 8 Análise Não-Linear

2. Dizemos que “ϕ é de ordem menor do queΦ no limite h → 0”, se para todo ε >0 existir um δ > 0 tal que ϕ (h) 2≤ ε Φ (h) 2 para h ∈ B(0,δ ) ⊂ E e, nestecaso, escrevemos ϕ = o(Φ ). Se Φ (h) = h, então escrevemos respectivamenteϕ (h) = o(h) , e podemos caracterizar esta classe de funções o(h) de maneira

equivalente pelo limitelimh→0

ϕ (h)

h 1= 0 ,

que pode ser escrita também como

ϕ (h) = ε (h) h ,

onde ε (h) → 0 quando h → 0.

É importante observar que as definições acima dependem crucialmente das nor-mas dos dois espaços vetoriais, ou seja, o conceito de ordem de aproximação é decaráter topológico e não algébrico ou métrico.

Exercícios :

8.14. Mostre que se tomarmos normas equivalentes respectivamente em E e F àsnormas acima, as relações de ordem de aproximação ficam inalteradas. Isto si-gnifica, em particular, que em espaços de dimensão finita não há variações nestesconceitos quando se alteram as normas.

8.15. Mostre que uma função g : V ⊂ E → F , é contínua em x0 ∈V se g( x0 + h) −g( x0) = O(h) em uma vizinhança da origem, mas esta não é uma condição necessá-ria. Sugestão : g : R → R, g( x) =

| x | .

Portanto, de posse destes conceitos, é natural esperar que, se desejamos um aper-feiçoamento no processo de representação da função g nas vizinhanças de x0, que aaproximação linear para g( x0 +h)−g( x0) produza um erro de ordem menor do que

h, ou seja, que g( x0 + h) −g( x0) = λ (h) + o(h).

Definição 8.16. Denominaremos esta expressão g( x0 + h) = g( x0) +λ (h) + o(h) de expansão deFréchet de primeira ordem.

Esta é uma das maneiras equivalentes de definir o conceito de derivada no cál-culo elementar de uma variável real que possibilita a sua extensão para as funçõesde várias variáveis e que será igualmente adequada para estendê-lo a situações bemmais gerais. E este é o nosso objetivo. Para que tal conceito seja útil, é importanteestabelecer que a aproximação linear “ótima” neste sentido, quando existir, é única

e bem determinada. Isto é facilmente verificado tomando-se h = th0, para t → 0, h0fixo qualquer e usando a propriedade característica das funções o(h).

Page 349: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 349/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 343

Teorema 8.17 (Unicidade da Expansão de Fréchet Primeira Ordem).Seja uma função g : V ⊂ E → F, onde E ,F são espaços normados e V ⊂ E é umconjunto aberto. Se existir uma expansão de Fréchet de primeira ordem na formag( x0 +h) = g( x0)+λ (h) +o(h) , onde λ ∈ L(E ,F ) , então g é contínua e λ é o único

operador linear que realiza esta tarefa.Prova. Obviamente, sendo λ contínua, temos imediatamente que limh→0 g( x0 +h)−g( x0) = λ (h) + o(h = 0, ou seja, g é contínua. Por outro lado, tomando h ∈ E efazendo t suficientemente pequeno para que x0+ th ∈ V , temos que o limite

limt →0

g( x0 + th) −g( x0)

t = lim

t →0(λ (h) + ε (th) h ) = λ (h)

existe (por λ ∈ L(E ,F ) e pelas propriedades de uma função o(h)), e determinaunivocamente o valor de λ (h).

Definição 8.18.Sejam E e F espaços normados, U ⊂ E um conjunto aberto, x0 ∈ U, e g : U → F uma função.

1. Dizemos que g é (Frechet) diferenciável em x0 se existir um operador linear limitado λ ∈ L(E , F ) tal que exista a expansão de Fréchet de primeira ordemna forma : g( x0 + h) − g( x0) = λ (h) + o(h) , e neste caso, como λ é único,dizemos que λ é a derivada de Frechet de g em x0 , e a denotamos por um dossímbolos λ = g( x0) = Dg( x0) = ∂ g( x0) = ∂ g∂ x ( x0). Em Física é comum denotar a derivada de um operador G entre espaços funcionais por δ G( x0) e denomina-lo de derivada variacional.

2. Se existir a derivada de g em todos os pontos de U, dizemos que g é diferenciá-vel em U, e podemos então definir a função derivada Dg : U → L(E , F ).

3. Se D : U ⊂ E → L(E , F ) for uma função contínua quando consideramos anorma uniforme de L(E ,F ) , dizemos que g é contínuamente diferenciável, edenotamos o espaço destas funções por C 1(U ,F ).

4. Se Dg : U → L(E , F ) = G for uma função também diferenciável, denotamos asua derivada por D2g : U → L(E ,G) = L(E , L(E ,F )) , que naturalmente cha-mamos de segunda derivada de g. Da mesma forma, recursivamente, podemosdefinir derivadas de Fréchet de ordem superior.

5. A ideia correspondente à Derivada Direcional também pode ser definida e é também denominada de Derivada de Gateaux : DGg( x0)h = limt →0

g( x0+th)−g( x0)t .

É fácil ver que a função DGg( x0) : E → E (que denominamos de derivadadirecional, de g no ponto x0), é linear. Entretanto, ao contrário da derivada pontual de Fréchet, que é por definição um operador linear limitado, (isto é,

Dg( x0) ∈ L(E ,F )), a derivada direcional de Gateaux pode ser um operador linear não-limitado (v. observação abaixo).

Page 350: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 350/371

344 8 Análise Não-Linear

A definição de derivadas de ordem superior exige a abordagem de espaços dotipo L(E , F ), L (E , L(E ,F )) , L (E , L(E ,...,F ),...). Estes espaços podem ser identi-ficados com espaços de funções lineares, bilineares e multilineares em geral. Porexemplo, o espaço L (E , L(E , F )) pode ser facilmente interpretado como o espaço

de funções M 2

(E ,F ) = h : E × E → F h linear em cada variável separadamente elimitada em S 1 ×S 1, | h( x, y) |≤ C x y e analogamente podemos definir :

Definição 8.19 (Funções (ou Formas) Multilineares Limitadas).

1. Se E e F forem espaços normados, definimos o espaço das funções (ou formas)k-lineares limitadas como : M k (E , F ) = h : E k → F, h linear em cada variávelseparadamente e limitada em (S 1)k , | h( x1,.., xk ) |≤ C x1 · · · xk , paratodo k inteiro positivo, e M 0 = F, onde E k = “produto cartesiano de k espaçosE”. Claro que M 1(E ,F ) = L(E ,F ).

2. O espaço M k (E , F ) é dotável de uma norma uniforme, da seguinte maneira queestende o mesmo conceito do caso k = 1 :

h = sup h(s1, ..sk ) , (s1,..,sk ) ∈ (S 1)k .

3. O subespaço de M k (E , F ) das funções (ou formas) k-lineares simétricas é definido e denotado por M k

S (E , F ) = h ∈ M k (E ,F ) : h( x1,..., a, b,..., xn) =h( x1,...,b, a,..., xn) , onde a e b ∈ E ocupam respectivamente posições adja-centes, digamos i, i + 1 e i + 1, i.

4. O subespaço de M k (E , F ) das funções (ou formas) k-lineares alternadas (ou an-tisimétricas) é definido e denotado por M k

A(E , F ) =h ∈ M k (E ,F ) : h( x1,...,a, b,..., xn) = −h( x1,...,b, a,..., xn) , onde a e b ∈ E ocupam respectivamente posi-ções adjacentes, digamos i, i + 1 e i + 1, i. Estas funções são chamadas antisi-métricas porque h( x1,.., a, b,..., xn) = 0 se a = b.

5. Como as formas k-lineares alternadas tem propriedades de “produto”, é co-mum usar-se a notação ∧k E ∗ = M k (E ,R) , que é denominado de produto alter-nado. Na verdade, é possível definir algebricamente um produto alternado emqualquer espaço vetorial, e que produz exatamente esta estrutura no caso deE ∗ , mas que não abordaremos aqui.(v. referencias abaixo sobre formas diferen-ciais). Se E = H for um espaço de Hilbert, podemos identificar H = H ∗ e, comisto, definir um produto alternado ∧k H, que no caso k = 2 em H = R3 , podeser identificado com o produto vetorial, e no caso k = n para H = Rn pode ser identificado com a função determinante, ou com o volume orientado.

6. Um operador “polinomial” p : E →R , é definido como p( x) =k =m∑

k =0mk ( x,..., x) ,

onde cada função mk ∈ M k (E ,F ) é k −linear.

Page 351: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 351/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 345

Observação 8.20. 1. A derivada de ordem k , Dk g, pode então ser analogamenteinterpretada como uma função Dk g : U → M k (E ,F ).

2. A necessidade de especificar com cuidado os contradomínios das funções de-

rivadas não existe quando as funções são de variável real, porque o espaço L(R,F ) pode ser interpretado como o próprio F , uma vez que, se λ ∈ L(R, F ),então λ (t ) = λ (t · 1) = t λ (1), e portanto, λ pode ser representado por λ (1) =v ∈ F . Em particular, no cálculo elementar, as derivadas Dg( x0) são identifica-das com números, e as funções derivadas Dg : U ⊂ R→ R com funções reaisde variável real, tal como a função original g : U →R.

3. No cálculo elementar de várias variáveis, a derivada Dg( x0) de uma funçãog : U ⊂Rn −→ Rm é interpretada como uma matriz, a matriz jacobiana

∂ gk

∂ xm( x0),

que representa o operador linear Dg( x0) ∈ L(R

n

,R

m

).

4. No caso especial acima, quando m = 1 e g : U ⊂ Rn −→ R, então a derivada Dg( x0) ∈ L(Rn,R) é representada por um vetor do Rn, normalmente denotadopor ∇g( x0) e denominado de gradiente de g em x0. Esta forma de representaçãopode ser generalizada para o caso em que temos funções definidas em espa-ços de Hilbert e valores escalares, por meio do teorema de representação deRiesz-Fréchet. Isto é, se H for um espaço de Hilbert com escalares complexose g : U ⊂ H −→C for uma função diferenciável em U então, pela identificação H ∗ = L( H ,C) ≡ H , podemos identificar Dg( x0) ∈ H , e interpretar Dg : U → H .Estes operadores tem uma grande importância no cálculo clássico, que de certaforma também é herdada no caso de dimensão infinita, razão pela qual os dis-tinguiremos com uma denominação especial.

Definição 8.21 (Operadores gradientes e formas diferenciais).

a) Se H for um espaço de Hilbert, então os operadores A : U ⊂ H → H, quesão derivadas de uma função escalar, isto é A = Dϕ , são denominadosde Operadores Gradientes, ou operadores conservativos, e escreve-se A =∇ϕ ; ao operador diferenciável ϕ denomina-se Potencial de A.

b) Se E for um espaço normado, então uma função ω : U −→ M k (E ,R) =∧k E ∗ é chamadaForma Diferencial de grau k. Se E = H for um espaço de Hilbert, então, pela identificação de Riesz-Fréchet, uma forma diferencialde grau k é uma função do tipo ω : U −→ M k ( H ,R) = ∧k H .

As formas diferenciais são particularmente importantes no estudo de geometriae da análise global (isto é, a análise em espaços métricos com estrutura geomé-trica de variedades modeladas em espaços de Banach).

Page 352: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 352/371

346 8 Análise Não-Linear

Referências sobre Formas Diferenciais :V. I. Arnold, Metodi Matematici della Meccanica Classica, Mir, 1979.S. Lang, Introduction to Differentiable Manifolds, A. Wesley, 1998.

5. A relação entre derivada de Fréchet e direcional de Gateux está ligada à questãode uniformidade com respeito às direções, que é implicitamente exigida na pri-meira e não na segunda. É fácil ver que se uma função tem derivada de Fréchetem um ponto, ela terá derivada direcional de Gateaux. Entretanto, a volta não éverdadeira, e esta questão já surge mesmo em espaços de dimensão finita. Por

exemplo, a função ϕ : R2 → R, ϕ ( x, y) = x2 y2

x2+ y2 , ϕ (0, 0) = 0, é contínua na ori-gem, tem derivada direcional em todas as direções, mas não tem derivada deFréchet. Para mostrar isto, suponha que exista a derivada de Fréchet que seriarepresentada pelo produto escalar com o vetor gradiente, Dϕ (0.0)h = α ,h.Por outro lado, a derivada direcional em qualquer direção h seria dada pelomesmo valor, DGϕ (0, 0)h = α , h. Mas as derivadas direcionais nas direçõese1 = (1,0) e e2 = (0, 1) podem ser calculadas diretamente e valem zero, o que

implica em α = 0. Mas na direção h = (1, 1), a derivada direcional vale 0, o queseria impossível. Na verdade, a derivada direcional de Gateaux pode existir ape-nas para algumas direções e não para todo o espaço E e isto pode ser verificadopor meio de exemplos no R2 (verifique).

6. A continuidade (limitação) da derivada de Fréchet em cada ponto como umoperador linear é um dos requisitos básicos na sua definição. A derivada deGateaux, por outro lado, pode ser um operador linear não-limitado. Por exem-plo, se A : E → E for um operador linear não-limitado, a derivada de Fréchetde A não existe mas a derivada de Gateaux existe e é a própria função A. Umoperador quadrático Q( x) = B( x, x), onde B : E ×E →R é bilinear, contínuo ounão, sempre tem derivada direcional de Gateaux DGQ( x)h = B( x,h) + B(h, x)(v. exercício abaixo), mas nem sempre tem derivada de Fréchet.

Vejamos um exemplo de como o cálculo vetorial pode ser estendido para espaçosde Hilbert :

Teorema 8.22 (Teorema de Green-Kelvin).Seja H um espaço de Hilbert, U ⊂ H um conjunto aberto, v ∈ C 1(U , H ) um campovetorial em U. Definimos como integral de linha

L

v ·dx =

1 0

v( z(t ))), ∂ z∂ t

(t )dt ,

onde z ∈ C 1([0, 1], H ) é uma parametrização da curva L. Então,

a) Mostre que a integral de linha não depende da parametrização diferenciável.

Page 353: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 353/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 347

b) Se Dv( x) ∈ L( H ) for simétrico (isto é, Dv( x)h, g = h, Dv( x)g para ∀h,g ∈U), para todo x ∈ H, a integral

LS

v·dx =

1

0

v( x(s, t ))), ∂ x

∂ t (s,t )

dt

independe de s, ou seja, a integral de linha é invariante por deformações ho-motópicas diferenciais.

c) Em um conjunto simplesmente conexo U, é possível definir uma função poten-

cial ϕ ∈C 1(U , R) tal que Dϕ ( x) = v( x) fazendo ϕ ( x) = x

x0

v ·dx

Prova. a) Exercício.

b) Seja x ∈ C 2([0,1] × [0,1],U ) uma família de curvas diferenciavelmente de-formáveis com pontos inicial e final constantes, isto é, tais que x(s,0) =constante e x(s,1) = constante. Então,

d ds

1 0

v( x(s, t ))), ∂ x∂ t

(s, t )dt =

1 0

Dv( x(s,t )))∂ x∂ s

, ∂ x∂ t

(s, t ) + v( x(s, t ))), ∂ 2 x∂ t ∂ s

(s,t )dt

=

1 0

d dt

v( x(s, t )), ∂ x∂ s

dt = v( x(s, t )), ∂ x∂ s

|10 = 0,

o que mostra a invariância da integral com a deformação homotópica diferencialna variável s.

c) Exercício.

Passaremos agora a obter várias propriedades operacionais das derivadas.

8.4.2 Propriedades operacionais da derivada de Fréchét

Todas as propriedades abaixo devem ser cuidadosamente verificadas “ab ovo” apartir da definição acima, uma vez que não dispomos de nenhuma regra de derivaçãodo cálculo elementar que, como veremos, em algumas circunstâncias adquirem umaforma estranha a princípio, devido ao contexto mais geral.

1. Funções Constantes.

É fácil ver que a derivada de uma função constante é a função constante que acada x0 leva à função linear nula, isto é, Dg( x0) = 0 ∈ L(E , F ) (verifique).

Page 354: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 354/371

348 8 Análise Não-Linear

2. Função Linear :Se g : E → F for uma função linear, então g( x0 + h) −g( x0) = g(h) e portanto,de acordo com a expansão que define a derivada, concluímos que Dg( x) = gpara todo x, e a função erro é obviamente o(h) porque é nula ! ! Observe que,

tal como no caso elementar, a função derivada Dg : E → L(E ,F ), é constante,mas as derivadas Dg( x) não são funções constantes! ! Aprecie cuidadosamentea sutileza desta distinção e verifique porque ela não é enfatizada no cálculoelementar.

3. Funções Quadráticas e PolinomiaisSeja B : E × E −→ F uma função bilinear, isto é, B( x +λ y, z + γ u) = B( x, z) +λ B( y, z) +γ B( x,u) +λγ B( y, u), e contínua, B( x, y) ≤ C x y . Definimosentão a função quadrática Q : E → F na forma Q( x) = B( x, x). Esta função édiferenciável e sua derivada DQ( x0) é operador linear limitado definido por :

DQ( x0)h = B(h, x0) + B( x0,h).

Exercícios :

8.16. Mostre que DQ( x0)h = B(h, x0) + B( x0, h), e no caso de uma função bili-near simétrica, DQ( x0)h = 2 B( x0, h).

8.17. Aplique esta fórmula para o caso de dimensão finita onde Q( x) = Ax, x.

8.18. Usando os resultados acima, calcule a derivada da função Q( x) = x 2

para x ∈ H , um espaço de Hilbert.

8.19. Mostre que a derivada da função

Q(ϕ ) = Ω 1

2 ∇ϕ

2

− f ϕ dx,

definida no espaço normado C 20(Ω ,R) = g ∈ C 2(Ω ,R) ; g(s) = 0 para s ∈∂Ω = fronteira da região Ω , com a norma g 1,∞= g ∞ + ∇g ∞, é dadapor

DQ(ϕ )h =

Ω

(ϕ − f )hdx.

Sugestão : use a expansão da definição de derivada, uma integração por partese o teorema da divergência (Gauss).

8.20. Mostre que a função Q do exercício anterior definida no mesmo espaçovetorial C 20 (Ω ,R), agora normado com . ∞, não é diferenciável ! !

8.21. Mostre que a função Q definida no mesmo espaço vetorial C 20(Ω ,R),agora normado com g 2=

Ω

g 2

dx, é diferenciável ! !

Page 355: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 355/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 349

8.22. Mostre que a derivada direcional de Gateaux de um funcional quadrático J : E → R, J ( x) = B( x, x) + Ax, onde B é bilinear e A é linear, sempre existe,independente da continuidade de B ou A, e independe da norma do espaço E .

8.23. Mostre que, na verdade, a observação acima vale para qualquer operador“polinomial” p : E →R, que é definido como p( x) =

k =m∑

k =0mk ( x,..., x), onde cada

função mk é k −linear, isto é, linear em cada variável separadamente ; m0 é umafunção constante, m1 é linear, m2 é bilinear e etc.

8.24. Analise a forma das derivadas direcional e de Frechet para funcionais (va-lores reais) trilineares e k −lineares em geral, e particularize para os simétricos eantissimétricos (v. abaixo a fórmula de Jacobi para a derivada do determinante,que é n−linear em Rn e antissimétrico).

4. Inversão em uma Álgebra de BanachSeja A uma álgebra de Banach com identidade (em particular, pense em L(E ),sendo E um espaço de Banach, ou o conjunto das matrizes reais n×n), e U ( A) ogrupo de elementos inversíveis, que, pelo teorema de Neumann-Peano, sabemosser um conjunto aberto. Consideremos então a função i : U ( A) → U ( A) ⊂ A,i(a) = a−1. Mostraremos que i é uma função Fréchet-diferenciável e calculare-mos sua função derivada. Para isto escrevemos a expansão de Neumann-Peano

i(a + h) = (a + h)−1 = a−1 ∞

∑k =0

(−ha−1)k = a−1 − a−1ha−1 + a−1 ∞

∑k =2

(−ha−1)k

= i(a) −a−1ha−1 + a−1 ∞

∑k =2

(−ha−1)k ,

e observemos que a segunda parcela do último termo, −a−1ha−1, é uma ope-

ração linear limitada de L( A) (na variável h), que será a candidata natural para Di(a)h. Para a comprovação desta suspeita, basta mostrar que a última parcela

é uma função o(h), isto é, que a−1 ∞

∑k =2

(−ha−1)k = o(h), o que é fácil, uma vez

que podemos escrever uma estimativa desta série na forma

a−1 ∞

∑k =2

(−ha−1)k ≤ h 2 a−1 4 ∞

∑k =0

h a−1 k .

Portanto, Di(a) : U ( A) → L( A), e Di(a)h = −a−1ha−1. Interprete esta fórmulano cálculo elementar em que A =R, ou C.

5. Operadores integrais não-lineares

Consideremos o espaço normado E = (C 0([0, 1],R), . ∞), um núcleo K ( x, y) ∈C 1([0,1]2,R), e o operador integral K :C 0([0, 1],R) → C 0([0,1],R) definido daseguinte maneira (v. capítulo 3) :

Page 356: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 356/371

350 8 Análise Não-Linear

K [ϕ ]( x) =

1 0

K ( x,ϕ (ζ ))d ζ .

Mostraremos que K é diferenciável e que a sua função derivada é um operadorδ K : E → L(E ) da forma

δ K [ϕ ]h =

1 0

∂ yK ( x,ϕ (ζ ))h(ζ )d ζ .

Iniciemos, como sempre, com a expansão da definição :

K [ϕ + h]( x) =

1 0

K ( x,ϕ (ζ ) + h(ζ ))d ζ .

Para isto, utilizaremos o teorema fundamental do cálculo de uma maneira muito

útil nestas situações, escrevendo1

0

K ( x, y +η)d ζ = K ( x, y) +

1 0

1 0

d ds

K ( x, y + sη)ds

d ζ

= K ( x, y) +

1 0

1 0

∂ K ( x, y + sη)∂ y

ηd ζ ,

e, aplicando esta expressão na expansão de K [ϕ + h]( x) na forma

K [ϕ + h]( x) =

1 0

K ( x,ϕ (ζ )) +

1 0

∂ K ( x,ϕ (ζ ) + sh(ζ ))

∂ y

h(ζ )

d ζ ,

e agora introduzindo adequadamente o termo candidato à derivada temos :

K [ϕ + h]( x) =

1 0

K ( x,ϕ (ζ ))d ζ +

1 0

∂ yK ( x,ϕ (ζ ))h(ζ )d ζ

+

1 0

1 0

(∂ yK ( x,ϕ (ζ ) + sh(ζ )) −∂ yK ( x,ϕ (ζ )))h(ζ )d ζ .

Para concluirmos que a derivada é o operador integral que havíamos proposto,devemos mostrar que a última integral do termo a direita acima é uma funçãoo(h) em (C 0([0,1],R), . ∞) quando h ∞→ 0. Como ∂ yK ( x, y) é uniforme-

mente contínuo em [0,1]2, dado um ε > 0, existe um δ > 0, tal que, se η ≤δ temos | ∂ yK ( x, y) −∂ yK ( x, y +η) |≤ ε para todos ( x, y) ∈ [0, 1]2. Portanto, po-demos obter a seguinte estimativa

Page 357: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 357/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 351

1 0

1 0

(∂ yK ( x,ϕ (ζ ) + sh(ζ ))−∂ yK ( x,ϕ (ζ )))h(ζ )d ζ

≤ ε h ∞

para qualquer h tal que h ∞≤ δ , o que demonstra o desejado.

6. Determinante - Fórmula de Euler-Jacobi

Consideremos o conjunto aberto GL(Rn) ⊂ L(Rn) = “Espaço das matrizes com-plexas n × n” e a função determinante d : GL(Rn) −→ R, d ( A) = det A. Emdiversas questões da análise, e especialmente de equações diferenciais, é im-portante conhecer a “aproximação linear ótima”, isto é, a derivada, para estafunção. A fórmula de Jacobi é surpreendentemente simples quando confron-tada com a complexidade da definição da função determinante. Esta fórmulatem similares em dimensão infinita mas que não será tratada aqui. Para obtê-la,tal como nos exemplos anteriores, temos que recorrer à expansão da definiçãode derivada. Então escrevemos, usando a propriedade de produto

det( A + H ) = det( I + HA−1) A= det( I + HA−1) ·det( A).

Observemos agora que estaremos fazendo com que H → 0 e, portanto, pode-mos supor que cada entrada da matriz HA−1 é um elemento o( H ). Usando pro-priedades de expansão por colunas e linhas para o cálculo do determinante,e lembrando que apenas nos interessam os termos independentes e de pri-meiro grau, podemos verificar que estes se resumem a (*) : det( I + HA−1) =1 + Tr ( HA−1) + o( H ). Portanto,

D(det)( A) H = det( A) · Tr ( HA−1),

que é a importante Fórmula de Euler-Jacobi.Para algumas aplicações desta fórmula em Equações diferenciais e Dinâmica

do meio contínuo consulte Bassanezi-Ferreira (Harbra 1988).Uma possível demonstração alternativa :A derivada D(det)( A) é um funcional linear no espaço de Hilbert das matrizesn × n com o produto interno P, Q = Tr (PQ ) = Tr (QP) (Produto de Frobe-nius). Portanto, existe uma matriz X tal que D(det)( A) H = Tr ( HX ). Tente mos-trar que X = 1

n det( A) A−1 ! ! Pelo menos, fica claro qual é a forma da derivada !

7. Funções Analíticas em Álgebras de BanachUma decepção nos espera quando tratamos de funções descritas por séries

convergentes em álgebras de Banach. Se ϕ ( z) = ∞

∑k =0

ck zk for uma função analí-

tica no disco unitário, podemos definir a função correspondente em uma bola

unitária B1 de uma álgebra de Banach A, ϕ : B1 ⊂ A → A na forma naturalcomo ϕ (a) =

∑k =0

ck ak . Mostraremos mais adiante por meio de um teorema

Page 358: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 358/371

352 8 Análise Não-Linear

geral que estas funções são de fato infinitamente diferenciáveis no sentido deFréchet. Entretanto, não dispomos da fórmula que seria a sugestão natural nocaso, isto é, Dϕ (a)h em geral não é representável pelo produto do elemento

obtido como ϕ (a) =∞

k =0

kck ak −1, onde ϕ ( z) é a derivada complexa da função

ϕ . Esta questão pode ser facilmente entendida considerando simplesmente asfunções potências. Por exemplo, se ϕ (a) = a3, então, ϕ (a + h) = (a + h)3 =(a + h)(a + h)(a + h) = a3 + a2h + aha + ha2 + ah2 + hah + h2a + h3 de ondeé fácil ver que a derivada é a função linear representada pela complicada fór-mula : Dϕ (a)(h) = a2h + aha + ha2, uma vez que ah2 + hah + h2a + h3 = o(h)(verifique). Em geral, se ϕ (a) = am, então Dϕ (a)h = ∑

j+k =m−1a jhak , o que já

nos indica uma fórmula extremamente complicada para o caso de uma série depotências ! ! Obviamente, a questão toda é motivada pela possível não comuta-tividade; se a álgebra de Banach for comutativa, as fórmulas naturais valem. Oexemplo seguinte mostra também que a derivada de Fréchet tem interessantesrelações com a derivada de Cauchy quando esta existe em contextos de maisestruturas.

8. Derivada de Frechet e Derivada de Cauchy na Álgebra CSe considerarmos o espaço vetorial R2 como uma álgebra de Banach, coma operação produto como dos números complexos, isto é, ( x1, x2) · ( y1, y2) =( x1 y1 − x2 y2, x1 y2 + x2 y1), então podemos definir a derivada de Cauchy parafunções ϕ : U ⊂R2 →R2 como o limite tradicional

ϕ ( z) = limh→0

ϕ ( z + h) −ϕ ( z)

h ,

e é fácil ver, pelo mesmo argumento apresentado no início deste capítulo que, sea derivada de Cauchy existe, então a derivada de Frechet existe e é representadapor uma transformação linear da forma especial Dϕ ( z) · h, isto é, como o pro-

duto complexo de h por um elemento fixo Dϕ ( z) ∈ R2

. Este tipo de operadorlinear (a,b) · (h1,h2) é facilmente representado por matrizes com a forma espe-

cial a −bb a

(verifique!), e geometricamente pode ser interpretado como compo-

sição de uma rotação com uma homotetia. Portanto, pensando agora no sentidocontrário, se uma função ϕ tiver derivada de Fréchet, ela terá também derivadade Cauchy se, e somente se, a matriz jacobiana que representa a derivada deFréchet tiver a forma especial acima. Este resultado é simplesmente o teoremade Cauchy-Riemann que faz esta extraordinária conexão entre dois importantís-simos conceitos de derivada.A derivada de Cauchy só pode ser definida em álgebras que têm uma vizin-hança da origem formada por elementos inversíveis (exceto a origem, claro ! !),o que caracteriza uma álgebra de divisão. Mas para este caso, existe um famoso

teorema de Gelfand-Mazur que nos garante serem C e R as únicas álgebras dedivisão de Banach. Portanto, a derivada de Cauchy tem o seu significado realapenas nestes contextos.

Page 359: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 359/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 353

9. Derivada da Função Composição :Consideremos o espaço normado E = (C 0([0, 1],R), . ∞), K ( x, y) ∈C 1([0, 1]2,R)e o operador composição K :E →E definido da seguinte maneira, K [ϕ ]( x) =K ( x,ϕ ( x)).

Exercício :

8.25. Analise a diferenciabilidade do operador K .

8.4.3 Teoremas Fundamentais do Cálculo de Fréchet

Passaremos a aprsentar agora alguns dos teoremas fundamentais do cálculo ele-mentar em sua versão de Fréchet.

Teorema 8.23 (Regra da Cadeia).Sejam E ,F , G espaços de Banach, os conjuntos abertos U ⊂ E, V ⊂ F, e as funções

f ∈ C 1

(U ,V ) , g ∈ C 1

(V , G) e ϕ = g f : U → G, onde ϕ ( x) = g ( f ( x)) , isto é, ϕ é acomposição de g e f . Então,

1. ϕ ∈C 1(U ,G) e

2. Dϕ ( x) = Dg( f ( x)) D f ( x) , onde a composição se dá entre Dg( y) ∈ L(F ,G) e D f ( x) ∈ L(E ,F ).

Prova. Esta demonstração segue literalmente os argumentos do teorema para o casoE = F = G = R, e faz uso da expansão de Fréchet que passamos a analisar, escre-vendo y = f ( x) para simplificar a notação, e ε i(h) → 0 com h → 0,

ϕ ( x + h) = g ( f ( x + h)) = g ( f ( x) + D f ( x)h + ε 1(h) h )

= g ( f ( x) + k )g( f ( x)) + Dg( f ( x))k +ε 2 (k ) k

= ϕ ( x) + Dg( y) D f ( x)h + o(h) +ε 2

( D f ( x)h +ε 1(h) h ) ( D f ( x)h +ε 1(h) h ) ,

onde k = D f ( x)h +ε 1(h) h . Lembrando-se que Dg( y) ∈ L(F , G), temos

Dg( y) (ε 1(h) h ) = o(h).

Para demonstrar o desejado, basta observar que

ε 2 ( D f ( x)h +ε 1(h) h ) = ε 0(h) → 0

quando h → 0 e que

( D f ( x)h +ε 1(h) h ) ≤ ( D f ( x) 0 + ε 1(h) ) h ≤ M h ,

e portanto,

ε 2 ( D f ( x)h +ε 1(h) h ) ( D f ( x)h +ε 1(h) h ) = o(h).

Page 360: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 360/371

354 8 Análise Não-Linear

Exercícios :

8.26. Utilizando a regra da cadeia e a derivada do operador composição, K [ϕ ]( x) =K ( x,ϕ ( x)), obtenha a derivada deste operador integral não linear no espaço (C 0([0, 1],R

), . ∞).

8.27. Se α ∈C 1(R,U ⊂ E ) e ϕ ∈C 1(U , F ) obtenha uma expressão para a derivadade ϕ (α (t )) e interprete-a.

8.28. No exercício anterior, se E = H for um espaço de Hilbert e F = R, interprete Dϕ ( x) como um gradiente e a derivada de ϕ (α (t )) geometricamente.

No cálculo elementar de funções de várias variáveis, uma das ferramentas teóri-cas fundamentais é o teorema da desigualdade do valor intermediário, que pode serperfeitamente estendido para espaços normados. Para isto necessitamos de utilizaro conceito de integração de funções de variável real com valores em um espaço nor-mado. Esta teoria já foi desenvolvida “ab ovo” no ‘Capítulo 4. O Teorema do Valor

Médio é um aperfeiçoamento da expansão de Fréchet, baseado nela mesma. Vere-mos mais adiante que uma das grandes questões da análise topológica de funções é asua descrição nas imediações de seus pontos mais notáveis (como por exemplo, nospontos singulares, isto é, onde Dϕ ( x) /∈ GL(E )), por meio de aproximações qualita-tivas elementares, cujos passos iniciais são os conceitos de continuidade e de deri-vada de Fréchet. Os teoremas de Morse-Palais, Anosov-Moser e Lyapunov-Schmidtsão alguns pontos altos nesta direção, que é um dos grandes temas de pesquisa dasúltimas décadas surgidos de várias motivações (topológicas, equações diferenciais,aplicações) e sob diversos títulos como teoria da catástrofe (Thom), singularidades(Arnold), bifurcação (Poincaré-Lyapunov-Schmidt) e etc.

Teorema 8.24 (Valor médio integral e Desigualdade do valor Intermediário).

Sejam E e F espaços normados U ⊂ E um aberto, contendo o segmento [ x, x + h] ,e ϕ : U ⊂ E −→ F uma função continuamente diferenciável, ϕ ∈ C 1(U , F ). Então,∀λ ∈ F ∗ temos a igualdade do valor médio integral

λϕ ( x + h) −λϕ ( x) =

1 0

λ Dϕ ( x + sh)hds,

e a desigualdade do valor intermediário

ϕ ( x + h) −ϕ ( x) ≤ sup0≤s≤1

Dϕ ( x + sh) h .

Prova. Seja λ ∈ F ∗ qualquer e consideremos a função real de variável real g(s) =

λ (ϕ ( x + sh)), de onde é fácil concluir que g ∈ C 1([0, 1],R) e que g(s) = λ Dϕ ( x +sh)h, pelo teorema da composição. Então, pelo teorema fundamental do cálculointegral temos

Page 361: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 361/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 355

λϕ ( x + h)−λϕ ( x) =

1 0

g(s)ds =

1 0

λ Dϕ ( x + sh)hds =

e, portanto, pelo teorema do valor médio do cálculo de uma variável real temos

| λϕ ( x + h) −λϕ ( x) |≤1

0| g(s) | ds =

1 0

| λ Dϕ ( x + sh)h | ds

≤1

0 λ 0 Dϕ ( x + sh) h ds

≤1

0 λ 0 sup0≤s≤1 Dϕ ( x + sh) h ds

≤ λ 0 sup0≤s≤1 Dϕ ( x + sh) h .

Como a desigualdade

| λ (ϕ ( x + h)−ϕ ( x)) ≤ sup0≤

s≤

1 Dϕ ( x + sh) h λ 0

é válida para todos os funcionais λ ∈ F ∗, devemos concluir que necessariamente ϕ ( x + h)−ϕ ( x) ≤ sup0≤s≤1 Dϕ ( x + sh) h , tal como desejado. Esta últimaconclusão é baseada no seguinte lema do Teorema de Hahn-Banach-Helly : Se E forum espaço normado, α ∈ E , α > 1, então, existe um λ ∈E ∗ tal que | λα |> λ 0

que convidamos o leitor a provar e em seguida utilizar para concluir a demonstração.

A estimativa fornecida pelo teorema do valor intermediário é de grande impor-tância para a determinação de funções lipschitzianas e contrações, tal como nosmostra o importante teorema a seguir.

Teorema 8.25.Sejam E , F espaços normados, U ⊂ E um aberto convexo e g ∈ C 1(U ,F ) tal quesup x∈U Dg( x) ≤ M. Então,

1. g é uma função Lipchitziana em U,

2. Se M < 1 , então g é uma contração.

Prova. Basta tomar x, y ∈ U que, sendo convexo, também contem todo o segmento[ x, y] = x + s( y − x), 0 ≤ s ≤ 1, e daí usar a representação do teorema do valormédio integral

g( y)

−g( x) =

1

0

d

ds

g( x + s( y

− x))ds =

1

0

Dg( x + s( y

− x))ds( y

− x),

e a estimativa que ele implica

Page 362: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 362/371

356 8 Análise Não-Linear

g( y) −g( x) ≤ 1

0

Dg( x + s( y− x))ds

y− x

≤ 1 0

Dg( x + s( y− x)) ds y− x ≤ M y− x .

Um dos teorema mais úteis no trato operacional da análise é a simetria da se-gunda derivada e, portanto, das derivadas de ordem superior, que pode ser analoga-mente estendida para este contexto.

Teorema 8.26 (Teorema de Schwarz - Simetria das derivadas sucessivas).Sejam E e F espaços normados, ϕ : U ⊂ E −→ F , tal que ϕ ∈ C 2(U ,F ). Então, D2ϕ : U −→ M 2S (E ,F ) , isto é, D2ϕ ( x) é uma função bilinear simétrica para todosos x

∈U : D2ϕ ( x)(h, k ) = D2ϕ ( x)(k ,h) ,

∀h,k

∈E.

Prova. A demonstração segue os mesmos argumentos utilizados no cálculo elemen-tar.

Consideremos a função auxiliar simétrica em h e k Ψ (h,k ) = ϕ ( x + h + k ) −ϕ ( x + h) −ϕ ( x + k ) +ϕ ( x) de duas formas,

Ψ (h,k ) = (ϕ ( x + h + k ) −ϕ ( x + h))− (ϕ ( x + k ) −ϕ ( x))= (ϕ ( x + h + k ) −ϕ ( x + k ))− (ϕ ( x + h) −ϕ ( x)) ,

e apliquemos sucessivamente a igualdade integral do valor médio a cada uma delas,obtendo

ϕ ( x + h + k ) −ϕ ( x + h) =1

0 Dϕ ( x + h + sk )kds e

ϕ ( x + k ) −ϕ ( x) =1

0 Dϕ ( x + sk )kds.

Juntando as expressões acima e aplicando novamente o teorema de valor médiointegral (e a permutação da integral com operações lineares), temos

Ψ (h,k ) =1

0[ Dϕ ( x + h + sk ) − Dϕ ( x + sk )]kds

=1

0

1

0[ D2ϕ ( x +ξh + sk )h]d ξ

kds

=

1

0

1

0 D2ϕ ( x +ξh + sk )d ξ

ds

hk

= 1

0 1

0 [ D2ϕ ( x +ξh + sk )−

D2ϕ ( x)]d ξdshk + D2ϕ ( x)hk .

Mas, como D2ϕ é contínua, concluímos que

Page 363: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 363/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 357

limh,k →0ε 1(h, k ) = lim

h,k →0

sup

0≤ξ ,s≤1 D2ϕ ( x +ξh + sk )− D2ϕ ( x)

= 0,

e, portanto, analogamente,

Ψ (h,k ) = D2ϕ ( x)hk +ε 1(h, k ) h k = D2ϕ ( x)kh + ε 2(k ,h) h k ,

de onde, tomando h = tu e k = tv, e fazendo t → 0, concluímos que, necessariamente, D2ϕ ( x)uv = D2ϕ ( x)vu, para todos u, v ∈ E .

Alguns teoremas de convergência uniforme de funções e de suas derivadas sãoválidos e importantes também neste contexto. Apresentaremos abaixo uma versãoque será útil para demonstração de outros resultados e generaliza um teorema clás-sico do cálculo de uma variável na linguagem da análise funcional.

Teorema 8.27 (Convergência uniforme de funções e de suas derivadas).Sejam E ,F espaços normados, F de Banach, U ⊂ E um conjunto abert,o e conside-remos o espaço vetorial das funções continuamente diferenciáveis C 1(U ,F ). Então,o espaço normado de funções G = ϕ ∈ C 1(U , F ), ϕ 1,∞= sup x∈U ϕ ( x) +sup x∈U Dϕ < ∞ , com a norma ϕ 1,∞ , é de Banach.

Prova. Formalmente a demonstração segue os mesmos passos que são utilizados nocálculo elementar.

Seja ϕ n uma sequência de Cauchy em G. Então, pelo teorema geral de espa-ços métricos, como ϕ n e Dϕ n são de Cauchy na norma uniforme, ambas convergemnesta norma para funções contínuas, respectivamente, denominadas de ϕ e Φ . De-vemos provar que ϕ ∈ G e que Dϕ =Φ . Para isto, utilizamos a expansão do teoremado valor intermediário integral na forma

ϕ n( x + h) = ϕ n( x) + Dϕ n( x)h + 1

0

( Dϕ n( x + sh) − Dϕ n( x)) dsh,

e, fazendo uso da convergência uniforme, podemos passar ao limite, para obtermos

ϕ ( x + h) = ϕ ( x) +Φ ( x)h +

1 0

(Φ ( x + sh)−Φ ( x))ds

h,

e, pela continuidade de Φ , concluímos que esta é uma expansão de Fréchet quedefine Φ ( x) como Dϕ ( x).

Page 364: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 364/371

358 8 Análise Não-Linear

8.4.4 Métodos de Newton-Kantorovich

Uma vez de posse das ferramentas básicas da análise em espaços normados,abordaremos agora uma série de métodos fundamentais para a sua aplicação. O

resultado mais útil neste contexto será o teorema de inversão local da identidadeperturbada, uma vez que trabalharemos com operadores não-lineares diferenciáveise que, portanto, podem ser aproximados localmente por operadores lineares limita-dos. O teorema da função inversa será o resultado fundamental desta seção. Entre-tanto, antes de abordarmos este teorema e suas aplicações, é importante apresentaras motivações clássicas que deram origem aos conceitos e métodos de caráter tãogeral. A ideia mais importante para a resolução aproximada de uma equação do tipoϕ ( x) = 0, é atribuida a Newton, e remonta aos primórdios do nascimento do própriocálculo fazendo uso do conceito de tangente a uma curva. A sua motivação geomé-trica é clara e bem conhecida e não a reproduziremos. A sua motivação analítica,que abordaremos, também é interessante e nem sempre apresentada.

Suponha, por exemplo, que x0 seja uma aproximação da solução x da equaçãoϕ ( x) = 0. Então, usando a expansão de Fréchet, podemos escrever

0 = ϕ ( x) = ϕ ( x0 +ε 0) = ϕ ( x0) + Dϕ ( x0)ε 0 + o(ε 0).

Se Dϕ ( x0) for considerada inversível, então podemos expressar ε 0 como ε 0 =− Dϕ ( x0)−1ϕ ( x0) + o(ε 0). Na impossibilidade de calcular o “erro” exatamente,o calculamos aproximadamente como ε 0 = − Dϕ ( x0)−1ϕ ( x0) com um erro me-nor (dinamicamente, pelo menos!) do que ele mesmo. Com isto, melhoramos anossa estimativa para a solução, obtendo x1 = x0 + ε 0 = x0 − Dϕ ( x0)−1ϕ ( x0),com a qual podemos repetir o processo, o que imediatamente que nos fornece x2 = x1 − Dϕ ( x1)−1ϕ ( x1). Desta maneira fica claro que o método de Newton é umaiteração de ponto fixo com a função ψ ( x) = x − Dϕ ( x)−1ϕ ( x). Mas este métodointroduz um processo operacional de inversão do operador Dϕ ( xn) em cada etapa,o que pode significar um extraordinário problema por si mesmo, tanto do ponto de

vista teórico mas principalmente prático. Observe que a equação linear Dϕ ( x)h = aem h pode representar um problema não trivial de equações diferenciais ! Mesmono caso de dimensão finita, esta operação é uma inversão de matrizes, que pode setornar computacionalmente “dispendiosa” se exigida para cada etapa. Portanto, écomum o acerto de um compromisso entre a rapidez de convergência e a facilidadede execução do processo, que em tempo real pode resultar vantajoso, adotando-seos chamados métodos de Newton modificados. O mais comum e óbvio é aquele queutiliza a mesma “inclinação” inicial Dϕ ( x0) em todo o processo, o que naturalmenteretarda a taxa de convergência. Este método é suficiente para a demonstração dos re-sultados mais clássicos. Entretanto, em outras situações, há uma necessidade de queo método de Newton seja até acelerado, para que se introduza um processo de com-pensação de outros erros cometidos. Este é um outro lado da questão, que foi ampla-mente desenvolvido no contexto da análise funcional durante as últimas décadas e

que deu origem a uma das mais importantes teorias da matemática contemporânea,como sequência dos trabalhos de John Nash, Andrei N. Kolmogorov, Vladimir I.Arnold e Jurgen K Moser, os chamados teoremas Nash-Moser e KAM. A aplicação

Page 365: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 365/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 359

das antiquíssimas ideias de Newton no contexto de espaços de Banach é atribuida aLeonid V. Kantorovich.

A aplicação do método de Newton consiste em duas etapas básicas que devemser resolvidas :

1. A transformação do problema ϕ ( x) = 0 em uma equação de ponto fixo parauma contração, e

2. A obtenção de uma região invariante para a contração com vistas à aplicação dométodo de Banach-Cacciopoli.

A primeira etapa é genericamente tratada nos métodos do tipo Newton usando-se uma função A : E → E continuamente inversível e transformado-se o problemapara a forma equivalente

x + Aϕ ( x) = x,

em que a função ψ ( x) = x + Aϕ ( x) deve ser contrativa. As diversas maneiras dese escolher a função A definem a modificação do método. O chamado método deNewton modificado faz uso de funções lineares A ∈ GL(E ) fixas. Observe que no

método original, A é uma função linear mas dependente de x, isto é, A( x) ∈ GL(E )e, portanto, de fato, a transformação neste caso é não-linear. Se a funçãoϕ for conti-nuamente diferenciável, o que é o caso típico tratado por Newton, podemos usar oteorema de valor intermediário para melhor caracterizar a transformação A desejadae concluirmos que devemos escolher A de tal forma que na região de busca tenhamos D( I + Aϕ )( x) = I + DAϕ ( x) ≈ 0. Portanto, se um ponto x0 estiver “suficientementepróximo” da solução e se Dϕ ( x0) ∈ GL(E ), então, considerando-se que Dϕ ( x) écontínua e que GL(E ) é aberto, podemos escolher A = − Dϕ ( x0)−1 na espectativade que I − Dϕ ( x0)−1 Dϕ ( x) se mantenha sempre limitada por um α < 1.

Exercícios :

8.29. Usando o teorema do valor intermediário, mostre que, no método de Newtonoriginal, o processo de convergência é acelerado no sentido de que o problema deponto fixo resultante ψ ( x) = x, para ψ ( x) = x − Dϕ ( x)−1ϕ ( x), é tal que ψ ( x) −ψ ( y) ≤ α ( x, y) x − y , onde a razão de convergência α “melhora” conforme oprocesso converge, isto é, α ( x, y) −→ 0 quando x → y. Sugestão : Escreva

ψ ( x)−ψ ( y) = Dϕ ( x)−1

1 0

[ Dϕ ( x + s( y− x) − Dϕ ( x)]ds

( x− y).

8.30. SupondoΦ continuamente diferenciável, e seguindo o argumento do exercícioanterior, argumente que uma expectativa razoável para que a convergência de umaiteração xn = Φ ( xn−1) seja acelerada é que Φ tenha a primeira derivada nula noponto fixo. Sugestão : use o Teorema do Valor Intermediário para escrever

Φ ( x) −Φ ( y) = 1

0

[ DΦ ( x + s( y− x)ds( x− y).

Page 366: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 366/371

360 8 Análise Não-Linear

Neste caso usa-se dizer que o ponto fixo é um super-atrator ou que a aproximaçãoé quadrática.

Como já observamos, se, por um lado, a aceleração que o método original pro-duz “custa” muito caro, por outro, ela é altamente desejável ou mesmo necessáriapara a compensação de desvios inevitáveis (numéricos ou analíticos) que ocorremno processo. Os métodos de Newton acelerados são de grande importância no estudode problemas funcionais em que ocorrem singularidades que vão se acumulando acada etapa e deteriorando progressivamente o processo de convergência. Os difíceisteoremas do tipo Nash-Moser e KAM fazem exatamente isto em um contexto muitogeral. Apresentaremos a seguir uma interessante variante acelerada do método deNewton, que evita o cálculo de inversas e é devido à J.Moser (J. Moser, Stable and Random Motions in Dynamical Systems, Princeton U.P., 1973). A ideia básica deMoser é embutir no processo iterativo uma aproximação sucessiva e paralela da in-versa de Dϕ ( x). Observemos inicialmente que a função real ψ ( x) = 2 x − ax2 tem x = 1

a como um de seus pontos fixos (o outro é x = 0), que é um super-atrator

pois ψ (1a ) = 0. Para que esta função seja utilizada no contexto de operadores li-neares onde o produto (composição), não é comutativo, é necessário escolher entre

ψ 1( X ) = 2 X − XAX , ψ 2( X ) = 2 X − AX 2 e ψ 3( X ) = 2 X − X 2 A. Deixamos ao leitor averificação de que Dψ 1( A−1) = 0 , e a conclusão de que esta é a função convenientepara o cálculo da inversa de A pelo método das contrações X n+1 = 2 X n− X n AX n.Com isto o método Newton-Moser toma a seguinte forma natural :

xn+1 = xn − X nϕ ( xn),

X n+1 = 2 X n − X n Dϕ ( xn+1) X n,

que pode ser pensada como a iteração de uma função Ψ : E × L(E ) −→ E × L(E ),ondeΨ ( x, X ) = ( x− X ϕ ( x), 2 X − XDϕ ( x− X ϕ ( x)) X ), cujo ponto fixo será ( x, X )

tal que ϕ ( x) = x e X = Dϕ ( x)−1

.

Exercício :

8.31. Mostre que a iteração de Newton-Moser é de fato acelerada se ϕ tem um zerosimples no ponto fixo. Sugestão : Calcule ( !) a derivada de

Ψ ( x, X ) = ( x− X ϕ ( x),2 X − XDϕ ( x− X ϕ ( x)) X )

no ponto fixo ( x, Dϕ ( x)−1).

A segunda questão que surge na aplicação de qualquer método iterativo, e parti-cularmente nos métodos de Newton, se refere à obtenção de um conjunto invariante

em que se possa realizar a iteração. Esta é em geral uma questão delicada que exigeestimativas cuidadosas e a escolha de regiões apropriadas. O lema da bola invariante

Page 367: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 367/371

8.4 Aproximação por linearização local : O Cálculo Diferencial em Espaços Normados 361

para contrações, que de certa forma foi também utilizado na demonstração do Teo-rema de Kantorovich (Perturbação Local da Identidade), é um dos argumentos maisúteis na resolução desta questão. Em virtude de sua importância e simplicidade,repetiremos este lema :

Lema 8.28 (Existência de Bola Estável sob Contração).Se ϕ for uma α −contração em uma bola fechada B R( x0) para qual é válida aestimativa ϕ ( x0) − x0 ≤ (1 −α ) R, então, ϕ ( B R( x0)) ⊂ B R( xo) , isto é, a bola B R( x0) é invariante para a função ϕ , que, portanto, tem um único ponto fixo em B R( x0).

Prova. Suponhamos então que x ∈ B( x0, R). Basta fazermos a triangulação :

d (ϕ ( x), x0) ≤ d (ϕ ( x),ϕ ( x0)) + d (ϕ ( x0), x0) ≤ α d ( x, x0) + (1−α ) R ≤ R.

Podemos dizer neste caso que x0 é uma quase-solução quando existe a bola

B( x0, R) tal que ϕ ( x0) − x0 ≤ (1−α ) R.O importante Teorema de Newton-Kantorovich que se segue é simplesmente um

compilamento das condições exigidas para o cumprimento do Lema de Invariânciada Bola no caso do método de Newton modificado. As condições deste teoremasão extremamente técnicas e aparentemente artificiais. Entretanto, a argumentaçãoprecedente nos fornece todas as razões necessárias para a sua formulação.

Teorema 8.29 (Teorema de Newton-Kantorovich (Newton Modificado)).Sejam E um espaço de Banach, U ⊂E um suconjunto aberto, x0 ∈U e f ∈C 1(U , E )tais que Df ( x0) ∈ GL(E ). Para r > 0 tal que B( x0,r ) ⊂ U, definimos

1. Or [ D f ]( x0) = sup x∈ B( x0,r ) D f ( x) − D f ( x0) = “oscilação da derivada”,

2. λ ( x0) = D f ( x0)−1

−1

, e3. α (r , x0) = λ Or [ D f ]( x0).

Se para algum valor de r > 0 tivermos

f ( x0) ≤ λ (1−α (r ))r

então, existirá uma única raiz de f ( x) = 0 em B( x0, r ) que poderá ser obtida pelaiteração de Newton modificado xn+1 = xn − D f ( x0)−1 f ( xn).

Prova. Transformemos a equação f ( x) = 0 em um problema de ponto fixo pelométodo de Newton modificado na forma x − D f ( x0)−1 f ( x) = x e denominemosϕ ( x) = x − D f ( x0)−1 f ( x). Como f ∈ C 1(U ,E ), podemos usar o teorema do valormédio integral para concluir que em B( x0,r ) temos ϕ ( x)−ϕ ( y) ≤α (r ) x− y e

que α (r ) = λ Or [ D f ]( x0) → 0 quando r → 0. Ou seja, existe r 0 tal que para todo r <r 0 a função modificada de Newton ϕ = I − D f ( x0)−1 f é uma contração em B( x0, r ).Se a condição acima for satisfeita, é imediato que α (r ) < 1, pois f ( x0) ≥ 0. (!)

Page 368: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 368/371

362 8 Análise Não-Linear

Para que a segunda etapa do método seja concluída, devemos mostrar que existeuma bola B( x0,r ) invariante. Mas como

ϕ ( x0) − x0 = D f ( x0)−1 f ( x0) ≤ D f ( x0)−1 f ( x0)

≤ λ −1 f ( x0) ≤ (1−α (r ))r ,

o desejado pode ser garantido pelo lema acima.

Exercício :

8.32. Argumente o teorema de Newton-Kantorovich sob o ponto de vista do teoremade Kantorovich para a perturbação local da identidade, supondo naturalmente que afunção em questão é tantas vezes diferenciável quanto necessárias.

Outros teorema do tipo Newton-Kantorovich podem ser obtidos considerando-

se as condições do Lema de Invariancia da Bola para as diversas modificações dométodo de Newton, ou mesmo para o método original.

8.5 Os Teoremas da Função Inversa e da Função Implícita : APerturbação Diferencial da Identidade

Os teoremas da função inversa e implícita na sua concepção operacional sãouma extensão diferencial do teorema de Kantorovich para a perturbação local daidentidade, e podem ser interpretados de diversas formas. O problema clássico dafunção inversa é formulado por uma equação na variável x, f ( x) = y, a ser resolvidapela variável x em termos de y. A ênfase clássica no conceito de variável é substi-tuída pelo conceito de função na matemática moderna quando o mesmo problema éreinterpretado como a procura de uma função f ∗ contínua e diferenciável e inversa ádireita de f , isto é, f ( f ∗( y)) = y. Sob um ponto de vista talvez mais contemporâneo,embora já existente na análise aplicada há muito tempo, a equação f ( x) = y pode servista como uma questão geométrica de perturbação e estabilidade ou de continua-ção e bifurcação. No primeiro caso, observamos que este problema só tem sentidoquando existir de antemão uma solução pontual x0 para y0, isto é, f ( x0) = y0, e aquestão é formulada como uma indagação sobre a estabilidade da propriedade deexistência de solução x(ε ) para dados perturbados y + ε , com dependência contí-nua e/ou diferenciável de ε , ou, em outros termos, indaga-se sobre a possibilidadede se estender continuamente a solução pontual na forma x(ε ) para f ( x) = y + ε ,onde x(0) = x0. Neste último caso, admite-se que o problema possa ter mais de um

“ramo” de continuação, o que caracteriza o problema de bifurcação. Um exemplotípico desta situação é o problema na reta com f ( x) = x2, para x0 = 0, e y0 = 0.Com ε < 0 não há solução e para ε > 0 há dois ramos de soluções, x1(ε ) =

√ ε , e

Page 369: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 369/371

8.5 Os Teoremas da Função Inversa e da Função Implícita : A Perturbação Diferencial da Identidade 363

x2(ε ) = −√ ε . As questões sobre bifurcação de soluções são de extrema importância

para o estudo de equações diferenciais e serão tratadas mais adiante.O teorema da função inversa se ocupa do problema quando há a possibilidade

de continuação única de uma solução pontual, ou, do ponto de vista operacional,

quando a função é assintoticamente aproximada por homeomorfismos lineares (istoé, tem derivadas de Fréchet que são de GL(E )).

Teorema 8.30 (Teorema de Kantorovich Diferenciável (Perturbação Diferen-ciável da Identidade - Estabilidade Difeomórfica).Sejam E espaço de Banach, U ⊂ E um aberto, 0 ∈ U , e f ∈ C 1(U , E ) tal que f (0) = 0 , D f (0) = I. Então,

1. f é localmente uma perturbação contrativa e diferenciável da identidade, istoé, existe uma bola B(0,r ) ⊂ U onde f ( x) = x +ϕ ( x) para uma contração ϕ ∈C 1( B(0,r ),E ) , com Dϕ (0) = 0 ,

2. f é um homeomorfismo local, isto é, existe uma bola B(0, r ) ⊂ U tal que f ( B(0, r )) = V é aberto e f −1

∈C 0(V , E ).

3. O homeomorfismo local garantido pelo Teorema de Kantorovich é um difeo-morfismo, isto é, f −1 ∈ C 1(V , E ).

Prova. 1. A expansão de Fréchet pode ser escrita na forma

f ( x) = f (0) + D f (0) x + o( x) = x +ϕ ( x),

onde ϕ = f − I ∈ C 1(U ,E ), e o Teorema do Valor Médio Integral nos fornece aseguinte expansão em subconjuntos convexos de U :

ϕ ( y) −ϕ ( x) = x − y +

1

0 D f ( x + s[ y− x])ds

( y− x)

= 1 0 ( D f ( x + s[ y− x]) − I ) ds( y− x).

Como D f é contínua e D f (0) = I , existe então uma bola B(0, r ) ⊂ U , tal que D f ( x + s[ y − x]) − I ≤ 1

2 para x, y ∈ B(0, r ), o que prova a primeira parte doteorema.

2. Basta usar o teorema de Kantorovich para perturbação contrativa da identidade.

3. Para mostrar que f −1 ∈ C 0(V , E ) é diferenciável, passamos à definição de Fré-chet com a ajuda de um fato importante sobre a diferenciabilidade de f , queressaltaremos como lema.

Lema 8.31. Para todo x∈

U, existe uma vizinhança U 0(

x) onde f

−1 é localmente

lipschitziana.

Page 370: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 370/371

364 8 Análise Não-Linear

Prova. Como D f ( z) é contínua, existem U 0 e m > 0, tal que D f ( z)−1 ≤ m se z ∈ U 0. Usando a expansão de Fréchet em x temos

f ( x + h) − f ( x) = D f ( x)h + ε (h) h ⇒

h = D f ( x)−1 ( f ( x + h) − f ( x) − ε (h) h ) ⇒

h− D f ( x)−1ε (h) h = D f ( x)−1 ( f ( x + h) − f ( x)) .

Assim, 1− D f ( x)−1ε (h) h ≤ D f ( x)−1 ( f ( x + h) − f ( x))

≤ m f ( x + h) − f ( x) .

E finalmente,

h

m

(1− D f ( x)−1

ε (h) ) f ( x + h)

− f ( x)

≤ m

(1− mε (h) ) f ( x + h) − f ( x) ≤

C f ( x + h) − f ( x) .

Prova (Continuação da prova do Teorema 8.30). Então, se y = f ( x), k = f ( x +h)− f ( x), escrevendo a expansão de Fréchet para f e usando o lema acima temos,

f −1( y + k )− f −1( y) = h = D f ( x)−1 [ f ( x + h) − f ( x)]− D f ( x)−1ε (h) h

= D f ( x)−1k +ε 1(k )o(k ),

ou seja, podemos concluir pela própria definição de Fréchet que D f −1( y) = D f ( x)1.

Neste estudo, adotamos um ponto de vista operacional que além de ser contem-porâneo a muitas de suas aplicações, e especialmente relacionadas aos trabalhos deMoser e Arnold, enfatiza claramente as suas origens na linha operacional que utili-zamos para abordar os teoremas de Banach-Cacciopoli, Neumann-Peano e Kanto-rovich, e que é o próprio cerne conceptual da análise funcional.

A equação implícita f ( x,λ ) = 0 pode ser considerada como um caso especialda equação da função inversa se a escrevermos como uma equação de duas com-

ponentes F ( x,λ ) = ( f ( x,λ ), λ ) para ser resolvida no ponto y = (0,λ ). Entretanto,em muitos casos, a equação implícita pode ser interpretada como um problema decontinuação da solução pontual f ( x0,λ 0) = 0 em que o parâmetroλ representa uma

Page 371: Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

7/18/2019 Ferreira&Fassoni Anfunc Jun2014 Versão Prelim

http://slidepdf.com/reader/full/ferreirafassoni-anfunc-jun2014-versao-prelim 371/371

8.5 Os Teoremas da Função Inversa e da Função Implícita : A Perturbação Diferencial da Identidade 365

deformação estrutural da própria função que define a equação. Observemos que épossível simplificar consideravelmente a notação da equação implícita, por meio desimples mudanças de variáveis, para supor que x0 = 0, λ 0 = 0 (observe que esteszeros podem ser distintos, uma vez que x e λ podem “viver” em espaços diferentes),

f (0,0) = 0. Mais ainda, se adiantamos que o teorema da função implícita pressupõeque ∂ f ∂ x (0,0) ∈ GL(E ), então podemos também tomar sem perda de generalidade∂ f ∂ x (0,λ ) = I (v. exercício abaixo).

Teorema 8.32 (Teorema da Função Implícita - Estabilidade de Difeomeorfis-mos Locais com Perturbações Estruturais).Sejam E ,F espaços de Banach, U ⊂ E ,V ⊂ F abertos, (0,0) ∈ U ×V , e f ∈C 1(U ×V , E ) tal que f (0,λ ) = 0 , D x f (0,λ ) = I. Então,

1. f é localmente uma perturbação contrativa uniforme e diferenciável da identi-dade, isto é, existem bolas B(0,r )× B(0,δ ) ⊂U ×V onde f ( x,λ ) = x +ϕ ( x,λ ) para uma contração uniforme ϕ ∈ C 1( B(0, r ) × B(0,δ ), E ) , com ϕ (0,λ ) = 0 e D xϕ (0) = 0.

2. Se Φ : G → G (onde G = h ∈ C 1( Bδ ⊂ F , Br ⊂ E ),h(0) = 0 é espaço de Ba-nach com a norma h 1= Dλ h ∞), for definida como Φ [ z](λ ) = f ( z(λ ),λ ) ,então, Φ é homeomorfismo local.

Exercícios :

8.33. Mostre que se f ∈ C 1(U ×V , E ), ( x0, y0) ∈ U ×V ⊂ E × F , f ( x0, y0) = 0,∂ f ∂ x ( x0, y0) ∈ GL(E ), então, em uma vizinhança de ( x0, y0), podemos transformara equação implícita f ( x,λ ) = 0 em uma equação equivalente F ( z,λ ) = 0, ondeF (0,0) = 0, ∂ F

∂ z (0,λ ) = I .

Muito mais se poderia falar sobre isto e muitas outras coisas, entretanto, comodisse Salomão, há tempo próprio para tudo : “... tempo para rasgar e tempo de

coser, tempo de estar calado e tempo de falar ...”. E disse mais : “Não há limites para fazer livros, e o muito estudar é enfado da carne”.

Eclesiastes 3.7 e 12.12.

SILENCIO !

A man nerviosa e palpitante o seo,as niebras n ’os meus ollos condensadascon un mundo de dudas n ’os sentidos