42
Resolução da lista de exercícios Variância Variáveis aleatórias independentes Stops para o passeio aleatório MAC 5796. Aula 7 Walter Mascarenhas 13/04/2011 Walter Mascarenhas MAC 5796. Aula 7

MAC 5796. Aula 7 - ime.usp.brwalterfm/cursos/mac5796/Aula7.pdf · Resolução da lista de exercícios Variância Variáveis aleatórias independentes Stops para o passeio aleatório

Embed Size (px)

Citation preview

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

MAC 5796. Aula 7

Walter Mascarenhas

13/04/2011

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Resumo

1 Resolução da lista de exercícios

2 Variância

3 Variáveis aleatórias independentes

4 Stops para o passeio aleatório

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

A figura fundamental do cálculo

f (x + δ )

o(δ 2)⋘ δ 2

f (x) + f ′(x)δ + 12 f ′′(x)δ 2

f (x) + f ′(x)δ

f (x)

x + δxWalter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Vacina Gatos Infectados I/G1 10 0 0.002 17 1 0.063 23 2 0.09

Conclusão apressada: a primeira vacina é a melhor pois resulta namenor probabilidade de infecção.

Na verdade esta conclusão é uma confusão!!!

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

A confusão surge por não termos claro um modelo probabilístico.

Não faz sentido identificar probabilidade com porcentagem deocorrências.

O que isto tem a ver com trading: TUDO. Se você não entende ummodelo então não deveria confiar nas conclusões obtidas a partirdele. (Ou pode comprar gato por lebre...)

Exemplo: comparação da performance de algoritmos usandoargumentos sem sentido estatístico. Overfitting.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Modelo I: Vacina funciona × Vacina não funciona

Hipótese: Vacina não funciona

Vacina Gatos Infectados Probabilidade de I ≤

1 10 0(

100

)(34

)10 (14

)0= 0.056

2 17 1 ∑1k=0

(17k

)(34

)17−k (14

)k= 0.050

3 23 2 ∑2k=0

(23k

)(34

)21−k (14

)k= 0.049

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Segundo o Modelo I, a vacina 3 atribui a menor probabilidade aoque foi observado sob a hipótese de que a vacina não. É razoávelentão escolher a vacina 3 como a melhor.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Modelo II: Estimando a eficácia da vacina

Segunda lista de exercícios...

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

ℒ2(Ω,A,P) é a família de variáveis aleatórias f em (Ω,A,P) taisque E

(f 2)< ∞.

Se f ∈ ℒ2(Ω,A,P) então f é integrável pois

E(∣f ∣) = E(∣f ∣; ∣f ∣ ≤ 1) +E(∣f ∣; ∣f ∣> 1)≤ 1+E(f 2)< ∞.

Para f ∈ ℒ2(Ω,A,P) podemos definir

variancia(f) = E(

(f−E(f))2)

e o desvio padrão de f :

σ(f ) =√

variancia(f).

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Desvio pequenoDesvio grande

Variância = dispersão da variável aleatória ao redor da média.

Desigualdade de Chebyshev:

P(∣f −E(f )∣ ≥ ε)≤ σ(f )2

ε2 .

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Desigualdade de Schwarz: se f ,g ∈ ℒ2(Ω,A,P) então

E(∣fg ∣)≤√

E(f 2)E(g2).

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Demonstração da desigualdade de Schwarz.

Primeiro passo: esquentando os motores.

f = 1{A} e g = 1{B} .

Neste caso

E(∣fg ∣) = E(1{A}1{B}) = E(1{A∩B}) = P(A∩B) .

E(f 2)= E(1{A})≥ P(A∩B) .

E(g2)= E(1{A})≥ P(A∩B) .

Logo

E(∣fg ∣)≤√P(A∩B)2 ≤

√E(f 2)E(g2).

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Segundo passo:

f =n

∑j=1

aj1{Aj} e g =m

∑k=1

bk1{Bk} .

Neste caso

∣fg ∣=n

∑j=1

m

∑k=0∣ajbk ∣1{Aj}1{Bk}=

n

∑j=1

m

∑k=1∣ajbk ∣1{Aj ∩Bk}

Logo, como P(A∩B)≤√P(A)

√P(B),

E(∣fg ∣) =n

∑j=0

m

∑k=0∣ajbk ∣P(Aj ∩Bk)

≤n

∑j=1

m

∑k=1

(∣aj ∣√P(Aj)

)(∣bk ∣

√P(Bk)

).

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Pela desigualdade de Cauchy (para números)

E(∣fg ∣)≤

√√√⎷( n

∑j=1

a2j P(Aj)

)(m

∑k=1

b2kP(Bk)

)=√

E(f 2)E(g2).

Logo, a desigualdade vale quando f e g são funções simples.

Usamos agora o Teorema da Classe Monótona:

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Versão simplificada do teorema da classe monótona 1.

Considere duas famílias C ⊂ℳ de variáveis aleatórias não negativas

SeC contém todas as funções da forma f = ∑

nk=1 ak1{Ak} com

ak ∈ [0,∞) e Ak ∈ A.

Se { fn, n ∈N} é uma seqüência de elementos de C efn ↑ f ∈ℳ então f ∈ C.

então C =ℳ.

1veja Probability with Martingales, de David Williams, para a versão completa.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Terceiro passo:

f =n

∑j=1

aj1{Aj} com aj ≥ 0 e g ≥ 0 com E(g2)< ∞.

Classes: ℳ={

g ≥ 0 com E(g2)< ∞

}e

Cf =

{g ∈ℳ tal que E(∣fg ∣) = E(fg)≤

√E(f 2)E(g2)

}.

Segundo passo ⇒Cf contém as g ’s simples.Convergência monótona: Se gn ∈ Cf ↑ g ∈ℳ então

fgn ↑ fg ⇒ E(fg) = limE(fgn)≤√

E(f 2) limE(g2n ) =

√E(f 2)E(g2).

Logo, g ∈ℳ e classe monótona ⇒Cf =ℳ.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Quarto passo:

f ≥ 0 com E(f 2)< ∞ e g ≥ 0 com E

(g2)< ∞.

Classes: ℳ={

g ≥ 0 com E(g2)< ∞

}e

Cf =

{g ∈ℳ tal que E(∣fg ∣) = E(fg)≤

√E(f 2)E(g2)

}.

Terceiro passo ⇒Cf contém as g ’s simples.Convergência monótona: Se gn ∈ Cf ↑ g ∈ℳ então

fgn ↑ fg ⇒ E(fg) = limE(fgn)≤√

E(f 2) limE(g2n ) =

√E(f 2)E(g2).

Logo, g ∈ℳ e classe monótona ⇒Cf =ℳ.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

ResumoE(∣fg ∣)≤

√E(f 2)E(g2)

se f ,g ≥ 0 e E(f 2),E(g2)< ∞.

Caso geral:

E(∣fg ∣) = E(∣f ∣ ∣g ∣)≤√

E(∣f ∣2)E(∣g ∣2

)=√

E(f 2)E(g2).

E se E(f 2) ou E

(g2)= ∞?

Ok desde que convencionarmos que 0×∞ = 0.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Duas variáveis aleatórias f e g são independentes se para todointervalo I = [a,b] e J = [c ,d ] os eventos f −1(I ) e g−1(J) sãoindependentes.

Informalmente, f e g são independentes se o valor de uma nãofornece informação sobre o valor da outra. Por exemplo se Ω é obaralho, com cartas de igual probabilidade, então f e g a seguir sãoindependentes:

f (♦∗) = 1, f (♥∗) = 2, f (♣∗) = 3, f (♠∗) = 4.

g(∗A) = 1, g(∗n) = n, g(∗J) = 11, g(∗Q) = 12, g(∗K ) = 13.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Teorema: se f ,g ∈ ℒ2(Ω,A,P) são independentes então

E(fg) = E(f )E(g).

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Caso simples:

f =n

∑j=1

aj1{Aj} e g =m

∑k=1

bk1{Bk} .

fg =n

∑j=1

m

∑k=1

ajbk1{A}1{B}=n

∑j=1

m

∑k=1

ajbk1{A∩B} .

E(fg) =n

∑j=1

m

∑k=1

ajbkP(Aj ∩Bk)

Independência ⇒ P(Aj ∩Bk) = P(Aj)P(Bk) e

E(fg) =n

∑j=1

m

∑k=1

ajbkP(Aj)P(Bk) = E(f )E(g).

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Caso semi simples:

f = simples≥ 0 e g ∈ ℒ2(Ω,P,A)

Considere a classesℳ={

g ∈ ℒ2(Ω,P,A) e independente de f}

e G = {g ∈ℳ tal que E(fg) = E(f )E(g)}.

G contém as funções simples (Caso simples).

Se {gn, n ∈N} ∈ G e gn ↑ g ∈ℳ então fgn ↑ fg eE(fgn) = E(f )E(gn) ↑ E(f )E(g) pelo Teorema da convergênciamonótona. Logo g ∈ G.

Pelo teorema da classe monótona, G =ℳ. Ou seja, para todag ∈ ℒ2(Ω,P,A) independente de f temos que E(fg) = E(f )E(g).

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Caso não negativo:

f ∈ ℒ2(Ω,P,A)≥ 0 e g ∈ ℒ2(Ω,P,A)≥ 0

Considere a classesℳ=

{g ∈ ℒ2(Ω,A,P) ,g ≥ 0 e independente de f

}e

G = {g ∈ℳ tal que E(fg) = E(f )E(g)}.

G contém as funções simples ≥ 0 (Caso semi simples).

Se {gn, n ∈N} ∈ G e gn ↑ g ∈ℳ então fgn ↑ fg eE(fgn) = E(f )E(gn) ↑ E(f )E(g) pelo Teorema da convergênciamonótona. Logo g ∈ G.

Pelo teorema da classe monótona, G =ℳ. Ou seja, para todasf ,g ∈ ℒ2(Ω,P,A), f,g ≥ 0 e independentes temos queE(fg) = E(f )E(g).

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Caso geralf = f +− f −, f +, f − ∈ ℒ2(Ω,A,P) ,

g = g+−g−, g+,g− ∈ ℒ2(Ω,A,P) ,

E(fg) = E(f +g+− f +g−− f −g+ + f −g−

)= E

(f +g+

)−E(f +g−

)−E(f −g+

)+E(f −g−

)= E

(f +)E(g+)−E(f +)E(g−)−E(f −)E(g+)

+E(f −)E(g−)

=(E(f +)−E(f −))(

E(g+)−E(g−))

= E(f )E(g).

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

A covariância entre duas variáveis aleatórias f e g em ℒ2(Ω,A,P)é definida como

cor (f ,g) = E((f −E(f ))(g −E(g))).

A covariância é uma medida de independência: Se f e g sãoindependentes então f −E(f ) e g −E(g) também sãoindependentes e

cor (f ,g) =E((f −E(f ))(g −E(g))) =E(f −E(f ))E(g −E(g)) = 0.

Em geral variáveis dependentes podem ter correlação 0, ou seja acorrelação nula é apenas um indicativo de independência. Porém,para variáveis com distribuição normal ausência de correlação éequivalente a independência.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

n

vGanho = e−ρn v

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Visão informal:

O valor esperado do ganho é

E(G ) =∞

∑n=v

P(Tv = n)e−ρnv ,

Onde Tv = Tv (ω) é o primeiro instante no qual o preço atinge ovalor v .

Note que pode acontecer do preço NUNCA atingir v . Neste casodefinimos Tv (ω) = ∞.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Visão Formal:

Tv

Ω

v v +2 v +4 v +6 v +8 v +10

A′ = { subconjuntos que dependem de finitas coordenadas }

Exemplo Cv ,n = {ω ∈ Ω com Tv (ω) = n} ∈ A′.

A= σ(A′)

= menor σ − algebra contendo A′.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Visão Formal:

Note que para decidirmos se ω ∈ Cv ,n = {ω ∈ Ω com Tv (ω) = n}precisamos apenas decidir se

pk =k

∑j=1

ωj < v para 0≤ k < n e pn =n

∑j=1

ωj = v .

Ou seja, precisamos analisar apenas ωN = {ω1, . . . ,ωN } ∈ ΩN .Logo, podemos atribuir probabilidade a Cv ,n de acordo com oraciocínio para ΩN .

Isto define uma medida de probabilidade P em A′.

Há uma extensão natural de P para A.

Com isto definimos nosso espaço de probabilidade (Ω,A,P).Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

TUDO nesta formalização faz um (bom) sentido.

Por exemplo: porque usar A ao invés de A′?

Resposta: o conjunto Cv ,∞ = {ω ∈ Ω com Tv (ω) = ∞} não estáem A′, pois precisamos considerar infinitas coordenadas ωk paradecidir se ω ∈ Cv ,∞. Porém

Cv ,∞ =

(Ω−

∪n∈N

Cv ,n

)∈ A.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Voltando ao valor esperado do ganho com o stop:

E(G ) =∞

∑n=1

P(Tv = n)e−ρnv =∞

∑n=1

P(Cv ,n)e−ρnv .

Logo, o primeiro passo para calcular E(G ) é calcular P(Cv ,n).

Esta é a nossa tarefa agora.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Calculando P(Cv ,n):

v > n⇒ P(Cv ,n) = 0,

pois não há como subir mais que n em n passos.

n ≥ 1,v ≤ 0⇒ P(Cv ,n) = 0

pois p0 = 0, i.e. a primeira chegada no 0 ocorre para n = 0.

v ≥ 0⇒ P(Cv ,v ) = pv , (1)

pois para atingir v em v passos temos que subir em todos eles.

0< v < n⇒ P(Cv ,n) = pP(Cv−1,n−1) +qP(Cv+1,n−1) . (2)

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

n

v

p

q

v −1

n−1

v +1

0< v < n⇒ P(Cv ,n) = pP(Cv−1,n−1) +qP(Cv+1,n−1) .

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

0≤ v < n⇒ P(Cv ,n) = pP(Cv−1,n−1) +qP(Cv+1,n−1) .

-n

6v

��������

q

q

q

q

q

q q q q

@@I

a

@@I

@@Ia

a

@@I

@@I

@@I

a

a

a

��

��

��

a

a

a

��

��a

a

��

a

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

0< v < n⇒ P(Cv ,n) = pP(Cv−1,n−1) +qP(Cv+1,n−1) .

P(Cn,n) = pn e P(C0,n) = 0.

Indução mostra que, para 0≤ v ≤ n,

P(Cv ,n) =vn

(n

n+v2

)p

n+v2 q

n−v2 .

v = n:nn

(n0

)pn = pn✓

v = 0:0n

(nn2

)p

n2 q

n2 = 0✓

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Queremos usar

0< v < n⇒ P(Cv ,n) = pP(Cv−1,n−1) +qP(Cv+1,n−1) .

para provar que

P(Cv ,n) =vn

(n

n+v2

)p

n+v2 q

n−v2 .

Indução:

P(Cv ,n) = pv −1n−1

(n−1n+v−2

2

)p

n+v−22 q

n−v2 +q

v +1n−1

(n−1n+v

2

)p

n+v2 q

n−v−22

=

((v −1)

(n−1n+v−2

2

)+ (v +1)

(n−1n+v

2

))p

n+v2 q

n−v2

n−1.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

((v −1)

(n−1n+v−2

2

)+ (v +1)

(n−1n+v

2

))

= (n−1)!

(v −1(n−v

2

)!(n+v−2

2

)!

+v +1(n−v−2

2

)!(n+v

2

)!

)

=(n−1)!(n−v

2

)!(n+v

2

)!

((v −1)

n + v2

+ (v +1)n− v2

)

=1n

(n

n+v2

)(nv − v)

= (n−1)vn

(n

n+v2

).

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Combinando as últimas equações dos dois slides anteriores obtemos

P(Cv ,n) =vn

(n

n+v2

)p

n+v2 q

n−v2 .

c.q.d.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Da última equação concluímos que

E(G ) =∞

∑n=v

vn

(n

n+v2

)p

n+v2 q

n−v2 e−ρnv

ou ainda, fazendo n = v +2k ,

E(G ) = v2e−ρvpv∞

∑k=0

1v +2k

(v +2kv +k

)(pqe−2ρ

)k

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

P(Cv ,n) =vn

(n

n+v2

)p

n+v2 q

n−v2 . (3)

P(Cv ,n) =vn

(pq

)v/2 n!(n+v2

)!(n−v

2

)!

(pq)n/2 .

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Stirling mostra que

n!(n+v2

)!(n−v

2

)!≈ nn√

2π(n+v

2

)(n−v2n

)(n+v2

) n+v2(n−v

2

) n−v2

=2n√

π (n + v)(n−v

2n

)(1+ v

n

) n+v2(1− v

n

) n−v2

≈ 2n√πn 1

2ev2 e−

v2

≈ 2n

√2

πn.

Walter Mascarenhas MAC 5796. Aula 7

Resolução da lista de exercíciosVariância

Variáveis aleatórias independentesStops para o passeio aleatório

Combinando os dois últimos slides obtemos

P(Cv ,n)≈ v(

pq

) v2√

2πn3 (4pq)

n2 .

Walter Mascarenhas MAC 5796. Aula 7