67
Vari´ aveis Aleat´ orias Discretas Ricardo Ehlers [email protected] Departamento de Matem´ atica Aplicada e Estat´ ıstica Universidade de S˜ ao Paulo

Vari aveis Aleat orias Discretasconteudo.icmc.usp.br/pessoas/ehlers/SME0320/discretas.pdf · Podemos de nir uma vari avel aleat oria X como a vari avel ... calcular a probabilidade

Embed Size (px)

Citation preview

Variaveis Aleatorias Discretas

Ricardo [email protected]

Departamento de Matematica Aplicada e EstatısticaUniversidade de Sao Paulo

Introducao

Definicao

Uma variavel aleatoria e uma funcao definida num espaco amostralque assume valores reais.

1

Exemplo. Uma moeda e lancada 3 vezes. Sejam os eventos, C :resultado cara, K : resultado coroa, e as funcoes X : o numero decaras e Y : o numero de faces iguais.

valores de X valores de Y

CCC 3 3CCK 2 2CKC 2 2KCC 2 2KKC 1 2KCK 1 2CKK 1 2KKK 0 3

2

Definicao

Uma variavel aleatoria discreta X assume valores x1, x2, . . . em umconjunto finito ou infinito enumeravel.

• Neste caso, probabilidades sao calculadas como somas,

P(X ∈ A) =∑xi∈A

P(X = xi ),

para um conjunto A qualquer.

• Para distribuicoes discretas de probabilidade tambem e semprepossıvel mostrar que

∞∑i=1

P(X = xi ) = 1.

3

No exemplo anterior, assumindo que a moeda e honesta e oslancamentos sao independentes todos os resultados do espacoamostral tem probabilidade 1/8. Por exemplo,

P(CCK ) = P(C )P(C )P(K ) =1

2

1

2

1

2=

1

8.

Distribuicao de probabilidades da variavel aleatoria X ,

Valores de X Probabilidades

3 0.1252 0.3751 0.3750 0.125

4

P(X = 3) = P(CCC ) =1

8

P(X = 2) = P(CCK ) + P(CKC ) + P(KCC ) =3

8

P(X = 1) = P(CKK ) + P(KKC ) + P(KCK ) =3

8

P(X = 0) = P(KKK ) =1

8

5

A partir da distribuicao de X outras probabilidades podem sercalculadas,

P(X ≥ 2) = P(X = 2) + P(X = 3) =3

8+

1

8=

1

2

P(X ≤ 2) = P(X = 2) + P(X = 1) + P(X = 0)

=3

8+

3

8+

1

8=

7

8

P(X < 2) = P(X = 1) + P(X = 0)

=3

8+

1

8=

4

8

6

Funcao de Distribuicao

Funcao de Distribuicao

Definicao

O equivalente teorico ao conceito de frequencias acumuladas e afuncao de distribuicao acumulada ou simplesmente funcao dedistribuicao definida como,

F (x) = P(X ≤ x) =∑xi≤x

P(X = xi ), ∀x ∈ R.

7

Exemplo. Uma moeda honesta e lancada 3 vezes de formaindependente e X representa o numero de caras.

F (x) =

0, x < 0,0.125, 0 ≤ x < 1,0.5, 1 ≤ x < 2,0.875, 2 ≤ x < 3,1, x ≥ 3.

8

Representacao grafica.

−2 −1 0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x

)

9

Para uma variavel aleatoria discreta X que assume valoresx1, x2, . . .

F (x) =∑i :xi≤x

P(X = xi ).

10

Exemplo. Seja a variavel aleatoria X tal que,

F (x) =

0, x < 0,0.5, 0 ≤ x < 1,0.6, 1 ≤ x < 2,0.85, 2 ≤ x < 3,1, x ≥ 3.

P(X = 0) = F (0) = 0.5,

P(X = 1) = F (1)− F (0) = 0.10,

P(X = 2) = F (2)− F (1) = 0.25,

P(X = 3) = F (3)− F (2) = 0.15,

11

−2 −1 0 1 2 3 4 5

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x

)

12

Principais Modelos Discretos

Principais Modelos Discretos

• Estudaremos alguns modelos teoricos que se adequam a umaserie de problemas praticos.

• Estes modelos envolvem parametros cujo conhecimento enecessario para calcular probabilidades.

• Na maioria dos problemas reais os parametros seraodesconhecidos e sera preciso fazer algum tipo de inferenciasobre eles.

• Por enquanto assumiremos que os parametros sao conhecidos.Vamos nos concentrar nas principais caracterısticas dosmodelos apresentados.

13

A distribuicao Uniforme Discreta

Suponha um experimento com um numero finito de possıveisresultados e cada um deles com a mesma probabilidade de ocorrer.

Defina uma variavel aleatoria X cujos possıveis valores {x1, . . . , xk}estao associados aos resultados deste experimento. Entao,

P(X = xi ) =1

k, i = 1, . . . , k.

14

A distribuicao de Bernoulli

• Em muitos experimentos os possıveis resultados apresentamou nao uma determinada caracterıstica.

• Esta caracterıstica sera muitas vezes determinada pelopesquisador dependendo dos objetivos do experimento.

• Neste tipo de experimento estaremos interessados naocorrencia de um sucesso ou falha.

• E usual denotar a probabilidade de sucesso por p,

P(sucesso) = p P(fracasso) = 1− p.

15

Podemos definir uma variavel aleatoria X como a variavelindicadora de sucesso em um experimento binario,

X =

{1, se ocorre sucesso0, se ocorre fracasso

e a probabilidade de X assumir cada um dos seus possıveis valores e

P(X = x) =

{px(1− p)1−x se x = 0, 1

0 caso contrario.

Dizemos que X tem distribuicao de Bernoulli com parametro p ouequivalentemente,

X ∼ Bernoulli(p), 0 < p < 1.

16

A distribuicao Binomial

• Suponha que n experimentos (ou ensaios) independentes, saoexecutados, sendo n fixo.

• Cada experimento resulta num sucesso com probabilidade pou numa falha com probabilidade 1− p.

• O experimento consiste na observacao das variaveis aleatoriasX1, . . . ,Xn onde Xi ∼ Bernoulli(p), i = 1, . . . , n.

• Frequentemente estaremos interessados no numero total desucessos obtidos, independente da ordem em que eles ocorrem.

• Por exemplo, uma moeda e lancada 10 vezes e o numero totalde caras e contado (aqui “cara” e um sucesso).

17

O numero total de sucessos e,

Y =n∑

i=1

Xi ,

cujos possıveis valores sao 0, 1, . . . , n.

Dizemos que Y e uma variavel aleatoria com distribuicao binomialcom parametros n e p, ou

Y ∼ Binomial(n, p).

18

As probabilidades de cada um destes possıveis valores sao dadaspor

P(Y = k) =

(n

k

)pk(1− p)n−k , k = 0, 1, . . . , n (1)

sendo (n

k

)=

n!

k!(n − k)!

e m! =∏m

i=1 i e o fatorial de m (define-se 0! = 1).

19

Probabilidades Binomiais com n = 5

x

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0 1 2 3 4 5

p = 0.2 p = 0.5

p = 0.7

0 1 2 3 4 5

0.0

0.1

0.2

0.3

0.4

0.5

0.6

p = 0.9

20

Probabilidades Binomiais com n = 20

x

0.00

0.05

0.10

0.15

0.20

0.25

0 5 10 15 20

p = 0.2 p = 0.5

p = 0.7

0 5 10 15 20

0.00

0.05

0.10

0.15

0.20

0.25

p = 0.9

21

Probabilidades Binomiais com n = 100

x

0.00

0.05

0.10

0 20 40 60 80 100

p = 0.2 p = 0.5

p = 0.7

0 20 40 60 80 100

0.00

0.05

0.10

p = 0.9

22

Exemplo. Em uma linha de montagem estima-se que a proporcaode itens defeituosos e aproximadamente 0.1.

• Assume-se que esta proporcao e (aproximadamente) constanteao longo do processo,

• 20 itens sao selecionados de forma independente,

• calcular a probabilidade de no maximo 2 itens defeituosos.

23

Definindo a variavel aleatoria Y : numero de itens defeituosospodemos calcular P(no maximo 2 itens defeituosos) como,

P(Y ≤ 2) = P(Y = 0) + P(Y = 1) + P(Y = 2)

=

(20

0

)0.10 0.920 +

(20

1

)0.11 0.919 +

(20

2

)0.12 0.918

= 0.1216 + 0.2702 + 0.2852 = 0.677.

24

Experimentos nao binomiais

• Lancar um dado ate que apareca o numero 6. (Numero derepeticoes nao e fixo).

• Testar itens em um lote ate encontrar 5 defeituosos.

• De um conjunto de 20 prontuarios de pacientes dos quais 5sofreram infarto sortear 3 sem reposicao e contar quantossofreram infarto.

• De um lote de itens manufaturados retirar 15 itens semreposicao e verificar quantos sao defeituosos e naodefeituosos. (Ensaios nao sao independentes).

• Calcular a probabilidade de ganhar na Mega-Sena (apostadorescolhe 7 dezenas dentre 60).

25

Distribuicao Geometrica

• Suponha que ensaios de Bernoulli sao realizados de formaindependente e com a mesma probabilidade de sucesso (p).

• Seja X o numero de ensaios necessarios antes de ocorrerprimeiro sucesso. Por exemplo,

• Numero de inspecoes necessarias antes de encontrar-se umitem defeituoso em um lote.

• Numero de nascimentos antes de nascer um menino.

26

Dizemos que X tem distribuicao Geometrica com parametro p,

X ∼ Geometrica(p), 0 < p < 1.

Se X = k os k primeiros ensaios resultam em fracasso (comprobabilidade 1− p) e o ultimo ensaio resulta em sucesso (comprobabilidade p). Entao,

P(X = k) = pk∏

i=1

(1− p) = (1− p)kp, k = 0, 1, 2, . . .

Verifique que

∞∑k=0

P(X = k) =∞∑k=0

(1− p)kp = 1

27

Probabilidades Geometricas

x

0.0

0.2

0.4

0.6

0.8

0 5 10 15 20

p = 0.2 p = 0.5

p = 0.7

0 5 10 15 20

0.0

0.2

0.4

0.6

0.8

p = 0.9

28

Exemplo. Um motorista ve uma vaga de estacionamento em umarua. Ha cinco carros na frente dele, e cada um deles temprobabilidade 0.2 de tomar a vaga. Qual a probabilidade de a vagaser tomada pelo carro que esta imediatamente a frente dele?

• Defina a variavel aleatoria X como o numero de carros quepassam pela vaga antes que ela seja tomada.

• Assume-se que cada motorista toma a vaga ou nao de formaindependente.

• Calcule a probabilidade,

P(X = 4) = (0.8)4 0.2 = 0.08192.

29

Falta de memoria

Se X e uma variavel aleatoria com distribuicao Geometrica,

P(X ≥ j + k|X ≥ j) = P(X ≥ k).

Esta e a unica distribuicao discreta com esta propriedade.

Definicao alternativa

Seja Y o numero de ensaios ate ocorrer o primeiro sucesso. Entao,Y = X + 1, e

P(Y = j) = (1− p)j−1p, j = 1, 2, . . .

30

Distribuicao Binomial Negativa

Seja X o numero de ensaios de Bernoulli independentes antes deocorrerem r sucessos.

X tem distribuicao binomial negativa com parametros r e p ,denotando-se

X ∼ BN(r , p).

Sua funcao de probabilidade e dada por,

P(X = k) =

(r + k − 1

k

)pr (1− p)k , k = 0, 1, 2, . . .

com r ≥ 1 e 0 < p < 1.

31

Probabilidades Binomiais negativas com r = 2.

x

0.0

0.2

0.4

0.6

0.8

0 5 10 15 20

p = 0.2 p = 0.5

p = 0.7

0 5 10 15 20

0.0

0.2

0.4

0.6

0.8

p = 0.9

32

Probabilidades Binomiais negativas com r = 6.

x

0.0

0.1

0.2

0.3

0.4

0.5

0 10 20 30 40

p = 0.2 p = 0.5

p = 0.7

0 10 20 30 40

0.0

0.1

0.2

0.3

0.4

0.5

p = 0.9

33

Distribuicao de Poisson

Usada para modelar o numero de ocorrencias de um certofenomeno, durante um intervalo fixo de tempo ou regiao fixa doespaco. Exemplos,

• o numero de chamadas recebidas por uma central telefonicapor hora,

• o numero de defeitos por unidade de comprimento de uma fitamagnetica,

• o numero de nmetoides encontrados por unidade de superficiede solo,

• o numero diario de novos casos de cancer de mama, etc.

34

Seja a variavel aleatoria X o numero de ocorrencias por intervalofixo (de tempo ou espaco).

Dizemos que X tem distribuicao de Poisson com parametro λ,

X ∼ Poisson(λ), λ > 0,

com funcao de probabilidade,

P(X = k) =λke−λ

k!, k = 0, 1, 2, . . .

35

Probabilidades Poisson com λ ∈ {1, 2, 5, 15}.

x

0.0

0.1

0.2

0.3

0 5 10 15 20 25 30

lambda = 1 lambda = 15

lambda = 2

0 5 10 15 20 25 30

0.0

0.1

0.2

0.3

lambda = 5

36

• A constante λ pode ser interpretada como o numero esperado(ou numero medio) de ocorrencias por unidade de tempo ouespaco.

• Verifique que∞∑k=0

P(X = k) = 1.

37

Exemplo. O numero de partıculas radioativas emitidas em cadaintervalo de 5 segundos tem distribuicao de Poisson e sabe-se queem media 2 partıculas sao emitidas por intervalo. Se foremobservados 10 intervalos de tempo qual a probabilidade de que emcada um deles menos de 3 partıculas sejam emitidas?

38

• Defina a variavel aleatoria X como o numero de partıculasemitidas por intervalo sendo que o numero medio de emissoese λ = 2.

• Portanto X tem distribuicao de Poisson com parametro iguala 2 e queremos calcular P(X < 3),

P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2)

=20e−2

0!+

21e−2

1!+

22e−2

2!= 0.1351 + 0.2707 + 0.2707 = 0.6767.

• Esta e a probabilidade de emissao de menos de 3 partıculasem um intervalo de tempo. Portanto, para 10 intervalos aprobabilidade sera 0.676710 = 0.0201.

39

Exemplo. O numero medio de gols em jogos de copa do mundo eaproximadamente 2.5 gols por jogo. Assumindo que o modelo dePoisson seja adequado e sendo X o numero de gols em umapartida,

k P(X = k)

0 0.0821 0.2052 0.2573 0.2134 0.1335 0.0676 0.0287 0.0108 0.003

40

Exemplo. Pacientes sao admitidos em uma unidade de tratamentointensivo (UTI) e deseja-se modelar o numero de dias que ospacientes permanecem na UTI. O modelo Poisson e adequado?

A distribuicao de Poisson nao e adequada pois o numero de diasnao pode ser zero.

Se X e o numero de dias na UTI poderiamos usar uma distribuicaode Poisson truncada em zero. Deseja-se calcular, P(X = k|X > 0).

41

Distribuicao Hipergeometrica

Considere um experimento que resulta em ensaios de Bernoullidependentes. Uma forma de induzir dependencia consiste emamostrar sem reposicao de uma populacao finita.

Suponha que temos uma amostra e uma populacao tais que,

• Populacao: tem M elementos do tipo I, N −M do tipo II.

• Amostra: k elementos do tipo I, n − k do tipo II.

Suponha que itens sao sorteados sem reposicao.

Seja a variavel aleatoria X o numero de elementos do tipo I naamostra.

42

Dizemos que X tem distribuicao hipergeometrica com funcao deprobabilidade,

P(X = k) =

(Mk

)(N−Mn−k

)(Nn

)k = 0, 1, . . . ,min(M, n).

43

Probabilidades Hipergeometricas com N = 500 e n = 100.

x

0.00

0.05

0.10

0.15

0 20 40 60 80

M = 50 M = 60

M = 70

0 20 40 60 80

0.00

0.05

0.10

0.15

M = 80

44

Probabilidades Hipergeometricas com N = 500 e n = 300.

x

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0 20 40 60 80

M = 50 M = 60

M = 70

0 20 40 60 80

0.00

0.02

0.04

0.06

0.08

0.10

0.12

M = 80

45

Probabilidades Hypergeometricas com N = 500 e n = 300.

x

0.00

0.02

0.04

0.06

0.08

0 50 100

M = 100 M = 120

M = 130

0 50 100

0.00

0.02

0.04

0.06

0.08

M = 140

46

• Se n = 1 entao k = 0 ou k = 1,

P(X = 1) =

(M1

)(N−M0

)(N1

) =M

N

X ∼ Bernoulli(M/N)

• Se os itens forem sorteados com reposicao,

X ∼ Binomial

(n,

M

N

).

47

Exemplo. Um fabricante garante que produz 10% de itensdefeituosos. De um lote com 100 itens serao selecionados 5 aoacaso, sem reposicao. Qual a probabilidade de nenhum serdefeituoso?

Populacao: N = 100, M = 10 (itens defeituosos)

Amostra: n = 5, k = 0

X : numero de defeituosos na amostra.

P(X = 0) =

(100

)(905

)(1005

) ≈ 0.584

48

Medidas de Posicao e Dispersao

Medidas de Posicao para Variaveis Aleatorias Discretas

Seja uma variavel aleatoria discreta X que assume valoresx1, x2, . . .

• A esperanca matematica denotada por E (X ) e dada por,

E (X ) = x1P(X = x1) + x2P(X = x2) + · · · =∞∑i=1

xiP(X = xi ).

49

• A mediana de X e o valor Md que satisfaz as seguintescondicoes,

P(X ≥ Md) ≥ 1/2

P(X ≤ Md) ≥ 1/2

• Se as desigualdades sao satisfeitas num certo intervalo amediana sera o ponto medio do intervalo.

• A moda (Mo) e o valor (ou valores) de X que tem maiorprobabilidade de ocorrencia,

P(X = Mo) = max{p1, p2, . . . }

50

Exemplo. Sejam as variaveis aleatorias X e Y com asdistribuicoes de probabilidade abaixo.

X P(X=x) Y P(Y=y)

3 1/8 -3 4/92 3/8 -1 1/91 3/8 0 2/90 1/8 2 2/9

51

Os valores esperados de X e Y sao,

E (X ) = 0× 1/8 + 1× 3/8 + 2× 3/8 + 3× 1/8

= 12/8 = 1.5

E (Y ) = −3× 4/9− 1× 1/9 + 0× 2/9 + 2× 2/9

= −9/9 = −1

52

Transformacoes lineares

No exemplo anterior seja Z = 5X − 10 cuja distribuicao e,

Z P(Z=z)

5 1/80 3/8

-5 3/8-10 1/8

E (Z ) = 5× 1/8 + 0× 3/8− 5× 3/8− 10× 1/8 = −2.5

= 5E (X )− 10

53

Variancia de uma variavel aleatoria discreta

Definicao. A variancia de X e a media ponderada dos desviosquadraticos de seus valores em relacao a sua media.

Var(X ) = σ2X =

∞∑i=1

(xi − E (X ))2P(X = xi )

• A variancia e um valor esperado,

Var(X ) = E (X − E (X ))2 = E (X 2)− [E (X )]2

=∞∑i=1

x2i P(X = xi )− [E (X )]2

54

Para transformacoes lineares Z = aX + b valem as propriedades,

E (Z ) = aE (X ) + b

Var(Z ) = a2Var(X )

55

Exemplo. Seja X com distribuicao Bernoulli de parametro p.Entao,

E (X ) = p

E (X 2) = p

Var(X ) = p(1− p)

56

Exemplo. Seja X com distribuicao Poisson de parametro λ.Entao,

E (X ) =∞∑k=0

kλke−λ

k!= λe−λ

∞∑k−1=0

λk−1

(k − 1)!= λ

Var(X ) = λ

Portanto,E (X ) = Var(X ) = λ > 0.

57

Exemplo. Seja uma variavel aleatoria que representa o numero dereservas por hora em uma agencia online. Historicamente a agenciatem recebido aproximadamente 15 reservas por hora em mediacom desvio padrao igual a 2.5.

O modelo Poisson nao e adequado pois este assume queE (X ) = Var(X ).

58

Exemplo. Seja X com distribuicao Poisson truncada em zero eparametro λ. Entao,

P(X = k|X > 0) =1

P(X > 0)

λke−λ

k!

=1

1− P(X = 0)

λke−λ

k!

=1

1− e−λλke−λ

k!

E (X ) =λ

1− e−λ

Var(X ) = E (X )(1 + λ− E (X ))

59

Exemplo. Seja X com distribuicao Binomial de parametros n e p.Entao,

E (X ) = np

Var(X ) = np(1− p)

60

Exemplo. Seja X com distribuicao Geometrica de parametro p.Entao,

E (X ) =1− p

p

Var(X ) =1− p

p2

61

Exemplo. Seja X com distribuicao Binomial Negativa eparametros r e p. Entao,

E (X ) = r1− p

p

Var(X ) = r1− p

p2

62