27
Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica Prof. Walmes M. Zeviani Departamento de Estatística Universidade Federal do Paraná Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica

Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Distribuições discretas:Geométrica, Binomial Negativa e Hipergeométrica

Prof. Walmes M. Zeviani

Departamento de EstatísticaUniversidade Federal do Paraná

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 1

Page 2: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Conteúdo

Neste vídeoI Modelos probabilísticos discretos

adicionais.I Geométrica.I Binomial Negativa.I Hipergeométrica.

I Fundamentação e propriedades.I Exemplos de aplicação.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 2

Page 3: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Distribuição Geométrica

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 3

Page 4: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Características de uma v.a. com distribuição Geométrica

Um experimento aleatório consiste em fazer tentativasde Bernoulli, de modo que

1. As tentativas sejam independentes.2. Cada tentativa apresente apenas um de dois

resultados possíveis (0: fracasso ou 1: sucesso).3. A probabilidade de um sucesso em cada tentativa,0 < p < 1, é constante.4. Seja Y a variável aleatória que conta o número de

tentativas feitas até o primeiro sucesso.5. Definida nestas condições, Y tem distribuição

Geométrica com parâmetro p.

Figura 1. Cena de um jogo debets. Extraído degazetadopovo.com.br.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 4

Page 5: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Distribuição GeométricaA variável aleatória Y tem distribuição geométrica de parâmetro 0 < p < 1 se sua funçãode probabilidades é dada por alguma das duas parametrizações a seguir.

1) Parametrização do número detentativas

p(y) = (1− p)y−1 · p,y ∈ {1, 2, . . .}.

Essa parametrização apresenta:I µ = E(Y ) = 1

p .

I σ 2 = V(Y ) = 1−pp2 .

2) Parametrização do número defracassos

p(y) = (1− p)y · p,y ∈ {0, 1, . . .}.

Essa parametrização apresenta:I µ = E(Y ) = 1−p

p .

I σ 2 = V(Y ) = 1−pp2 .

Denotamos por Y ∼ Geom(p).Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 5

Page 6: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Gráfico da distribuição Geométrica

p = 0.5 p = 0.75 p = 0.9

p = 0.05 p = 0.1 p = 0.25

2.5 5.0 7.5 10.0 2.5 5.0 7.5 10.0 2.5 5.0 7.5 10.0

0.00

0.05

0.10

0.15

0.20

0.25

0.00

0.25

0.50

0.75

0.000

0.025

0.050

0.075

0.100

0.0

0.2

0.4

0.6

0.00

0.01

0.02

0.03

0.04

0.05

0.0

0.1

0.2

0.3

0.4

0.5

Valores de Y

Prob

abili

dade

Figura 2. Gráficos para a distribuição Geométrica na parametrização de número de tentativas.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 6

Page 7: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Propriedade da falta de memória

I Uma das propriedades da distribuição geométrica éa falta de memória, segundo a qual

P(Y > y+a|Y > a) = P(Y > y), para qualquer a > 0.I Assim, sob distribuição geométrica, a probabilidade

de sucesso para a próxima tentativa após ter feitoa = 10 tentativas é a mesma se já tivesse feitoa = 100 tentativas ou após a primeira tentativa(a = 1).

Figura 3. Máquinas de aposta emum cassino. Foto dehttps://www.needpix.com/.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 7

Page 8: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Exemplo: algorítmo para quebrar CAPTCHA

Uma estatística precisa consultar informações públicasdisponibilizadas em um site governamental que é pro-tegido com um sistema de CAPTCHA. Para isso, ela pro-gramou um algorítmo baseado em OCR (optical characterrecognition) que resolve corretamente as CAPTCHAS comp = 0.5.

1. Qual a probabilidade de quebrar a CAPTCHA nasegunda tentativa?

2. Se o site tiver uma regra de bloquear o acesso após7 ou mais tentativas erradas, para evitar ação derobô, qual a chance dela ser bloqueada?

Figura 4. Exemplo de CAPTCHA.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 8

Page 9: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Solução

1. Usando a função de probabilidade, tem-se

p(2) = (1− 0.5)2−1 · 0.5 = 0.250.2. Aplicando a fórmula, obtem-se pela regra do complementar

P(Y ≥ 7) = 1− P(Y < 7) = 1− 7−1∑y=1(1− p)y−1 · p

= 1− (p(1) + · · ·+ p(6))= 0.016.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 9

Page 10: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Distribuição Binomial Negativa

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 10

Page 11: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Características de uma v.a. com distribuição Binomial NegativaÉ uma generalização da distribuição Geométrica.

Um experimento aleatório consistem em fazer tentativasde Bernoulli, de modo que

1. As tentativas sejam independentes.2. Cada tentativa apresente apenas um de dois

resultados possíveis (0: fracasso ou 1: sucesso).3. A probabilidade de um sucesso em cada tentativa,0 < p < 1, é constante.4. Seja Y a variável aleatória que conta o número de

tentativas feitas até r-ésimo sucesso.5. Definida nestas condições, Y tem distribuição

Binomial Negativa com parâmetros p e r.6. Quando r = 1, obtém-se a distribuição Geométrica.

Figura 5. Dardos em um alvo.Foto de Hasan Albari no Pexels.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 11

Page 12: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Distribuição Binomial NegativaA variável aleatória Y tem distribuição Binomial Negativa com parâmetros r > 0 e0 < p < 1 se sua função de probabilidades é dada por alguma das duas parametrizaçõesa seguir.

1) Parametrização do número detentativas

p(y) = (y− 1r − 1

)· (1− p)y−r · pr ,

y ∈ {r, r + 1, r + 2, . . .}.Essa parametrização apresenta:

I µ = E(Y ) = rp .

I σ 2 = V(V ) = r·(1−p)p2 .

2) Parametrização do número defracassos

p(y) = (r + y− 1y

)· (1− p)y · pr ,

y ∈ {0, 1, 2, . . .}.Essa parametrização apresenta:

I µ = E(Y ) = pr1−p .I σ 2 = V(Y ) = pr(1−p)2 .

Denotamos por Y ∼ BNeg(r, p).Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 12

Page 13: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Gráfico da distribuição Binomial Negativap = 0.3 p = 0.5 p = 0.75 p = 0.9

r=

1r

=3

r=

5

5 10 15 20 5 10 15 20 5 10 15 20 5 10 15 20

0.00

0.25

0.50

0.75

0.00

0.25

0.50

0.75

0.00

0.25

0.50

0.75

Valores de Y

Prob

abili

dade

Figura 6. Gráficos para a distribuição Binomial Negativa com a parametrização do número de tentativas.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 13

Page 14: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Exemplo: vitórias no vídeo gameUm jogador de vídeo game é confrontado com uma sériede oponentes independentes em um jogo online. Dadasua experiência, ele tem 25% de chance de perder paraum oponente. O jogador contínua a enfrentar oponentesaté perder 3 vezes para então o jogo encerrar. O resul-tado com cada oponente é independente de confrontosprévios.

1. Qual a probabilidade de sair do jogo sem umavitória?

2. Qual a probabilidade de enfrentar 5 oponentes parasair do jogo?

3. Qual o número esperado de oponentes em um jogo? Figura 7. Jogo de futebol no vídeogame. Foto de EVG Culture noPexels.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 14

Page 15: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Solução

1. Fazendo uso da função de probabilidade, tem-se

p(3) = (3− 13− 1)· (1− 0.25)3−3 · 0.253 = 0.253 = 0.016.

2. Novamente, aplicando a função de probabilidade

p(5) = (5− 13− 1)· (1− 0.25)5−3 · 0.253 = 0.053.

3. O número médio de oponentes usa a expressão para o valor esperado

µ = r/p = 3/0.25 = 12.Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 15

Page 16: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Relações com a Binomial NegativaI A distribuição Binomial Negativa tem importante aplicação como alternativa à

distribuição de Poisson na modelagem de número de eventos por unidade detempo, espaço, etc.

I Observe a dualidade entre Binomial e Binomial Negativa. Na primeira, o número detentativas é fixo e a v.a. é o número de sucessos. Na segunda, o número de sucessosé fixo e a v.a. é o número de tentativas.

I Como visto, a distribuição Geométrica é caso particular da distribuição BinomialNegativa quando r = 1.

I Pela propriedade da falta de memória da Geométrica, a distribuição BinomialNegativa pode ser obtida considerando a soma de r v.a. independentes dedistribuição Geométrica de parâmetro p (soma das tentativas),

YBN = Y1 + · · ·+ Yr , Yi ∼ Geo(p), entãoYBN ∼ BNeg(r, p).

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 16

Page 17: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Distribuição Hipergeométrica

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 17

Page 18: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Características de uma v.a. com distribuição Hipergeométrica

I Considere o experimento aleatório de retirar semreposição r > 0 elementos de um conjunto dem+ n elementos em que m > 0 são de um tipo(sucesso) e n > 0 de outro (fracasso).

I Considere todos os elementos têm igualprobabilidade de serem retirados.

I Defina Y como o número de elementos de um tipo,e.g. sucesso, contidos na amostra retirada.

I Sob essas condições, Y tem distribuiçãohipergeométrica com parâmetros m, n e r.

Figura 8. Cartas de um baralho.Foto de Midhun Joy no Pexels.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 18

Page 19: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Usos da Hipergeométrica

I Uma das principais aplicação da distribuiçãohipergeométrica é em situações envolvendoamostragem aleatória simples sem reposição.

I Na área de Controle Estatístico de Qualidade,aplica-se em problemas de amostragem deaceitação de lotes.

I Uma aplicação bastante interessante é naestimação de tamanho de população usandocaptura e recaptura, como visto no vídeo demotivação desta Unidade Didática.

I Na pesca: tamanho de cardumes ou estoquepesqueiro.

I Na segurança pública: determinar o número depessoas participando de manifestações populares.

Figura 9. Pescador puxando arede. Foto de Quang Nguyen Vinhno Pexels.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 19

Page 20: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Distribuição HipergeométricaUma variável aleatória Y tem distribuição hipergeométrica de parâmetros m, n e r se suafunção de probabilidades é dada por

p(y) =(my

)·(

nr − y

)(m+ nr

) , y ∈ {max(0, r − n), · · · ,min(r, m)}.Denotamos por Y ∼ Hip(m, n, r).A v.a. Hipergeométrica tem média e variância dadas por

I µ = E(Y ) = rp em que p = mm+n .

I σ 2 = V(Y ) = rp(1− p)( (m+n)−r(m+n)−1).

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 20

Page 21: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Gráfico da distribuição Hipergeométricam = 10 m = 20 m = 30 m = 40 m = 50

r=

5r

=20

r=

30

0 10 20 30 0 10 20 30 0 10 20 30 0 10 20 30 0 10 20 30

0.00.10.20.30.4

0.00.10.20.30.4

0.00.10.20.30.4

Valores de Y

Prob

abili

dade

n = 30

Figura 10. Gráficos para a distribuição Hipergeométrica.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 21

Page 22: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Exemplo: questões no Moodle

No ambiente virtual de aprendizado Moodle, uma profes-sora pode selecionar ao acaso sentenças para apresentaruma questão de verdadeiro e falso. Suponha que para umassunto, ela tenha 30 sentenças ao todo, das quais 10 sãofalsas.

1. Qual a probabilidade de um aluno receber na provauma questão com 6 sentenças e todas serem falsas(e o aluno não ter o que marcar)?

2. Qual a probabilidade de ter 3 verdadeiras e 3 falsas?3. Qual o número médio de questões falsas na prova?

Figura 11. Uma questão deverdadeiro ou falso.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 22

Page 23: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Solução

1. Faz-se o uso da função de probabilidade,

p(6) = (106 ) · ( 206−6)(10+206 ) = 3.5366932× 10−4.2. Idem ao anterior,

p(3) = (103 ) · ( 206−3)(10+206 ) = 0.23.3. Usa-se a expressão da esperança matemática,

µ = mrm+ n = 10610 + 20 = 2.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 23

Page 24: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Relação entre Binomial e HipergeométricaSejam Y1 ∼ Bin(r, p) e Y2 ∼ Hip(m, n, r). Sabe-se pelas expressões que

E(Y1) = E(Y2) = rp, sendo p = rmm+ n e N = m+ n.

V(Y2) = V(Y1)(N − rN − 1) = rp(1− p)(N − rN − 1

)︸ ︷︷ ︸(1)

A medida que N � r, tem-se que(N−rN−1) ≈ 1 e com isso V(Y2) = V(Y1). O termo (1) é

conhecido como fator de correção para população finita.

O que isso significa na prática?

Que a distribuição Binomial pode ser usada como alternativa à distribuiçãoHipergemométrica, de forma a aproximá-la para o cálculo de probabilidades, quando otamanho da população é muito grande (N →∞).

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 24

Page 25: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Considerações finais

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 25

Page 26: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Distribuições discretas adicionaisModelos adicionais

I Existem muitos modelosprobabilísticos discretos.

I Vários são generalizações dosmodelos apresentados.

I Outros são construções considerandooutras premissas ou necessidades.

I Modelos probabilísticos fazemsuposições que podem ser limitantesou frágeis em certos contextos.

I O emprego adequado de umadistribuição em uma situação prática éfundamental para a utilidade dosresultados obtidos.

Alguns modelosI Lei de Benford.I Beta-binomial.I Poisson-binomial.I Poisson generalizada.I COM-Poisson.I Gamma Count.I Hipergeométrica não central de

Fisher.I Hipergeométrica não central de

Wallenius.I E outros.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 26

Page 27: Distribuições discretas: Geométrica, Binomial Negativa e …paulojus/estbas/slides/403_modelos... · 2021. 5. 2. · 1.Qual a probabilidade de quebrar a CAPTCHA na segunda tentativa?

Considerações finais

Neste vídeoI Modelos probabilísticos discretos

adicionais.I Geométrica.I Binomial Negativa.I Hipergeométrica.

I Fundamentação e propriedades.I Exemplos de aplicação.

Prof. Walmes M. Zeviani Distribuições discretas: Geométrica, Binomial Negativa e Hipergeométrica 27