39
Distribuições de Probabilidade Frases “Uma probabilidade razoável é a única certeza” Samuel Howe “A experiência não permite nunca atingir a certeza absoluta. Não devemos procurar obter mais que uma probabilidade .” Bertrand Russel Roteiro 1. Distribuições de Probabilidade 2. Aproximação da Binomial 3. Geração de Números Aleatórios 4. Ajuste de Distribuições 5. Referências

Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

1

Distribuições de Probabilidade

Frases

“Uma probabilidade razoável é a única certeza”Samuel Howe

“A experiência não permite nunca atingir a certeza absoluta. Não devemos procurar obter mais que uma probabilidade .”

Bertrand Russel

Roteiro

1. Distribuições de Probabilidade2. Aproximação da Binomial3. Geração de Números Aleatórios4. Ajuste de Distribuições5. Referências

Page 2: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

2

Distribuições de Probabilidade

Funcionalidades

Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições de probabilidade:√ Probabilidade no ponto (distribuição discreta)√ Densidade de probabilidade no ponto (distribuição

contínua)√ Função de distribuição acumulada no ponto√ Quantil correspondente a uma probabilidade

Calc > Probability Distributions è

Page 3: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

3

Distribuições Discretas

Minitab:• Binomial• Hipergeométrica• Discreta• Inteira• Poisson

Outras:• Binomial Negativa• Geométrica• Bernoulli

Probabilidade no ponto(s)

Probabilidade acumulada

Quantil referente a uma probabilidade

{ }kXP =

{ }kXP ≤

{ } paXP =≤

Valores de entrada

Distribuições Discretas – Comandos

Distribuição Binomial

• Notação:

• Função de probabilidade:

• Esperança:

• Variância:

),(~ pnbinomialX

np

)1( pnp −

{ } knk pppn

kXP −−

== )1(

Page 4: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

4

Distribuição Binomial – Exemplo

Montar tabela com os valores de distribuição binomial com parâmetros n = 30 e p = 0,4

• Para gerar os valores dos pontos (k):

Calc > Make Patterned Data > Simple Set of Numbersè

Valores de k

Binomial – Probabilidades no Ponto

Parâmetros

Valores de entrada

Valores de saída

Binomial – Probabilidades Acumuladas

Parâmetros

Valores de entrada

Valores de saída

Page 5: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

5

Binomial (30; 0,4) – Tabelak P(X=k) P(X<=k)0 0,000 0,0001 0,000 0,0002 0,000 0,0003 0,000 0,0004 0,001 0,0025 0,004 0,0066 0,012 0,0177 0,026 0,0448 0,050 0,0949 0,082 0,17610 0,115 0,29111 0,140 0,43112 0,147 0,57813 0,136 0,71514 0,110 0,82515 0,078 0,90316 0,049 0,95217 0,027 0,97918 0,013 0,99219 0,005 0,99720 0,002 0,99921 0,001 1,00022 0,000 1,00023 0,000 1,000

Gráfico da Função de Probabilidade

Graph > Scatter Plot > Single è

Binomial (30; 0,4) – Gráfico Função de Probabilidade

k

P(X

=k)

302520151050

0,16

0,14

0,12

0,10

0,08

0,06

0,04

0,02

0,00

Função de Probabilidade - Binomial (30, 0,4)

Page 6: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

6

Quantis da binomial(30; 0,4) para 0,056; 0,058; 0,060; ... ; 0,0672

• Para gerar os valores das probabilidades

Quantis

Calc > Make Patterned Data > Simple Set of Numbersè

Valores de probabilidade

• Cálculo dos quantis

Parâmetros

Valores de entrada

Valores de saída

Binomial (30; 0,4) – Tabela de Quantisp quantil

0,056 80,058 80,060 80,062 80,064 80,066 80,068 80,070 80,072 80,074 80,076 80,078 80,080 80,082 80,084 80,086 80,088 80,090 80,092 80,094 80,096 90,098 90,100 90,102 9

{ } paXP =≤

Page 7: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

7

Distribuições Contínuas

• Qui-quadrado• Normal• F• t de Student• Uniforme

• Beta• Exponencial• Gama• Valor extremo• Lognormal• Logística• Weibull• outras

Probabilidade no ponto(s)

Probabilidade acumulada

Quantil referente a uma probabilidade

{ }kXP =

{ }kXP ≤

{ } paXP =≤

Valores de entrada

Distribuições Discretas – Comandos

Distribuição Normal

• Notação: X ~ N(µ, s 2)

• Função de densidade:

• Esperança: µ

• Variância: s 2

−=2

21

exp21

)(σ

µσπ

xxf

Page 8: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

8

Cálculo de Probabilidades

• Para valores únicos, são mais fáceis de serem obtidos através da janela Session:√ Editor > Enable Commands

• Para cálculo de densidade:PDF valor do quantil;nome distribuição parâmetro 1 parâmetro 2.

• Para cálculo da função de distribuição acumuladaCDF valor do quantil;nome distribuição parâmetro 1 parâmetro 2.

• Para cálculo de quantil:InvCDF valor da probabilidade;nome distribuição parâmetro 1 parâmetro 2.

Normal Padrão MTB > PDF -1; SUBC> Normal 0,0 1,0. Probability Density Function Normal with mean = 0 and standard deviation = 1 x f( x ) -1 0,241971

MTB > CDF -1; SUBC> Normal 0,0 1,0. Cumulative Distribution Function Normal with mean = 0 and standard deviation = 1 x P( X <= x ) -1 0,158655

MTB > InvCDF 0,05; SUBC> Normal 0,0 1,0. Inverse Cumulative Distribution Function Normal with mean = 0 and standard deviation = 1 P( X <= x ) x 0,05 -1,64485

)1(−f

{ }1−≤XP

{ } 05,0=≤ aXP

X ~ N (100,100)

{ }11090 << XP

{ }95>XP

{ }95<XP

MTB > cdf 95; SUBC> normal 100 10. Cumulative Distribution Function Normal with mean = 100 and standard deviation = 10 x P( X <= x ) 95 0,308538

Cumulative Distribution Function Normal with mean = 100 and standard deviation = 10 x P( X <= x ) 90 0,158655 110 0,841345

= 0,841345 – 0,158655 = 0,682690

= 1 – 0,158655 = 0,841345

Page 9: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

9

Gráficos Densidade Normal

• Sobrepor gráficos das funções de densidade N (100, 100), N (100, 25) e N(90, 25).

• Criar coluna das abcissas X:

Calc > Make Patterned Data > Simple Set of Numbersè

Valores de X

• Calcular as probabilidades da coluna N(100,100):Calc > Probability Distributions > Normal è

Parâmetros

Valores de entrada

Valores de saída

• Repetir o procedimento de cálculo de probabilidades para N(100, 25) e N(90, 25).

• Fazer gráfico sobreposto:Graph > Scatterplot > Simple è

Page 10: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

10

X

De

nsid

ade

de

Pro

bab

ilid

ad

e

130120110100908070

0,09

0,08

0,07

0,06

0,05

0,04

0,03

0,02

0,01

0,00

VariableN(100, 100)N(100, 25)N(90, 25)

Funções de Densidade Normal

Parâmetro de locação: µParâmetro de escala: s 2

Gráfico Função de Distribuição Acumulada

• Sobrepor gráficos das funções de distribuição acumulada N (100, 100), N (100, 25) e N(90, 25).

• Usar coluna das abcissas X montada para as densidades;

• Calcular as probabilidades acumuladas da coluna Ac N(100,100):Calc > Probability Distributions > Normal è

Parâmetros

Valores de entrada

Valores de saída

Page 11: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

11

• Repetir o procedimento de cálculo de probabilidades para Ac N(100, 25) e Ac N(90, 25).

• Fazer gráfico sobreposto:Graph > Scatterplot > Simple è

X

Pro

bab

ilida

de A

cum

ula

da

130120110100908070

1,0

0,8

0,6

0,4

0,2

0,0

VariableAc N(100, 100)Ac N(100, 25)Ac N(90, 25)

Função de Distribuição Acumulada Normal

Distribuição Exponencial

• Notação: X ~ exponencial (?)

• Função de densidade:

• Esperança:

• Variância:

=−

..00

)(cc

xexf

xλλ

λ1

2

Page 12: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

12

Distribuição Exponencial

• Notação: X ~ exponencial (ß)

• Função de densidade:

• Esperança:

• Variância:

≥=−

..0

01

)(cc

xexf

β

β

Cálculos de Probabilidade

• O parâmetro da exponencial utilizado pelo Minitab é a média da distribuição

• Podem ser obtidos através da janela Session:√ Editor > Enable Commands

• Para cálculo de densidade (ou probabilidade acumulada ou quantil):

PDF(ou CDF ou InvCDF) valor;exponencial média.

MTB > CDF 2; SUBC> exponencial 0,5. Cumulative Distribution Function Exponential with mean = 0,5 x P( X <= x ) 2 0,981684

{ }2>XP

{ }5,02,0 << XP

{ } 50,0=≤ aXP

Cumulative Distribution Function Exponential with mean = 0,5 x P( X <= x ) 0,2 0,329680 0,5 0,632121

MTB > InvCDF 0,5; SUBC> exponencial 0,5. Inverse Cumulative Distribution Function Exponential with mean = 0,5 P( X <= x ) x 0,5 0,346574

= 0,632121 – 0,329680 = 0,302441

= 1 – 0,981684= 0,018316

X ~ exponencial média 0,5

Page 13: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

13

Variáveis Discretas – Probabilidade

• No caso de variáveis discretas, o comando PDF fornece a probabilidade em um ponto;

• A função de distribuição acumulada F(x) permite o cálculo de probabilidades em subconjuntos de pontos:

P{a = X = b} = F(b) – F(a)

= P{X =b} – P{ X = a}

MTB > pdf 7; SUBC> binomial 10 0,35. Probability Density Function Binomial with n = 10 and p = 0,35 x P( X = x ) 7 0,0212030

MTB > CDF 7; SUBC> binomial 10 0,35. Cumulative Distribution Function Binomial with n = 10 and p = 0,35 x P( X <= x ) 7 0,995179

Cumulative Distribution Function Binomial with n = 10 and p = 0,35 x P( X <= x ) 3 0,513827 6 0,973976

{ }7=XP

{ }8<XP

{ }74 <≤ XP

X ~ binomial (10; 0,35)

{ }7≤= XP

{ }63 ≤<= XP= 0,513827 –0,973976= 0,460149

Função Gama

• Dada por:

• Se r é inteiro positivo, então:

∫∞ −−=Γ

0

1)( dxexr xr

)!1()( −=Γ rr

Page 14: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

14

Exemplo Função Gama

• Pode ser obtidos através da janela Session:√ Editor > Enable Commands

Let K nº = gamma(valor)Print K nº

• Calcular G(2,3)

MTB > Let K1 = gamma(2,3) MTB > print k1 Data Display K1 1,16671

Distribuição de Weibull

• Notação: X ~ Weibull (ß, d)

• Função de densidade:

• Esperança:

• Variância:

• Parâmetro de forma: ß

• Parâmetro de escala: d

=

−−

..0

0)(

1

cc

xex

xf

x β

δβ

δδβ

( )βδ 11+Γ

( ) ( )[ ]{ }2122 11 ββδ +Γ−+Γ

Gráficos Densidade de Weibull

• Sobrepor gráficos das funções de densidade Weibull com parâmetros de forma e de escala iguais a: 1 e 1; 3,4 e 2; 4,5 e 6,2.

• Criar coluna das abcissas X_w:Calc > Make Patterned Data > Simple Set of Numbersè

First value: 0Last value: 15In steps of: 0,1

Page 15: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

15

• Calcular as probabilidades das colunas W(1, 1), W(3,4; 2) e W(4,5; 6,2):

Calc > Probability Distributions > Weibull è

Parâmetros

Valores de entrada

Valores de saída

• Fazer gráfico sobreposto:

Graph > Scatterplot > Simple è

Parâmetro de forma: ßParâmetro de escala: d

X_w

De

nsi

dade

de

Pro

ba

bilid

ade

1614121086420

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0,0

VariableW(1; 1)W(3,4; 2)W(4,5; 6,2)

Densidade de W(1; 1), W(3,4; 2) e W(4,5; 6,2)

W(ß, d)

Page 16: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

16

Distribuição Gama

• Notação: X ~ Gama (r, ?)

• Função de densidade:

• Esperança:

• Variância:

• Parâmetro de forma: r

• Parâmetro de escala: ?

>Γ=

−−

..0

0)()(

1

cc

xrex

xf

xrr λλ

λr

2λr

Distribuição Gama – Minitab

• Notação: X ~ Gama (r, ß)

• Função de densidade:

• Esperança:

• Variância:

• Parâmetro de forma: r

• Parâmetro de escala: ß

>Γ=

−−

..0

0)()(

1

cc

xr

exxf r

r x

β

β

βr

2βr

Gráficos Densidade Gama

• Sobrepor gráficos das funções de densidade gama com parâmetros de forma e de escala iguais a: 1 e 1; 2 e 0,5; 2 e 1.

• Criar coluna das abcissas X_g:Calc > Make Patterned Data > Simple Set of Numbersè

First value: 0Last value: 6In steps of: 0,1

Page 17: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

17

• Calcular as probabilidades das colunas G(1, 1), G(2; 0,5) e G(2; 1):

Calc > Probability Distributions > Weibull è

Parâmetros

Valores de entrada

Valores de saída

• Fazer gráfico sobreposto:

Graph > Scatterplot > Simple è

X_g

De

nsi

dade

de

Pro

ba

bilid

ade

6543210

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0,0

VariableG(1, 1)G(2; 0,5)G(2, 1)

Densidades Gama

Parâmetro de forma: rParâmetro de escala: ß

G(r, ß)

Page 18: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

18

Aproximação da Binomial

Aproximação pela Poisson

• Se n ? 8 e p ? 0, com np ? ? então a variável aleatória XB ~ Binomial (n, p) pode ser aproximada por XP ~ Poisson (?), neste caso ? ˜ np.

Exemplo

• Calcule os valores de P{X = x} e P{X = x} para X ~ Binomial (70; 0,01)

• Calcule as mesmas probabilidades usando a Poisson (XP)

• Verifique a aproximação comparando os gráficos das funções de distribuição acumulada das duas variáveis

Page 19: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

19

• Gerar coluna das abcissas X_b:

• Calcular as probabilidade binomiais

Calc > Make Patterned Data > Simple Set of Numbersè

First value: 0Last value: 70In steps of: 1

• Calcular as probabilidades Poisson

• Gráficos de distribuição acumulada.

Graph > Scatter Plot > Singleè

Page 20: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

20

x_b

Y-D

ata

1086420

1,0

0,9

0,8

0,7

0,6

0,5

Distribuição Acumulada Exata e Aproximada

Abcissas entre 0 e 10

x_b

Y-D

ata

543210

0,5

0,4

0,3

0,2

0,1

0,0

VariableP(X_b=x)P(X_p=x)

Função de Probabilidade Exata e Aproximada

Abcissas entre 0 e 3

• Não é a representação correta da função de distribuição de uma variável discreta

• Se o valor de p se aproxima de , deve-se fazer uma transformação para assegurar a qualidade da aproximação da binomial pela Poisson:XB ~ binomial (n, p)YB ~ binomial (n, 1-p)

• Desta maneira:

P{XB = k} = P{YB = n – k }• Assim pode-se aproximar YB pela Poisson,

com o mesmo procedimento anterior

Exemplo

• Seja XB ~ binomial (70; 0,98)• Calcular as seguintes probabilidades exatas,

comparando-as com sua aproximação pela Poisson

• P{XB = 68}• P{XB =65}• P{65 < XB =68}

Page 21: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

21

MTB > cdf 68; SUBC> binomial 70 0,98. Cumulative Distribution Function Binomial with n = 70 and p = 0,98 x P( X <= x ) 68 0,409559

MTB > CDF 65; SUBC> binomial 70 0,98. Cumulative Distribution Function Binomial with n = 70 and p = 0,98 x P( X <= x ) 65 0,0132298

MTB > pdf 68; SUBC> binomial 70 0,98. Probability Density Function Binomial with n = 70 and p = 0,98 x P( X = x ) 68 0,244540

{ }68=BXP

XB ~ binomial (70; 0,98)

{ }65≤BXP

{ }6865 ≤< BXP= 0,409559 –0,0132298= 0,396329

MTB > pdf 2; SUBC> poisson 1,4. Probability Density Function Poisson with mean = 1,4 x P( X = x ) 2 0,241665

Cumulative Distribution Function Poisson with mean = 1,4 x P( X <= x ) 4 0,985747 1 0,591833

{ }68=BXP

YB ~ binomial (70; 0,02) ˜ YP ~ Poisson (1,4)

{ }65≤BXP

{ }6865 ≤< BXP= 0,985747 – 0,591833= 0,393914

{ }6870 −=≈ PYP

{ } }4{15 ≤−=≥≈ PP YPYP

= 1 – 0,985747

= 0,014253

{ } }41{52 ≤<=<≤≈ PP YPYP

Comparação

0,39390,3963P{65 < XB =68}

0,01430,0132P{XB =65}

0,24170,2445P{XB = 68}

Aproximação PoissonExataProbabilidades

Page 22: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

22

Aproximação pela Normal

• Há situações em que a variável aleatória XB ~ Binomial (n, p) pode ser aproximada por XN ~ Normal (np, np(1-p)).

• Em geral a aproximação é aceitável quando np = 5 e np(1-p) = 5, sendo melhor quanto maior for o valor de n.

Correção de Continuidade

P{XB = k} ˜ P{ k – 0,5 = XB =k + 0,5}

Cumulative Distribution Function Normal with mean = 50 and standard deviation = 5 x P( X <= x ) 68,5 0,999892 67,5 0,999767 60,5 0,982136

{ }68=BXP

XB ~ binomial (100; 0,5) ˜ XN ~ normal (50,25)

{ }60≤BXP{ }6860 ≤< BXP

= 0,999892 – 0,982136= 0,017756

{ }5,685,67 ≤≤≈ NXP

{ }5,60≤≈ NXP

= 0,999892 – 0,999767

= 0,000053

{ }5,685,60 ≤<≈ NXP

= 0,982136

Page 23: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

23

Comparação

0,01780,0175P{60 < XB =68}

0,98210,9824P{XB =60}

0,00000,0001P{XB = 68}

Aproximação PoissonExataProbabilidades

Comparação da Aproximação e Exata

• Criar coluna X_bn de 0 a 100

• Criar coluna X_corr = X_bn +0,5

Calc > Make Patterned Data > Simple Set of Numbersè

First value: 0Last value: 100In steps of: 1

Calc > Calculator è

• Calcular na coluna XB(100; 0,5) as probabilidades acumuladas binomiais (exatas)

• Calcular na coluna XN(50; 25) as probabilidades acumuladas aproximadas pela normal (com correção de continuidade)

Page 24: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

24

• Construir gráfico das distribuições acumuladas sobrepostas XB(100, 0,5) e XN(50, 25)

Valores de X

Pro

bab

ilid

ade

Acu

mu

lad

a

6055504540

1,0

0,8

0,6

0,4

0,2

0,0

VariableXB(100,0,5) * X_bXN(50,25) * X_co

Distribuição Acumulada de XB(100,0,5) e XN(50,25)

Abcissas entre 40 e 60

Comparação entre Aproximações (1)

• Distribuição exata: XB ~ (70; 0,01)√ Aproximação normal: coluna XN(50; 25)√ Aproximação de Poisson: calculada a coluna

YP(50) para uma variável YP ~ Poisson(50)

• Comparação gráfica entre as 3 distribuições

X-Data

Y-D

ata

1086420

1,0

0,8

0,6

0,4

0,2

0,0

VariableP(X_b<=k) * x_bP(X_p<=x) * x_bXN(7;0,693) * x_b

Aproximação Poisson e Normal de Binomial (70, 0,01)

Abcissas entre 0 e 10

Page 25: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

25

Comparação entre Aproximações (2)

• Distribuição exata: XB ~ (100; 0,5)√ Aproximação normal: coluna XN(50; 25)√ Aproximação de Poisson: calculada a coluna

YP(50) para uma variável YP ~ Poisson(50)

• Comparação gráfica entre as 3 distribuições

Abcissas entre 30 e 70

X-Data

Y-D

ata

7060504030

1,0

0,8

0,6

0,4

0,2

0,0

VariableXB(100; 0,5) * x_bXP(50) * x_bnXN(50,25) * x_cor

Aproximações Normal e Poisson da Binomial (100, 0,5)

Aproximações – Comentários

Mantidas as condições de qualidade de cada aproximação, temos:

• A aproximação de Poisson é melhor que a aproximação normal para valores de p nas proximidades de 0 e 1.

• A aproximação Normal é melhor que a aproximação de Poisson para valores intermediários de p.

Page 26: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

26

Geração de Números Aleatórios

Gerador de Números Aleatórios

• São usados para simular modelos, estudar estimadores, etc.

• O Minitab executa sua geração de acordo a várias distribuições de probabilidade:

Discretas• Binomial• Hipergeométrica• Discreta• Poisson• outras

Contínuas• Uniforme• Normal• Exponencial• Lognormal• outras

Calc > Random Data è

Page 27: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

27

Exemplo 1 – Geração de Normais

• Gerar 2 amostras de uma N(86,6; 4,62) de tamanho 29 e armazenar nas colunas N1 e N2√ Calcular a média e o desvio padrão amostral√ Construir o histograma das amostras em painéis

separados√ Comparar os histogramas com a função de

densidade exata

Geração de Amostras Normais

Calc > Random Data è

Os resultados serão exclusivos a cada procedimento

Média e Desvio Padrão Amostrais

MTB > Describe 'N1' 'N2'; SUBC> Mean; SUBC> StDeviation. Descriptive Statistics: N1; N2 Variable Mean StDev N1 86,869 4,235 N2 86,160 4,783

Valores exatos:Média: 86,6Desvio padrão: 4,6

Page 28: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

28

Construção HistogramasD

ensi

da

de

de

Pro

ba

bili

da

de

0,08

0,06

0,04

0,02

0,00

9996939087848178

0,08

0,06

0,04

0,02

0,00

N1

N2

Histogramas de N1 e N2

Usar densidade no eixo Y

Edit Panels > Arrangement >Rows: 2/ Columns: 1

Comparação com Distribuição Exata

Add > Distribution Fit è

• Clicando com o botão direito do mouse no gráfico:

Page 29: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

29

De

nsi

da

de

de

Pro

ba

bili

da

de

0,08

0,06

0,04

0,02

0,00

9996939087848178

0,08

0,06

0,04

0,02

0,00

N1

N2

Normal Histogramas de N1 e N2

Exemplo 2 – Geração de Exponenciais

• Gerar 3 amostras de tamanho 34 de uma exponencial com média 128 e armazenar nas colunas E1, E2 e E3.√ Calcular a média e o desvio padrão amostral√ Construir o histograma das amostras em painéis

separados√ Comparar os histogramas com a função de

densidade exata

Geração de Amostras Exponenciais

• Repetir os procedimentos de geração de números aleatórios para amostra exponencial

Page 30: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

30

Média e Desvio Padrão Amostrais

Valores exatos:Média: 128Desvio padrão: 128

MTB > describe 'E1'-'E3'; SUBC> mean; SUBC> StDev. Descriptive Statistics: E1; E2; E3 Variable Mean StDev E1 116,3 137,0 E2 119,4 121,4 E3 124,1 134,4

De

nsi

ty

560480400320240160800

0,0048

0,0036

0,0024

0,0012

0,0000

560480400320240160800

0,0048

0,0036

0,0024

0,0012

0,0000

E1 E2

E3

Histogramas de E1, E2 e E3

Usar densidade no eixo Y

Comparação com Distribuição Exata

Add > Distribution Fit è

• Clicando com o botão direito do mouse no gráfico:

Page 31: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

31

De

nsi

ty560480400320240160800

0,008

0,006

0,004

0,002

0,000

560480400320240160800

0,008

0,006

0,004

0,002

0,000

E1 E2

E3

Exponential Histogramas de E1, E2 e E3

Exemplo 3 – Geração de Weibull

• Gerar 2 amostras de tamanho 43 de uma Weibull com parâmetro de forma 2,3 e parâmetro de escala 148 e armazenar nas colunas W1 e W2.√ Calcular a média e o desvio padrão amostral√ Construir o histograma das amostras em painéis

separados√ Comparar os histogramas com a função de

densidade exata

Geração de Amostras Exponenciais

• Repetir os procedimentos de geração de números aleatórios para amostra exponencial

Page 32: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

32

Média e Desvio Padrão Amostrais

Valores exatos:

MTB > describe 'W1' 'W2'; SUBC> mean; SUBC> StDev. Descriptive Statistics: W1; W2 Variable Mean StDev W1 134,88 63,81 W2 144,47 56,17

MTB > let k1 = 2,3 MTB > let k2 = 148 MTB > let k3 = k2*gamma(1+1/k1) MTB > print k3 Data Display K3 131,115

Média

Desvio padrão

MTB > let k4=k2**2*(gamma(1+2/k1)-(gamma(1+1/k1))**2) MTB > let k5 = sqrt(k4) MTB > print k5 Data Display K5 60,4552

Usar densidade no eixo Y

De

nsit

y

0,008

0,006

0,004

0,002

0,000

240180120600

0,008

0,006

0,004

0,002

0,000

W1

W2

Histogramas de W1 e W2

Edit Panels > Arrangement >Rows: 2/ Columns: 1

Comparação com Distribuição Exata

Add > Distribution Fit è

• Clicando com o botão direito do mouse no gráfico:

Page 33: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

33

De

nsi

ty

0,008

0,006

0,004

0,002

0,000

240180120600

0,008

0,006

0,004

0,002

0,000

W1

W2

Weibull Histogramas de W1 e W2

Ajuste de Distribuições

Verificação de Normalidade

• Muitos procedimentos estatístico adotam a hipótese de normalidade dos dados

• Assim, é freqüente a necessidade de verificação de normalidade dos dados

• No Minitab, uma das maneiras de verificar a adequação do modelo (normal e outros) éatravés do Probability Plot

Page 34: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

34

• Teste de normalidade da coluna N1:

Graph > Probability Plot > Single è

• Se os pontos estiverem próximos à reta, háindicação de normalidade

• Os outliers aparecem como pontos distantes do padrão geral

N1

Pe

rce

nt

1009590858075

99

95

90

80

70

60504030

20

10

5

1

Mean

0,959

86,87StDev 4,235N 29AD 0,149P-Value

Probability Plot of N1Normal - 95% CI Parâmetros estimados

Estatísticade teste

P-valor p/ o teste:H0: dados normaisH1: Dados não-normais

• Repetição do procedimento para coluna E1:

E1

Perc

ent

6004002000-200-400

99

95

90

80

70

60504030

20

10

5

1

Mean

<0,005

116,3StDev 137,0N 34AD 2,879P-Value

Probability Plot of E1Normal - 95% CI Parâmetros estimados

P-valor p/ o teste:H0: dados normaisH1: Dados não-normais

H0 Rejeitada

• Pontos afastam-se da reta• Teste rejeita a hipótese de normalidade

Page 35: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

35

Exemplo 4 – Ajuste de Modelo

• Repetir o teste de normalidade para as colunas E2, E3, W1 e W2Graph > Probability Plot > Single è

• O histograma de W2 apresenta uma maior simetria comparado com o de W1

Pe

rce

nt

4002000-200

99

90

50

10

16004002000-200

99

90

50

10

1

3002001000-100

99

90

50

10

13002001000

99

90

50

10

1

E2 E3

W1 W2

E2

P-Value <0,005

E3Mean 124,1StDev 134,4N 34AD

Mean

2,014P-Value <0,005

W1Mean 134,9StDev 63,81N 43

119,4

AD 1,281P-Value <0,005

W2Mean 144,5StDev 56,17N

StDev

43AD 0,543P-Value 0,154

121,4N 34AD 2,130

Probability Plot of E2; E3; W1; W2Normal - 95% CI

H0 Rejeitada

Sem evidência pra rejeitar H0

• Verificar o ajuste à exponencial das colunas E1, E2 e E3Graph > Probability Plot > Single è

Page 36: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

36

• Apesar de haver pontos fora da banda de confiança do gráfico, as estatísticas de teste não permitem rejeitar a hipótese de modelo exponencial

Pe

rce

nt

1000100101

90

50

10

11000,00100,0010,001,000,100,01

90

50

10

1

1000100101

90

50

10

1

E1 E2

E3

E1

E2Mean 119,4N 34AD 1,253P-Value 0,057

E3

Mean

Mean 124,1N 34AD 0,935P-Value 0,136

116,3N 34AD 0,621P-Value 0,341

Probability Plot of E1; E2; E3Exponential - 95% CI

Não há evidências para rejeitar H0

H0: modelo exponencialH1: outro modelo

• Verificar o ajuste ao modelo Weibull das colunas W1 e W2Graph > Probability Plot > Single è

Pe

rce

nt

100010010

99

90807060504030

20

10

5

3

2

1

100010010

99

90807060504030

20

10

5

3

2

1

W1 W2 W1

P-Value <0,010

W2Shape 2,786Scale 161,1N 43AD

Shape

0,678P-Value 0,074

2,263Scale 151,8N 43AD 1,521

Probability Plot of W1; W2Weibull - 95% CI

• No caso de W1, a quantidade de pontos fora da banda de confiança do gráfico, pode ter influenciado a estatística de teste a rejeitar a hipótese de modelo Weibull.

Não há evidências para rejeitar H0

H0: modelo WeibullH1: outro modelo

Há evidências para rejeitar H0

Page 37: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

37

Exemplo 5 – Amostra Binomial

• Gere 3 amostras de tamanho 25 de uma distribuição binomial com parâmetros n = 70 e p = 0,4 e as armazene nas colunas B1, B2 e B3

• Verifique a normalidade dos elementos padronizados de cada amostra

• Geração das amostras binomiais

Calc > Random Data > Binomial è

Padronização

• No caso da binomial a padronização exata édada por:

• No exemplo a média e o desvio padrão são:

)1( pnpnpx

z ii −

−=

MTB > let k1 = 70*0,4 MTB > let k2 = sqrt(70*0,4*0,60) MTB > print k1 k2 Data Display K1 28,0000 K2 4,09878

Page 38: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

38

• No Minitab, a padronização é obtida por:Calc > Standardize è

Média Desvio padrão

• Gráfico de probabilidade normal para as colunas Bp1, Bp2 e Bp3

Graph > Probability Plot > Single è

• Há evidências de que os dados padronizados são normais.

• Os pontos do gráfico encontram-se dentro da região de confiança

Não há evidências para rejeitar H0

H0: Normalidade dadosH1: outro modelo

Pe

rce

nt

420-2-4

99

90

50

10

1420-2

99

90

50

10

1

420-2-4

99

90

50

10

1

Bp1 Bp2

Bp3

Bp1

P-Value 0,154

Bp2Mean 0,3123StDev 1,065N 25AD

Mean

0,492P-Value 0,199

Bp3Mean 0,02928StDev 1,237N 25

0,4001

AD 0,235P-Value 0,768

StDev 1,271N 25AD 0,535

Probability Plot of Bp1; Bp2; Bp3Normal - 95% CI

Page 39: Métodos Computacionais em Estatística · 2 Distribuições de Probabilidade Funcionalidades Como pacote estatístico, o Minitab efetua os seguintes cálculos referentes a distribuições

39

Referências

Bibliografia Recomendada

• Bussab, W. O. e Morettin, P. A. (Saraiva)Estatística básica

• Montgomery, D. C. e Runger, G. C. (LTC) Estatística aplicada e probabilidade para engenheiros