29
Professor: Rodrigo A. Scarpel [email protected] www.mec.ita.br/~rodrigo MOQ-13 PROBABILIDADE E ESTATÍSTICA

MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

  • Upload
    lemien

  • View
    236

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

Professor: Rodrigo A. Scarpel

[email protected]

www.mec.ita.br/~rodrigo

MOQ-13 PROBABILIDADE E ESTATÍSTICA

Page 2: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

ProgramaPrograma do do cursocurso::

Regressão linear simples e correlação.Aplicações de modelos de regressão linear.15 e 16

Prova14

Feriado (4/6)13

Testes não-paramétricos (associação, independência e de aderência).12

Testes de Hipóteses. Inferência baseada em 2 amostras (entre parâmetros de populações distintas).11

Propriedades dos estimadores. Intervalos de confiança(estimação por intervalo). Tamanho da amostra.10

Amostras aleatórias. Distribuições amostrais. Teoremado limite central. Variáveis aleatórias Qui-quadrado e t-Student.9

Princípios de estatística. Estimadores e estimativas. Estimação pontual de parâmetros (Métodos dos momentos e da máximaverossimilhança). Estatística Descritiva.

8

Prova7

Variáveis aleatórias conjuntas, função distribuição conjunta e marginal. Independência estatística. Covariância e Coeficientede Correlação.6

Feriado (2/4)5

Principais distribuições de probabilidade contínuas (Exponencial negativa e Normal).4

Valor esperado e variância. Momentos de uma variável aleatória. Função geradora de momentos. Principais distribuições de probabilidade discretas (Bernoulli, Binomial e Poisson).3

Teorema da probabilidade total e teorema de Bayes. Variáveis aleatórias. Distribuições de probabilidade. Funções massa, densidade, e distribuição acumulada. Funções de variáveis aleatórias.2

Introdução à probabilidade (eventos, espaço amostral, axiomas, propriedades, probabilidade condicional e independência).1

ConteúdoSemanas

Page 3: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

Professor: Rodrigo A. Scarpel

[email protected]

www.mec.ita.br/~rodrigo

TESTE DE HIPÓTESES

Page 4: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

O processo de inferência:

AMOSTRA

POPULAÇÃO

HIPÓTESES

ESTIMAÇÃO DOS PARÂMETROS

TESTAR ADERÊNCIA

FAZER INFERÊNCIAS EM RELAÇÃO A POPULAÇÃO

�Hipóteses: - iid ⇒⇒⇒⇒ Amostra aleatória

- Distribuições populacional e amostral (TLC)

- Parâmetros conhecidos ou não (σσσσ)

Page 5: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

Teste de Hipóteses: Princípios

• O teste de hipóteses é utilizado quando objetiva-se decidir qual de

duas alegações contraditórias, sobre o valor de um parâmetro, está

correta.

• Hipótese estatística (hipótese) é uma afirmação sobre os valores de

parâmetros ou sobre a forma de uma distribuição de probabilidade.

• Em um teste de hipóteses há sempre 2 hipóteses contraditórias sendo

consideradas.

• Ex: Tempo médio de atendimento = 300h ou ≠≠≠≠ 300h

Fatia de mercado ≥≥≥≥ 15% ou <<<< 15%.

OBJETIVO: DEFINIR, A PARTIR DAS INFORMAÇÕES

AMOSTRAIS, QUAL DAS DUAS ESTÁ CORRETA.

Page 6: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

• Def: Hipótese nula (H0) é a afirmação assumida

inicialmente como verdadeira e Hipótese alternativa (HA) é

a afirmação que contradiz H0.

• Como H0 é considerada verdadeira, se não houver alguma

evidência forte na amostra que a contradiga, as duas

conclusões possíveis são: Rejeitar H0 ou Não Rejeitar H0.

• Em síntese: utilizaremos dados amostrais para decidir se H0

deve ou não ser rejeitada.

Teste de Hipóteses: Princípios

Page 7: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

i. Definir as hipóteses:

ii. Cálculo da estatística do teste;

iii. Verificar as regiões de rejeição (valores para os quais Ho será

rejeitada);

iv. Tomar a decisão (rejeitar ou não H0).

Assim, a hipótese nula será rejeitada se, e somente se, o valor da

estatística do teste cair na região de rejeição.

H0 : θθθθ = θθθθ0

HA : θθθθ ≠≠≠≠ θθθθ0

H0 : θθθθ ≥≥≥≥ θθθθ0

HA : θθθθ <<<< θθθθ0

H0 : θθθθ ≤≤≤≤ θθθθ0

HA : θθθθ >>>> θθθθ0

ou ou

• Se θθθθ representar o parâmetro de interesse:

Teste de Hipóteses: Procedimento

Page 8: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

� Os conceitos básicos do teste de hipóteses são introduzidos mais

facilmente enfocando primeiro uma situação simples (CASO A):

� O parâmetro de interesse é a média populacional (µµµµ)

� A distribuição da população é normal

� O valor do desvio-padrão (σσσσ) é conhecido.

� Seja x1, x2, …, xn uma amostra aleatória de uma distribuição normal com E[x] = µµµµ e

Var[X] = σσσσ2. Neste caso, independentemente do tamanho da amostra (n):

nNx

2

,~σµ

nx

x

22 σσ

µµ

=

=

Teste de Hipóteses: Média

Page 9: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

( )1,0~/

Zn

x

σµ−

n

xZ

/σµ−=

2,5751%1,965%

1,64510%

Zαααα/2SIGNIFICÂNCIA

2,3281,645

1,285

Zαααα

ou ou

Teste de Hipóteses: CASO A

Page 10: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

• Exemplo: Um fabricante de lâmpadas afirma que o tempo médio de vida

de seu produto é normalmente distribuído com média de 800h e desvio-

padrão de 40h. Uma amostra de n=30 lâmpadas foram testadas obtendo-

se um tempo médio de vida de 788h. Esses dados contradizem a

afirmação do fabricante (significância de 1%)?

• Passos: 1. Definir Ho e H1

2. Fixar αααα

3. Determinar as regiões de rejeição

4. Calcular a estatística do teste

5. Conclusão

Teste de Hipóteses: CASO A

Page 11: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

�Teorema do Limite Central: Seja x1, x2, …, xn uma amostra aleatória de

uma distribuição qualquer com média µµµµ e com variância σσσσ2. Se n é

suficientemente grande, então:

nNx

2

,~σµ&

nx

x

22 σσ

µµ

=

= ( )2,~ σµ nnNTo &

Obs: qto. maior for o valor de n, melhor será a aproximação (n>30)

CASO B : Se σσσσ2 não é conhecido e n é grande

CASO C: Se σσσσ2 não é conhecido e n é pequeno

(distribuição normal)

Teste de Hipóteses: Média

Page 12: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

Zns

x~

/

µ−

ns

xZ

/

µ−=

2,5751%1,965%

1,64510%

Zαααα/2SIGNIFICÂNCIA

2,3281,645

1,285

Zαααα

2,5751%1,965%

1,64510%

Zαααα/2SIGNIFICÂNCIA

2,3281,645

1,285

Zαααα

ou ou

Teste de Hipóteses: CASO B

Page 13: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

• Exemplo: um fabricante de pneus afirma que o tempo médio de vida de

seu produto é de 40.000 km. Uma amostra de n=64 pneus foram testados

obtendo-se um tempo médio de vida de 38.000 km com desvio-padrão de

16.000 km. Esses dados contradizem a afirmação do fabricante

(significância de 1%)?

• Passos: 1. Definir Ho e H1

2. Fixar αααα

3. Determinar as regiões de rejeição

4. Calcular a estatística do teste

5. Conclusão

Teste de Hipóteses: CASO B

Page 14: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

• Quando n é pequeno e a distribuição é Normal:

n

stx

2

,~ µns

xT

/

µ−= ,se distribui conforme uma t com k = n-1 g.l.

Teste de Hipóteses: CASO C

Page 15: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

Teste de Hipóteses: CASO C

Page 16: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

• Exemplo: um fabricante de sprinklers afirma que a

temperatura média de ativação de seu produto é de 130o F.

Uma amostra de n=9 produtos foram testados obtendo-se

uma temperatura média de ativação de 131,08o F com desvio-

padrão de 1,5o F. Esses dados contradizem a afirmação do

fabricante (significância de 5%)?

Teste de Hipóteses: CASO C

Page 17: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

Distribuição da diferença entre médias:

� Sejam A e B duas populações:

i. normais com parâmetros conhecidos: CASO A

ii. quaisquer com parâmetros conhecidos ou não (n grande) : CASO B

iii. normais com parâmetros não conhecidos e n pequeno: CASO C

( ),,~ 2AAAA nNx σµ ( )BBBB nNx 2,~ σµ

+−−

B

B

A

ABABA nn

Nxx22

,~σσµµ⇒⇒⇒⇒

( ),,~ 2AAAA nNx σµ& ( )BBBB nNx 2,~ σµ&

+−−

B

B

A

ABABA nn

Nxx22

,~σσµµ&⇒⇒⇒⇒

( ) 1~ −−BnBBBB tnsx µ

⇒⇒⇒⇒

( ) ,~ 1−−AnAAAA tnsx µ

( ) ( )( ) ( ) 2

22

~ −++−−−BA nn

B

B

A

ABABA t

n

s

n

sxx µµ

Page 18: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

Intervalo de confiança: Diferença entre médias

CASO A: CASO B (OPÇÃO 1):

CASO B (OPÇÃO 2): CASO C:

( ) ( )Z

n

s

n

s

xx

B

B

A

A

BABA ~22

&

+

−−− µµ

( ) ( )Z

nn

xx

B

B

A

A

BABA ~22

&

σσ

µµ

+

−−−( ) ( )Z

nn

xx

B

B

A

A

BABA ~22 σσ

µµ

+

−−−

( ) ( )2

22~ −+

+

−−−BA nn

B

B

A

A

BABA t

n

s

n

s

xx µµ

Page 19: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

NOVO: x = (60 * 5 + 180 * 4 + 100 * 3 + 52 * 2 + 8 * 1) / 400 = 3,58

s2 = (60 * (5-3,58)2 + 180 * (4-3,58)2 + ... + 86 * (1-3,58)2) / 399 =0,86

28

11 15

241317

25

40

45

0

20

40

60

80

100

Controle Novo

Com certeza voucomprar (5)

Provavelmente voucomprar

Não sei se vou comprar

Provavelmente não voucomprar

Com certeza não voucomprar (1)

Intenção de Compra

Amostra Total: 400

PadrãoPadrão de de AAççãoãoMMéédiadia Novo > Novo > ControleControle (95%)(95%)

Teste de produto:

85,4

40099,0

40086,0

25,358,3 =+

−=z

como z > zcrítico a intenção de compra do novo produto é maior (95%)

CONTROLE: x = (44 * 5 + 112 * 4 + 160 * 3 + 68 * 2 + 16 * 1) / 400 = 3,25

s2 = (44 * (5-3,25)2 + 112 * (4-3,25)2 + ... + 16 * (1-3,25)2) / 399 =0,99

Page 20: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

• Se X~Bin(n,p) em que n é relativamente grande (n≥≥≥≥30) e n.p.(1-p)>5

pode ser aproximada à uma Normal com µµµµ = n.p e σσσσ2 =n.p.(1-p), ou seja,

)1,0(~)1.(.

.N

ppn

pnx

−−

−n

pppNp

)1(,~ ^

^

ou ou

Teste de Hipóteses: Proporção

Page 21: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

• Exemplo: Uma pesquisa de mercado com 90 consumidores mostrou que

o market-share de uma empresa é de 45%. É possível afirmar que ela é

líder de mercado (significância de 1%)?

• Passos: 1. Definir Ho e H1

2. Fixar αααα

3. Determinar as regiões de rejeição

4. Calcular a estatística do teste

5. Conclusão

Teste de Hipóteses: Proporção

Page 22: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

ou ou

� Seja x1, x2, …, xn uma amostra aleatória de uma distribuição normal com E[x] = µµµµ e

Var[X] = σσσσ2. Para testar se σσσσ2 = σσσσ20 faz-se:

( )20

220

1

σχ sn −=� Estatística do teste:

� Hipóteses e regiões de rejeição:

Teste de Hipóteses: Variância

Page 23: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

• Exemplo: Um fabricante de baterias afirma que a vida útil delas tem

distribuição aproximadamente normal com desvio-padrão de 0,9 ano. Se

uma amostra aleatória de 10 dessas baterias tem desvio-padrão de 1,25

anos, você acha que σσσσ > 0,9? (significância de 5%)?

• Passos: 1. Definir Ho e H1

2. Fixar αααα

3. Determinar as regiões de rejeição

4. Calcular a estatística do teste

5. Conclusão

Teste de Hipóteses: Variância

Page 24: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

• Def: Um erro tipo I consiste em rejeitar Ho quando ela é

verdadeira e P(erro tipo I) = αααα

• Def: Um erro tipo II consiste em não rejeitar Ho quando ela

é falsa e P(erro tipo II) = ββββ

Proposição: Suponha que um experimento e o tamanho da amostra

sejam fixos. Então, reduzir o tamanho da região de rejeição para

obter um valor menor de αααα resulta em um valor maior de ββββ.

Portanto, não há como tornar, simultâneamente, αααα e ββββ menores.

Erros em testes de hipóteses

Page 25: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

OKTipo I)P(Erro

Tipo II)P(ErroOK

α = nível de significância

1 − α β

1 − β = poder do teste

H0 Verdadeira H

0 Falsa

Rejeito H0

Não Rejeito H0

Teste de Hipóteses: Erros Tipo I e II

Page 26: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

OKTipo I)P(Erro

Tipo II)P(ErroOK

α

1 − α β

1 − β

Réu inocente Réu culpado

Absolver o réu

Condenar o réu

H0: Réu é inocenteHa: Réu é culpado O réu pode ser:

O juiz pode:

Teste de Hipóteses: Erros tipo I e II

Page 27: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

Gerenciamento dos erros tipo I e II

Erro Tipo I:

↓↓↓↓ αααα ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo I

↑↑↑↑ n ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo I

Erro Tipo II:

↑↑↑↑ αααα ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo II

↑↑↑↑ n ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo II

Page 28: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

Escolha do nível de significância:

� Vou substituir um componente de meu produto por outro mais caro se isto o tornar melhor na percepção do consumidor.

� Consequências do Erro Tipo I: Perda do investimento, perda de margem ou de share

� Consequências do Erro Tipo II: perda da oportunidade de ganho competitivo

� Vou substituir um componente de meu produto por outro mais barato se isto não o tornar pior na percepção do consumidor.

� Consequências do Erro Tipo I: perda da oportunidade de aumentar a margem ou ganhar share.

� Consequências do Erro Tipo II: perda de share, de imagem, etc

Page 29: MOQ-13 PROBABILIDADE E ESTATÍSTICA - mec.ita.brrodrigo/Disciplinas/MOQ13/S11.pdf · Distribuições amostrais. Teorema do limite central. Variáveis aleatórias Qui-quadrado e t-Student

Para casa:

• Lista de Exercícios 9 (site: www.mec.ita.br/~rodrigo/)

• Leitura: Devore – cap. 8: Testes de hipóteses …

cap. 9: Inferências baseadas em duas amostras

Walpole et al. – cap.10 : Testes de hipóteses .