27
Teste de Hipótese

Teste de Hipótese. Introdução Em estatística, uma hipótese é uma afirmativa sobre uma propriedade da população. Um teste de hipótese (ou teste de significância)

Embed Size (px)

Citation preview

Teste de Hipótese

Introdução

Em estatística, uma hipótese é uma afirmativa sobre uma propriedade da população.

Um teste de hipótese (ou teste de significância) é um procedimento padrão para testar uma afirmativa sobre uma propriedade da população.

Exemplos

Um repórter afirma que a maioria dos motoristas americanos passa com sinal vermelho.

Médicos afirmam que a temperatura do corpo de adultos saudáveis não é igual a 98,6ºF.

Exemplos

A proporção de motoristas que admitem passar com sinal vermelho e maior do que 0,5. A afirmativa é p > 0,5. Se p > 0,5 for falso então p ≤ 0,5 deve ser

verdadeira. Tomamos p > 0,5 como hipótese alternativa e

p=0,5 como hipótese nula.

Exemplos

A altura média de jogadores profissionais de basquete é, no máximo, 7 pés. A afirmativa é μ ≤ 7. Se μ ≤ 7 for falso então μ > 7 deve ser verdadeira. Tomamos μ > 7 como hipótese alternativa e

μ = 7 como hipótese nula.

Componentes de um teste de Hipótese: Hipótese nula (Representada por Ho) é uma

afirmativa de que o valor do parâmetro populacional é igual a algum valor especificado.

Hipótese alternativa (Representada por H1 ou Ha)

é a afirmativa de que o parâmetro tem um valor que, de alguma forma, difere da hipótese nula.

Identificação das Hipóteses1. Identifique a afirmativa ou hipótese

específica a ser testada e expresse-a em forma simbólica.

2. Dê a forma simbólica que tem que ser verdadeira quando a afirmativa original é falsa

3. Hipótese alternativa é a que não contém a igualdade, e a hipótese nula iguala o parâmetro ao valor fixo sendo considerado

Estatística de teste

A estatística de teste é um valor calculado a partir dos dados amostrais e é usada para se tomar uma decisão sobre a rejeição da hipótese nula.

Principais estatísticas de teste Para proporção:

Para a média:

Para a variância:

n

sx

t

_

n

xz

n

pq

ppz

^

2

22 )1(

sn

x

ou

Região Crítica.

A região crítica é o conjunto de todos os valores da estatística de teste que nos fazem rejeitar a hipótese nula.

Nível de significância

O nível de significância (representado por α) é probabilidade de que a estatística de teste cairá na região crítica quando a hipótese nula for realmente verdadeira.

Valor Crítico

Um valor crítico é qualquer valor que separa a região crítica (onde rejeitamos a hipótese nula) dos valores da estatística de teste que não levam a rejeição da hipótese nula.

O valor P

O valor P (ou valor de Probabilidade) é a probabilidade de se obter um valor da estatística de teste que seja no mínimo tão extremo quanto o que representa os dados amostrais, supondo que a hipótese nula seja verdadeira.

Fundamentos. Dada uma afirmativa, identificar a hipótese nula e a

hipótese alternativa, e expressá-las, em forma simbólica.

Dados uma afirmativa e dados amostrais, calcular o valor da estatística de teste.

Dado um nível de significância, identificar o(s) valor(es) crítico(s).

Dado um nível da estatística de teste, identificar o valor P.

Estabelecer a conclusão de um teste de hipótese em termos simples.

Identificar os erros tipo I e tipo II que podem ser cometidos ao se testar uma dada afirmativa.

Decisões e Conclusões

Critério de Decisão: a decisão de rejeitar ou deixar de rejeitar a hipótese nula é feita, em geral, usando o método tradicional (ou clássico) de teste de hipótese, o método do valor P, ou as vezes a decisão se baseia em intervalos de confiança.

Método Tradicional

Rejeite Ho se a estatística de teste ficar dentro da região crítica.

Deixa de rejeitar Ho se a estatística de teste não ficar dentro da região crítica.

Método do valor P

Rejeite Ho se o valor P ≤ α (onde α é o nível de significância).

Deixe de rejeitar Ho se o valor P > α.

Intervalos de confiança.

Como uma estatística de intervalo de confiança de um parâmetro populacional contém os valores prováveis do parâmetro, rejeite uma afirmativa de que o parâmetro populacional tenha um valor que não esteja incluído no intervalo de confiança.

Identificação de erros Tipo I e Tipo II Ao testar uma hipótese nula, chegamos a

uma conclusão de rejeita-la ou de deixar de rejeita-la.

Tais conclusões são as vezes corretas as vezes erradas

Apresentamos dois tipos de erros que podem ser cometidos.

Erro Tipo I

O erro de rejeitar a hipótese nula quando ela é, de fato, verdadeira. O símbolo α (alfa) é usado para representar a probabilidade de um erro do tipo I.

Erro Tipo II

O erro de deixar de rejeitar a hipótese nula quando ela é, de fato, falsa. O símbolo β (Beta) é usado para representar a probabilidade de um erro tipo II.

Teste de Hipótese – Erros I e II

Hipóteses H0 : = 0

H1: > 0

Existe a possibilidade de se selecionar uma amostra de uma população com média 0 e obter alto de forma que leve a conclusão errada de que H0 é falsa?

X

Sim. Este erro é chamado de erro do tipo I e equivale ao nível de significância .

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- +0

2

0( , )Nn

1

crítX

P(rejeitar H0 / H0 é verdadeira) = P(aceitar H0 / H0 é verdadeira) = 1 -

0Xz

n

0crítcrít

Xz

n

0crít crítX zn

Teste de Hipótese – Erros I e II

Hipóteses H0 : = 0

H1: > 0

Existe a possibilidade de se selecionar uma amostra de uma população com média 1 (> 0) e obter de forma que leve a conclusão errada de que H0 é verdadeira?

X

Sim. Este erro é chamado de erro do tipo II ou erro .

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- 0

2

0( , )Nn

1

crítX

P(aceitar H0 / H1 é verdadeira) = P(rejeitar H0 / H1 é verdadeira) = 1 - (poder do teste)

+1

2

1( , )Nn

aceitaçãode H0

Teste de Hipótese – Erros I e II

Hipóteses H0 : = 0

H1: > 0

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0 5 10 15 20- 0

2

0( , )Nn

1

crítX +1

2

1( , )Nn

H0 é verd. H0 é falso

Aceita H0

Rejeita H0

1 -

1 -

Alternativas para diminuir :

• distanciar 1 de 0

• aumentar • aumentar n

ResumoParâmetro Condições Distribuição e Estatística de

testeValores P e Críticos

Proporção np ≥ 5 e nq ≥ 5 Normal: Tabela A-2

Média σ conhecido e população normalmente distribuída ou n>30

Normal: Tabela A-2

σ desconhecido e população normalmente distribuída ou n>30

t-Student: Tabela A-3

Desvio Padrão ou

Variância

População normalmente distribuída

Qui-Quadrado: Tabela A-4

n

pq

ppz

^

n

xz

n

sx

t

_

2

22 )1(

sn

x

ResumoParâmetro

Condições Distribuição e Erro

Proporção np ≥ 5 e nq ≥ 5 Normal: Tabela A-2

Média σ conhecido e população normalmente distribuída ou n>30

Normal: Tabela A-2

σ desconhecido e população normalmente distribuída ou n>30

t-Student: Tabela A-3

Desvio Padrão ou

Variância

População normalmente distribuída

Qui-Quadrado: Tabela A-4

n

qpzlo

^^

2

nzl

2

0

n

stl

2

0

2

22

2

2 )1()1(

ED X

sn

X

sn

Resumo

Possíveis resultados de um T.H. e suas probabilidades condicionadas à realidade

Realidade

H0 verdadeira H0 falsa

Decisão

Aceitar H0 Decisão correta (1-α)

Erro tipo II

β

Rejeitar H0 Erro tipo I

α

Decisão correta (1-β)