34
Teste de Hip´oteses & Valor-P Matias Rom´ ario & Gabriel Universidade Federal do Cear´ a [email protected] 03/06/2016 Matias Rom´ ario & Gabriel (UFC) Teste de Hip´oteses e valor-P 03/06/2016 1 / 34

Teste de hipótese & P-value

Embed Size (px)

Citation preview

Teste de Hipoteses &Valor-P

Matias Romario&

Gabriel

Universidade Federal do Ceara

[email protected]

03/06/2016

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 1 / 34

Sumario

1 IntroducaoDefinicaoAplicacaoTeoremasEstatıstica de TestesDecisao

2 ExemplosCalculo do valor-p

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 2 / 34

Metodos Estatısticos

Testes de Hipoteses consiste em verificar se a informacao estatıstica esuficientemente significante para rejeitar uma dada hipotese em favor deoutra (que e, de fato, o que se pretende comprovar estatisticamente).

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 3 / 34

Introducao a Hipoteses e Notacao

Sao fundamentais os seguintes conceitos para realizar um teste de hipotese:

Hipotese nula (H0: θ ∈ Θ):E a hipotese que assumimos como verdade para a construcao do teste.E o efeito, teoria, alternativa que estamos interessados em testar.

Hipotese alternativa (H1:θ ∈ Θ):E o que consideramos caso a hipotese nula nao tenha evidenciaestatıstica que a defenda.

Estatıstica do Teste: T (X )

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 4 / 34

Introducao a Hipoteses e Notacao

Continuando

Regiao de rejeicao: RR (a hipotese nula e rejeitada quando T (X ) ∈RR).

Erro do tipo I:A probabilidade de rejeitarmos a hipotese nula quando ela eefetivamente verdadeira (α)

Erro do tipo II:A probabilidade de rejeitarmos a hipotese alternativa quando ela eefetivamente verdadeira (β).

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 5 / 34

Conceitos iniciais

A ideia geral que temos a partir do slides atenriores e de que:

1 Faz-se uma suposocao inicial

2 Coleta-se evidencias (dados) em uma populacao

3 Baseado na avaliacao das evidencias, decide se aceita ou rejeita ahipotese inicial

*Em um Teste de Hipotese - Indepedente dos parametros da populacaoenvolvida - Os tres passos anteriores devem ser obedecidos.*Em estatıstica, nos sempre assumimos que a hipotese nula e verdadeira,ou seja, a hipotese nula e sempre o nosso pressuposto inicial.

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 6 / 34

Exemplos de Erros

Como pela lei uma pessoa e inocente ate que se prove o contrario, ashipoteses sao:H0: A pessoa e inocente.H1: A pessoa e culpada.

Erro I: A pessoa e condenada apesar de ser inocente.

Erro II: A pessoa e absolvida apesar de ser culpada.

Naturalmente, a Justica procura reduzir a possibilidade de ocorrer o Erro I,pois entende-se que e mais grave condenar inocentes do que absolvercriminosos.

VerdadeDecisao Hipotese nula Hipotese alternativaNao rejeita a nula OK Erro tipo IIRejeitar nula Erro tipo I OK

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 7 / 34

Observacoes

Fixamos H0 :µ=µ0. Dependendo da informacao que fornece o problemaque estamos estudando, a hipotese alternativa pode ter uma das tresformas abaixo:H1 :µ 6= µ0 (teste bilateral);H1 :µ > µ0 (teste unilateral a direita);H1 :µ < µ0 (teste unilateral a esquerda).Fixar o nıvel de significancia α.

Testeσ S

n≥ 30 z z

n<30 z t

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 8 / 34

Introducao a Matematica do Teste

A estatıstica de teste e um valor calculado a partir da amostra, e que eusado para tomar a decisao acerca de rejeitar ou nao a hipotese nula.para proporcoes:

T =X − np0√np0q0

Estatıstica de teste para a media (σ conhecido):

T =X − µ0

σ/√n

Estatıstica de teste para a media da amostra:

Z =X − µ0

s/√n

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 9 / 34

Exemplo Ilustrativo

Uma linha de producao opera com um peso medio de enchimentode 16 ml por recipiente. Sobrenchimento e Subenchimento saoproblemas serios e a linha de producao deve ser paralisada se algumdeles ocorrer. De dados passados sabe-se que o Desvio Padrao e0,8ml. Um inspetor de qualidade analisa uma amostra de 30unidades a cada duas horas, e nesse intervalo ele toma a decisao.Se a media amostral foi de 15,82 ml, qual atitude tomar?Temos:µ0 = 16 mlH0 = 16H1 6= 16Supomos a confiancia do teste em 95 ←− α = 0,05

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 10 / 34

Solucao para uma amostra

Atraves da tabela, podemos observar que se trata de um teste do tipo Z.Trata-se de um teste bilateral, pois valores diferentes de 16 sao rejeitados.Entao ambos os lados da cauda de nosso grafico recebem 0,025, enotamos que na nossa tabela Z e encontramos o valor -1,96.Temos: σ = 0, 8, n = 30, x = 15,82 e µ0 = 16

Z =X − µ0

σ/√n

=

Z =15, 82− 16

0, 8/√

30= 1, 23

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 11 / 34

Exemplo 2

Um fabricante de conservas anuncia que o conteudo de seu produto e, emmedia, 2000 gramas, com desvio padrao de 40 gramas. A fiscalizacao depesos e medidas investigou uma amostra aleatoria de 64 latas, verificandouma media de 1990 gramas. Fixando o nivel de significancia em 0,05,devera o fabricante ser multado?

µ0 = 2000 gramasH0 = 2000H1 < 2000

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 12 / 34

Solucao

Temos a situacao em que se apresenta um H1 < µ0 . Logo, temos um testeunilateral a esquerda. Utilizando a tabela Z, encontramos o valor -1,64,temos tambem:n = 64, x = 1990 e µ0 = 2000 e σ = 40

Z =X − µ0

σ/√n

=

Z =1990− 2000

40/√

64= −2

Encontra-se dentro da area de H1 , logo o fabricante tem que ser multadopor colocar menos que o anuciado.

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 13 / 34

Exemplo 3

Considere que uma industria compra de um certo fabricante, pinos cujaresistencia media a ruptura e especificada em 60 kgf (valor nominal daespecificacao). Em um determinado dia, a industria recebeu um grandelote de pinos e a equipe tecnica da industria deseja verificar se o loteatende as especificacoes.

H0 : O lote atende as especificacoes (Hipotese Nula)H1 : O lote nao atende as especificacoes (Hipoteses alternativa)Seja a V.A(variavel aleatoria) X : resistencia a ruptura X∼N(µ; 25)H0 : µ = 60 (Hipoteses simples)H1 : µ 6= 60 (Hipoteses Composta bilateral)

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 14 / 34

Forma Alternativa

Definicao Alternativa 1 do Teste de Hipoteses

Uma hipoteses estatıstica e uma afirmacao ou conjetura sobre o parametro, ouparametros, da distribuicao de probabilidades de uma caracterıstica, X, dapopulacao ou de uma v.a.

Definicao Alternativa 2 do Teste de Hipoteses

Um teste de uma hipoteses estatıstica e o procedimento ou regra de decisao quenos possibilita decidir por H0 ou H1 , com base a informacao contida na amostra.

Suponha que a equipe tecnica da industria tenha decidido retirar uma amostraaleatoria de tamanho n=16, do lote recebido, medir a resistencia de cada pino ecalcular a resistencia media X (estimador de µ)

X ∼ N

(µ,

25

16

)

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 15 / 34

Resolucao

Para quais valores de X a equipe tecnica deve rejeitar H0 e portantonao aceitar o lote?

Se o lote esta fora de especificacao, isto e, H1 :µ 6= 60, espera-se que amedia amostral seja inferior ou superior a 60 kgf .Suponha que equipe tecnica tenha decidido adotar a seguinte regra:rejeitar H0 se x for maior que 62.5 kgf e ou menor que 57.5 kgf .R

R= (x > 62,5 ou x < 57,5) −→Regiao de rejeicao de H0.

Rc = Ra =(x ≤ 57,5 x ≤ 62,4) −→Regiao de aceitacao de H0.

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 16 / 34

Exemplo 2

Considerando o exemplo 1.H0 : Aceitar o lote.H1 : Nao aceitar o lote.Erro tipo I: Nao aceitar o lote sendo que ela esta dentro dasespecificacoes.Erro tipo II: Aceitar o lote sendo que ela esta fora das especificacoes.P(Erro Tipo I) = α(Nıvel de Significancia)α = P( Rejeitar H0 | H0 verdadeira)P(Erro Tipo II) = β = P(Nao rejeitar H0 | H0 falso)

1− β = P(Rejeitar |H0 Falso) →Poder do teste

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 17 / 34

Continuacao...

Considerando as hipoteses do exemplo 1: H0 : µ = 60 contra H1 : µ 6= 60.α = P(x > 62.5 ou x < 57.5 | H0 :µ = 60) → sob H0 , x ∼ N(60, 25/16).α = P(x > 62.5 | H0 : µ = 60) + P(x < 57.5 | H0 : µ = 60)=

P=

[x−60√25/16

> 62.5−60√25/16

]+ P

[x−60√25/16

< 57.5−60√25/16

]=

P[Z > 2] + P[Z < -2] = 0.02275 + 0. 02275 = 0.0445

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 18 / 34

Para duas amostras populacionais

Seja X uma variavel aleatoria contınua, para uma populacao 1 temos amedia de X igual a µ1 e para uma populacao 2 temos µ2. O objetivo ecompara a media populacional µ1 e µ2

A hipotese nula e a alterantiva do teste sao respectivamente:H0 : µ1 = µ2

H1 : µ1 6= µ2

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 19 / 34

Exemplo

Um estudo objetivou analisar a associacao entre diversas variaveis com asındrome metabolica (SM) em indivıduos de origem japonesa, com 30 anosde idade ou mais.Pergunta: Indivıduos com SM e sem SM possuem, em media, valoresiguais para pressao sistolica?Temos duas populacoes, uma com SM(µ1: media de PAS para P.1) eoutra sem SM(µ2)σ1 seria o desvio para a P.1 e σ2 para a P.2

Existe uma versao do teste de comparacao que pressupoe σ1 = σ2 e outraque nao faz esse pressuposto.

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 20 / 34

Matematica do Teste para duas populacoes

Quando σ1 e σ2 sao conhecidos

Z =X 1 − X 2√σ2

1n + σ2

2n

=

Quando σ21 = σ2

2 = σ2 Sao desconhecidos

T =X 1 − X 2 − (µ1 − µ2)

S2p

√1n + 1

n

=

Onde S2p e uma media entre as variancias amostrais ponderada pelo grau

de liberdade n1-1 e n2-1:

S2p =

(n1 − 1)S21 + (n2 − 1)S2

2

n1 + n2 − 2

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 21 / 34

Continuacao

Lembramos que H0 e verdadeira, t0 e um valor de uma variavel aleatoriaque segue a distribuicao t de Student com n1+n2 -2 graus de liberdade.Utilizando P(rejeita H0 | H0 e verdadeira) = 0.05 = αTemos um grafico bipartido com 0.025 em ambas as caldas. Entaosupomos que retiramos duas amostras, n1 = 50 e n2 = 52.

Grau de liberdade = n1+n2 -2 = 50 + 52 - 2 = 100, α = 0.05, logo1-α = 0.95Vamos agora encontrar o valor de t∗ na tabela de distribuicao t Student(t∗ = 1,984)

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 22 / 34

Resolucao

Considerando:n1 =52 n2 = 50x1 = 142,1 mmHg x2 = 121,6 mmHgs1 = 23,0 mmHg s2 = 21,3 mmHg

S2p =

(n1 − 1)S21 + (n2 − 1)S2

2

n1 + n2 − 2=

S2p =

51 ∗ 232 + 49 ∗ 21, 32

52 + 50− 2= 492, 0981

T =X 1 − X 2

S2p

√1n + 1

n

=142, 1− 121

492, 0981√

152 + 1

50

=20, 5

4, 39379= 4, 67

Valor t0 > t∗, logo rejeitamos H0

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 23 / 34

Tomada de Decisao

Nas estatısticas, existem duas maneiras de determinar se a evidencia eprovavel ou improvavel dada a suposicao inicial:

Podemos tomar a “abordagem de valor crıtico” (Apresentado emmuitos dos livros mais antigos).

Podemos tomar a “abordagem do P-value” (que e usado na maioriadas vezes em pesquisa, artigos de revistas e software estatıstico).

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 24 / 34

Valor-P

A escolha do nıvel de significancia do teste e completamente arbitraria,uma forma alternativa para resolver esse problema e:Calcular uma quantidade chamada nıvel crıtico, probabilidade designificancia ou valor-pA abordagem P-value consiste em determinar o “provavel” ou“improvavel”, determinando a partir de probabilidade, assumindo que ahipotese nula e verdadeira. Se o valor P e pequeno, digamos P ≤ α, entaoe “provavel”, e se o valor P e grande, digamos mais do que α (P > α),entao e “improvavel”.Se o valor P < α, a hipotese nula e rejeitada em favor da hipotesealternativa. Se o valor P > α, a hipotese nula nao e rejeitada .

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 25 / 34

Teoremas

Valor P

o p-valor e a probabilidade de observar resultados extremos quanto aquelesque foram obtidos se a hipotese nula for verdadeira. A ideia e que se ovalor-p for grande ele fornece evidencia de que H0 e verdadeira, enquantoque um valor-p e pequeno, indica que existe evidencia nos dados contraH0.

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 26 / 34

Heurıstica

Podemos considerar, especificamente quatro passos para resolver qualquerproblema de teste de hipoteses com o valor-P.

1 Especificar as Hipoteses nula e alternativas.2 Usando os dados de exemplo e assumindo que a hipotese nula e verdadeira,

calcular o valor da estatıstica de teste (T-test). Para realizar o teste dehipotese para a media da populacao µ, usamos a estatıstica T.

T =X − µs√

n

3 Usando a distribuicao conhecida da estatıstica de teste, calcular o valor P:“Se a hipotese nula e verdadeira, qual e a probabilidade de que nosobservamos uma estatıstica de teste mais extremo na direcao da hipotesealternativa”

4 Definir o nıvel de significancia, α, a probabilidade de ter um erro de tipo Iser pequeno - 0,01, 0,05 ou 0,10 . Compare o valor P para α. Se o valor P≤ α, rejeitar a hipotese nula em favor da alternativa. Se o valor P > α,nrejeitar a hipotese nula.

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 27 / 34

Probabilidade de Significancia Valor-p

Valores Significados

P ≥ 0,10 Nao existe evidencia contra H0

0,05 ≤ P < 0,10 Fraca evidencia contra H0

0,01 ≤ P < 0,05 Evidecia significativa...0,001 ≤ P < 0,01 Evidencia altamente significativaP < 0,001 Evidencia extremanente significativa

Amostras de valores

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 28 / 34

Exemplo 1

Um neurologista esta testando o efeito de uma nova droga no tempo deresposta injetando em 100 ratos uma dose da droga, sujeitando cada um aestımulos neurologicos, e anotando o tempo de resposta. O neurologistasabe que a media do tempo de resposta para os ratos nao injetados com adroga e de 1,2 segundos. A media do tempo de resposta dos 100 ratosinjetados e de 1,05 segundos, com um desvio padrao amostral de 0,5segundos.Voce acha que a droga tem efeito no tempo de resposta?

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 29 / 34

Resolucao

Temos que:H0: Droga nao ter efeito =⇒ µ0 = 1,2 segundos.H1: Droga faz efeito =⇒ µ 6= 1,2s quando a droga e dada.considere H0

σx =σ√100

=S√100

=0, 5

100

σx = 0.005

z =1, 2− 1, 05

0, 05=

0, 15

0, 05= 3

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 30 / 34

Valor-P

Temos que Z=3 na Tabela de Distribuicao Normal Padronizada(tabela Z) equivalea 0,4987, isso multiplicando por dois (ja que e bilateral) da 0,9974 = 99,7%Nosso p-value equivale a 0.003

0.97x

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 31 / 34

Simulacao

Os sistemas de escapamento de uma aeronave funcionam devido a umpropelente solido. A taxa de queima desse propelente e uma caracterısticaimportante do produto. As especificacoes requerem que a taxa media dequeima tem de ser 50 centımetros por segundo. Sabemos que o desviopadrao da taxa de queima e σ=2 centımetros por segundo. Oexperimentalista decide especificar uma probabilidade do erro tipo I, ounıvel de significancia, de α=0,05. Ele seleciona uma amostra aleatoria den=25 e obtem uma taxa media amostral de queima de x = 51,3centımetros por segundo. Que conclusoes poderiam ser tiradas?

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 32 / 34

Referencias

B. Burt Gerstman (2008)

Basic Biostatistics; Statistics for public Health Practice

cap.9

Ricardo S. Ehlers (2011)

Teste de Hipotese. Notas de aulas - USP disponıvel emhttp://www.icmc.usp.br/ ehlers/inf/cap6.pdf

Vıctor H. L. Davila (2012)

Teste de Hipotese, IME-UNICAMP. Disponıvel emhttp://www.ime.unicamp.br/ hlachos/Inferencia Hipo1.pdf

Entre outros disponıveis na internet

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 33 / 34

Duvidas?

Matias Romario & Gabriel (UFC) Teste de Hipoteses e valor-P 03/06/2016 34 / 34