18
 Estatística 2 1.Teste de Hi óteses Prof. Gustavo B. Araujo Bibliografia Anderson, Sweeney e Williams – caps. 9 Morettin e Bussab – caps. 12

1.2 Testes de Hipótese - 1a Parte

Embed Size (px)

DESCRIPTION

FECAP

Citation preview

  • Estatstica 2

    1.Teste de Hipteses 1.Teste de Hipteses

    Prof. Gustavo B. Araujo

    Bibliografia

    Anderson, Sweeney e Williams caps. 9Morettin e Bussab caps. 12

  • Recapitulando

    Pesquisador Hiptese(s) sobre a realidade Dados Verificaoda(s) hiptese(s)

    - Quando coletamos dados, o que esperamos deles ?

    extrair informaes sobre o problema de interesse extrair informaes sobre o problema de interesse que essas informaes valham para a populao e no apenas para a

    amostra de dados coletados

    - Mas como fazer afirmaes sobre as caractersticas de uma populaocom base em informaes dadas por amostras ?

  • Intervalos de Confiana

    1) Construo de intervalos de confiana para estimadores amostraispontuais.

    para cada amostra coletada poderamos observar um valor distintoda estatstica de interesse.

    o interessante que, em alguns casos, como no caso da mdiaamostral, se pegarmos esses diversos valores da estatstica de interesse,veremos que eles se distribuem normalmente ao redor do valor do parmetrode interesse.

    Assim, surge a possibilidade de construir intervalos de confianapara o parmetro, baseados na distribuio amostral do estimador pontual.

  • Quando usamos intervalos de confiana ?

    em geral, quando no sabemos praticamente nada sobre oparmetro estudado e queremos levar em considerao o grau de incertezaassociado ao processo amostral.

    por ex.: na primeira pesquisa sobre inteno de voto parapresidente, no sabemos ao certo a distribuio da inteno de voto doseleitores para os candidatos. Assim, podemos recorrer construo deintervalos de confiana para as propores observadas a fim de levar emconsiderao a incerteza associada ao processo amostral.

  • Testes de Hipteses

    2) Realizao de testes de hiptese sobre parmetros da populao.

    agora estamos interessados em testar alguma afirmao feita sobreuma populao (sobre um parmetro de uma populao).

    queremos saber se os resultados amostrais parecem sustentar ou queremos saber se os resultados amostrais parecem sustentar oucontrariar tal afirmao.

    Assim, o objetivo do teste de hipteses fornecer uma metodologiaque nos permita verificar se os dados amostrais trazem evidncias que apoiemou refutem uma hiptese formulada sobre um parmetro da populao.

  • - A idia central do teste de hipteses supor verdadeira a hiptese emquesto e verificar a probabilidade que se teria de encontrar determinadoresultado amostral, dado que a hiptese verdadeira.

    se a probabilidade de encontrar o resultado amostral encontrado formuito pequena, supondo verdadeira a hiptese, passamos a acreditar que amuito pequena, supondo verdadeira a hiptese, passamos a acreditar que ahiptese no se sustenta.

    j se a probabilidade de encontrar o resultado amostral encontradono for muito pequena, supondo verdadeira a hiptese, no podemos rejeitarque a hiptese se sustente.

  • quando testamos uma hiptese, estamos tomando uma deciso:

    no temos como saber com certeza se o valor amostral obtido seaproxima do verdadeiro valor populacional.

    o que podemos fazer dizer qual a probabilidade de obter-se certo o que podemos fazer dizer qual a probabilidade de obter-se certovalor amostral, se considerarmos verdadeira a hiptese feita.

    a toma-se a deciso:- se a probabilidade de encontrar aquele resultado, considerando

    verdadeira a hiptese, for suficientemente pequena, ento rejeitamos a hiptese.- se a probabilidade de encontrar aquele resultado, considerando

    verdadeira a hiptese, no for suficientemente pequena, ento no rejeitamos ahiptese.

  • Vejamos um exemplo:

    Sabemos que os parafusos da marca A apresentam resistncia mdia trao de 155 kg com desvio padro de 20 kg. Achei um ba de parafusos,todos iguais, mas no consegui identificar sua marca. Sei que se a resistnciamdia dos parafusos no ba for igual a 155 kg, eles so da marca A. Selecioneimdia dos parafusos no ba for igual a 155 kg, eles so da marca A. Selecioneialeatoriamente 25 parafusos e calculei sua resistncia trao mdia, igual a149 kg. Os parafusos so da marca A ?

  • - Primeiro, vamos definir a hiptese que queremos testar:

    os parafusos so da marca A (ou seja, = 155 kg)

    A hiptese a ser testada ser comumente chamada de Hiptese Nulae ser representada por H .e ser representada por H0.

    H0 : = 155 kg

  • - Vamos definir, tambm, a hiptese que passaremos a considerar, casoa Hiptese Nula no se sustente:

    os parafusos no so da marca A (ou seja, 155 kg) [ou < 155 ; >155 , dependendo das informaes disponveis]

    Estas hipteses sero comumente chamadas de Hiptese Alternativae sero representadas por H1.

    H1 : 155 kg ouH1 : < 155 kg ouH1 : > 155 kg

  • O objetivo do teste de hipteses dizer se H0 deve ou no ser rejeitadacom um alto nvel de confiana.

    operacionalmente, essa deciso tomada ao observarmos aprobabilidade de encontrarmos um valor para a mdia amostral igual ao queencontramos, dada uma populao com o valor do parmetro indicado por H .encontramos, dada uma populao com o valor do parmetro indicado por H0.

    se a probabilidade de encontrarmos certo for muito baixa, dadauma populao com parmetro igual a certo 1, ento ficamos mais confiantesde que o parmetro populacional no deve ser igual a 1, mas sim a certo 2.

    em nosso exemplo, se for muito raro encontrarmos uma mdiaamostral de 149 kg para uma populao com = 155 kg, passamos a acreditarque os parafusos no pertencem marca A.

  • Para que possamos dizer se a probabilidade de encontrarmos certo grande ou pequena, devemos construir uma regio de rejeio para H0, quechamaremos de Regio Crtica (RC).

    caso o valor observado para pertena a essa regio, rejeitamos H0;caso contrrio, no rejeitamos H .

    0

    caso contrrio, no rejeitamos H0.

    essa regio construda de modo que P( RC| H0 verdadeira)seja igual a R, fixado de antemo.

  • R a probabilidade de rejeitarmos H0, mas H0 ser verdadeira (o quetambm conhecido como Erro de Tipo 1).

    mesmo que a probabilidade de encontrar certo valor amostral sejapequena, ela ainda existe. E se for to pequena a ponto de nos fazer rejeitar H0,podemos ento estar cometendo um erro, pois h a possibilidade de estarmos

    0

    podemos ento estar cometendo um erro, pois h a possibilidade de estarmosrejeitando H0, mas H0 ser verdadeira.

  • A probabilidade R de se cometer um erro de tipo I um valor queescolhemos e que recebe o nome de nvel de significncia do teste.

    quanto menor for R, menor a probabilidade de se obter umaamostra com pertencente regio crtica, o que faria com que fosse pequena aprobabilidade de que aquela amostra tivesse sido extrada de uma populaoprobabilidade de que aquela amostra tivesse sido extrada de uma populaopara a qual H0 verdadeira.

    em geral o valor fixado de R 5%, 1% ou 0,1%.

  • Voltando a nosso exemplo, vamos agora resolv-lo:

    primeiro definimos a hiptese nula e a hiptese alternativa:

    H0 : = 155 kgH : 155 kg0

    H1 : 155 kg

    a regra de deciso dever indicar dois pontos i e s tais que: seestiver entre i e s , no rejeitaremos que os parafusos sejam da marca A; seestiver fora do intervalo, diremos que no so da marca A.

  • fixaremos R = 5%. Assim temos:

    0,05 = P(erro do tipo I) = P( < i ou > s| ~ N(155,400))= P(Z < -1,96 ou Z > 1,96).

    Assim, encontramos [lembrando que ]:Assim, encontramos [lembrando que ]:

    i => -1,96 = ( i 155)/(20/5) => i = 155 7,84 = 147,16

    s => 1,96 = ( s 155)/(20/5( => s = 155 + 7,84 = 162,84

    Assim, a regio de rejeio de H0 : RC = { < 147,16 ou > 162,84}=> como RC, no rejeitamos H0, ou seja, no rejeitamos que os

    parafusos sejam da marca A.

  • dizer que no rejeitamos que os parafusos sejam da marca A noequivale a afirmar que os parafusos so da marca A.

    Isso porque, quando no rejeitamos H0, tambm podemos estarcometendo um erro: no rejeitar H0, quando H0 falsa.0 0

    Na verdade, existem muitas outras possibilidades para o valor doparmetro populacional alm daquele expresso por H0.

    E no temos como apontar com certeza qual o correto valorpopulacional.

  • o teste de hipteses serve para rejeitar hipteses e no para confirm-las.

    Isso porque:

    gostaramos de minimizar ambos os erros, mas isso infelizmente no possvel.

    quando diminumos a probabilidade de cometer o erro de tipo I [P(rejeitarH |H verdadeira)], passamos a no rejeitar H com maior facilidade.H0|H0 verdadeira)], passamos a no rejeitar H0 com maior facilidade.

    porm, quando passamos a no rejeitar H0 com maior facilidade,aumentamos a probabilidade de no rejeitar H0 quando H0 falsa (erro do tipo II).

    o mesmo se d quando tentamos minimizar a probabilidade de cometer oerro de tipo II [P(no rejeitar H0|H0 falsa)]: passamos a rejeitar H0 com maiorfacilidade, o que faz com que aumente a probabilidade de que iremos rejeitar H0 quandoH0 verdadeira.

    Assim, temos que escolher entre minimizar o erro do tipo 1 ou o erro do tipo2 e escolhemos minimizar o erro do tipo 1 (o que faz com que o teste seja bom pararejeitar hipteses, mas no para confirm-las).