Apostila de estatística 1

Embed Size (px)

Citation preview

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

SU M R I O1. INTRODUO ................................................................................................................................................................... 3 1.1. GENERALIDADES ............................................................................................................................................................ 3 1.2. METODOLOGIA DO TESTE DE HIPTESES ........................................................................................................................ 3 1.3. AS HIPTESES ................................................................................................................................................................. 4 1.4. A ESCOLHA DO TESTE ESTATSTICO ................................................................................................................................ 5 1.5. CONCEITOS ADICIONAIS DO TESTE DE HIPTESES ........................................................................................................... 5 1.6. A DISTRIBUIO AMOSTRAL ........................................................................................................................................... 8 1.7. TESTES ESTATSTICOS PARAMTRICOS ........................................................................................................................... 9 1.8. ETAPAS DO TESTE DE HIPTESES .................................................................................................................................... 9 2. TIPOS DE TESTES PARAMTRICOS ........................................................................................................................ 11 2.1. TESTES PARA UMA AMOSTRA ....................................................................................................................................... 11 2.1.1. Teste para a mdia de uma populao................................................................................................................ 11 2.1.2. Teste para a proporo........................................................................................................................................ 15 2.1.3. Teste para a varincia......................................................................................................................................... 16 2.2. TESTES PARA DUAS AMOSTRAS INDEPENDENTES .......................................................................................................... 17 2.2.1. Teste para a igualdade entre as varincias de duas populaes ........................................................................ 17 2.2.2. Teste para a diferena entre duas mdias populacionais.................................................................................... 19 2.3. DUAS AMOSTRAS RELACIONADAS (DEPENDENTES) ...................................................................................................... 25 2.3.1. Teste para a diferena entre duas propores .................................................................................................... 26 3. EXERCCIOS.................................................................................................................................................................... 29 4. RESPOSTAS...................................................................................................................................................................... 36 5. REFERNCIAS ................................................................................................................................................................ 39

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

2

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

TESTES DE HIPTESES PARAMTRICOS1 .. I N T R O D U O 1 INTRO DUO1.1. GENERALIDADESUm dos principais assuntos da Estatstica moderna a inferncia estatstica. A inferncia estatstica dividida em dois grandes tpicos: a estimao de parmetros e os testes de hipteses. No desenvolvimento dos mtodos da estatstica moderna, as primeiras tcnicas de inferncia que apareceram foram as que faziam diversas hipteses sobre a natureza da populao da qual se extraram os dados. Como os valores relacionados com a populao so denominados parmetros, tais tcnicas estatsticas foram denominadas de paramtricas.

1.2. METODOLOGIA DO TESTE DE HIP TESESNas cincias do comportamento, efetua-se levantamentos a fim de determinar o grau de aceitao de hipteses baseadas em teorias do comportamento. Formulada uma determinada hiptese particular necessrio coletar dados empricos e com base nestes dados decide-se ento sobre a validade ou no da hiptese. A deciso sobre a hiptese pode levar a rejeio, reviso ou aceitao da teoria que a originou. Para se chegar a concluso que uma determinada hiptese dever ser aceita ou rejeitada, baseado em um particular conjunto de dados, necessrio dispor de um processo objetivo que permita decidir sobre a veracidade ou falsidade de tal hiptese. A objetividade deste processo deve ser baseada na informao proporcionada pelos dados, e como estes dados, em geral, envolvem apenas parte da populao que se pretende atingir, no risco que se est disposto a correr de que a deciso tomada no esteja correta. A metodologia para a deciso sobre a veracidade ou falsidade de uma determinada hiptese envolve algumas etapas. 1. Definir a hiptese de igualdade (H0). 2. Escolher a prova estatstica (com o modelo estatstico associado) para tentar rejeitar H0. 3. Definir o nvel de significncia () e um tamanho de amostra (n).

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

3

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

4. Determinar (ou supor determinada) a distribuio amostral da prova estatstica sob a hiptese de nulidade. 5. Definir a regio de rejeio. 6. Calcular o valor da prova estatstica, utilizando os valores obtidos na(s) amostra(s). Se tal valor estiver na regio de rejeio, rejeitar, ento a hiptese nula, seno a deciso ser que a hiptese nula no poder ser rejeitada ao nvel de significncia determinado.

1.3. AS HIP TESESUma hiptese estatstica uma suposio ou afirmao que pode ou no ser verdadeira, relativa a uma ou mais populaes. A veracidade ou falsidade de uma hiptese estatstica nunca conhecida com certeza, a menos que, se examine toda a populao, o que impraticvel na maior parte das situaes. Desta forma, toma-se uma amostra aleatria da populao de interesse e com base nesta amostra estabelecido se a hiptese provavelmente verdadeira ou provavelmente falsa. A deciso de que a hiptese provavelmente verdadeira ou falsa tomada com base em distribuies de probabilidade denominadas de distribuies amostrais. Em estatstica trabalha-se com dois tipos de hiptese. A hiptese nula a hiptese de igualdade. Esta hiptese denominada de hiptese de nulidade e representada por H0 (l-se h zero). A hiptese nula normalmente formulada com o objetivo de ser rejeitada. A rejeio da hiptese nula envolve a aceitao de outra hiptese denominada de alternativa. Esta hiptese a definio operacional da hiptese de pesquisa que se deseja comprovar. A natureza do estudo vai definir como deve ser formulada a hiptese alternativa. Por exemplo, se o teste do tipo paramtrico, onde o parmetro a ser testado representado por , ento a hiptese nula seria: H0 : = 0 e as hipteses alternativas seriam: H1 : = 1 (Hiptese alternativa simples) ou H1: 0 ; > 0 ou < 0. (Hipteses alternativas compostas) No primeiro caso, H1: 0, diz-se que o teste bilateral (ou bicaudal), se H1: > 0, diz-se que o teste unilateral (ou unicaudal) direita e se H1 : < 0, ento, diz-se que o teste unilateral (ou unicaudal) esquerda.

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

4

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

1.4. A ESCOLHA DO TESTE ESTATS TICOExistem inmeros testes estatsticos tanto paramtricos quanto no paramtricos. Alguns itens devem ser levados em conta na escolha da prova estatstica para determinada situao. A maneira como a amostra foi obtida, a natureza da populao da qual se extraiu a amostra e o tipo de mensurao ou escala empregado nas definies operacionais das variveis envolvidas, isto , o conjunto de valores numricos e ainda o tamanho da amostra disponvel. Uma vez determinados a natureza da populao e o mtodo de amostragem ficar estabelecido o modelo estatstico. Associado a cada teste estatstico tem-se um modelo estatstico e condies de mensurao, o teste vlido sob as condies especificadas no modelo e pelo nvel da escala de mensurao. Nem sempre possvel verificar se todas as condies do modelo foram satisfeitas e neste caso tem-se que admitir que estas condies foram satisfeitas. Estas condies do modelo estatstico so denominadas suposies ou hipteses do teste. Qualquer deciso tomada atravs de um teste estatstico somente ter validade se as condies do modelo forem vlidas. bvio que quanto mais fracas forem as suposies do modelo mais gerais sero as concluses. No entanto, as provas mais poderosas, isto , as que apresentam maior probabilidade de rejeitar H0 quando for falsa, so as que exigem as suposies mais fortes ou mais amplas.

1.5. CONCEITOS ADICIONAIS DO TESTE DE HIP TESESAlm dos conceitos j vistos para o teste de hipteses necessrio ainda definir os erros envolvidos e as regies de rejeio e de aceitao. Para ilustrar estes conceitos ser suposto o seguinte teste a ser feito: Dispem-se de duas moedas com aparncia idntica, s que uma (M1) equilibrada, isto , P(Cara) = P(Coroa) = 50%, enquanto que a outra (M2) viciada de tal forma que favorece cara na proporo de 80%, ou seja, P(Cara) = 80% enquanto que P(Coroa) = 20%. Supem-se que uma das moedas lanada e que com base na varivel X = nmero de caras, deve-se decidir qual delas foi lanada. Neste caso o teste a ser feito envolve as seguintes hipteses: H0: A moeda lanada a equilibrada (M1), ou seja, p = 50% H1: A moeda lanada a viciada (M2), ou seja p = 80%, onde p a proporo de caras. Tem-se que tomar a deciso de apontar qual foi a moeda lanada, baseado apenas em uma amostra, por exemplo 5 lanamentos, de uma populao infinita de lanamentos possveis. A deciso, claro, estar sujeita a erros, pois se est tomando a deciso em condies de incerteza.

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

5

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

A deciso ser baseada nas distribuies amostrais das duas moedas. A tabela 01 mostra as probabilidades de se obter os valores: 0, 1, 2, 3, 4 e 5, da varivel X = nmero de caras, em 5 lanamentos de cada uma das moedas. Tabela 01 - Probabilidades de se obter cara em 5 lanamentos de uma moeda x 0 1 2 3 4 5 Total P(X = x) sob H0 1/32 3,125% 5/32 15,625% 10/32 31,250% 10/32 31,250% 5/32 15,625% 1/32 3,125% 1 100% P(X = x) sob H1 1/3125 0,032% 20/3125 0,640% 160/3125 5,120% 640/3125 20,480% 1280/3125 40,960% 1024/3125 32,768% 1 100%

Para poder aceitar ou rejeitar H0 e como conseqncia, rejeitar ou aceitar H1, necessrio estabelecer uma regra de deciso, isto , necessrio estabelecer para que valores da varivel X vai-se rejeitar H0, ou seja, afirmar H1, e para que valores da varivel X, vai-se aceitar H0, ou seja, nesta situao particular, afirmar H0. Desta forma, estabelecendo-se que se vai rejeitar H0, se a moeda lanada der um nmero de caras igual a 3, 4 ou 5, pode-se ento determinar as probabilidades de tomar as decises corretas ou as probabilidades dos erros envolvidos. Assim o conjunto de valores que levar a rejeio da hiptese nula ser denominado de regio crtica (RC) e, neste caso, este conjunto igual a: RC = { 3, 4, 5 } A faixa restante de valores da varivel denominada de regio de aceitao (RA) e, neste caso, este conjunto vale: RA = { 0, 1, 2 } Evidentemente esta regra como qualquer outra permitir decidir sob a H0, mas estar sujeita a erro. Est se tomando a deciso de aceitar ou rejeitar H0 com base no nmero X de caras obtidas em 5 lanamentos, que apenas uma amostra, muito pequena, do nmero infinito de lanamentos possveis. Com base em resultados amostrais, no possvel tomar decises definitivamente corretas. Entretanto, pode-se calcular a probabilidade da deciso estar errada. Neste caso foi decidido rejeitar H0 se X = nmero de caras assumir um dos valores do conjunto RC. No entanto, tais valores podem ocorrer sob H0, isto , tais valores podem ocorrer quando se lana a moeda M1, conforme tabela. Ento se H0 for rejeitada porque X assumiu o valor 3, 4 ou 5, pode-se estar cometendo um erro. A probabilidade deste erro igual a probabilidade de ocorrncia destes valores sob H0, isto , quando a moeda M1 lanada, que conforme tabela igual a: 10/32 + 5/32 + 1/32 = 16/32 = 50%P r o f . L o r V ia li, D r . v ia l i@ p u c r s . b r h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/ 6

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

Lembrando que rejeitar H0 apenas uma das duas situaes possveis num teste de hipteses, tem-se que se X assumir um valor do conjunto RA se aceitar Ho. Mas tais valores podem ocorrer sob H1, isto , quando a moeda M2 lanada. Ento se Ho for aceita porque X assumiu um dos valores: 1, 2 ou 3, pode-se estar cometendo um outro tipo de erro, cuja probabilidade igual a da ocorrncia destes valores sob H1 que de: 1/3125 + 20/3125 + 160/3125 = 181/3125 = 5,79% A probabilidade de que a varivel (nmero de caras) assuma um valor do conjunto RC denominada de nvel de significncia do teste. O nvel de significncia do teste , na realidade, a probabilidade de se rejeitar a hiptese nula, quando ela verdadeira, sendo ento a probabilidade de se cometer um erro. Como este apenas um dos dois tipos de erro possvel de ser cometido num teste de hipteses, ele denominado de erro do tipo I. O outro tipo de erro possvel de ser cometido aceitar H0 quando ela falsa e denominado de erro do tipo II. Em resumo pode-se ter as seguintes situaes em um teste de hipteses: Tabela 02 - Possibilidades envolvidas em um teste de hipteses Deciso Aceitar H0 Deciso correta H0 verdadeira Rejeitar H0 Erro do Tipo I

Realidade

1 - = P(Aceitar H0 / H0 V) = = P(Erro do tipo I) = P(H0 / H0) P(Rejeitar H0 / H0 V) = Nvel de significncia do teste = P(H1 / H0) Erro do Tipo II Deciso correta = P(Erro do tipo II) = 1 - = P(Rejeitar H0 / H0 falsa) = P(Aceitar H0 / H0 falsa) = = P(H1 / H1) = Poder do teste. P(Aceitar H0 /H1 V) = P(H0 /H1)

H0 falsa

Pode-se, agora, determinar as probabilidades de se cometer os erros dos tipos I e II e como conseqncia as probabilidades de se tomar as decises corretas. A probabilidade de se cometer erro do tipo II, pode ser determinada aqui, porque o teste do tipo simples, isto , a hiptese alternativa envolve um nico valor (neste caso p = 80%). Geralmente, a hiptese alternativa do tipo composto (p < 80% ou p > 80% ou ainda p 80%), e ento a determinao do erro do tipo II s poder ser feita mediante suposies respeito dos valores que ela pode assumir. Existiro, na realidade, infinitas opes para o erro do tipo II. Para este caso, tem-se: = nvel de significncia do teste = P(Erro do tipo I) = P(rejeitar H0 / H0 verdadeira) = P( x RC / p = 50%) = P( x { 3, 4, 5 }/ p = 50%) = 10/32 + 5/32 + 1/32 = 16/32 = 50%

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

7

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

1 - = P(Deciso correta) = P(Aceitar H0 / H0 verdadeira) = P( x RA / p = 50%) = P( x { 0, 1, 2 }/ p = 50%) = 1/32 + 5/32 + 10/32 = 16/32 = 50% = P(Erro do tipo II) = P(Aceitar H0 / H0 falsa) = P( x RA / p = 80%) = P( x { 0, 1, 2 }/ p = 80%) = 1/3125 + 20/3125 + 160/3125 = 181/3125 = 5,69% 1 - = Poder do teste = P(Deciso correta) = P(Rejeitar H0 / H0 falsa) = P( x RC / p = 80%) = P( x { 3, 4, 5 }/ p = 80%) = 640/3125 + 1280/3125 + 1024/3125 = 2944/3125 = 94,31% Por estes resultados pode-se verificar, que o erro do tipo II poderia ser aceitvel, mas o erro do tipo I no, pois um valor igual a probabilidade de se decidir corretamente. Neste caso, uma opo para diminuir o erro do tipo I seria mudar a regio de rejeio. Se a regio crtica escolhida tivesse sido RC = { 5 }, isto , rejeitar a hiptese nula somente se em 5 lanamentos da moeda fosse obtida 5 caras as probabilidades acima ficariam: = nvel de significncia do teste = P(Erro do tipo I) = P(Rejeitar H0 / H0 verdadeira) = P( x RC / p = 50%) = P( x { 5 }/ p = 50%) = 1/32 = 3,12%. 1 - = 1 - P(Erro do tipo I) = P(Aceitar H0 / H0 verdadeira) = P( x RA / p = 50%) = P( x { 0, 1, 2, 3, 4 } / p = 50%) = 1/32 + 5/32 + 10/32 + 10/32 + 5/32 = 31/32 = 96, 88%. = P(Erro do tipo II) = P(Aceitar H0 / H0 falsa) = P( x RA / p = 80%) = P(x { 0, 1, 2, 3, 4}/ p = 80%) = 1/3125 + 20/3125 + 160/3125 + 640/3125 + 1280/3125 = 2101/3125 = 67,33%. 1 - = 1 - P(Erro do tipo II) = P(Rejeitar H0 / H0 falsa) = P( x RC / p = 80%) = P( x { 5 }/ p = 80%) = 1024/3125 = 32,77% = Poder do teste. Pode-se ver ento que o erro do tipo I diminui sensivelmente, mas em compensao tivemos um aumento substancial do erro do tipo II. Isto sempre vai ocorrer. A nica forma de reduzir os dois tipos de erro simultaneamente pelo aumento do tamanho da amostra. Neste caso, est se considerando uma amostra de apenas 5 lanamentos dos infinitos possveis. natural que os erros associados sejam grandes, pois a amostra muito pequena. Aumentado-se o tamanho da amostra possvel com a mesma regio crtica diminuir sensivelmente os dois tipos de erro.

1.6. A DISTRIB UIO AMOSTRALA distribuio amostral uma distribuio de probabilidade, isto , uma distribuio terica que descreve o comportamento de uma determinada estatstica ou estimador. As principais estatsticas utilizadas nos testes de hipteses possuem modelos conhecidos. Tm-se a distribuio normal, aP r o f . L o r V ia li, D r . v ia l i@ p u c r s . b r h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/ 8

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

distribuio t (de Student) a distribuio 2 (qui-quadrado), a distribuio F (de Snedkor) como as principais.

1.7. TESTES ESTATSTICOS PARAMTRICOSEm termos gerais, uma hiptese uma conjectura sobre algum fenmeno ou conjunto de fatos. Em estatstica inferencial o termo hiptese tem um significado bastante especifico. uma conjectura sobre uma ou mais parmetros populacionais. O teste de hipteses paramtrico envolve fazer inferncias sobre a natureza da populao com base nas observaes de uma amostra extrada desta populao. Questo a ser feita Populao Valor hipottico do parmetro. Selecionada Aleatoriamente Amostra Valor observado da estatstica. = 455 Qual a magnitude da diferena entre o valor observado da estatstica e o valor hipottico da parmetro? Deciso a ser tomada No rejeitar a hiptese Diferena pequena Diferena grande Rejeitar a hiptese

x = 435

Figura 01 - A lgica do teste de hipteses Em outras palavras, testar hipteses, envolve determinar a magnitude da diferena entre um valor observado de uma estatstica, por exemplo a proporo p, e o suposto valor do parmetro () e ento decidir se a magnitude da diferena justifica a rejeio da hiptese. O processo segue o esquema da figura 01.

1.8. ETAPAS DO TESTE DE HIP TESES Qualquer teste de hipteses paramtrico segue os seguintes passos: 1. F ormular as hipteses.Estabelecer as hipteses nula e alternativa. A construo de um teste de hipteses pode ser colocado de forma geral do seguinte modo. Toma-se uma amostra da varivel (ou das variveis) X (no

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

9

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

caso) de uma dada populao, de onde se tem uma hiptese sobre um determinado parmetro, por exemplo: . Esta hiptese a hiptese nula ou hiptese de igualdade: H0: = 0 Tendo formulado a hiptese nula conveniente determinar qual ser a hiptese aceita caso a hiptese nula seja rejeitada, isto , convm explicitar a hiptese alternativa. A hiptese alternativa vai depender de cada situao mas de forma geral tem-se: H1: = 2 (hiptese simples), ou ento o que mais comum, hipteses compostas: H1: > 0 (teste unilateral ou unicaudal direita) < 0 (teste unilateral ou unicaudal esquerda) 0 (teste bilateral ou bicaudal)as hipteses so do tipo composto.

2. Determinar a estatsti ca (es ti mador ) a ser utilizado.Aps fixar as hipteses necessrio determinar se a diferena entre a estatstica amostral e o suposto valor do parmetro da populao suficiente para rejeitar a hiptese. A estatstica utilizada deve ser definida e sua distribuio terica determinada.

3. F ixar o nvel de significncia do teste.Fixar a probabilidade de ser cometer erro do tipo I, isto , estabelecer o nvel de significncia do teste. Fixado o erro do tipo I, possvel determinar o valor crtico, que um valor lido na distribuio amostral da estatstica considerada (tabela). Este valor vai separar a regio de crtica (de rejeio) da regio de aceitao.

4. Calcular a esta tstica teste (a esti ma tiva).Atravs da amostra obtida calcular a estimativa que servir para aceitar ou rejeitar a hiptese nula. Dependendo do tipo de hiptese alternativa este valor servir para aceitar ou rejeitar H0. O procedimento :

Teste estatstico = (Estatstica - Parmetro) / Erro padro da Estatstica 5. To ma r a deciso.Se o valor da estatstica estiver na regio crtica rejeitar Ho, caso contrrio, aceitar H0.

6. F ormular a concluso.Com base na aceitao ou rejeio da hiptese nula, enunciar qual a deciso a ser tomada na situao do problema.P r o f . L o r V ia li, D r . v ia l i@ p u c r s . b r h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

10

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

2 .. T IP O S D E T E S T E S PA R A M T R IC O S 2 T IP O S D E T E S T E S PA R A M T R IC O SOs testes paramtricos podem ser divididos em testes para: Uma amostra Duas amostras independentes Duas amostras emparelhadas (dependentes) Vrias amostras (Anlise de Varincia)

2.1. TESTES PARA UMA AMOSTRA2.1.1. T E ST E PARA A M DI A DE UMA P OP UL AO

(a) conhecidoO teste para a mdia de uma populao pode ser executado com qualquer tamanho de amostra se soubermos que a populao de onde for extrada a amostra segue uma distribuio normal. Se a distribuio da populao no for conhecida ento necessrio trabalhar com amostras grandes (pelo menos 30 elementos) para poder garantir a normalidade da mdia da amostra atravs do teorema central do limite. As hipteses so: H0: = 0 contra H1: = 1 ou ento, o que mais comum: H1: > 0 < 0 0 A estatstica teste utilizada aqui a mdia da amostra: X . Esta mdia para ser comparada com o valor tabelado, determinado em funo da probabilidade do erro do tipo I, (isto , o nvel de significncia do teste), precisa ser primeiramente padronizada. Isto feito, baseado no seguinte resultado: Se X uma varivel aleatria normal com mdia e desvio padro , ento a varivel: Z = (X - ) /

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

11

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

Tem uma distribuio normal com mdia 0 e desvio padro 1. A varivel resultante Z se encontra tabelada. Qualquer livro de Estatstica traz esta tabela que fornece os valores desta varivel, para z variando de -3,9 at 3,9 em intervalos de 0,1 (aproximao decimal), entre -3,9 e -3,0 e entre 3,0 e 3,9, e em intervalos de 0,01 (aproximao centesimal) para os valores entre -3,0 e 3,0. Para X sabe-se que X = (mdia das mdias) que X = n (erro padro da mdia), ento o valor padronizado de X ser: Z = (X - X ) / X = (X - ) / n Supondo-se fixado um nvel de significncia de = P(Erro do Tipo I), verifica-se na tabela qual o valor de z (no teste unilateral) ou z/2 (teste bilateral). Rejeita-se H0 (hiptese nula) se o valor de z calculado na expresso acima for: (i) Maior do que z (no teste unilateral direita); (ii) Menor do -z (no teste unilateral esquerda) e (iii) Maior que z/2 ou menor que -z/2 (no teste bilateral). Tabela 03 - Valores de z para alguns nveis de significncia = Nvel de significncia = P(Erro do Tipo I) 10% Teste bilateral Teste unilateral Exemplo A associao dos proprietrios de indstrias metalrgicas est preocupada com o tempo perdido em acidentes de trabalho, cuja mdia, nos ltimos tempos, tem sido da ordem de 60 hora /homens por ano com desvio padro de 20 horas/homem. Tentou-se um programa de preveno de acidentes e, aps o mesmo, tomou-se uma amostra de 9 indstrias e mediu-se o nmero de horas/homem perdidas por acidente, que foi de 50 horas. Voc diria, ao nvel de 5%, que h evidncia de melhoria? Soluo As hipteses a serem testadas so: H0: = 60 hora/homens H1: < 60 hora/homensP r o f . L o r V ia li, D r . v ia l i@ p u c r s . b r h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/ 12

5% 1,96 1,64

1% 2,57 2,33

1,64 1,28

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

A evidncia amostral para sugerir que a mdia baixou dada atravs da amostra de n = 9 (elementos) que forneceu x = 50 horas/homens. Vamos testar se esta diferena de 10 horas/homens ou no significativa ao nvel de 5%. Para isto necessrio padronizar o resultado amostral. Z = (X - X ) / X = (X - ) / / n = (50 - 60) / 20/ 9 = -1,50 Para saber se este valor (-1,50) pouco provvel necessrio compar-lo com o valor crtico z (pois se trata de um teste unilateral esquerda), que neste caso vale -1,64, j que o nvel de significncia foi fixado em 5%. V-se portanto que o valor amostral no inferior ao valor crtico, no estando portanto na regio de rejeio. Isto quer dizer que a diferena apresentada na amostra no suficientemente grande para provar que a campanha de preveno deu resultado. Ento a concluso : No possvel ao nvel de 5% de significncia afirmar que a campanha deu resultado, isto , rejeitar H0. Convm lembrar que o fato de no rejeitar a hiptese nula, no autoriza a fazer afirmaes a respeito da veracidade dela. Ou seja, no se provou H0, pois no momento que se aceita a hiptese nula, o risco envolvido o do Tipo II, e este neste caso no est fixado (controlado). O teste de hipteses feito para rejeitar a hiptese nula e sua fora est na rejeio. Assim quando se rejeita se prova algo, mas quando se aceita, nada se pode afirmar.

(b) desconhecido A distribuio t de StudentQuando o desvio padro populacional () desconhecido necessrio estim-lo atravs do desvio padro da amostra (s). Mas ao substituir o desvio padro da populao na expresso: Z = (X - X ) / X = (X - ) / / n no teremos mais uma distribuio normal. De fato, conforme demonstrado por W. S. Gosset (Student) a distribuio da varivel: (X - X ) / X = (X - ) / s/ n $ No mais normal padro. Ao substituir por s na expresso teremos uma distribuio parecida com a normal, isto , simtrica em torno de zero, porm com uma variabilidade maior. Desta forma a distribuio t mais baixa no centro do que a normal padro, mas mais alta nas caudas. Assim:

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

13

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

(X - X ) / X = (X - ) / s/ n = tn-1, onde n - 1 indica a distribuio t considerada, pois $ cada tamanho de amostra produz uma distribuio de Student diferente. A distribuio t de Student encontra-se tabelada em funo de n = tamanho da amostra ou ento em funo de n - 1 denominado de graus de liberdade da distribuio. Neste caso cada linha de uma tabela se refere a uma distribuio particular e cada coluna da tabela a um determinado nvel de significncia. Conforme a tabela o nvel de significncia poder ser unilateral ou bilateral. Em todo caso necessrio sempre ler no cabealho ou no rodap da tabela as explicaes sobre como ela est estruturada. Desta forma a diferena entre o teste para a mdia de uma populao com conhecido e um com desconhecido que necessrio trocar a distribuio normal padro pela distribuio t de Student. Exemplo O tempo mdio, por operrio, para executar uma tarefa, tem sido 100 minutos. Introduziu-se uma modificao para diminuir este tempo, e, aps certo perodo, sorteou-se uma amostra de 16 operrios, medindo-se o tempo de execuo gasto por cada um. O tempo mdio da amostra foi 85 minutos com desvio padro de 12 minutos. Este resultado evidencia uma melhora no tempo gasto para realizar a tarefa? Apresente as concluses aos nveis de 5% e 1% de significncia e diga quais as suposies tericas necessrias que devem ser feitas para resolver o problema. Soluo A suposio terica necessria admitir que a distribuio da populao de onde foi extrada a amostra segue uma normal pois n < 30. H0: = 100 H1: < 100 Considerando, ento, um teste unilateral esquerda e tendo = 5% ( = 1%) tem-se que a regio de rejeio constituda por RC = [-, -1,753].(RC = [-, -2,602]) O valor de teste : t15 =X s n

=

85 100 12 4

= -5

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

14

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

Como este valor pertence as duas regies crticas, pode-se rejeitar a hiptese nula, aos nveis de 5% e 1% de significncia, isto , neste caso, pode-se afirmar que a modificao diminuiu o tempo de execuo da tarefa. 2.1.2. T E ST E PARA A P ROP ORO O teste para a proporo populacional normalmente baseado na seguinte suposio: tem-se uma populao e tem-se uma hiptese sobre a proporo de elementos da populao que possuem uma determinada caracterstica. Esta proporo supostamente igual a um determinado valor 0. Assim a hiptese nula : H0 : = 0 O problema fornece informaes sobre a alternativa, que pode ser uma das seguintes: H1 : 0 H1 : > 0 H1 : < 0 A estatstica teste a ser utilizada a proporo amostral P, que para amostras grandes (n > 50) tem uma distribuio aproximadamente normal com mdia:

P = , e desvio padro

P =

(1 ) n

Exemplo As condies de mortalidade de uma regio so tais que a proporo de nascidos que sobrevivem at 60 anos de 0,60. Testar esta hiptese ao nvel de 5% de significncia se em 1000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes at os 60 anos. Soluo H1: = 0,60 H0: 0,60 Considerando, ento, um teste bilateral e tendo = 5% tem-se que a regio de aceitao constituda pelo intervalo RA = [-1,96, 196]. O valor de teste :

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

15

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS p (1 ) n 0,53 0,60 060(1 0,60) 1000

z=

=

= -4,52.

Como este valor no pertence a regio de aceitao, pode-se rejeitar a hiptese nula, ao nvel de 5% de significncia, isto , neste caso, pode-se afirmar que a taxa dos que sobrevivem at os 60 anos menor do que 60%. Neste caso, tambm poderia ser realizado um teste unilateral esquerda. Este teste tambm rejeitaria a hiptese nula, pois para ele o valor crtico z = -1645. 2.1.3. T E ST E PARA A VARI NCI A Para aplicar o teste para a varincia necessrio supor a normalidade da populao de onde ser extrada a amostra. As hipteses so: H0: 2 = 2 contra 0 H1: 2 2 0

2 > 2 0 2 < 2 0A estatstica teste (n 1) s2

2 0

21 n

Quer dizer o quociente acima tem uma distribuio qui-quadrado com n-1 graus de liberdade. A qui-quadrado uma distribuio assimtrica positiva que varia de zero a mais infinito. Esta distribuio tabelada tambm em funo dos nmero de graus de liberdade, isto , cada grau de liberdade (n -1) representa uma distribuio diferente. As colunas das tabelas representam diferentes nveis de significncia, isto , rea sob a curva acima do valor tabelado. Em funo do tipo de hiptese alternativa define-se a regio de rejeio. No primeiro caso tem-se uma regio de rejeio do tipo bilateral. Logo, fixado um nvel de significncia , a regio crtica ser2 RC = [0, 1 ] U [ 2 , ). Desta forma, aceita-se a hiptese nula se a estatstica teste, acima, pertencer 2 2 ao intervalo [ 1 , 2 ]. 2

Exemplo Uma das maneiras de controlar a qualidade de um produto controlar a sua variabilidade. Uma mquina de empacotar caf est regulada para encher os pacotes com desvio padro de 10 g eP r o f . L o r V ia li, D r . v ia l i@ p u c r s . b r h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/ 16

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

mdia de 500g e onde o peso de cada pacote distribu-se normalmente. Colhida uma amostra de n = 16, observou-se uma varincia de 169 g2. possvel afirmar com este resultado que a mquina est desregulada quanto a variabilidade, supondo uma significncia de 5%? Soluo H0: 2 = 100 contra H1: 2 100

2 = (15.169)/100 = 25,35. cComo = 5% a regio de aceitao a regio compreendida entre os valores: [ 97, 5% , 2,5% ] = [6,26, 27,49]. Como o valor calculado pertence a esta regio, aceita-se H0, isto ,2

2

com esta amostra no possvel afirmar que a mquina est desregulada, ao nvel de 5% de significncia. Supem-se a existncia de duas populaes. Uma populao X com mdia X e desvio padro

X e uma populao Y com mdia Y e desvio padro Y . Da populao X extrada uma amostra detamanho n com mdia X e da populao Y extrada uma amostra de tamanho m com mdia Y . Define-se a varivel D como sendo a diferena entre as duas mdias amostrais. Assim D = X - Y e tem-se:

D = E(D ) = E( X - Y ) = E( X ) - E( Y ) = X - Y Y D = V( D ) = V( X - Y ) = V( X ) + V( Y ) = nX + m .2 2

2.2. TESTES PARA DUAS AMOSTRAS INDEP ENDENTESNeste tipo de teste so retiradas duas amostras de forma independente, isto , as medidas so obtidas em unidades amostrais diferentes. 2.2.1. T E ST EP OP UL AE S PARA A I GUAL D ADE E NT RE AS VARI NCI AS DE DUAS

Supem-se a existncia de duas populaes. Uma populao X com mdia X e desvio padro

X e uma populao Y com mdia Y e desvio padro Y . Da populao X extrada uma amostra detamanho n com mdia X e varincia S2 e da populao Y extrada uma amostra de tamanho m X com mdia Y e varincia S2 . YP r o f . L o r V ia li, D r . v ia l i@ p u c r s . b r h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/ 17

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

As hipteses so: H0: 2 = 2 = 2 X Y H1: 2 2 X Y Nestas condies sabe-se que:

(n 1) S2 X

2 X

: n 1 e2

(m 1) S2 Y

2 Y

: m12

Sob a hiptese de H0 ser verdadeira (isto , 2 = 2 ) tem-se: X Y S2 X n1 = = F(n 1 m 1) , isto , o quociente entre as varincias amostrais possui uma , 2 2 2 SY Y m1m1

2 n1 X

2

Q=

distribuio F (de Snedekor) com n-1 graus de liberdade no numerador e m - 1 graus de liberdade no denominador. Como a distribuio F depende de dois parmetros 1 e 2, uma tabela tridimensional ser necessria para computar os valores de F correspondentes a diferentes probabilidades e valores de 1 e

2. Como conseqncia, somente os pontos da cauda direita de 5% e 1% de rea so tabelados,correspondendo a vrios valores de 1 e 2, isto , encontram-se tabelados os valores P(F > f) = 0,01 e P(F > f) = 0,05. Para poder se obter valores bilaterais da distribuio F necessrio usar a propriedade que se F tal que tem uma distribuio com 1 e 2 graus de liberdade, ento F = 1 / F tem distribuio F com 2 e 1 graus de liberdade. Assim a probabilidade de que F < f pode ser calculada por: P(F < f) = P(1 / F > 1 / f) = P(F > 1 / f) Lembrando que s so fornecidos valores com as significncias de 1% e 5%. Outro valor entre estes dois poder ser obtido aproximadamente por interpolao. Assim por exemplo dados 1 = 5 (graus de liberdade do numerador) e 2 = 8 (graus de liberdade do denominador), o valor de f de F(5, 8) tal que P(F > f) = 5% f = 3,69. Ento o valor f de F(5, 8) tal que P(F < f) = 5% dado por: 1 / F(8, 5) = 1 / 4,82 = 0,21. Fixado um nvel de significncia a regio crtica RC encontrada atravs de dois valores F1 e F2 da distribuio F tais que: P(F RC) = P(F < F1 ou F > F2) = , onde F1 e F2 so encontrados na tabela de modo a satisfazer a igualdade: P(F < F1) = P(F > F2) = /2.P r o f . L o r V ia li, D r . v ia l i@ p u c r s . b r h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

18

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

Exemplo: (BUS81 - pg. 275) Quer se verificar se duas mquinas produzem peas com a mesma homogeneidade quanto resistncia tenso. Para tal, sorteiam-se duas amostras de 6 peas de cada uma das mquinas e observa-se as resistncias. Os resultados esto na tabela. Mquina X Mquina Y Soluo: Como n = m = 6, tem-se que: Q= S2 X = F(5, 5) = 5,05 2 SY 145 143 127 128 136 132 142 138 141 142 137 132

A regio crtica RC ser: RC = (0; 1/5,05) U (5,05; ) = (0; 0,20) U (5,05; ) As amostras fornecem:S2 = 40 e S2 = 37, portanto a distribuio do quociente Q calculado ser: Y X

Qc =

S2 X = 40 / 37 = 1,08. 2 SY

Por estes resultados no possvel rejeitar a hiptese de igualdade entre as varincias a um nvel de significncia de 10%. (Como o teste bilateral, ele envolve uma rea de 5% em cada cauda da distribuio, logo a significncia total de 10%). 2.2.2. T E ST E PARA A DI F E RE NA E NT RE DUAS M DI AS P OP UL ACI ONAI S

(a) Supondo as varincias ( 2 e 2 )conhecidas X YAs hipteses so: H0: X - Y = contra H1: X - Y ou

X - Y > ou ainda X - Y < Se = 0, ento X - Y = 0, isto , X = Y.

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

19

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

Como as varincias so conhecidas, tem-se ento que, para n, m 30 ou para amostras extradas de populaes normais, que a varivel D = X - Y ter uma distribuio aproximadamente normal com mdia E( D ) = X - Y e varincia V( D ) = X + Y .n m2 2

A varivel teste ser, ento: z=XY

X + Yn m

2

2

Assim fixando o nvel de significncia , a hiptese nula ser rejeitada se: |z| > z/2 no teste bilateral; z > z, no teste unilateral direita e z < z no teste unilateral esquerda. Exemplo: Um fabricante produz dois tipos de pneus. Para o pneu do tipo A o desvio padro de 2500 km e para o pneu do tipo B de 3000 km. Uma cia de txis testou 50 pneus do tipo A e 40 do tipo B, obtendo 24000 km de mdia para o A e 26000 para o tipo B. Adotando = 4% testar a hiptese de que a durao mdia dos dois tipos a mesma. Soluo: As hipteses so: H0: A - B = 0 ( A = B ) contra H1: A - B 0 ( A B ) Como = 4%, ento z/2 = -2,05. O valor da varivel teste ser: z=24000 26000 25002 30002 + 50 40

= -3,38

Portanto, rejeita-se a hiptese de igualdade entre as duraes mdias dos dois tipos de pneus. Com base nestas amostras, pode-se afirmar, ao nvel de 4% de significncia, que os dois tipos de pneus diferem quanto a durabilidade mdia.

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

20

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

(b) Va rincias 2 e 2 desconhecidas, mas supostamente iguais X YVamos supor que as duas populaes tenham a mesma varincia 2 = 2 = 2 , porm X Y desconhecidas. As hipteses so: H0: X - Y = contra H1: X - Y ou

X - Y > ou ainda X - Y < A varivel teste anterior, para esta situao, ser: Z=X Y

X + Yn m

2

2

, mas neste caso 2 = 2 = 2 (por suposio), ento: X Y

Z =

XY

=

XY

=

XY 1 1 + n m

, como o valor 2 no conhecido, dever ser

X + Yn m

2

2

+n

2

2

m

substitudo por um estimador no-tendencioso. Como S2 e S2 so estimadores no tendenciosos do Y X mesmo parmetro 2, ento, a mdia ponderada:

S=2

(n 1)S2 + (m1)S2 X Y , tambm ser um estimador no-tendencioso de 2. n + m 2

Logo a expresso acima poder ser escrita como:XY 1 1 S + n m

, que ter uma distribuio no mais normal mas sim t com n + m 2 graus de

liberdade, desde que n, m sejam maiores ou iguais a 30, ou ento que as amostras tenham sido extradas de populaes que tenham distribuies normais. Desta forma, a expresso para testar a diferena entre duas mdias populacionais, nesta situao ser: tc = tn+m-2 =XY S 1 1 + n m

Assim fixando o nvel de significncia , a hiptese nula ser rejeitada se: |tc| > t/2 no teste bilateral;P r o f . L o r V ia li, D r . v ia l i@ p u c r s . b r h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/ 21

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

tc > t, no teste unilateral direita e tc < t no teste unilateral esquerda. Exemplo: As resistncias de dois tipos de concreto foram medidas, mostrando os resultados da tabela. Fixado um nvel de significncia de 5%, existe evidncia de que o concreto do tipo A seja mais resistente do que o concreto do tipo B. Tipo A Tipo B Soluo: Antes de mais nada vamos testar se as duas populaes possuem a mesma varincia. Para tanto aplica-se o teste de igualdade de varincias, utilizando as amostras acima e uma significncia de 5%. Tem-se: Graus de liberdade: 4 (numerador), 4 (denominador) F = 7,5/5,0 = 1,50. F2,5% = 0,10 F97,5% = 9,60 Significncia do resultado obtido: 35,20%. Neste caso, no possvel afirmar que as varincias populacionais so diferentes. As hipteses so: H0: A - B = 0 ( A = B ) contra H1: A - B > 0 ( A > B ) Os dados obtidos da tabela so:X = 55,0 e Y = 53,0 S2 = 7,50 e S2 = 5,0, ento S = X Y2

54 50

55 54

58 56

51 52

57 53

(n 1 S2 + (m 1)S2 ) X Y n + m 2

=

(5 1 7,5 + (5 1 5,0 ). ). = 6,25. 5 +5 2

O valor da varivel teste ser: tc =55 53 1 1 2,50. + 5 5

= 1,265

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

22

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

Como = 5%, e o grau de liberdade n - m - 2 = 10 - 2 = 8, ento o valor de t tabelado ser: 1,86. Neste caso, com estas amostras no possvel afirmar que o concreto do tipo A seja mais resistente do que o concreto do tipo B.

(c) Va rincias 2 e 2 desconhecidas e supostamente desiguais X YAs hipteses so: H0: X - Y = contra H1: X - Y ou

X - Y > ou ainda X - Y < Como as varincias so desconhecidas necessria estim-las atravs das varincias amostrais S2 e S2 . Neste caso, ao se substituir as varincias populacionais pelas amostrais na X Y expresso:X Y2 X 2 Y

no se ter mais uma distribuio normal, mas sim uma distribuio t com o

n

+

m

grau de liberdade fornecido pela seguinte expresso:

=

S2 S 2 X+ Y n m S2 X n n 12

2

+

S2 Y m m 1

2

desde que n, m sejam maiores ou iguais a 30, ou ento que as amostras tenham sido extradas de populaes que tenham distribuies normais. Assim fixando o nvel de significncia , a hiptese nula ser rejeitada se: |tc| > t/2 no teste bilateral; tc > t, no teste unilateral direita e

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

23

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

t < t no teste unilateral esquerda, onde t =

XY

SX + SYn m

2

2

Exemplo: As resistncias de dois tipos de concreto foram medidas, mostrando os resultados da tabela. Fixado um nvel de significncia de 5%, existe evidncias de que o concreto do tipo A seja mais resistente do que o concreto do tipo B. Tipo A Tipo B Soluo: Antes de mais nada vamos testar se as duas populaes possuem a mesma varincia. Para tanto aplica-se o teste de igualdade de varincias, utilizando as amostras acima e uma significncia de 10%. Tem-se: Graus de liberdade: 4 (numerador), 4 (denominador). F = 17,3/2,5 = 6,92. Significncia do resultado obtido: 4,38%. F crtico: 6,39. Neste caso, possvel afirmar que as varincias populacionais so diferentes. As hipteses so: H0: A - B = 0 ( A = B ) contra H1: A - B > 0 ( A > B ) Os dados obtidos da tabela so:X = 55,6 e Y = 53,0 S2 = 17,3 e S2 = 2,5 X Y

54 51

55 54

58 55

50 52

61 53

O valor da varivel teste ser: t= 55,6 53,0 = 1,31 17,3 2,5 + 5 5

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

24

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS S2 S 2 X+ Y n m 2 2

Com = 5%, e o grau de liberdade =

S2 S 2 X Y n m + n1

2

m 1

17,3 2,5 + 6,25 5 = 5 = = 5,48 0,8125 2 2 17,3 2,5 5 5 + 4 4

2

5, ento o valor de t tabelado ser: 2,57. Neste caso, com estas amostras no possvel afirmar que o concreto do tipo A seja mais resistente do que o concreto do tipo B.

2.3. DUAS AMOSTRAS RELACIONADAS (DEP ENDENTES)Quando se compara as mdias de duas populaes, pode ocorrer uma diferena significativa por causa de fatores externos no-controlveis. Um modo de contornar este problema coletar observaes aos pares, de modo que os dois elementos de cada par sejam homogneos em todos os sentidos, exceto naquele que se quer comparar. Por exemplo, para testar dois mtodos de ensino A e B, pode-se usar pares de gmeos, sendo que um recebe o mtodo de ensino A e o outro o mtodo de ensino B. Este procedimento controla a maioria dos fatores externos que afetam a aprendizagem e se houver diferena deve-se realmente ao mtodo. Outra forma fazer as observaes das duas amostras no mesmo indivduo. Por exemplo, medindo uma caracterstica do indivduo antes e depois dele ser submetido a um tratamento. A exemplo da comparao de duas mdias com amostras independentes, neste caso, tem-se duas amostras: X1, X2, ..., Xn e Y1, Y2, ..., Yn, s que agora as observaes esto emparelhadas, isto , a amostra formada pelos pares: (X1, Y1), (X2, Y2), ..., (Xn, Yn) Define-se a varivel D = X - Y. Como resultado tem-se a amostra: D1, D2, ..., Dn2 Supem-se que D segue uma N( D , D) . Ento: SD = Di = ( Xi Yi) = X - Y n i=1 n i=1

1n

1 n

Ter uma distribuio: N( D ,

Dn

) . Definindo:

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

25

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

1 Di D S = n 1 i =12 D n

(

)

2

=

i =1

Di n Dn 1

n

2

, tem-se que a estatstica:

t=

D D SD n

, tem uma distribuio t com n - 1 graus de liberdade.

Exemplo: Cinco operadores de mquinas so treinados em duas mquinas de diferentes fabricantes, para verificar qual delas apresentava maior facilidade de aprendizagem. Mediu-se o tempo que cada um dos operadores gastou na realizao de uma mesma tarefa com cada um dos dois tipos de mquinas. Os resultados esto na tabela ao lado. Ao nvel de 10% possvel afirmar que a tarefa realizada na mquina X demora mais do que na mquina Y? Soluo: As hipteses so: H0: X - Y = 0 (X = Y) contra H1: X - Y > 0 (X > Y ) Pela tabela v-se que: di: 5, 2, 5, 6 e 7 Logo: d = 5 e SD = 1,8708, logo t = 5,98. Como = 10%, ento t = 1,54, pois o nmero de graus de liberdade n - 1 = 4. Portanto, rejeita-se a hiptese nula, isto , a 10% de significncia pode-se afirmar que com a mquina X se demora mais do que com a mquina Y. 2.3.1. T E ST E PARA A DI F E RE NA E NT RE DUAS P ROP ORE S As hipteses so: H0: 1 - 2 = contra H1: 1 - 2 ou Operador Fabricante 1 Fabricante 2 1 80 75 2 72 70 3 65 60 4 78 72 5 85 78

1 - 2 > ou ainda 1 - 2 < Se = 0, ento 1 - 2 = 0, isto , 1 = 2.

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

26

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

Extradas uma amostra de cada uma das duas populaes a varivel P1 - P2 ter uma distribuio aproximadamente normal com mdia E(P1 - P2) = 1 - 2 e varincia 2 P2 = p11(1 1) 2 (1 2) + , desde que nP1 > 5 e mP2 > 5. n m

A varivel teste ser, ento: z =

P1 P2 1(1 1) 2(1 2) + n m

Como os valores de 1 e 2 no so conhecidos, deve-se utilizar suas estimativas P1 e P2. Desta forma, o valor de z ser: z=P1 (1 P1) P2 (1 P2) + n m P1 P2

Assim fixando o nvel de significncia , a hiptese nula ser rejeitada se: |z| > z/2 no teste bilateral; z > z, no teste unilateral direita e z < z no teste unilateral esquerda. Exemplo: Em uma pesquisa de opinio, 32 dentre 80 homens declararam apreciar certa revista, acontecendo o mesmo com 26 dentre 50 mulheres. Ao nvel de 5% de significncia os homens e as mulheres apreciam igualmente a revista? Soluo: As hipteses so: H0: 1 - 2 = 0 (1 = 2) contra H1: 1 - 2 0 (1 2) Tem-se que P1 = 32 / 80 = 0,40 e P2 = 26 / 50 = 52% O valor da varivel teste ser: z=0,40 0,52 0,40.0,60 0,52.0,48 + 80 50

= -1,34

Como = 5%, ento z/2 = -1,96.

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

27

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

Portanto, aceita-se a hiptese de igualdade entre as preferncias de homens e mulheres, isto , a este nvel de significncia no possvel afirmar que exista diferena entre as preferncias de homens e mulheres quanto revista.

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

28

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

3 .. E X E R C C IO S 3 E X E R C C IO S(01) Pretende-se lanar uma moeda 5 vezes e rejeitar a hiptese de que a moeda no-tendenciosa, isto , pretende-se rejeitar Ho: = 0,50, se em 5 (cinco) jogadas ocorrerem 5 coroas ou 5 caras. Qual a probabilidade de se cometer erro do tipo I? (02) (Bussab, pg. 249) Se, ao lanarmos 3 vezes uma moeda, supostamente equilibrada, aparecerem 3 caras decide-se rejeitar a hiptese de que a moeda honesta, qual a probabilidade de se cometer erro do tipo I? Se a moeda favorece cara em 80% das vezes, qual a probabilidade de se cometer erro do tipo II? (03) Voc suspeita que um dado viciado, isto , voc suspeita que a probabilidade de obter face 6 maior do que 1/6. Voc decide testar a hiptese de que o dado no-viciado, jogando-o cinco vezes e rejeitando essa hiptese se ocorrer a face 6 (seis), 4 ou 5 vezes. Qual o nvel de significncia do teste? (04) Nas faces de dois tetraedros regulares, aparentemente idnticos, esto marcados os valores: 0, 1, 2 e 3. Ao lanar um destes tetraedros o resultado observado o valor da face que fica em contato com a superfcie. Os dois tetraedros so chumbados, de tal maneira que, ao jog-los, as probabilidades de cada uma das faces ficar em contato com a superfcie so as da tabela. Tomando ao acaso um dos tetraedros tem-se duas hipteses: H0 : Trata-se do tetraedro A; H1 : Trata-se do tetraedro B. (04.1) Para testar H0 contra H1, o tetraedro escolhido lanado duas vezes. Adota-se a seguinte regra de deciso: rejeitar H0 se a soma dos resultados dos dois lanamentos for maior ou igual a 5. Determinar o nvel de significncia e o poder do teste. (04.2) Determinar o nvel de significncia e o poder do teste se a regra de deciso for: rejeitar H0 se sair o valor 3 (trs) em ao menos um dos lanamentos e o outro resultado no for o valor 0 (zero). (05) Em cada uma das quatro faces de dois tetraedros regulares, aparentemente idnticos, esto marcados os valores: 1, 2, 3 e 4. Entretanto, um dos tetraedros feito de material homogneo (tetraedro A) , de maneira que, ao lan-lo a probabilidade de qualquer uma das 4 faces fique em contato com a superfcie 0,25. O outro tetraedro (tetraedro B) chumbado, de tal maneira que, ao jog-lo, a face com o valor 4 (quatro) tem probabilidade de 0,50 de ficar em contato com a superfcie, enquanto que qualquer uma das outras trs tem probabilidade igual a 1/6. Suponha que um dos Face 0 1 2 3 Total Tetraedro A 0,40 0,20 0,20 0,20 1 Tetraedro B 0,20 0,20 0,20 0,40 1

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

29

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

tetraedros lanado 48 vezes, para testar a hiptese H0 de que foi lanado o tetraedro A, contra a hiptese H1 de que foi lanado o tetraedro B. Supem-se ainda a seguinte regra de deciso: se nos 48 lanamentos, a face com o valor 4 (quatro), for obtida 20 ou mais vezes, rejeita-se H0 em favor de H1. Determine o nvel de significncia e o poder do teste. (06) Uma urna contm 6 fichas, das quais so brancas e 6 - so pretas. Para testar a hiptese de nulidade de que = 3, contra a alternativa de que 3, so retiradas 2 (duas) fichas da urna ao acaso e sem reposio. Rejeita-se a hiptese nula se as duas fichas forem da mesma cor. (06.1) Determine P(Erro do Tipo I). (06.2) Determine o poder do teste para os diferentes valores de . (06.3) Considere, agora, que a segunda ficha retirada aps a reposio da primeira. Calcule, novamente, o nvel de significncia e os valores do poder do teste. (06.4). Compare os dois procedimentos (com e sem reposio da segunda ficha retirada). Qual a concluso? (07) Para decidirmos se os habitantes de uma ilha so descendentes da civilizao A ou B, iremos proceder da seguinte forma: (i) Selecionamos uma amostra aleatria de 100 moradores adultos da ilha e determinamos a altura mdia; (ii) Se a altura mdia for superior a 176 cm, diremos que os habitantes so descendentes de B, caso contrrio, admitiremos que so descendentes de A. Os parmetros das duas civilizaes so: A: A = 175 cm e A = 10 cm e B: B = 177 cm e B = 10 cm. Define-se ainda: erro do tipo I como sendo dizer que os habitantes so descendentes de B quando, na realidade, so de A e erro do tipo II dizer que os habitantes so de A quando, na realidade, so descendentes de B. (07.1) Qual a probabilidade de erro do tipo I e do tipo II? (07.2) Se A = B = 5, como ficariam os valores dos erros do tipo I e II? (07.3) Qual deve ser a regra de deciso se quisermos fixar a a probabilidade de Erro I em 5%. Qual a probabilidade de erro II neste caso? (07.4) Quais as probabilidades de Erro II, se as mdias forem: A = 178 e se B = 180? (08) Fazendo o teste H0 : = 1150 ( = 150) contra H1 : = 1200 ( = 200) e com n = 100, estabeleceu-se a seguinte regio crtica: RC = [1170, +). (08.1) Qual a probabilidade de rejeitar H0 quando verdadeira? (08.2) Qual a probabilidade de Aceitar H0 quando H1 verdadeira?

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

30

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

(09) Dados os valores: 4, 6, 3, 6 e 6, de uma amostra aleatria de 5 (cinco) observaes de uma varivel X, estime a mdia e a varincia de X e admitindo que X tenha uma distribuio normal, teste, a 5%, a hiptese de que a mdia da populao 1 (um), contra a hiptese alternativa de que maior do que 1 (um). (10) Sabe-se que o consumo mensal per capita de determinado produto tem distribuio normal, com desvio padro de 2 kg. A diretoria da empresa que fabrica esse produto resolveu que retiraria o produto da linha de produo se a mdia de consumo per capita fosse menor do que 8 kg, caso contrrio, continuaria a fabric-lo. Foi realizado uma pesquisa de mercado, tomando-se uma amostra aleatria de 25 pessoas e verificou-se um consumo total de 180 kg do produto. (10.1) Construa um teste de hiptese adequado para verificar a hiptese acima a um nvel de significncia de 5% e diga qual deve ser a deciso a ser adotada pela empresa? (10.2) Qual a probabilidade de a empresa tomar a deciso errada se, na realidade, o consumo mdio mensal populacional de 7,80 kg? (10.3) Se a diretoria tivesse fixado uma significncia de 1%, a deciso seria a mesma? (10.4) Se o desvio padro populacional fosse de 4 kg, qual seria a deciso a ser tomada com base na amostra mencionada acima? (11) A associao dos proprietrios de indstrias metalrgicas est preocupada com o tempo perdido com acidentes de trabalho, cuja mdia, nos ltimos tempos, tem sido da ordem de 60 homens/hora por ano, com desvio padro de 20 homens/hora. Tentou-se um programa de preveno de acidentes e, aps o mesmo, tomou-se uma amostra aleatria de 16 indstrias e verificou-se que o tempo perdido baixou para 50 homens /hora ano. Voc diria que, ao nvel de 5% de significncia, o programa surtiu efeito? (12) Est-se desconfiado de que a mdia das receitas municipais, per capita, das cidades pequenas (menos de 20 mil habitantes) maior do que a mdia da receita estadual que de 1229 unidades monetrias. Para testar a hiptese realizada uma amostragem com 10 pequenas cidades que forneceram os seguintes resultados (em termos de receitas mdias): 1230, 582, 576, 2093, 2621, 1045, 1439, 717, 1838, 1359 Verifique que no possvel rejeitar a hiptese de que as receitas municipais so iguais as do estado, aos nveis usuais de significncia. Como isto se justifica, j que a mdia da amostra obtida bem maior do que a mdia do estado! (13) Medidos os dimetros de 31 eixos de um lote aleatrio, produzido pela empresa Sofazredondo S.A. obteve-se a distribuio abaixo: Dimetros (em mm) Nmero de eixos 56,5 1 56,6 2 56,7 2-

56,8 4

56,9 10

57,0 5

57,1 4

57,2 2

57,3 131

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

Ao nvel de significncia de 5%, h evidncia de que o dimetro mdio dos eixos esteja fora da especificao de uma mdia de 57 mm? (14) Um fabricante garante que 90% das peas que fornece a um cliente esto de acordo com as especificaes exigidas. O exame de uma amostra aleatria de 200 destas peas revelou 25 fora das especificaes. Verifique se as nveis de 5% e 1% de significncia h exagero na afirmativa do fabricante. (15) Suponha que a experincia tenha mostrado que dos alunos submetidos a determinado tipo de prova, 20% so reprovados. Se de uma determinada turma de 100 alunos, so reprovados apenas 13, pode-se concluir, ao nvel de significncia de 5%, que estes alunos, so melhores? (16) Um exame composto de 100 testes do tipo certo-errado. (a) Determine o nmero mnimo de testes que um aluno deve acertar para que se possa, ao nvel de significncia de 5%, rejeitar a hiptese de que o aluno nada sabe sobre a matria e respondeu ao acaso, em favor da hiptese de que o alunos sabia alguma coisa sobre a matria do teste? (b) Qual seria este mnimo, se fosse adotado o nvel de significncia de 1%? (17) O rtulo de uma caixa de sementes informa que a taxa de germinao de 90%. Entretanto, como a data de validade est vencida, acredita-se que a taxa de germinao seja inferior a este nmero. Fazse um experimento e de 400 sementes, tomadas ao acaso, 350 germinam. Qual a concluso ao nvel de 5% de significncia? (18) Observou-se a produo mensal de uma indstria durante alguns anos e verificou-se que ela obedecia a uma distribuio normal com varincia igual a 300 u2. Foi adotada ento uma nova tcnica de produo e durante um perodo de 24 meses observou-se a produo mensal. Aps este perodo constatou-se que a varincia foi de 400 u2. H motivos para se acreditar que houve alterao na varincia ao nvel de 10%? (19) Numa linha de produo importante que o tempo gasto numa determinada operao no varie muito de empregado para empregado. Em operrios bem treinados a variabilidade fica em 100 u2. A empresa colocou 11 novos funcionrios para trabalhar na linha de produo, supostamente bem treinados, e observou os seguintes valores, em segundos: 125 135 115 120 150 130 125 145 125 140 130

Testar se a tempo despendido por estes funcionrios pode ser considerado mais varivel do que os demais funcionrios. Utilize 5% de significncia. (20) O departamento de psicologia fez um estudo comparativo do tempo mdio de adaptao de uma amostra de 50 homens e outra de 50 mulheres, tomados ao acaso, de um grande complexo industrialP r o f . L o r V ia li, D r . v ia l i@ p u c r s . b r h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/ 32

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

que mostrou os seguintes resultados da tabela. possvel afirmar, ao nvel de 5% de significncia que as mulheres desta empresa levam mais tempo para se adaptarem? (21) Diversas polticas, em relao s filiais de uma rede

Estatsticas Mdia Desvio padro

Homens 3,2 meses 0,8 meses

Mulheres 3,7 meses 0,9 meses

de supermercados, esto associadas ao gasto mdio dos clientes em cada compra. Deseja-se comparar estes parmetros de duas novas filiais, atravs de duas amostras de 50 clientes, selecionados ao acaso, de cada uma das novas filiais. As mdias obtidas foram 62 e 71 unidades monetrias. Supondo que os desvios padres sejam idnticos e iguais a 20 um, teste a hiptese de que o gasto mdio dos clientes no o mesmo nas duas filiais. Utilize uma significncia de 2,5%? (22) Uma fbrica de embalagens para produtos qumicos est estudando dois processos Processo A B Tamanho da amostra 15 12 Mdia 48 52 Desvio padro 10 15

diferentes de combate a corroso nas latas usadas para embalagem. Para verificar o efeito dos dois processos foram utilizadas duas amostras aleatrias que apresentaram os valores da tabela, quanto a varivel durao da embalagem (em meses) antes da primeira mancha de corroso aparecer. Ao nvel de significncia de 5% possvel afirmar que um tratamento melhor do que o outro? (23) Voc recebe a informao de que a diferena entre duas mdias amostrais estatisticamente significativa ao nvel de 1%. Dizer se as afirmaes abaixo esto certas ou erradas e justificar. (23.1) H pelo menos 99% de probabilidade de existir uma diferena real entre as mdias das duas populaes. (23.2) Se no houvesse diferena entre as mdias das duas populaes, a probabilidade de detectar uma tal diferena (ou diferena maior) entre as mdias amostrais seria de 1% ou menos. (23.3) A informao constitu uma evidncia slida de que realmente exista diferena entre as mdias populacionais. Todavia, por si s, no constitu evidncia suficiente de que tal diferena seja suficientemente grande para ter importncia prtica. Isto ilustra a diferena entre os conceitos significncia estatstica e significncia prtica. (23.4) O valor da estatstica teste (valor calculado) exatamente 1%. (23.5) A probabilidade de que as mdias das duas amostras sejam diferentes de 1%. (24) Foram levantadas quatro hipteses sobre a mdia salarial anual de engenheiros mecnicos e civis: (i) Engenheiros mecnicos e civis ganham em mdia o mesmo salrio. (ii) Os engenheiros mecnicos ganham, em mdia R$ 500 a mais do que os civis. (iii) Os engenheiros mecnicos ganham, em mdia R$ 1000 a mais do que os civis. Engenheiros Mecnicos Civis-

Tamanho da amostra 250 200

Mdia 38000 36000

Desvio padro 8000 10000

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

33

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

(iv) Os engenheiros mecnicos ganham, em mdia R$ 2000 a mais do que os civis. Para testar a hiptese foram extradas duas amostras aleatrias dos salrios dos dois tipos de profissionais que apresentaram os valores da tabela. Com base, nos valores, responda, justificando, as seguintes questes: (24.1) Sem quaisquer, clculos detalhados, podemos verificar imediatamente, qualquer uma das hipteses. (24.2) Se aplicarmos um teste bilateral a cada uma das hipteses, quais seriam rejeitadas ao nvel de 5%? (24.3) Se aplicarmos um teste unilateral a cada uma das hipteses, quais seriam rejeitadas ao nvel de 5%? (24.4) Vrias hipteses foram consideradas aceitveis, ao nvel de 5% de significncia. Se voc tivesse que escolher apenas uma delas para publicar como concluso do estudo, por qual optaria? Por qu? (25) Calculadoras eletrnicas utilizam dois mtodos diferentes de entrada e processamento numrico. Vamos denominar um dos mtodos de mtodo algbrico (MA) e o outro de mtodo polons (MP). Para comparar qual deles mais eficaz feito um teste com 20 usurios sem experincia prvia com calculadoras, onde 10 vo utilizar calculadoras de um tipo e o outros 10 as de outro tipo. A tabela mostra o tempo em segundos que cada MA MP 12 10 16 17 15 18 13 16 16 19 10 12 15 17 17 15 14 17 12 14 Operador 1 2 3 4 5 6 7 8 9 10

operador gastou para realizar um conjunto padro de clculos. Testar a hiptese de que no existe diferena entre os dois mtodos no que se refere ao tempo de operao, utilizando uma significncia de 5%. (26) Num ensaio para testar a proteo de dois tipos de tinta em superfcies metlicas, 55 painis foram pintados com a tinta PK12 e 75 com a tinta PK15. Decorridos dois anos de exposio dos painis ao ar livre, verificou-se que, dos painis pintados com PK12, 6 apresentaram problemas enquanto que dos 75 painis pintados com PK15, 19 apresentaram problemas. Pode-se concluir, destes valores, com 5% de significncia, que as duas marcas de tintas diferem quanto a capacidade de proteo? (27) Um psiclogo defende a idia de que a autorizao para dirigir s deve ser dada a maiores do que 21 anos de idade. Para tanto argumentou que os jovens entre 18 e 21 causam no mnimo 15% a mais acidentes dos que os de mais de 21 anos. Suas concluses so baseadas em uma amostra de 150 pessoas entre os 18 e 21 anos, dos quais 60 j haviam se envolvido em algum tipo de acidente. J entre os motoristas maiores de 21 anos de 200 observados, 30 j haviam se envolvido em algum tipo de acidente. (a) Teste a argumentao do psiclogo a um nvel de 5% de significncia. (b) Qual o problema que as amostras coletadas pelo psiclogo apresentam?P r o f . L o r V ia li, D r . v ia l i@ p u c r s . b r h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/ 34

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

(28) Em dois anos consecutivos foi feito um levantamento de mercado sobre a preferncia dos consumidores pelo por um determinado produto. No primeiro ano o produto era anunciado com freqncia semanal nos veculos de comunicao e no segundo ano com freqncia mensal. No levantamento foram utilizados duas amostras independentes de 400 consumidores cada. No primeiro ano o percentual de compradores ficou em 33% e no segundo ano em 29%. Considerando o nvel de significncia de 5%, teste a hiptese de que a freqncia do anncio tem influncia na manuteno da fatia de mercado. (29) Uma das maneiras de medir o grau de satisfao dos empregados de uma mesma categoria quanto a poltica salarial atravs do desvio padro de seus salrios. A fbrica A diz ser mais coerente na poltica salarial do que a fbrica B. Para verificar essa afirmao, sorteou-se uma amostra de 10 funcionrios no especializados de A e 15 de B, obtendo-se os desvios padres: sA = 1,0 s.m. e sB = 1,6 s.m. Qual a sua concluso a um nvel de 5% de significncia? (30) (BUSSAB - pg. 277) Deseja-se comparar a qualidade de um produto produzido por dois fabricantes. Esta qualidade est sendo medida pela uniformidade com que produzido o produto por cada fbrica. Tomaram-se duas amostras, uma de cada Estatsticas Amostra Mdia Varincia Fbrica A 21 21,15 0,0412 Fbrica B 17 21,12 0,1734

fbrica, medindo-se o comprimento dos produtos. A qualidade da produo das duas fbricas a mesma a um nvel de 5%?

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

35

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

4 .. R E S P O S TA S 4 R E S P O S TA S(01) RC = { 0, 5} = P(RC) = P{ X = 0 ou X = 5 / = 0,50} = (1/2)5+ (1/2)5 = 1/16 = 6,25% (02) RC = { 3 } = P({ 3 }) = (1/2)3 = 1/8 = 12,50%

= P(Ac. H0 / H0 Falsa} = P(X = 0, 1, 2 / = 0,8} = (1/5)3 + 3(4/5)1 (1/5)2 + 3(4/5)2 (1/5)1 =48,80% (03) RC { 4, 5} = P(RC) = P({ X = 4 ou X = 5 / = 1/6}) = 13/3888 = 0, 33% (04) (04.1) RC = { (2, 3), (3, 2), ( 3, 3) } = P(RC) = 0,20.0,20 + 0,20.0,20 + 0,20.0,20 = 12% Poder do Teste = 1 - = P(Rej. H0 / H0 Falsa} = 0,20.0,40 + 0,20.0,40 + 0,40.0,40 = 32% (04.2) RC = { (3, 1), (3, 2), ( 3, 3), (1, 3), (2, 3) } = P(RC) = 5.0,04 = 0,20 = 20% Poder do Teste = 1 - = P(Rej. H0 / H0 Falsa} = 4.0,08 + 0,16 = 0,48 = 48% (05) RC = { X 20 / Tetraedro A) = P(RC) = P({ X 20 / Tet. A}) P( Z (19,5 - 12) / 3) = 0,62%

= P(Ac. H0 / H0 Falsa} = P(X < 20 / Tet. B} = 9,68% Poder = 1 - = 100% - 9,68% = 90,32%(06) (06.1) n = 2 S/R RC = {BB, PP} = P(RC) =(3/6).(2/5) + (3/6).(2/5) = 1/5 + 1/5 = 0,40 = 40% (06.2) n = 2 S/R 1 - = P(Rejeitar H0 / H0 falsa) = 0 ou = 6 1 - = P(RC / = 0 ) = 1 = 100% = P(R / = 6)

= 1 ou = 5 1 - = P(RC / = 1 ) = (1/6).(0/5) + (5/6).(4/5) = 2/3 = 66,67% = P(RC / = 5) = 2 ou = 4 1 - = P(RC / = 2 ) = (2/6).(1/5) + (4/6).(3/5) = 7/15 = 46,67% = P(RC / = 4)(06.3) n = 2 C/R 50% RC = {BB, PP} = P(RC) =(3/6).(3/6) + (3/6).(3/6) = 1/4 + 1/4 = 0,50 =

= 0 ou = 6 1 - = P(RC / = 0 ) = 0 + 1 = 100% = P(RC / = 6) = 1 ou = 5 1 - = P(RC / = 1 ) = (1/6).(1/6) + (5/6).(5/6) = 13/18 = 72,22% = P(RC / = 5) = 2 ou = 4 1 - = P(RC / = 2 ) = (2/6).(2/6) + (4/6).(4/6) = 5/9 = 55,56% = P(RC / = 4)(06.4) Com reposio o NS () maior do que SR. Por outro lado, repondo o poder do teste maior ou igual a quando no se faz reposio. (07) (07.1) P(Erro I) = P( XA > 176) = P(Z > 176 - 175) = P(Z > 1) = 15,87% P(Erro II) = P( XB < 176) = P(Z < 176 - 177) = P(Z < -1) = 15,87% (07.2) P(Erro I) = P( XA > 176) = P[Z > (176 - 175)/0,5] = P(Z > 2) = 2,28% P(Erro II) = P( XB < 176) = P[Z < (176 - 177)/2] = P(Z < -2) = 2,28%

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

36

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

(07.3) 5% = P(Erro I) = P( XA > 176) = P(Z > 176 - 175) P(Z > x - 175) = 5% x = 176,645. Neste caso, deve-se rejeitar H0 somente se a mdia for superior a 176,645. P(Erro II) = P( XB < 176,645 - 177) = P(Z < -0,36) = 35,94% (07.4) B = 178 P(Erro II) = P( XB < 176 - 178) = P(Z < -2) = 2,28%

B = 180 P(Erro II) = P( XB < 176 - 180) = P(Z < -4) = 0,00%(08) (08.1) = P(Rej. H0 / H0 V) = P( X > 1170 / = 1150) = P[Z > (1170 - 1150) / 15)] = P(Z > 1,33) = 9,18% (08.2) = P(Ac H0 / H1 V) = P( X < 1170 / = 1200) = P[Z < (1170 - 1200) / 20)] = P(Z < -1,50) = 6,68% (08.3) P[Z > (x - 1150) / 15)] = P[Z < (x - 1200) / 20)] (x - 1150) / 15 = -(x - 1200) / 20 x = 1171,43 (09) x = 5, s2 = 2 t = 6,32 > t5% = 2,132, portanto rejeita H0 (10) (10.1) H0: = 8 kg contra H1: < 8 kg. Como = 5%, z = -1,645 e zc = -2. Logo rejeitar H0 (10.2) = P(Ac. H0 / H1 V) = P( X > 7,34 / = 7,80) = P(Z < 1,14) = 87,29% (10.3) H0: = 8 kg contra H1: < 8 kg. Como = 1%, z = -2,33 e zc = -2. No rejeita H0 (10.4) Aceitar H0 tanto ao nvel de 5% quanto ao de 1% de significncia. (11) Como = 5%, z = -1,645 e zc = -2. Rejeita-se H0, isto , pode-se dizer que o programa surtiu efeito. (12) Como tc = -0,566, no possvel rejeitar a hiptese aos nveis de 1%, 5% e mesmo 10%. Isto se justifica devido a grande variabilidade da amostra que apresenta um desvio padro igual a 675,82. (13) H0: = 57mm contra H1: 57 mm Como tc = -2,557 e tt = -2,042, rejeita-se H0. (14) H0: = 10% contra H1: > 10%. Como zc = 1,18. Logo no se pode rejeitar H0. (15) H0: = 20% contra H1: < 20%. Como zc = -1,75 e z5% = -1,645 . Logo pode-se rejeitar H0. (16) H0: = 50% contra H1: > 50%. Como z5% = -1,645 o nmero mnimo de acertos : 50% + 1,645.P 59 Como z1% = -2,33 o nmero mnimo de acertos : 50% + 2,33.P 62 (17) H0: = 90% contra H1: < 90%. Como zc = -1,667 e z5% = -1,645 . Logo pode-se rejeitar H0. (18) No, pois 2 = 30,67 est na regio de aceitao que : RA = [13,09; 35,17] (19) No, pois 2 = 11,41 est na regio de aceitao que : RA = [0; 18,3] (20) H0: H = M contra H1: H < M. Como = 5%, t = -1,645 e tc = -2,936. Rejeitar H0. (21) H0: 1 = 2 contra H1: 1 2 . Como = 2,5%, t = -2,24 e tc = -2,25. Rejeitar H0.

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

37

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

(22) H0: 1 = 2 contra H1: 1 2 . Como = 5%, t25 = -2,06 e tc = -0,79. No rejeitar H0 (23) (23.1). Errada. (23.2) Correta. (23.3) Errada. (23.4) Errada. (23.5) Errada.

(24) (24.1) Sim a quarta. (24.2) Somente a (i) (24.3) Somente a (i) e a (ii). (24.4) A (i) que pode ser confirmada tanto no teste unilateral quanto no bilateral (mais rigoroso) (25) H0: 1 = 2 contra H1: 1 2 . Como = 5%, t = 2,26 e tc = -2,42. No rejeitar H0, supondo amostras emparelhadas. (26) H0: 1 = 2 contra H1: :1 2 . Como zc = 2,20 e z5% = 1,96. Pode-se afirmar que as duas tintas diferem. (27) (a) H0: 1 - 2 = 15% contra H1: : 1 - 2 < 15% Como zc = -2,11 e z5% = -1,645 . Logo pode-se afirmar que os jovens causam pelo menos 15% a mais de acidentes. (b) O problema que as amostras tem um vcio de origem, pois fica difcil de saber se esta diferena devida a imprudncia ou ao fato de que os motoristas so menos experientes. (28) H0: 1 = 2 contra H1: : 1 > 2 Como zc = 1,22 e z5% = 1,645 . Logo no se pode rejeitar H0 (29) No se pode afirmar que no so iguais, pois FC = 2,56 e a RA = [0,38; 2,65] (30) Pode-se afirmar que a qualidade difere, pois Fc = 4,21 e RA = [0,37; 2,54]

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

38

SRIE: Estatstica Bsica Te xto iv: TESTES DE HIPTES ES P ARAMTRICOS

5 .. R E F E R N C I A S 5 REF ERNC IAS[BUS86] BUSSAB, Wilton O, MORETTIN, Pedro A. Estatstica Bsica. 3. ed. So Paulo, Atual, 1986. [DOW89] DOWNING, Douglas, CLARK, Jeff. Statistics The Easy Way. Hauppauge (New York): Barrons Educational Series, Inc, 1989. [HIN88] HINKLE, Dennis E., WILLIAM, Wiersma, JURS, Stephen G. Applied Statistics for the Behavioral Sciences. Boston: Houghton Mifflin Co., 1988. [HOF80] HOFFMAN, Rodolfo. Estatstica para Economistas. So Paulo. Livraria Pioneira Editora, 1980. [NET77] NETO, Pedro Luiz de Oliveira Costa. Estatstica. So Paulo, Edgard Blcher, 1977. [MAS90] MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And Economics. IRWIN, Boston, 1990. [MEY78] MEYER, Paul L. Probabilidade: aplicaes Estatstica. Traduo do Prof. Ruy C. B. Loureno Filho. Rio de Janeiro, Livros Tcnicos e Cientficos Editora S.A., 1978 [RES93] Research & Education Association. The Statistics Problem Solver. Piscataway (New Jersey): 1993. [STE81] STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo. Editora Harbra, 1981. [WEL82] WLKOWITZ, Joan, EWEN, Robert B., COHEN, Jacob. Introductory Statistics for the Behavioral Sciences. Orlando(FL): Hartcourt Brace Javanovich, 1982. [WON85] WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatstica. Rio de Janeiro. Livros Tcnicos e Cientficos Editora S. A., 1985.

P r o f . L o r V ia li, D r . -

v ia l i@ p u c r s . b r

-

h t tp :/ / w w w . ma t. p u c r s . b r / f a ma t / v ia l i/

39