26
1 Universidade Federal do Piauí Campus Universitário “Prof a . Cinobelina Elvas” – Bom Jesus, PI Profa. Gisele VI - TESTES DE HIPÓTESES 1. Introdução A Inferência Estatística é a parte da estatística que trata das condições sob as quais se faz inferências (ou pressuposições ou generalizações) sobre uma população, com base em dados amostrais. Se uma amostra é representativa de uma população, possui as mesmas características básicas da mesma, e os resultados amostrais podem ser inferidos como resultados válidos para a população estudada. A inferência estatística envolve questões de dois tipos: a estimação de parâmetros populacionais e os testes de hipóteses. Os TESTES DE HIPÓTESES (ou testes de significância ou teoria da decisão estatística) constituem procedimentos estatísticos cujo objetivo é tomar decisões baseadas nas evidências fornecidas pelos dados amostrais. Supondo que seja levanta uma hipótese sobre o valor do parâmetro, essa hipótese será considerada verdadeira até que prove o contrário. Portanto, o teste de hipótese é o procedimento que nos levará a rejeitar ou na essa hipótese a partir das evidências obtidas nos resultados amostrais. Exemplo: Podemos estar interessados em verificar se as seguintes afirmações são verdadeiras: 1. a produtividade média de leite em Bom Jesus é de 2,3 kg/animal; 2. a produtividade média de leite em Bom Jesus e em Cristino Castro são, ambas, de 2,3 kg/animal. Aplicando-se o teste de hipóteses adequado poderemos rejeitar ou não a hipótese de que a produtividade média de leite em Bom Jesus é realmente de 2,3 kg/animal, e rejeitar ou não a hipótese de que a produtividade média de leite em Bom Jesus e em Cristino Castro são, ambas, de 2,3 kg/animal. Observa-se que se podem fazer inferências sobre os parâmetros de apenas uma população, ou sobre os parâmetros de duas populações diferentes, no exemplo sobre a média da produtividade de leite na população leiteira de Bom Jesus, e sobre as médias das produtividades nas populações leiteiras de Bom Jesus e Cristino Castro. Desenvolveremos, neste conteúdo, os testes de hipóteses para os parâmetros mais usuais que viemos estudando nos conteúdos anteriores, média e variância, para uma e duas populações.

Apostila 6 - Testes de hipóteses

Embed Size (px)

Citation preview

Page 1: Apostila 6 - Testes de hipóteses

1

Universidade Federal do Piauí

Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI

Profa. Gisele

VI - TESTES DE HIPÓTESES

1. Introdução

A Inferência Estatística é a parte da estatística que trata das condições sob as quais se faz

inferências (ou pressuposições ou generalizações) sobre uma população, com base em dados

amostrais. Se uma amostra é representativa de uma população, possui as mesmas características

básicas da mesma, e os resultados amostrais podem ser inferidos como resultados válidos para a

população estudada. A inferência estatística envolve questões de dois tipos: a estimação de parâmetros

populacionais e os testes de hipóteses.

Os TESTES DE HIPÓTESES (ou testes de significância ou teoria da decisão estatística)

constituem procedimentos estatísticos cujo objetivo é tomar decisões baseadas nas evidências

fornecidas pelos dados amostrais. Supondo que seja levanta uma hipótese sobre o valor do parâmetro,

essa hipótese será considerada verdadeira até que prove o contrário. Portanto, o teste de hipótese é o

procedimento que nos levará a rejeitar ou na essa hipótese a partir das evidências obtidas nos

resultados amostrais.

Exemplo:

Podemos estar interessados em verificar se as seguintes afirmações são verdadeiras:

1. a produtividade média de leite em Bom Jesus é de 2,3 kg/animal;

2. a produtividade média de leite em Bom Jesus e em Cristino Castro são, ambas, de 2,3

kg/animal.

Aplicando-se o teste de hipóteses adequado poderemos rejeitar ou não a hipótese de que a

produtividade média de leite em Bom Jesus é realmente de 2,3 kg/animal, e rejeitar ou não a hipótese

de que a produtividade média de leite em Bom Jesus e em Cristino Castro são, ambas, de 2,3

kg/animal.

Observa-se que se podem fazer inferências sobre os parâmetros de apenas uma população, ou

sobre os parâmetros de duas populações diferentes, no exemplo sobre a média da produtividade de

leite na população leiteira de Bom Jesus, e sobre as médias das produtividades nas populações leiteiras

de Bom Jesus e Cristino Castro.

Desenvolveremos, neste conteúdo, os testes de hipóteses para os parâmetros mais usuais que

viemos estudando nos conteúdos anteriores, média e variância, para uma e duas populações.

Page 2: Apostila 6 - Testes de hipóteses

2

Importante ressaltar que, os testes desenvolvidos neste conteúdo pressupõem que a característica

em análise é normalmente distribuída com média µ e variância 2σ .

2. Formulação das hipóteses

Hipótese nula (Ho): é a hipótese que sugere que a afirmação que estamos fazendo sobre o

parâmetro populacional é verdadeira. Portanto, Ho sempre inclui o sinal de igual, da não variação.

Hipótese alternativa (Ha): é a hipótese que sugere que a afirmação que estamos fazendo

sobre o parâmetro populacional é falsa, ou seja, que o valor do parâmetro é diferente, menor ou maior

que o estipulado. Portanto, Ha sempre inclui o sentido da variação.

Exemplo: Estamos interessados em verificar se as seguintes afirmações, em relação à produtividade

média de leite, são verdadeiras:

- a produtividade média de leite em Bom Jesus é de 2,3 kg/animal;

- a produtividade média de leite em Bom Jesus e em Cristino Castro são ambas, de 2,3 kg/animal.

Podemos testar então as seguintes hipóteses:

Ho: µBom Jesus = 2,3

Ha: µBom Jesus ≠ 2,3 ou

µBom Jesus < 2,3 ou

µBom Jesus > 2,3

Ou ainda, poderíamos testar, em relação às duas populações leiteiras, as seguintes hipóteses:

Ho: µBom Jesus = µCristino castro

Ha: µBom Jesus ≠ µCristino castro ou

µBom Jesus < µCristino castro ou

µBom Jesus > µCristino castro

De acordo com a hipótese alternativa utilizada no teste de hipótese, este pode ser classificado

em unilateral à esquerda (Ex.: µBom Jesus < 2,3 e µBom Jesus < µCristino castro), unilateral à direita (Ex.: µBom

Jesus > 2,3 e µBom Jesus > µCristino castro) e bilateral (Ex.: µBom Jesus ≠ 2,3 e µBom Jesus ≠ µCristino castro).

3. Decisão em um teste estatístico

A decisão de um teste estatístico, ou seja, se devemos ou não rejeitar a hipótese de nulidade, é

feita por meio da comparação do valor especificado para o parâmetro com aquele estimado a partir de

uma amostra da população.

Raramente, o valor estimado será idêntico àquele especificado para o parâmetro. Para

diferentes amostras, um estimador pode assumir diferentes valores, sendo que existem intervalos de

Page 3: Apostila 6 - Testes de hipóteses

3

valores mais prováveis de ocorrer que outros. Este tipo de comportamento caracteriza uma

distribuição de probabilidade.

Do ponto de vista matemático, o valor dado pelo estimador pode diferir do valor esperado

para o parâmetro. Esta diferença matemática nem sempre representa que a hipótese de nulidade deva

ser rejeitada, pois como o estimador é uma variável aleatória, é esperado que ele assuma valores

dentro de um intervalo. O que um teste de hipóteses faz é comparar o valor especificado para um

parâmetro com a estimativa fornecida pelo estimador. Se a variação entre os dois valores for

PEQUENA diz-se que a foi devido à amostragem (acaso), consequentemente o valor do parâmetro é

realmente o especificado. Logo, a diferença entre o valor paramétrico e sua estimativa não é

significativa e não se rejeita a hipótese de nulidade.

Por outro lado, se a variação entre o valor paramétrico e sua estimativa for GRANDE, conclui-

se que a diferença é significativa e rejeita-se a hipótese de nulidade.

Nota-se que para a rejeição ou não da hipótese de nulidade é preciso estabelecer o que é uma

PEQUENA ou GRANDE diferença entre o valor paramétrico e sua estimativa. Para isto, devemos

conhecer a distribuição de probabilidade do estimador usado para estimar o parâmetro. Vamos ilustrar

com o seguinte exemplo:

Suponha que, em uma fazenda, o tempo médio gasto pelos trabalhadores na execução de uma

tarefa é de 15 minutos (µ = 15 min). Sabe-se que o tempo de execução da tarefa é uma variável

aleatória que segue distribuição normal com variância igual a 2,5 min2 [X ∼ N (15; 2,5)].

Um pesquisador implantou um novo sistema para diminuir o tempo médio de execução da

tarefa e uma amostra de 10 trabalhadores foi obtida a qual forneceu uma estimativa de 14,9 minutos

( X = 14,9 min). Do ponto de vista matemático o número 14,9 é menor que o número 15, mas do

ponto de vista estatístico, esse resultado 14,9 min é um resultado amostral e, portanto, está sujeito a

variações. Faz-se então o seguinte questionamento: Esse resultado constitui uma evidência de que

realmente o tempo médio diminuiu ou ele pode ter ocorrido por mero acaso?

Para responder à pergunta têm-se duas opções: medir o tempo gasto por todos os trabalhadores

na execução da tarefa com o novo sistema, ou então fazer uso de um teste de hipóteses. Na primeira

opção é claro que nenhum teste de hipóteses seria necessário, pois o pesquisador teria condições de

conhecer o verdadeiro valor do tempo médio na execução da tarefa com o novo sistema na população

de trabalhadores. Na segunda opção, o pesquisador faz uso dos valores amostrais, despendendo menos

trabalho, custo e tempo. Nesse caso teríamos as hipóteses a serem testadas:

Ho: µ = 15 minutos

Ha: µ < 15 minutos

Em termos probabilísticos poderíamos dizer que existe GRANDE probabilidade de em uma

população com média igual a 15 min existir grupos de 10 indivíduos que apresentem uma média na

execução da tarefa igual ou inferior a 1,49. Justificativa semelhante poderia ser atribuída a médias

amostrais que tivessem valores próximos ao valor suposto. Nesses casos, o pesquisador tem a

Page 4: Apostila 6 - Testes de hipóteses

4

tendência de não rejeitar a hipótese de nulidade, isto porque há forte indício de que a amostra foi

retirada de uma população que apresenta uma média próxima do que a suposta de 15 minutos.

Por outro lado, daquela população de trabalhadores, poder-se-ia tirar um grande número de

diferentes amostras de tamanho igual a 10, e cada uma forneceria um valor para a média amostral.

Então se a média amostral apresentar um valor muito distante do valor suposto, como por exemplo, 6

minutos, o pesquisador tem a tendência de rejeitar a hipótese de nulidade, isto porque há forte indício

de que a amostra foi retirada de uma população que apresenta uma média menor do que a suposta de

15 minutos. Em termos probabilísticos poderia se dizer que a probabilidade de encontrar um grupo de

indivíduos com média igual ou inferior a 6 minutos é muito PEQUENA, em uma população que

apresenta uma média igual a 15 min.

É possível ao pesquisador estabelecer um valor crítico que o ajuda a decidir sobre rejeitar ou

não a hipótese de nulidade. Este valor crítico pode a princípio ser estabelecido de duas maneiras:

1ª) O pesquisador de posse dos seus conhecimentos prévios sobre o assunto estabeleceria um valor

crítico antes de coletar a amostra. Este valor seria um valor para a média amostral tal que acima dele o

pesquisador não rejeitaria a hipótese de nulidade e abaixo dele rejeitaria a hipótese de nulidade. A

desvantagem deste método é não poder estabelecer a princípio qual seria a probabilidade de se

cometer o erro tipo I, ou seja, a que nível de significância que o teste de hipótese será realizado. Esta é

uma informação importante em trabalhos científicos, pois com a mesma é possível comparar os

resultados e conclusões de diferentes trabalhos de pesquisa.

2ª) O outro procedimento para definir o valor crítico em um teste de hipóteses é que este é conhecido a

partir do nível de significância estabelecido e o uso de tabelas estatísticas. Existe uma tabela específica

para cada tipo de teste de hipóteses. Estas tabelas fornecem valores críticos que delimitam regiões de

rejeição e de não-rejeição da hipótese de nulidade. O valor obtido de uma ou mais amostras retiradas

da população é então usado para calcular o valor de uma estatística que tem distribuição de

probabilidade idêntica àquela usada para identificar o valor tabelado. A comparação entre o valor

calculado e tabelado permite ao pesquisador decidir entre rejeitar ou não a hipótese Ho. Veremos mais

adiante alguns testes que utilizam este método.

4. Erros Tipo I e Tipo II

Quando utilizamos os testes de hipóteses podemos está cometendo dois tipos de erros, ou seja,

quando rejeitamos a hipótese nula, corremos o risco de estarmos tomando uma decisão errônea, ou

seja, nós rejeitamos a hipótese nula quando na verdade deveríamos aceitá-la. Este risco é o NÍVEL DE

SIGNIFICÂNCIA do teste, também conhecido como erro do tipo I e, a probabilidade de sua

ocorrência vale α.

Um segundo tipo de erro que podemos cometer, é aceitar a hipótese nula, quando ela é falsa.

Neste caso, temos o erro do tipo II, o qual é representado pela letra grega β. Esquematicamente,

temos:

Page 5: Apostila 6 - Testes de hipóteses

5

Se H0 é: ação

VERDADEIRA FALSA

NÃO REJEITAR H0 decisão correta (1-α) erro do tipo II (β)

REJEITAR H0 erro tipo I (α) decisão correta (1-β)

Características dos erros tipos I e II:

(i) Os erros tipo I e tipo II estão relacionados do seguinte modo: quando α decresce β cresce.

Portanto, não é possível encontrar testes que tornem simultaneamente ambos os erros tão

pequenos quanto queremos. Desse modo, é sempre necessário “privilegiar” uma das

hipóteses de maneira que não seja rejeitada, amenos que sua falsidade se torne muito

evidente. Nos testes a hipótese privilegiada é Ho, que só será rejeitada quando a evidência

de sua falsidade superar o limite de )%1.(100 α−

(ii) Ao assumir α como muito pequeno, então β pode aproximar-se de 1. O ideal na hora de

definir um teste é encontrar um compromisso satisfatório entre α e β (mesmo que sempre

a favor de Ho). Denominamos o PODER DE UM TESTE a quantidade 1 – β, ou seja,

Poder de um teste ≡ 1 – β = P (rejeitar Ho, dado que é falsa)

(iii) Erro tipo I é controlado com a escolha de α.

(iv) A única forma de causar uma redução de α e β simultaneamente é aumentar o tamanho da

amostra.

(v) Se H0 for falso, β será maior quanto mais próximo o valor do parâmetro estiver do valor

sob a hipótese H0.

Na prática, é costume escolherem-se níveis tradicionais (5% e 1%) para α e ignorar o erro tipo

II, assim, iremos aqui nos preocupar em controlar apenas o erro tipo I.

5. Representação gráfica da decisão de um teste

Uma vez que podemos ter três possibilidades para o teste de hipótese de acordo com a

hipótese alternativa utilizada: teste unilateral à esquerda, unilateral à direita e bilateral, podemos

representar a decisão do teste, em cada caso, da seguinte maneira (Figura 1):

Page 6: Apostila 6 - Testes de hipóteses

6

Figura 1. Gráficos da curva de distribuição normal em Testes de hipóteses unilateral à esquerda (a),

unilateral à direita (b) e bilateral (c).

Observe as respectivas regiões de aceitação (RAHo) e de rejeição (RRHo) da hipótese de nulidade

em cada caso. No teste bilateral, as áreas de rejeição correspondem a α/2, enquanto que nos testes

unilaterais a área de rejeição corresponde a α. Em todos os casos a área de aceitação de Ho

corresponde a 1 – α. Observe que o sinal > ou < aponta para o lado da curva a ser utilizado no teste

unilateral.

6. Passos para a construção de um teste de hipótese

Vejamos agora uma seqüência que pode ser usada sistematicamente para qualquer Teste de

Hipótese.

Passo 1. Define-se a hipótese H0 a ser testada e qual a hipótese alternativa Ha;

Passo 2. Usa-se a teoria estatística e as informações disponíveis para decidir qual estatística

(estimador) será usada para testar a hipótese H0. Obter as propriedades dessa estatística (média,

desvio padrão, etc.). Com os dados amostrais, calcula-se o valor da estatística do teste;

Passo 3. Fixa-se um nível de significância α (para teste bilaterais usa-se α/2) e obtém-se o valor

tabelado ou ponto crítico.

Passo 4. Compara-se o valor da estatística do teste (valor calculado) com o valor tabelado. Se o

valor da estatística calculado pertence à região de aceitação (RAH0), não se rejeita H0, caso

contrário, rejeita H0.

Page 7: Apostila 6 - Testes de hipóteses

7

7. Testes de Média Populacionais

O objetivo de testarem-se hipóteses sobre médias verdadeiras é avaliar certas afirmações feitas

sobre as mesmas. Por exemplo, podemos desejar verificar a afirmação de que as alturas médias de

plantas de feijão, para sementes de alto e baixo vigor, são iguais.

Existem, basicamente, três tipos de afirmações que se podem fazer quando se estuda médias

populacionais, no entanto, no nosso curso veremos duas, quais sejam:

1. a afirmação diz respeito a uma média populacional, então, temos o teste de uma média

populacional. Exemplo, o peso ao nascer de bezerros da raça nelore, é de 25,5 kg;

2. a firmação diz respeito as médias de duas populações (dois tratamentos) são iguais, temos

então, o teste de comparação de duas médias. Exemplo, a produção média de batatinhas de

duas variedades são iguais.

As técnicas que nós vamos estudar pressupõem uma distribuição normal da distribuição

amostral da estatística ou estimadores ( 21,, XXX ). Essa suposição será valida se a distribuição da

variável em estudo seguir uma distribuição normal e a amostragem for aleatória e, em geral, com boa

aproximação se a amostra for suficientemente grande (sugestão: n ≥ 30)

7. 1. Teste de uma média populacional (µµµµ) quando a variância populacional (σσσσ2) for conhecida

Como o teste é para média de populações normais com variância conhecida, usaremos a variável

Z ∼ N (0, 1). O valor calculado será:

n

XZ c

µ−=

Pois se X ~ N (µ, σ2) ⇒ X ~ N

n

2

µ ⇒ X ~ N

n

σµ,

Vejamos, agora, uma aplicação dos 5 passos definidos na seção anterior, para testar a hipótese

de que a média de uma população µ seja igual ao número fixado µ0 , supondo-se a variância σ2 dessa

população seja conhecida.

Exemplo:

Uma máquina automática para encher pacotes de sementes enche-os segundo uma distribuição

normal, com média µ e variância sempre igual a 400 g2. A máquina foi regulada para µ = 500 g.

Desejamos, periodicamente, colher uma amostra de 16 pacotes e verificar se a produção está sobre

controle, isto é, se µ = 500 ou não. Se uma dessas amostras apresentar uma média X = 492 g, você

pararia ou não a produção para regular a máquina?

Vejamos como testar essa hipótese.

Passo 1. Indiquemos por X o peso de cada pacote; então X ~ N (µ, 400). E as hipóteses que nos

interessam são:

H0 : µ = 500 g

Ha : µ ≠ 500 g

Page 8: Apostila 6 - Testes de hipóteses

8

Pois a máquina pode desregular para mais ou para menos.

Passo 2. Pela afirmação do problema, σ2 = 400 g será sempre a mesma; logo, para todo µ, a média

X de 16 pacotes terá distribuição N (µ,400/16), de modo que o desvio padrão de X é Xσ = 5. Em

particular, X ~N (500,25).

Passo 3. Vamos fixar α = 1%; pela hipótese alternativa, dizemos que temos um teste bilateral.

Portanto nossa região crítica será como podemos observa na figura 10.

Figura 2. Região crítica para o teste H0 : µ = 500 g versus Ha : µ ≠ 500 g

OBS: Os valores tabelados (“Z” tabelados) são obtidos da tabela de “Z” da seguinte forma:

Como se utilizou um α = 1%, tem-se que a região de aceitação equivale a 99%, ou seja,

1 - α = 1 – 0,01 = 0,99

Como o teste é bilateral, busca-se na tabela o valor de Z correspondente a esta probabilidade. Se

for utilizada a tabela unilateral de Z (dada na aula do dia 30/05 à tarde), tem-se antes que dividir 0,99

por 2, e aí sim buscar o valor de Z referente a essa probabilidade. No caso, 0,495. Portanto, para esse

valor de probabilidade o valor de Z é 2,57. Como a tabela é unilateral, mas a curva da distribuição

Normal é simétrica, os pontos à esquerda e à direita da média µ =0 são, -2,57 e 2,57, respectivamente.

Por outro lado, se for utilizada a tabela bilateral de Z (dada junto com a apostila), deve-se buscar

direto o valor de Z referente a essa probabilidade. No caso, esta probabilidade é 0,9911 e o valor de Z

referente é também + 2,57.

Passo 4. A informação pertinente da amostra é sua média que nesse caso particular é X = 492,

temos:

60,116/20

500492−=

−=cZ

Page 9: Apostila 6 - Testes de hipóteses

9

Passo 5. Como Zcalc = -1,60 ∈RAH0 , aceita-se H0, ou seja, podemos concluir com um nível de

significância de 1% que a produção está sobre controle com um peso médio de 500 g por pacote de

sementes.

7. 2. Teste t para uma média populacional (µµµµ) quando a variância populacional (σσσσ2) for

desconhecida

É muito freqüente na prática, o caso em que desejamos testar a hipóteses referentes à média de

uma população cujo desvio padrão é desconhecido. Se dispusermos apenas de uma amostra de n

elementos extraídos dessa população, com base na qual iremos realizar o teste, devemos então usar

essa mesma amostra para estimar o desvio padrão σ da população.

Ao substituir σ por σ̂ em n

2σσ = , a variável resultante terá distribuição t de Student com n

- 1 graus de liberdade (onde σ̂ é a raiz quadrada da variância da amostra calculada com n - 1 no

denominador). A expressão a ser usada será, portanto,

n

Xtc

/σ̂

µ−= com n – 1 graus de liberdade

OBS: quando o tamanho da amostra e maior de 30 a população tende a ser distribuída

normalmente.

Exemplo:

Um criador de coelhos afirma que seus coelhos abatidos aos 90 dias apresentam um peso médio

de 2,701Kg. Uma amostra de 10 coelhos foi retirada aleatoriamente e calculou-se sua média e seu

desvio padrão, que foram 2,584 Kg e 0,0675Kg, respectivamente. Utilizando o teste de hipótese

podemos afirmar que o peso dos coelhos estão abaixo do que afirma o criador?

Vejamos como testar essa hipótese.

Passo 1. As hipóteses que nos interessam são:

H0 : µ = 2,701Kg

H1 : µ < 2,701Kg

Pois a máquina pode desregular para mais ou para menos.

Passo 2. Suponha que X, o peso dos coelhos, tenha distribuição N (µ ,σ2).

10

00675701,2−

=X

tc

Passo 3. Vamos fixar α = 5%; pela hipótese alternativa dizemos que temos um teste unilateral a

esquerda. Portanto nossa região crítica será como a da figura 11.

Page 10: Apostila 6 - Testes de hipóteses

10

Figura 3. Região crítica para o teste H0 : µ = 2,701 Kg versus H1 : µ < 2,701Kg

OBS: O valor tabelado (“t” tabelado) é obtido da tabela de “t” da seguinte forma:

Como se utilizou um α = 5%, basta olhar na tabela de “t” o valor referente a 5% com 9 graus de

liberdade (n – 1 = 10 – 1 = 9), que é, portanto 1,83. Como o teste é unilateral e usou-se uma tabela

bilateral, tem-se que olhar na tabela o valor tabelado para 2α, ou seja 10%. Logo, para α = 10% e 9

graus de liberdade o valor de “t” tabelado é 1,83, ou -1,83 já que a distribuição na tabela bilateral é

simétrica.

IMPORTANTE:

Quanto se tem uma tabela de “t” unilateral e o teste também é unilateral, ou

quando se tem uma tabela de “t” bilateral e o teste também é bilateral, usa-se o

nível de significância α. Porém, se tiver uma tabela unilateral e o teste for

bilateral, usa-se 2α e, quando se tiver uma tabela bilateral e um teste unilateral,

usa-se α/2.

Ou seja:

Tabela Teste (ou Hipótese alternativa) Nível de significância (α)

Unilateral Unilateral α

Bilateral Bilateral α

Unilateral Bilateral 2 α

Bilateral Unilateral α/2

Passo 4. A informação pertinente da amostra é sua média que nesse caso particular é X = 2,584,

temos:

481,510/0675,0

701,2584,2tc −=

−=

Page 11: Apostila 6 - Testes de hipóteses

11

Passo 5. Como tc = -5,481 ∈ RRH0 , rejeita-se H0, ou seja, ao nível de 5% de probabilidade pelo o

teste t a média dos pesos dos coelhos aos 90 dias é inferior a 2,701Kg, com 95% de confiança.

8. Teste para comparação de duas médias (µµµµ1 e µµµµ2) quando as variâncias populacionais (σσσσ21 e σσσσ2

2)

forem desconhecidas

Vamos agora estender o procedimento anterior para o caso de comparação de duas médias

populacionais, quando as variâncias populacionais são desconhecidas. Nesse caso, conhecem-se as

estimativas das variâncias populacionais.

A fundamentação básica continua sendo a mesma dos testes anteriores, só se farão algumas

alterações quanto à estatística teste a ser utilizada. Neste caso testamos a hipótese de igualdade das

duas médias, ou seja:

H0: µ1 = µ2.

Como no caso do teste de uma média populacional, temos três possibilidades para a hipótese

alternativa, quais sejam:

Ha: µ1 ≠ µ2.

Ha: µ1 > µ2.

Ha : µ1 < µ2.

Num teste de comparação de duas médias temos dois casos a considerar, quais sejam:

1. dados não pareados ou amostras independentes. Neste caso, os dados das duas

amostras não estão relacionados. Exemplo: o peso de bezerros de duas raças A e B.

2. dados pareados ou amostras dependentes. Quando os dados são relacionados dois a

dois, eles são denominados pareados. É comum na experimentação, tomar-se dados de uma

amostra de uma população antes e após a aplicação de um determinado tratamento. Como,

cada elemento da amostra é mensurado antes e depois o tratamento diz-se que os dados são

pareados. Exemplo: o peso de bezerros da raça A antes e após o tratamento com uma nova

ração.

8. 1. Dados não pareados ou amostras independentes

Aqui, também temos dois casos: quando a comparação é feita entre duas populações de

variâncias populacionais desconhecidas, mas supostamente iguais ou desiguais.

8. 1. 1. Teste para comparação de duas médias, de amostras independentes, de variâncias

populacionais desconhecidas e supostamente iguais.

O procedimento de teste de hipóteses sempre segue uma mesma seqüência, o que muda é a

estatística amostral de interesse do pesquisador e a estatística de teste a ser utilizada.

Page 12: Apostila 6 - Testes de hipóteses

12

Vamos supor que as amostras sejam independentes, oriundas de duas populações com

distribuição normal e que as variâncias das duas populações são desconhecidas e, portanto, precisam

ser estimadas.

Para sabermos se duas variâncias podem ser consideradas iguais, ou seja, se existe

homogeneidade de variâncias, é necessário que se proceda a um teste de hipótese sobre as variâncias

populacionais. Portanto, inicialmente, vamos testar a hipótese de homogeneidade de variâncias e, em

seguida, dado que aceitamos que as variâncias são iguais, vamos testar a hipótese de igualdade entre as

médias das duas populações. O teste de comparação de duas médias, quando as variâncias são

desiguais ou heterogêneas, será apresentado na próxima seção. A comparação entre variâncias é feita

com o uso do teste F, o qual veremos a seguir:

Teste F para comparação de variâncias populacionais

Como qualquer outro teste, devemos sempre iniciar pela formulação das hipóteses, que nesse

caso são dadas por,

H0 : 22

21 σσ =

Ha: 22

21 σσ >

Quando desejamos comparar variâncias devemos utilizar a estatística F (ou teste de Fisher-

Snedecor), dada pelo quociente entre as duas estimativas de variâncias, 21σ̂ e 2

2σ̂ , de 21σ e 2

1σ ,

respectivamente, distintas e supostas independentes. Temos,

22

21

ˆ

ˆ

σ

σ=cF com n1 – 1 e n2 – 1 graus de liberdade

As variâncias 21σ̂ e 2

2σ̂ são calculadas com os n1 e n2 dados das amostras, respectivamente.

Assim, dizemos que a 21σ̂ estão associados n1 – 1 graus de liberdades (numerador) e, da mesma forma,

para 21σ̂ estão associados n2 – 1 graus de liberdade (denominador). Vamos admitir SEMPRE que 2

1σ̂

é maior do que 22σ̂ , ou seja, no numerador vamos sempre usar a maior variância, ou seja:

variância

var

menor

iânciamaiorF = com n1 -1 e n2 - 1 graus de liberdade do numerador e do

denominador, respectivamente.

A conclusão do teste pode ser feita comparando o valor de F calculado com os dados da amostra

(Fcalculado), e o valor de F tabelado ou crítico, obtido na tabela da distribuição F dada em anexo, com n1

– 1 graus de liberdade no numerador e n2 – 1 graus de liberdade no denominador, e com um nível de

probabilidade α fixado. Então por esse procedimento rejeitamos H0 se Fcalculado > Fn1 – 1, n2 – 1,α.

Page 13: Apostila 6 - Testes de hipóteses

13

Exemplo:

As produções de duas variedades de milho, em toneladas por hectare, foram as seguintes:

Variedade A 1,3 1,4 1,1 1,4 1,5

Variedade B 1,8 1,6 1,9 1,9 1,8

Dos dados das amostras obtemos, Ax = 1,34, Bx =1,80, 2ˆAσ = 0,231, 2ˆ

Bσ = 0,0150.

Inicialmente vamos testar a hipótese de homogeneidade das variâncias com α = 5%. Assim o valor da

estatística F é,

F = 54,10150,0

0231,0=

Com o auxilio da tabela da distribuição F, com o nível de significância de 5%, com 4 e 4 graus

de liberdade no numerador e denominador, respectivamente, obtemos F4,4,5% = 6,39,. Como Fcalculado =

1,54, temos que Fcalculado < Fn1 – 1, n2 – 1,α., logo, aceitamos H0, ou seja, as variâncias são iguais, ao nível

de 5% de probabilidade.

Voltemos, agora, ao nosso objetivo, que é verificar se duas médias populacionais podem ser

consideradas iguais ou não. No exemplo, as hipóteses são dadas por:

H0 : µA = µB versus Ha : µA ≠ µB

Para estudar se duas médias populacionais são iguais ou não, a estatística teste a ser utilizada

é dada por:

+

−+

−+−

−=

2121

222

211

21

11

2

ˆ)1(ˆ)1(

)(

nnnn

nn

XXtc

σσ

A qual tem distribuição t de Student com n1 + n2 – 2 graus de liberdade.

A conclusão do teste pode ser feita comparando o valor de t com os dados da amostra (tcalculado),

e o valor de t tabelado ou crítico, obtido na tabela da distribuição de “t” dada em anexo, com n1 + n2 -

2 graus de liberdade, e com um nível de probabilidade α fixado. Então por esse procedimento

rejeitamos H0 se tabeladocalculado tt ≥ .

Para o nosso exemplo temos,

236,5)40,0(0191,0

46,0

5

1

5

1

255

0150,0)15(0231,0)15(

)80,134,1(t −=

−=

+

−+

−+−

−=

Page 14: Apostila 6 - Testes de hipóteses

14

Com o auxilio da tabela da distribuição t, com o nível de significância de 5%, com 8 graus de

liberdade, obtemos t8,5% = 2,306, como tcalculado = -5,236, temos que tabeladocalculado tt ≥ , rejeitamos H0,

ou seja, as duas variedades de milho têm produção diferentes, ao nível de 5% de probabilidade.

8. 1. 2. Teste para comparação de duas médias, de amostras independentes e variâncias

desconhecidas e supostamente desiguais.

Suponhamos que as amostras sejam oriundas de duas populações com distribuições normais,

independentes e variâncias heterogêneas e desconhecidas, portanto, precisam ser estimadas com base

na amostra. Como no item anterior, testa-se a homogeneidade das variâncias pelo teste F, mas, como

neste caso, rejeita-se a hipótese de nulidade de igualdade entre as variâncias, o procedimento de teste

de médias entre as duas populações sofre algumas modificações.

Neste caso, a estatística de teste da diferença entre duas médias, é dada por:

2

22

1

21

21

ˆˆ

)(

nn

XXtc

σσ+

−=

Onde, esta variável tem uma distribuição aproximada de Student, com grau de liberdade

corrigido, dado por:

1

ˆ

1

ˆ

ˆˆ

2

2

2

22

1

2

1

21

2

2

22

1

21

+−

+

=

n

n

n

n

nnv

σσ

σσ

Exemplo:

Em um centro agrícola, deseja-se testar o efeito de determinado fertilizante sobre a produção de

trigo. Para isso, escolheram-se 24 áreas de terra, cada uma 10 m2, de uma grande área homogênea.

Metades dessas unidades são tratadas com o fertilizante, enquanto a outra metade não recebe o

fertilizante, este é denominado de tratamento controle. A produção média do trigo sem fertilizante foi

de 1260 Kg/ha com desvio padrão de 280 Kg/ha, enquanto que a produção média com fertilizante foi

de 1710 Kg/ha com desvio padrão de 730 Kg/ha. Podemos afirma que houve aumento significativo na

produção de trigo ao nível de 5% de significância devido à utilização do fertilizante?

Antes de fazermos os testes sobre as médias populacionais deveremos verificar se as variâncias

são homogêneas ou não. Dos dados das amostras obtemos, 2ˆFσ = 532900, 2ˆ

Cσ = 78400. Inicialmente

vamos testar a hipótese de homogeneidade das variâncias com α = 5%. Assim o valor da estatística F

é:

F = 7972,678400

532900= .

Page 15: Apostila 6 - Testes de hipóteses

15

Com o auxilio da tabela da distribuição F, com o nível de significância de 5%, com 11 e 11

graus de liberdade no numerador e denominador, respectivamente, obtemos F11,11,5% = 2,82 como

Fcalculado = 6,7972, temos que Fcalculado > Fn1 – 1, n2 – 1,α., rejeitamos H0, ou seja, as variâncias são

diferentes.

As hipóteses, sobre as médias populacionais, são formuladas do seguinte modo:

H0 : µF = µC versus Ha : µF > µC

De acordo com a hipótese alternativa, nosso teste é unilateral. O valor da estatística t é:

99,1

12

78400

12

532900

)12601710(=

+

−=ct

com 12 graus de liberdade e,

1417,14

11

12

78400

11

12

532900

12

78400

12

532900

v22

2

≅=

+

+

=

Com o auxilio da tabela da distribuição t, com o nível de significância de 5%, com 14 graus de

liberdade (grau de liberdade corrigido), obtemos t14,5% = 1,761, como tcalculado = 1,99, temos que

tabeladocalculado tt ≥ . Rejeitamos H0, conseqüentemente, podemos afirma, ao nível de 5%, que o uso de

fertilizante causa um acréscimo significativo na produção.

8. 2. Dados pareados ou dependentes

Como o objetivo, é verificar se duas médias populacionais pareadas podem ser consideradas

iguais ou não se testa a hipótese em relação ao desvio médio ( D ), ou seja, em relação à diferença

média do antes e depois. As hipóteses são dadas por:

H0: D = oD versus Ha: D ≠ oD

Ha: D > oD

Ha: D < oD

OBS: O oD pode ser igual a zero ou não!!!! Se oD = 0, então teríamos:

H0: D = 0 versus Ha: D ≠ 0

Ha: D > 0

Ha: D < 0

Para estudar se duas médias populacionais são iguais ou não, a estatística teste a ser utilizada é

dada por:

Page 16: Apostila 6 - Testes de hipóteses

16

n

DDt

D

o

σ̂

−=

Em que:

n

D

D

n

i

i∑== 1 e

1

/)(ˆ 1 1

22

=

∑ ∑= =

n

nDDn

i

n

i

ii

Com distribuição “t” de Student e n - 1 graus de liberdade.

A conclusão do teste é feita comparando o valor de t calculado a partir dos dados amostrais

(tcalculado), com o valor de t tabelado ou crítico, obtido na tabela da distribuição t, com n - 1 graus de

liberdade, no nível de probabilidade α% fixado. Então por esse procedimento rejeitamos H0 se

tabeladocalculado tt ≥ .

Exemplo.

Os dados de peso de bezerros foram obtidos antes e depois da aplicação de uma nova ração

(tratamento), em uma amostra de tamanho n = 5. Ao nível de 5% de probabilidade podemos afirmar

que a aplicação da ração causou acréscimo de peso nos bezerros?

Seja,

X: peso antes do tratamento;

Y: peso após tratamento;

Bezerros 1 2 3 4 5

Xi 100 105 108 106 110

Yi 120 115 130 140 112

iD = Yi - Xi -20 -10 -22 -34 -2

As hipóteses, sobre as médias populacionais, são formuladas do seguinte modo:

H0 : D = 0 versus Ha: D > 0

Vamos calcular as estatísticas básicas:

6,175

)2()34()22()10(20−=

−+−+−+−+−=D

( )

1984,1215

5

88])2()34()22()10()20[(

ˆ

222222

=−

−−−+−+−+−+−

=Dσ

Page 17: Apostila 6 - Testes de hipóteses

17

Logo, o valor da estatística t é:

226,3

5

1984,1206,17

−=−−

=t

Com o auxilio da tabela da distribuição t, com o nível de significância de 5% e com 4 graus de

liberdade, obtemos t4,5% = 2,132 (Se a tabela for bilateral, olha-se α% = 10%).

Como tcalculado = -3,226, temos que tabeladocalculado tt ≥ . Logo, rejeita-se H0 ao nível de 5% de

significância, ou seja, o uso da ração causa um acréscimo no peso dos bezerros.

Este conteúdo é resultado de pesquisa em vários livros e apostilas de estatística e bioestatística, portanto,

ainda deve ser revisado. Qualquer crítica, erro de digitação (ou outro qualquer), etc., por favor, me comunique.

Obrigada.

Profa. Gisele

= 2,13

Page 18: Apostila 6 - Testes de hipóteses

18

Tabela I - Distribuição Normal Padrão Z~N(0,1)

Corpo da tabela dá a probabilidade p, tal que p = P(0< Z < Zc)

Segunda decimal de Zc Parte inteira da primeira decimal de Zc 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0,00 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359

0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141

0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517

0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879

0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224

0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549

0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852

0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133

0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621

1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830

1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015

1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177

1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319

1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441

1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545

1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633

1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706

1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817

2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857

2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890

2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916

2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936

2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952

2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964

2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974

2,80 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981

2,90 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986

3,00 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

3,10 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993

3,20 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995

3,30 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997

3,40 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998

3,50 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998

3,60 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,70 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,80 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999

3,90 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

4,00 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

Page 19: Apostila 6 - Testes de hipóteses

19

Tabela II – Distribuição t de Student

Nível de Significância αααα

Área em DUAS caudas (Teste bilateral)

0,20 0,10 0,05 0,025 0,01

Área em UMA cauda (Teste unilateral)

Graus de Liberdade (n-1)

0,10 0,05 0,025 0,01 0,005

1 3,078 6,314 12,706 31,821 63,656

2 1,886 2,920 4,303 6,965 9,925

3 1,638 2,353 3,182 4,541 5,841

4 1,533 2,132 2,776 3,747 4,604

5 1,476 2,015 2,571 3,365 4,032

6 1,440 1,943 2,447 3,143 3,707

7 1,415 1,895 2,365 2,998 3,499

8 1,397 1,860 2,306 2,896 3,355

9 1,383 1,833 2,262 2,821 3,250

10 1,372 1,812 2,228 2,764 3,169

11 1,363 1,796 2,201 2,718 3,106

12 1,356 1,782 2,179 2,681 3,055

13 1,350 1,771 2,160 2,650 3,012

14 1,345 1,761 2,145 2,624 2,977

15 1,341 1,753 2,131 2,602 2,947

16 1,337 1,746 2,120 2,583 2,921

17 1,333 1,740 2,110 2,567 2,898

18 1,330 1,734 2,101 2,552 2,878

19 1,328 1,729 2,093 2,539 2,861

20 1,325 1,725 2,086 2,528 2,845

21 1,323 1,721 2,080 2,518 2,831

22 1,321 1,717 2,074 2,508 2,819

23 1,319 1,714 2,069 2,500 2,807

24 1,318 1,711 2,064 2,492 2,797

25 1,316 1,708 2,060 2,485 2,787

26 1,315 1,706 2,056 2,479 2,779

27 1,314 1,703 2,052 2,473 2,771

28 1,313 1,701 2,048 2,467 2,763

29 1,311 1,699 2,045 2,462 2,756

30 1,310 1,697 2,042 2,457 2,750

Page 20: Apostila 6 - Testes de hipóteses

20

Tabela IIIa– Distribuição F de Fisher (αααα = 0,01 ou 1%)

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.

1 2 3 4 5 6 7 8 9 10 11 12

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

40

50

60

70

80

90

100

500

1000

Page 21: Apostila 6 - Testes de hipóteses

21

Tabela IIIb– Distribuição F de Fisher (αααα = 0,01 ou 1%)

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.

13 14 15 20 25 30 40 50 60 120 ∞

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

40

50

60

70

80

90

100

500

1000

Page 22: Apostila 6 - Testes de hipóteses

22

Tabela IVa– Distribuição F de Fisher (αααα = 0,05 ou 5%)

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.

1 2 3 4 5 6 7 8 9 10 11 12

1 161 199 216 225 230 234 237 239 241 242 243 244

2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41

3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74

4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68

6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00

7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57

8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28

9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91

11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79

12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69

13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48

16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42

17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38

18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34

19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28

21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25

22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23

23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20

24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16

26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15

27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13

28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12

29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09

40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,04 2,00

50 4,03 3,18 2,79 2,56 2,40 2,29 2,20 2,13 2,07 2,03 1,99 1,95

60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,95 1,92

70 3,98 3,13 2,74 2,50 2,35 2,23 2,14 2,07 2,02 1,97 1,93 1,89

80 3,96 3,11 2,72 2,49 2,33 2,21 2,13 2,06 2,00 1,95 1,91 1,88

90 3,95 3,10 2,71 2,47 2,32 2,20 2,11 2,04 1,99 1,94 1,90 1,86

100 3,94 3,09 2,70 2,46 2,31 2,19 2,10 2,03 1,97 1,93 1,89 1,85

500 3,86 3,01 2,62 2,39 2,23 2,12 2,03 1,96 1,90 1,85 1,81 1,77

1000 3,85 3,00 2,61 2,38 2,22 2,11 2,02 1,95 1,89 1,84 1,80 1,76

Page 23: Apostila 6 - Testes de hipóteses

23

Tabela IVb– Distribuição F de Fisher (αααα = 0,05 ou 5%)

Colunas: Graus de Liberdade Numerador. Linhas: Graus de Liberdade Denominador.

13 14 15 20 25 30 40 50 60 120 ∞

1 246 248 246 248 249 250

2 19,43 19,45 19,43 19,45 19,46 19,46

3 8,70 8,66 8,70 8,66 8,63 8,62

4 5,86 5,80 5,86 5,80 5,77 5,75

5 4,62 4,56 4,62 4,56 4,52 4,50

6 3,94 3,87 3,94 3,87 3,83 3,81

7 3,51 3,44 3,51 3,44 3,40 3,38

8 3,22 3,15 3,22 3,15 3,11 3,08

9 3,01 2,94 3,01 2,94 2,89 2,86

10 2,85 2,77 2,85 2,77 2,73 2,70

11 2,72 2,65 2,72 2,65 2,60 2,57

12 2,62 2,54 2,62 2,54 2,50 2,47

13 2,53 2,46 2,53 2,46 2,41 2,38

14 2,46 2,39 2,46 2,39 2,34 2,31

15 2,40 2,33 2,40 2,33 2,28 2,25

16 2,35 2,28 2,35 2,28 2,23 2,19

17 2,31 2,23 2,31 2,23 2,18 2,15

18 2,27 2,19 2,27 2,19 2,14 2,11

19 2,23 2,16 2,23 2,16 2,11 2,07

20 2,20 2,12 2,20 2,12 2,07 2,04

21 2,18 2,10 2,18 2,10 2,05 2,01

22 2,15 2,07 2,15 2,07 2,02 1,98

23 2,13 2,05 2,13 2,05 2,00 1,96

24 2,11 2,03 2,11 2,03 1,97 1,94

25 2,09 2,01 2,09 2,01 1,96 1,92

26 2,07 1,99 2,07 1,99 1,94 1,90

27 2,06 1,97 2,06 1,97 1,92 1,88

28 2,04 1,96 2,04 1,96 1,91 1,87

29 2,03 1,94 2,03 1,94 1,89 1,85

30 2,01 1,93 2,01 1,93 1,88 1,84

40 1,92 1,84 1,92 1,84 1,78 1,74

50 1,87 1,78 1,87 1,78 1,73 1,69

60 1,84 1,75 1,84 1,75 1,69 1,65

70 1,81 1,72 1,81 1,72 1,66 1,62

80 1,79 1,70 1,79 1,70 1,64 1,60

90 1,78 1,69 1,78 1,69 1,63 1,59

100 1,77 1,68 1,77 1,68 1,62 1,57

500 1,69 1,59 1,69 1,59 1,53 1,48

1000 1,68 1,58 1,68 1,58 1,52 1,47

Page 24: Apostila 6 - Testes de hipóteses

24

UNIVERSIDADE FEDERAL DO PIAUÍ Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI Lista de exercícios: Testes de hipóteses 1. O cálcio apresenta-se normalmente no sangue de mamíferos em concentrações ao redor de 6 mg por 100 ml do total de sangue. O desvio padrão normal dessa variável é 1 mg de cálcio por 100 ml do volume total de sangue. Uma variabilidade maior que essa pode ocasionar graves transtornos na coagulação do sangue. Uma série de nove provas sobreo paciente revelou uma média de amostral de 2 mg por 100 ml do volume total de sangue. Existe alguma evidência, para um nível α = 5%, de que o nível médio de cálcio para esse paciente seja diferente do normal? 2. O cálcio apresenta-se normalmente no sangue de mamíferos em concentrações ao redor de 6 mg por 100 ml do total de sangue. Uma variabilidade maior que essa pode ocasionar graves transtornos na coagulação do sangue. Uma série de nove provas sobreo paciente revelou uma média de amostral de 2 mg por 100 ml do volume total de sangue e variância amostral de 2 mg de cálcio por 100 ml do volume total de sangue. Existe alguma evidência, para um nível α = 5%, de que o nível médio de cálcio para esse paciente seja mais baixo do normal? 3. Duas espécies de pernilongos são morfologicamente tão similares que, por muitos anos, elas foram consideradas como se fossem a mesma. Diferenças biológicas, no entanto, existem. Estão apresentados a seguir os dados de tamanhos de palpo (apêndice do maxilar do inseto) das duas espécies consideradas em uma amostra de 20 insetos de cada espécie: Leptoconops

carteri e L. torrens. Verificar se com os dados apresentados é possível determinar alguma evidência significativa de diferença entre as duas espécies. Testar a hipótese de igualdade de médias das duas espécies usando um nível de significância de 5%.

Espécies Tamanho do palpo 31 32 36 32 35 36 36 36 36 35 38 34 34 35 36

L. carteri

36 35 34 37 37 37 38 39 35 42 40 44 40 42 43 38 41 35 38 36

L. torrens

38 40 37 40 39 4. Em uma pequena experiência foi executado um trabalho de por dez técnicos, de acordo com o método I, e por vinte técnicos, de acordo com o método II. Os resultados levaram aos seguintes dados sobre a duração média e variabilidade do tempo necessário à execução do trabalho: MÉTODO I – min531 =X ; min6ˆ 2

1 =σ

MÉTODO II – min572 =X ; min15ˆ 22 =σ

É possível afirmar que o método I fornece um tempo médio menor que o método II? Use α = 5%. 5. Para investigar a influência da opção profissional sobre o salário inicial de recém formados, investigaram-se dois grupos de profissionais: um de liberais em geral e outro de formados em Medicina Veterinária. Com os resultados abaixo, expressos em salários mínimos, quais suas conclusões ao nível de 5% de significância?

Page 25: Apostila 6 - Testes de hipóteses

25

Liberais (X) – 6,6 10,3 10,8 12,9 9,2 12,3 7,0 Médicos Veterinários (Y) – 8,1 9,8 8,7 10,0 10,2 10,8 8,7 10,1 6. Em um estudo para comparar os efeitos de duas dietas, A e B, sobre o crescimento, 6 ratos foram submetido à dieta A, e 9 ratos à dieta B. Após 5 semanas, os ganhos em peso foram: A 15 18 12 11 14 15 B 11 11 12 16 12 13 8 10 13 Admitindo que tenham duas amostras independentes de populações normais, teste a hipótese de que não há diferença entre as duas dietas, contra a alternativa que a dieta A é mais eficaz, ao nível de 1% de probabilidade. 7. As amostras (X1, X2, ..., X10) e (Y1, Y2, ..., Y10) de duas populações normais com médias

1µ e 2µ e mesma variância 2σ fornecem as estatísticas:

16ˆ;80 21 == σX

18ˆ;83 22 == σY

Teste ao nível de 5% de significância a hipótese H0: 1µ = 2µ contra a alternativa Ha: 1µ < 2µ . 8. Foram as seguintes as produções médias de duas variedades de soja, em t/ha: variedade A: média=3,8 t/ha com variância = 0,36 (t=ha)2; variedade B: média=4,6 t/ha com variância = 0,04 (t=ha)2. As informações obtidas, para as variedades A e B, foram baseadas em amostras de tamanhos 30 e 35 respectivamente. Teste a hipótese de que não há diferença significativa entre as produções médias, ao nível de 1% de probabilidade. 9. Um agrônomo realizou um levantamento para estudar o desenvolvimento de duas espécies de árvores, a bracatinga (Mimosa scabrella) e Canafístula (Peltophorum dubium). Para esta finalidade foram coletadas duas amostras de tamanho igual a 30 árvores. Os resultados para altura (dados fictícios), em metros, foram:

A hipótese levantada pelo pesquisador é que a Canafístula deve apresentar uma altura média maior do que a Bracatinga. Esses dados indicam evidência suficiente para suportar a hipótese do pesquisador? 10. Doze galinhas adultas foram submetidas ao tratamento com certa ração durante uma semana. Os animais foram perfeitamente identificados tendo sido mantidos, para tanto, em baias individuais. Os pesos, em gramas, antes e ao término da semana, são apresentados a seguir:

Page 26: Apostila 6 - Testes de hipóteses

26

Peso (g) antes e após o tratamento

Cobaia Antes Após

1 635 640 2 703 711 3 660 673 4 550 548 5 602 609 6 735 730 7 678 687 8 565 575 9 623 625 10 629 642 11 620 618 12 725 735

Ao nível de 1% de probabilidade podemos concluir que o uso da ração contribuiu para o aumento do peso médio dos animais? 11. Para comparar o peso vivo e peso jejum do gado crioulo Lageano, um pesquisador selecionou aleatoriamente uma maostra de 15 animais e anoitou os seus pesos. Os dados resultantes estão descritos abaixo. Esses dados têm evidência suficiente para garantir que existe diferença entre peso vivo e peso jejum? Compare os resultados utilizando α = 1% e 5%.

Animal Peso vivo Peso jejum 1 498 453 2 510 466 3 540 491 4 580 480 5 440 405 6 350 315 7 595 557 8 513 477 9 398 353 10 410 380 11 450 412 12 495 453 13 508 462 14 515 477 15 560 505