18
3.3 Testes de Hipóteses Em Estatística, uma hipótese é uma alegação, ou afirmação, sobre uma propriedade de uma população. As afirmações seguintes são exemplos de hipóteses a serem testadas pelos processos a serem apresentados: Pesquisadores médicos afirmam que a temperatura média do corpo humano não é igual a 98,6º F. A percentagem de motoristas hospitalizados em conseqüência de acidentes é menor no caso de carros equipados com airbag do que no caso de carros sem esse equipamento. Quando se utiliza equipamento novo na fabricação de altímetros para aviões, a variação nos erros é reduzida, de modo que os resultados apresentados são mais consistentes. Antes de iniciar um estudo deste item, deve-se ter em mente esta diretriz geral para o raciocínio estatístico: analisar uma amostra para distinguir entre resultados que podem ocorrer facilmente e os que dificilmente ocorrem. Podemos explicar a ocorrência de resultados altamente improváveis dizendo que ou ocorreu efetivamente um evento raro, ou as coisas não são como supúnhamos. Testaremos duas hipóteses a serem testadas definidas como: H 0 chamada de hipótese nula e H 1 chamada de hipótese alternativa. Há dois tipos possíveis de erro ao testar uma hipótese estatística. Pode-se rejeitar uma hipótese quando ela é, de fato, verdadeira, ou aceitar uma hipótese quando ela é, de fato, falsa. A rejeição de uma hipótese verdadeira é chamada “erro tipo I”. A aceitação de uma hipótese falsa constitui um “erro tipo II”. Abaixo é mostrado um quadro de erros de decisão: Quadro 1. Possíveis erros de decisão (Hipótese) Decisão tomada Não rejeitar Rejeitar H 0 verdadeira Correta Erro tipo I () H 1 verdadeira Erro tipo II () Correta

Testes de Hipóteses t e qui quadrado

Embed Size (px)

Citation preview

Page 1: Testes de Hipóteses t e qui quadrado

3.3 Testes de Hipóteses

Em Estatística, uma hipótese é uma alegação, ou afirmação, sobre uma

propriedade de uma população.

As afirmações seguintes são exemplos de hipóteses a serem testadas pelos processos a

serem apresentados:

Pesquisadores médicos afirmam que a temperatura média do corpo humano não

é igual a 98,6º F.

A percentagem de motoristas hospitalizados em conseqüência de acidentes é

menor no caso de carros equipados com airbag do que no caso de carros sem

esse equipamento.

Quando se utiliza equipamento novo na fabricação de altímetros para aviões, a

variação nos erros é reduzida, de modo que os resultados apresentados são mais

consistentes.

Antes de iniciar um estudo deste item, deve-se ter em mente esta diretriz geral

para o raciocínio estatístico: analisar uma amostra para distinguir entre resultados que

podem ocorrer facilmente e os que dificilmente ocorrem.

Podemos explicar a ocorrência de resultados altamente improváveis dizendo

que ou ocorreu efetivamente um evento raro, ou as coisas não são como supúnhamos.

Testaremos duas hipóteses a serem testadas definidas como: H0 chamada de hipótese

nula e H1 chamada de hipótese alternativa.

Há dois tipos possíveis de erro ao testar uma hipótese estatística. Pode-se

rejeitar uma hipótese quando ela é, de fato, verdadeira, ou aceitar uma hipótese quando

ela é, de fato, falsa. A rejeição de uma hipótese verdadeira é chamada “erro tipo I”. A

aceitação de uma hipótese falsa constitui um “erro tipo II”. Abaixo é mostrado um

quadro de erros de decisão:

Quadro 1. Possíveis erros de decisão

(Hipótese)

Decisão tomada

Não rejeitar Rejeitar

H0 verdadeira Correta Erro tipo I ()

H1 verdadeira Erro tipo II () Correta

Page 2: Testes de Hipóteses t e qui quadrado

As probabilidades desses dois tipos de erros são designadas, respectivamente,

por e . A probabilidade do erro tipo I é denominada “nível de significância” do

teste e é aquela considerada mais grave de errar. Por exemplo, Imagine um à decisão de

um juiz sobre um réu após um julgamento, como se pode ver na tabela abaixo. A

hipótese de nulidade é "o réu é inocente". Observe-se que o erro do tipo I é o mais

importante.

Quadro 2. Possíveis erros de decisão do Juiz

(Hipótese)

Decisão tomada

Não condenar Condenar

Réu inocente Correta ()

Réu culpado () Correta

É interessante notar que muitas vezes não há condenação porque as evidências (provas)

não são suficientes para condenação, ou seja, H0 não é rejeitada, mas não quer dizer

necessariamente que a inocência está provada. Nestes casos, afirmamos que não há

evidencias para rejeitar H0.

Daremos abaixo uma seqüência que pode ser usada sistematicamente para

qualquer teste de hipóteses.

1º Passo: Fixe a hipótese H0, a ser testada, e a hipótese alternativa H1.

2º Passo: Use a teoria estatística e as informações disponíveis para decidir qual

estatística (estimador) será usada para julgar a hipótese H0. (Não se

esquecendo de levantar as propriedades dessa estatística).

3º Passo : Fixe a probabilidade de cometer um erro tipo I, e use este valor

para construir a região crítica (RC).

4º Passo : Use as informações fornecidas pela amostra para encontrar o valor

da estatística que definirá a decisão.

5º Passo : Se o valor da estatística observado na amostra não pertencer a região

crítica, aceite H0; caso contrário, rejeite H0.

3.4.1 Teste para a Média de uma População

Page 3: Testes de Hipóteses t e qui quadrado

Vejamos agora uma aplicação dos cinco passos, definidos anteriormente, para

testar a hipótese de que a média de uma população é igual a um número fixado 0,

supondo-se a variância 2 da população conhecida.

Exemplo: Uma máquina automática de encher pacotes de café enche-os

segundo uma distribuição normal, com média e variância 400g2. O valor de pode

ser fixado num mostrador situado numa posição um pouco inacessível dessa máquina.

A máquina foi regulada para = 500g. Desejamos, de meia em meia hora, colher uma

amostra de 16 pacotes e verificar se a produção está sob controle, isto é, se = 500g ou

não. Se uma dessas amostras apresentasse uma média x = 492g, você pararia ou não a

produção para verificar se o mostrador está na posição correta?

Este é um exemplo típico de teste de hipóteses.

1º Passo: Indiquemos por X o peso de cada pacote; então, X : N(, 400). E as

hipóteses que nos interessa são:

H0 : = 500g

H1 : 500g

pois a máquina pode desregular para mais ou para menos. O problema fornece

informações sobre a alternativa, que poderia ter uma das três formas abaixo:

(i) H1 : 500g (teste bicaudal)

(ii) H1 : > 500g (teste monocaudal à direita)

(iii) H1 : < 500g (teste monocaudal à esquerda)

2º Passo: Pela afirmação do problema, 2 = 400 será sempre a mesma; assim,

qualquer que seja a média , a média X de 16 pacotes terá distribuição

X ~ N(, 400/16), isto é, X ~ N(, 25).

Em particular, se H0 é verdadeira,

X ~ N(500, 25).

Page 4: Testes de Hipóteses t e qui quadrado

3º Passo: Vamos fixar = 1%; pela hipótese alternativa, vemos que a hipótese

H0 deve ser rejeitada quando X for muito pequeno ou muito grande (teste bicaudal).

Assim, nossa região crítica será como a figura abaixo.

Da tabela da curva normal, obtemos que

1,487x5

500x58,2Z 1c

1c

1

9,512x5

500x58,2Z 2c

2c

2

.

Logo, RC = { x R | x < 487,1 ou x > 512,9}.

4º Passo: A informação pertinente da amostra é a sua média, que neste caso

particular é 0x = 492.

5º Passo: Como 0x RC, a nossa conclusão será não rejeitar H0, ou seja, o

desvio da média da amostra para a média proposta por H0 pode ser considerado como

devido apenas ao sorteio aleatório dos pacotes.

OBS: Em geral, a regra de decisão será: Rejeita-se a hipótese nula Ho se:

(De acordo com a hipótese alternativa)

Cauda inferior Bicaudal Cauda superior

H1: < o H1: o H1: > o

C C1 C2 C

RC RC RC RC

Page 5: Testes de Hipóteses t e qui quadrado

0x < cx 0x < 1cx ou 0x >

2cx 0x > cx

Esta idéia é válida também quando fazemos um teste para a proporção

populacional, que veremos em seguida.

3.4.2 Teste para Proporção

Construção do teste para proporções:

1º Passo: Temos uma população, e temos uma hipótese sobre a proporção p de

indivíduos portadores de uma certa característica. Esta hipótese afirma que essa

proporção é igual a um certo número p0. Então,

H0 : p = p0

O problema fornece informações sobre a alternativa, que pode ter uma das três formas

abaixo:

(iv) H1 : p p0 (teste bicaudal)

(v) H1 : p > p0 (teste monocaudal à direita)

(vi) H1 : p < p0 (teste monocaudal à esquerda)

2º Passo: Como vimos, a estatística p, a proporção da amostra, tem uma

distribuição aproximadamente normal, isto é:

n

pppNp

)1(,~ˆ

3º Passo: Fixado um valor , devemos construir a região crítica para p na suposição de

que os parâmetros definidos H0 sejam verdadeiros.

n

pppNp

)1(,~ˆ 00

0

Page 6: Testes de Hipóteses t e qui quadrado

e, conseqüentemente teremos a região crítica da Figura abaixo (no caso, supondo H1 : p

p0), onde n

ppZp

)1(ˆ 00 .

Fig. 7.1

O 4º e o 5º Passos irão depender da amostra, e o procedimento está descrito no exemplo

seguinte.

Exemplo: Uma estação de televisão afirma que 60% dos televisores estavam

ligados no seu programa especial da última Segunda feira. Uma rede competidora

deseja contestar essa afirmação, e decide, para isso, usar uma amostra de 200 famílias.

Qual deve ser o procedimento adotado para julgar a veracidade da afirmação da

estação? No passo 4 abaixo, daremos o resultado da amostra, pois é importante ficar

claro que o resultado da amostra não deve influenciar a escolha da hipótese alternativa.

1º Passo: Vamos colocar à prova a afirmação da estação, isto é,

H0 : p = 0,60

Sabemos que, se esta hipótese não for verdadeira, espera-se uma proporção menor,

nunca maior. A estação sempre divulgaria o máximo possível. Isto nos leva à hipótese

alternativa

H1 : p < 0,60.

2º Passo: A estatística a ser usada é p, a proporção de 200 famílias que

assistiram ao programa na última Segunda-feira, e da teoria temos

n

pppNp

)1(,~ˆ

Page 7: Testes de Hipóteses t e qui quadrado

3º Passo: Fixaremos = 5%, e sob a suposição de que H0 seja verdadeira, a

distribuição de p será:

200

24,0,6,0~ˆ Np ,

o que irá fornecer a região crítica (de acordo com a Fig. 7.2): RC = {p R | p̂

0,544}.

Fig. 7.2

Pois devemos achar o valor p̂ c, tal que 05,0)p̂p̂(P c

e como p é aproximadamente normal, temos

200/24,0

60,0ˆcp

ZP = 0,05, o que implica

,645,1200/24,0

60,0p̂

o valor 1,645 sendo obtido da normal padronizada N (0,1). Logo, p̂ c = 0,544,

correspondendo a região crítica acima

4º Passo: Admitamos que, do trabalho de campo, entrevistando as 200 famílias

sorteadas aleatoriamente, obtivemos 104 respostas afirmativas. Isto equivale a um valor

observado da proporção de p̂ = 104/200 = 0,52.

5º Passo: Do resultado acima, vemos que 0,52 RC; portanto, somos levados a

rejeitar H0. Isto é, há evidências de que a audiência do programa de Segunda feira não

foi de 60% e sim um percentual inferior a este.

Exercício: Num experimento famoso, o geneticista Gregor Mendel afirmou que em

uma amostra da segunda geração de sementes, resultado de cruzamentos entre ervilhas

amarelas e verdes, gera 1/4 de ervilhas verdes. Neste experimento, ele observou que 140

Page 8: Testes de Hipóteses t e qui quadrado

ervilhas dentre 556 cruzamentos eram verdes. Verifique se a afirmação de Mendel pode

ser rejeitada ao nível de 5% de confiança.

Page 9: Testes de Hipóteses t e qui quadrado

TESTE DE HIPÓTESES COM DUAS AMOSTRAS

TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MEDIAS POPULACIONAIS O procedimento associado com o teste da diferença entre duas medias é similar ao utilizado no teste de um valor hipotético da media populacional, exceto que se utiliza o erro padrão da diferença entre medias como base para se determinar o valor da estatística de teste associada com os resultados das amostras. A hipótese nula (Ho) usualmente testada é a de que as duas amostras

tenham sido obtidas de populações com médias iguais, ou seja, 0021 .

O uso da distribuição normal, nesse caso, esta baseado nas mesmas condições que o caso de uma média (ou uma amostra), exceto que estão envolvidas duas amostras independentes. Na prática dizemos que a

distribuição normal pode ser utilizada nesse teste sempre que (n 1 + n 2 ) ≥

30. O uso da distribuição de Student (t) leva em conta se as variâncias populacionais são equivalentes ou diferentes. Na prática utilizamos a

distribuição t de Student se (n 1 + n 2 ) < 30.

Estudaremos os seguintes casos: A) POPULACÕES NORMAIS COM VARIÂNCIAS CONHECIDAS

Consideremos duas populações normais independentes com médias 1

e 2 e variâncias 2

1 e 2

2 , sendo 1n e 2n duas amostras independentes

obtidas, respectivamente, dessas populações, e 1x e 2x suas médias.

A estatística de teste a ser usada é: Observação: Quando as variâncias populacionais forem desconhecidas,

mas (n 1 + n 2 ) ≥ 30, usamos as suas estimativas não tendenciosas (variâncias

amostrais 2

1s e 2

2s ), no cálculo da estatística de teste tz :

2

2

2

1

2

1

21

nn

xxzt

2

2

2

1

2

1

21

n

s

n

s

xxzt

Page 10: Testes de Hipóteses t e qui quadrado

Na pratica não temos conhecimento sobre a variância, logo partimos para o próximo: B) POPULACÕES NORMAIS COM VARIÂNCIAS EQUIVALENTES E DESCONHECIDAS Quando as variâncias de duas populações Normais forem

desconhecidas, mas iguais e (n 1 + n 2 ) < 30, usamos uma media ponderada das

variâncias amostrais 2

1s e 2

2s , no cálculo da estatística de teste tt :

A distribuição t é utilizada com um número de graus de liberdade igual a

gl = n 221 n

Se observarmos que as variâncias são bem diferentes usamos o próximo procedimento: C) POPULACÕES NORMAIS COM VARIÂNCIAS DESIGUAIS E DESCONHECIDAS Quando as variâncias de duas populações Normais forem

desconhecidas e diferentes sendo que (n 1 + n 2 ) < 30, usamos as variâncias

amostrais 2

1s e 2

2s , no cálculo da estatística de teste tt :

A distribuição t é utilizada com um número de graus de liberdade igual a: Exemplo 1: Em um estudo realizado foi observado o tamanho de samambaias e o tipo de adubo usado. Foram testados dois tipos, o usado freqüentemente

2

1111

21

2

22

2

11

21

21

nn

snsn

nn

xxtt

2

2

2

1

2

1

21

n

s

n

s

xxtt

2

11 2

2

2

2

2

1

2

1

2

1

2

2

2

1

2

1

n

n

s

n

n

s

n

s

n

s

gl

Page 11: Testes de Hipóteses t e qui quadrado

(Controle) e um novo adubo (Novo). Foram usadas 30 plantas e os resultados do crescimento são mostrados a seguir:

Estatísticas Controle Nova

Média 3cm 4cm

Desvio-Padrão 1cm 1,2cm

Verifique se existe diferença entre as duas rações. Resposta: Como os desvios são parecidos consideraremos as variâncias desconhecidas e semelhantes, assim teremos:

01,2

21515

2,11151115

15

1

15

1

43

tt

T_tabelado: t(0,05;n-2)= t(0,05;30-2)=1,701. Como |tt| > t(0,05;28), rejeitamos que as médias são iguais. Exemplo 2: Imagine que, para o mesmo exemplo anterior, o resultado obtido fosse:

Estatísticas Controle Nova

Média 3cm 4cm

Desvio-Padrão 2,2cm 1,2cm

Verifique se existe diferença entre as duas rações.

54,1-

15

2,1

15

2,2

43

22

tt

58gl

T_tabelado= t(0,05;58)= 1,671. Como |tt|< t(0,05;28), não temos evidencia para rejeitar que as médias são iguais. Observe que apesar de estarmos fazendo testes de diferença de médias, a variância é um fator determinante para rejeitar ou não a hipótese nula. TESTE DE HIPOTESES DA DIFERENÇA ENTRE DUAS MEDIAS POPULACIONAIS COM OBSERVACÕES EMPARELHADAS Fazemos testes de comparação de médias para dados emparelhados (amostras pareadas), obtidas de populações Normais, quando os resultados das duas amostras são relacionados dois a dois, de acordo com algum critério que fornece uma influência entre os vários pares e sobre os valores de cada

Page 12: Testes de Hipóteses t e qui quadrado

par. Para cada par definido, o valor da primeira amostra está claramente associado ao respectivo valor da segunda amostra. Para observações emparelhadas, ou amostras pareadas, o teste apropriado para a diferença entre duas médias consiste em determinar primeiro a diferença “d” entre cada par de valores, e então testar a hipótese nula de que a média das diferenças na população é zero. Então, do ponto de vista de cálculo, o teste é aplicado a uma única amostra de valores d. A média e o desvio padrão da amostra de valores “d” são obtidos pelas fórmulas: A estimativa do erro padrão da diferença média entre observações emparelhadas é obtida pela fórmula: Uma vez que o erro padrão da diferença média é calculado com base nas diferenças observadas em amostras emparelhadas (logo σ é desconhecido) e uma vez que os valores de d geralmente podem ser admitidos como tendo distribuição Normal, as distribuições t são apropriadas para testar

a hipótese nula de que 0d . A distribuição t nesse caso terá um número de

graus de liberdade igual a: gl = n-1 A estatística de teste, então, será dada por:

Observe que, se n≥30 podemos utilizamos z t (distribuição normal) no lugar de

tt

Exemplo1: Um experimento com 11 ratos de laboratório foi realizado com objetivo de verificar a eficiência de um novo tipo de sedativo. Para testar esse sedativo os quinze ratos foram submetidos a situações estressantes induzindo a um batimento cardíaco acelerado, logo depois era aplicado o sedativo. Os dados abaixo mostram o número de batidas por minuto antes e depois da aplicação do sedativo. Podemos concluir com 95% de certeza que o sedativo influi na diminuição do número de batimentos por minuto?

Antes 693 686 691 695 695 690 680 790 694 684 678

Depois 690 676 694 683 690 681 684 685 687 676 669

D 3 10 -3 12 5 9 -4 5 7 8 9

n

dd

2

2

dn

dSd

n

Sd

d

d

d

t

od

t

ˆ

Page 13: Testes de Hipóteses t e qui quadrado

42,362,1

54,5tt

t(0,05;n-1)= t(0,05;9)= 1,812 Como |tt|> t(0,05;9), rejeitamos que o número de batimentos cardíacos por minuto é o mesmo após a aplicação do sedativo. Podemos concluir, com 95% de confiança, que houve uma diminuição destes batimentos.

54,511

61d 14,5dS

62,1111

14,5ˆ

d

Page 14: Testes de Hipóteses t e qui quadrado

Teste Qui Quadrado

Definição: Qui Quadrado, simbolizado por X2, é um teste de hipóteses que se destina a encontrar um valor da dispersão para duas variáveis nominais, e avaliar a associação existente entre variáveis qualitativas. É um teste não paramétrico, ou seja, não depende de parâmetros populacionais, como média, proporção ou variância. O princípio básico deste método é comparar proporções, isto é, as possíveis divergências entre as frequências observadas e esperadas para um certo evento. Pode-se dizer que dois grupos se comportam de forma semelhante se as diferenças entre as frequências observadas e as esperadas em cada categoria forem muito pequenas, próximas a zero. Para aplicar o teste as seguintes proposições precisam ser satisfeitas:

Os grupos devem ser independentes,

Os itens de cada grupo são selecionados aleatoriamente,

As observações devem ser frequências ou contagens,

Cada observação pertence a uma e somente uma categoria e A amostra deve ser relativamente grande (pelo menos 5 observações em cada célula e, no caso de poucos grupos, pelo menos 10. Exemplo: em tabelas 2x 2).

Como calcular? Karl Pearson propôs a seguinte fórmula para medir as possíveis

discrepâncias entre proporções observadas e esperadas:

X2= , em que

o = frequência observada para cada classe,

e = frequência esperada para aquela classe. Percebe-se que as frequências observadas são obtidas diretamente dos dados das amostras, enquanto que as frequências esperadas são calculadas a partir destas. É importante notar que o desvio d = (o - e) é a diferença entre a frequência observada e a esperada em uma classe. Quando as frequências observadas são muito próximas às esperadas, o valor de X2é pequeno. Mas, quando as divergências são grandes (o - e) passa a ser também grande e, consequentemente, X2 assume valores altos. Hipóteses a serem testadas

O pesquisador trabalha com duas hipóteses:

Page 15: Testes de Hipóteses t e qui quadrado

Hipótese nula: As frequências observadas não são diferentes das frequências esperadas.

Não existe diferença entre as frequências (contagens) dos grupos, ou seja, não há

associação entre os grupos.

Hipótese alternativa: As frequências observadas são diferentes da frequências esperadas,

portanto existe diferença entre as freqüências, ou seja, há associação entre os grupos.

Procedimento: É necessário obter duas estatísticas denominadas X2calculado

e tabelado. As frequências observadas são obtidas diretamente dos dados

das amostras, enquanto que as frequências esperadas são calculadas a partir destas. A tomada de decisão é feita comparando-se os dois valores de X

2:

Se X2calculado > ou =

tabelado: Rejeita-se Ho.

Se X2calculado <

tabelado: “Aceita-se” Ho.

O nível de significância (α) representa a máxima probabilidade de erro que se tem ao

rejeitar uma hipótese. O número de graus de liberdade, nesse caso é assim calculado:

G.L. = número de classes – 1

Observação: É fácil perceber que quanto maior for o valor do X2mais significante é a

relação entre a variável dependente e a variável independente.

Exemplo 1: Se uma moeda não viciada for jogada 100 vezes, espera-se obter 50 caras e

50 coroas, já que a probabilidade de cair cara (p) é = ½ e a de cair coroa (q) também é =

½. Entretanto, na prática, é muito difícil obter valores observados, idênticos aos

esperados, sendo comum encontrar valores que se desviam dos teóricos.

Supondo que uma moeda foi jogada 100 vezes e se obteve 60 caras e 40 coroas.

a. Qual será o valor de X2?

b. Como se pode interpretar esse valor?

Resolvendo:

As frequências esperadas em cada classe são calculadas por: p.N. Portanto:

E(cara) = ½ .100 e E(coroa) = ½ .100

Assim, os valores esperados são: cara: 50 e coroa: 50 e os observados são: cara: 60 e

coroa: 40.

X2= [(60 – 50)

2 / 50] + [(40 – 50)

2 / 50]

a. Valor de X2= 2 + 2 = 4

b. Como se pode interpretar esse valor?

No exemplo dado, como o valor de Qui Quadrado obtido (4) foi maior que o esperado

ao acaso (3,841), aceita-se a hipótese alternativa e admite-se que a moeda seja viciada.

Usando a tabela:

Page 16: Testes de Hipóteses t e qui quadrado

Observe, que se tivéssemos lançado um dado seriam 6 classes possíveis. Como

faríamos, então?

Deve-se consultar uma tabela de X2e lembrar que, nesse caso:

G.L. = número de classes - 1

A tabela de Qui Quadrado mostra o número de Graus de liberdade nas linhas e o valor

da Probabilidade nas colunas.

Na coluna referente a 5% de probabilidade encontra-se o valor crítico de qui quadrado

( ), com o qual deve ser comparado o valor calculado de X

2.

Exemplo 2: Se um dado não viciado for jogado 6 vezes, espera-se obter 1 vez cada face (1, 2, 3, 4, 5 e 6) já que a probabilidade de cair qualquer face é 1/6. Supondo que um dado foi jogado 186 vezes e se obteve:

Face 1 Face 2 Face 3 Face 4 Face 5 Face 6

34 29 30 32 28 33

a. Qual será o valor de X2 ? b. Como se pode interpretar esse valor? Resolvendo: As frequências esperadas em cada classe são calculadas por: p.N. Portanto:

E(face 1) = E(face 2) = E(face 3) = E(face 4) = E(face 5) = E(face 6) = p.N = 1 / 6 .186 = 31

a. Qual será o valor de X2?

Assim, os valores parciais são somados: e chega-se ao valor de X2:

observado 34 29 30 32 28 33

esperado 31 31 31 31 31 31

X2parcial 0,2903 0,1290 0,0322 0,0322 0,2903 0,1290

X2= ( 0,2903 + 0,1290 + 0,0322 + 0,0322 + 0,2903 + 0,1290) = 0,903

b. Como se pode interpretar esse valor? Lembrando que G.L. = número de classes -1, como há há 6 classes, G.L. = 5.

Verificando-se a tabela de X2 na linha em G.L. = 5 encontra-se igual a

11,070. Como o valor de Qui Quadrado obtido ( 0,903 ) foi menor que o esperado ao acaso ( 11,070) admite-se que o dado seja honesto.

Em tabelas de contingência

Page 17: Testes de Hipóteses t e qui quadrado

Até aqui foram analisadas situações em que havia uma hipótese baseada em alguma teoria, gerando proporções esperadas. Por exemplo, efetuar um experimento semelhante ao de Mendel e verificar se a distribuição de uma certa variável obedece a proporção 3 :1. Entretanto, o teste de X2 pode ser aplicado em casos em que não se dispõe de uma teoria que permita efetuar o cálculo de classes esperadas.

Por exemplo, supondo que se deseja verificar se uma característica se distribui igualmente entre os sexos, ou em classes sociais, ou em diferentes grupos raciais, ou em grupos etários, ou em localizações geográficas ou... Note-se que não existe um modo de calcular os esperados. Nesses casos constrói-se uma tabela de contingência.

Hipóteses a serem testadas:

Hipótese nula, H0: Não há associação entre os grupos, ou seja, as variáveis são

independentes.

Hipótese alternativa, Ha: Há associação entre os grupos, ou seja, as variáveis são

dependentes.

Cálculo dos esperados:

A freqüência esperada em cada classe é calculada pela multiplicação do total de sua coluna, pelo total de sua linha, dividindo-se o produto pelo total geral da tabela (N).

E = total marginal da linha x total marginal da coluna / total (N) O número de graus de liberdade, quando os dados estão em tabela de contingência é

assim calculado:

G.L. = número de linhas - 1 x número de colunas - 1

Procedimento:

É necessário obter duas estatísticas denominadas X2calculado e tabelado.

A tomada de decisão é feita comparando-se os dois valores de X2:

Se X2calculado > ou = tabelado: Rejeita-se Ho.

Exemplo:

Os resultados abaixo provém de um teste sorológico aplicado a indivíduos pertencentes a 3 amostras compostas por indivíduos de provenientes de diferentes faixas etárias (crianças, adolescentes e adultos). Por à prova a hipótese de que a proporção de indivíduos com reação positiva não difere

Page 18: Testes de Hipóteses t e qui quadrado

significativamente nas 3 amostras contra a hipótese de que isso não é verdadeiro.

AMOSTRA Reação + Reação - Total

Crianças 25 45 70

Jovens 15 25 40

Adultos 10 30 40

Total 50 100 150

Para calcular os esperados multiplica-se os totais parciais relativos a cada casela e

divide-se pelo total geral (N).

Por exemplo, na casela crianças + = 50 x 70 / 150 = 23,3333

Depois calcula-se os qui quadrados parciais.

Por exemplo, na casela crianças + = (o-e)2 /e = [(25 - 23,3333)

2 / 23,3333)] = 0,1190.

Depois, calcula-se a parcela de X2referente a cada casela.

Ao final, soma-se as parcelas e obtém-se o X2.

Amostra Reação + Reação - Total

Crianças 25 45 70 Esp 23,3333 46,6667 (o-e)2 /e 0,1190 0,0595 Jovens 15 25 40 Esp 13,3333 26,6667 (o-e)2 /e 0,2083 0,1042 Adultos 10 30 40 Esp 13,3333 26,6667 (o-e)2 /e 0,8333 0,4167 Total 50 100 150

X2= 0,1190 + 0,0595 + 0,2083 + 0,1042 + 0,8333 + 0,4167=1,7410

O número de GL em tabelas é assim calculado:

GL = (número de linhas -1) x (número de colunas -1). Portanto:

GL = (2 - 1) x (3 - 1) = 2

Depois, consulta-se a tabela de Qui quadrado e verifica-se que = 5,991.

Como o valor de obtido é menor que o

conclui-se que os desvios não são

significativos.

Portanto, os indivíduos pertencentes às 3 amostras ( crianças, adolescentes e adultos )

reagem do mesmo modo ao teste sorológico, não havendo influência das diferentes

faixas etárias sobre o resultado do teste. Assim sendo, o resultado sorológico

independe dos grupos etários.