17
ESTATÍSTICA INFERENCIAL OU INDUTIVA PSICOLOGIA TESTES DE HIPÓTESES

e Statistic A

Embed Size (px)

Citation preview

Page 1: e Statistic A

ESTATÍSTICA INFERENCIAL OU INDUTIVAPSICOLOGIA

TESTES DE HIPÓTESES

Page 2: e Statistic A

TESTES DE HIPÓTESES

INTRODUÇÃO

Um dos principais assuntos da Estatística moderna é a inferência estatística. Como foi dito nas seções anteriores, a inferência estatística é dividida em dois grandes tópicos:

ESTIMAÇÃO DE PARÂMETROS TESTES DE HIPPOTESES

No caso das inferências através do Intervalo de Confiança, busca-se “cercar” o parâmetro populacional desconhecido, ou seja, obter uma estimativa do parâmetro populacional.

Em Testes de Hipóteses queremos testar uma alegação sobre o parâmetro populacional. Por exemplo, suponha que lhe foi pedido para testar uma alegação de que a proporção de brasileiros que tomam remédios sem receita médica é de 40%. Para testar a alegação você extrai uma amostra aleatória de n = 2500 pessoas e determina que 1200 delas tomam remédio sem receita médica. Neste caso, temos uma proporção amostral de

Será que esta estatística amostral é diferente o bastante da alegação (p = 40%) para decidir que essa alegação é falsa?

Esta pergunta pode ser respondida realizando um teste de hipótese, onde a hipótese questionada será a de que a proporção de indivíduos que tomam medicamentos sem receita é de 48%.

Um teste de hipótese é um procedimento que usa a estatística amostral para testar uma alegação sobre um parâmetro populacional. Em vez de obter uma estimativa do parâmetro populacional, aprenderemos a testar uma alegação sobre um parâmetro.

Outros exemplos, com base em resultados amostrais, podemos querer inferir

se determinada vacina é eficiente na cura de determinada doença, As pessoas com problemas de consumo de substancias possuem um nível médio de neuroticismo igual

ao das restantes pessoas da população. se um processo educacional é melhor do que outro, A altura média da população brasileira é 1,65 m. O desvio padrão populacional dos salários vale R$ 500,00. A proporção de paulistas com a doença X é de 40 %.

Estes são exemplos de hipóteses científicas, pois qualquer pessoa que duvide, ou queira comprová-la, poderá montar um experimento e averiguar sua veracidade.

ESTABELECENDO UMA HIPÓTESE Uma alegação sobre um parâmetro populacional é chamada de HIPÓTESE ESTATÍSTICA. Para testar uma hipótese estatística, devemos estabelecer cuidadosamente um par de hipóteses, onde:

uma representa a própria alegação, a outra representa a alegação contrária à alegação sobre o parâmetro populacional.

Assim, como uma é contrária a outra, se uma é verdadeira a outra é falsa.

DEFINIÇÃO 1 - Estas alegações são definidas da seguinte forma:

HIPÓTESE NULA

ESTATÍSTICA INFERENCIAL - PSICOLOGIA Página 2

Page 3: e Statistic A

É a própria alegação, ou seja, é a hipótese a ser testada. É uma hipótese estatística que contém uma afirmativa, tal como .

HIPÓTESE ALTERNATIVA É a alegação contrária à hipótese nula. É uma afirmativa que deve ser verdadeira se for falsa e contém afirmativas contrárias às afirmativas da hipótese nula, ou seja,

se em aparecer o sinal ,então, em deve ter o símbolo >. se em aparecer o sinal ,então, em deve ter o símbolo <. se em aparecer o sinal = ,então, em deve ter o símbolo .

Para escrever a hipótese nula, transforme a formulação verbal da alegação sobre o parâmetro populacional em uma formulação matemática. Em seguida formule a alegação contrária, ou seja, a hipótese nula.

EXEMPLO – Considere a alegação de que a proporção de brasileiros que tomam remédios sem receita médica é igual a 40%.

: p = 40% (alegação) : p 40% (alegação contrária)

EXEMPLO – Considere a alegação de que a proporção de brasileiros que tomam remédios sem receita médica é no máximo (menor ou igual) 40%.

: p 40% (alegação) : p > 40% (alegação contrária)

EXEMPLO – Considere a alegação de que a proporção de brasileiros que tomam remédios sem receita médica é no mínimo (maior ou igual) 40%.

: p 40% (alegação)

: p < 40% (alegação contrária)

METODOLOGIA DO TESTE DE HIPÓTESES

Formulada uma determinada hipótese particular é necessário coletar dados amostrais, e com base nestes dados decidir

REJEITAR a hipótese nula, ou ACEITAR a hipótese nula.

Ou seja, a hipótese nula é formulada com o simples propósito de ser ACEITA ou REJEITADA. O foco é todo em cima da hipótese nula.

Mas ao ACEITAR ou REJEITAR a hipótese nula podemos cometer um erro. Como todo o processo se baseia em informações proporcionadas apenas por uma parte da população (amostra), existe uma margem de erro ao inferirmos uma informação para a população. Neste caso podemos correr o risco de tomar uma decisão errada, isto é

Podemos ACEITAR a hipótese nula quando na verdade deveríamos ACEITAR, Ou podemos REJEITAR a hipótese nula quando deveríamos ACEITAR.

Essas possibilidades de erro são chamadas ERRO TIPO I ou ERRO TIPO II:

ERRO TIPO I - REJEITAR a Hipótese Nula quando ela é efetivamente VERDADEIRA. ERRO TIPO II - ACEITAR a Hipótese Nula quando é efetivamente FALSA.

ESTATÍSTICA INFERENCIAL - PSICOLOGIA Página 3

Page 4: e Statistic A

A situação acima fica melhor descrita na tabela abaixo

REALIDADE

DECIÇÃO

VERDADEIRA FALSA

ACEITADecisão Correta

(1 - )Erro tipo II

(1- )

REJEITA Erro Tipo I

( )Decisão Correta

( )

PROBABILIDADE DE COMETER O ERRO TIPO I - A probabilidade de REJEITAR a hipótese nula quando ela é VERDADEIRA é (alfa).

PROBABILIDADE DE COMETER O ERRO TIPO II - A probabilidade de ACEITAR a hipótese nula quando ela é FALSA é (beta).

Observe que o ERRO TIPO I só poderá ser cometido se REJEITARMOS , e o ERRO TOPO II se ACEITARMOS . Em geral, preocupa-nos mais a possibilidade de REJEITAR quando este seja VERDADEIRO, de modo que teremos mais cuidado com o ERRO TIPO I.

O ERRO TIPO I ou NÍVEL DE SIGNIFICÂNCIA (α) é controlado pelo pesquisador. O ERRO TIPO II é geralmente esquecido. Por isso, vamos sempre preferir uma REJEIÇÃO do que uma ACEITAÇÃO. No caso de uma REJEIÇÃO, ou tomamos a decisão CORRETA ou cometemos o erro com probabilidade (α).

Não REJEITAR a hipótese nula significa apenas que não se encontrou evidência estatística contra a mesma, o que de modo algum significa aceitar a sua veracidade. A veracidade ou falsidade de uma hipótese estatística nunca é conhecida com certeza, a menos que, se examine toda a população, o que é impraticável na maior parte das situações. O tomador de decisão deseja, obviamente, reduzir ao mínimo as probabilidades dos dois tipos de erros. Infelizmente, esta é uma tarefa difícil, porque, para uma amostra de determinado tamanho, a probabilidade de se incorrer em um erro tipo II aumenta à medida que diminui a probabilidade do erro tipo I e vice-versa. A redução simultânea dos erros poderá ser alcançada pelo aumento do tamanho da amostra.

NÍVEL DE SIGIFICÂNCIA

É definido pelo pesquisador. O nível de confiança significa a probabilidade de cometermos um erro de REJEITAR a hipótese nula quando ela é verdadeira, isto é, é a probabilidade máxima permitida de ocorrer um ERRO TIPO I, ou seja, probabilidade α.

Estabelecendo o nível de significância em um valor pequeno, estamos desejando que a probabilidade de rejeitar uma hipótese nula verdadeira também seja pequena. Os níveis de significância (α) mais utilizados são 1%, 5% e 10%. Ou seja, normalmente, planejamos um teste de maneira que o risco de cometer um ERRO TIPO I seja inferior a 1% ou 5% (ou seja, tem-se 99 % ou 95 % de não cometer erros, respectivamente).

ESTATÍSTICA TESTE

É uma distribuição teórica que descreve o comportamento de uma determinada estatística ou estimador.

Após estabelecer a hipótese nula e alternativa e especificar o nível de significância, a próxima etapa em um teste de hipótese é definir a estatística teste. A estatística teste é a estatística calculada a partir da amostra e usada para tomar a decisão sobre a população.

As principais estatísticas utilizadas nos testes de hipóteses possuem modelos conhecidos. Têm-se:

A distribuição normal padrão Z.

ESTATÍSTICA INFERENCIAL - PSICOLOGIA Página 4

Page 5: e Statistic A

A distribuição t de Student. A distribuição (qui-quadrado). A distribuição F de Snedkor.

TESTE DE HIPÓTESE PARA A MÉDIA (AMOSTRAS PEQUENAS)

Escolhido o nível de significância, podemos calcular a estatística t para uma média, para pequenas amostras (n 30)

desconhecido e teste t de Student

onde:

= média amostral. μ = valor da hipótese nula s = desvio padrão n = tamanho da amostra

DEFINIR A REGIÃO DE REJEIÇÃO (RR)

Região da curva de distribuição normal, onde os valores da estatística do teste levam à REJEIÇÃO (RR) da hipótese nula ou a ACEITAÇÃO (RA). A sua área é igual ao nível de significância, e sua direção é a mesma da

hipótese alternativa .

A natureza de um teste de hipótese depende do fato de o teste ser

monocaudal esquerdo monocaudal direito ou então bicaudal.

1- Se a hipótese alternativa contém uma afirmativa tal como , o teste é monocaudal esquerdo.

Temos uma região de rejeição

Se , não se pode REJEITAR . Se , REJEITA-SE .

2- Se a hipótese alternativa contém uma afirmativa tal como , o teste é monocaudal direito.

ESTATÍSTICA INFERENCIAL - PSICOLOGIA Página 5

ns

xt calculado

Page 6: e Statistic A

Temos uma região de rejeição

Se , não se pode REJEITAR . Se , REJEITA-SE .

3- Se a hipótese alternativa contém uma afirmativa tal como , o teste é bicaudal.

Temos duas regiões de rejeição

Se , não se pode REJEITAR .

Se ou , REJEITA-SE .

CONCLUSÃO: Se o valor de t calculado está DENTRO da região de aceitação RA, não se pode REJEITAR a

hipótese nula . Se o valor de t calculado está FORA da região de aceitação RA, REJEITA-SE a hipótese nula .

A seguir, são propostos 5 passos para a resolução de um teste de hipóteses:

PASSO 1: Estabeleça a Hipótese Nula e a Hipótese Alternativa . PASSO 2: Identifique a estatística teste e calcule o valor da variável teste. PASSO 3: Selecione um nível de significância , isto é, fixar um limite do erro e identifique o grau

de liberdade. Identifique na tabela da estatística teste, o valor de t. PASSO 4: Com o auxílio das tabelas estatísticas, valor da estatística teste com nível de

significância , determinar as regiões REJEIÇÃO (RR) e a região de ACEITAÇÃO (RA) para . PASSO 5: Concluir pela REJEIÇÃO OU NÃO de pela comparação do valor obtido no 4º passo.

EXEMPLO 1 - Os dois registros dos últimos anos de um colégio atestam para os calouros admitidos uma nota média 115. Para testar a hipótese de que a média de uma nova turma é a mesma tirou-se ao acaso uma amostra de 20 notas, obtendo-se média 118 e desvio padrão amostral 20. Admitir = 5 % = 0,05, para efetuar o teste.

ESTATÍSTICA INFERENCIAL - PSICOLOGIA Página 6

Page 7: e Statistic A

- SOLUÇÃO-

Dados do problema:

= 118 , n = 20 , μ = 115, s = 20 e = 5 % = 0,05

PASSO 1 - Estabelecer a Hipótese Nula e a Hipótese Alternativa

: μ = 115

: 115

PASSO 2 - Estatística teste

= = 0,67

PASSO 3 - Selecionar um nível de significância e o grau de liberdade. Depois, identificar o valor de t tabelado.

= 5 % = 0,05

graus de liberdade = n – 1 = 20 – 1 = 19

Como : 115, temos um teste bicaudal. O valor de t tabelado com nível de significância = 5 % = 0,05 e

19 graus de liberdade é:

= 2,093

PASSO 4 - Neste caso, temos duas regiões de rejeição que correspondem às duas caldas da curva normal.

PASSO 5 – Como 0,67 está FORA da região de REJEIÇÃO, NÃO SE PODE REJEITAR . Não há razões para

acreditar que média de uma nova turma seja diferente de 115.

EXEMPLO 2 - O IBGE afirma que a média de altura da população brasileira é maior ou igual a 170 cm (μ 170 cm). Mas outro instituto de pesquisas estatísticas desconfia que a média de altura NÃO seja maior. Com uma amostra de 30 indivíduos observou-se que a média da população brasileira foi de 163 cm, com desvio padrão de 8 cm. Teste a alegação do IBGE ao nível de 1% de confiança.

- SOLUÇÃO-

ESTATÍSTICA INFERENCIAL - PSICOLOGIA Página 7

Page 8: e Statistic A

Dados do problema:

= 163 , n = 30 , μ = 170, s = 8 e = 1 % = 0,01

PASSO 1 - Estabelecer a Hipótese Nula e a Hipótese Alternativa

: μ 170 cm

: 170 cm

PASSO 2 - Estatística teste

=

PASSO 3 - Selecionar um nível de significância e o grau de liberdade. Depois, identificar o valor de t tabelado.

= 1 % = 0,01

graus de liberdade = n – 1 = 30 – 1 = 29

Como : 170 cm, temos um teste monocaudal à esquerda. O valor de t tabelado com nível de

significância = 1 % = 0,01 e 29 graus de liberdade é:

= - 2,462

PASSO 4 - Neste caso, temos uma região de rejeição que corresponde à cauda esquerda da curva normal.

- 4,8 < - 2,462

PASSO 5 – Como - 4,8 está DENTRO da região de REJEIÇÃO, REJEITA-SE . Há indícios para acreditar que

média de altura do brasileiro NÃO é maior que 170 cm, como diz a alegação do IBGE.

EXERCÍCIOS

1-Para cada um dos casos seguintes verifique se é adequado um teste monocaudal ou um teste bicaudal, e trace uma curva normal para ilustrar cada teste. Identifique a área na(s) cauda(s).OBS:. Não é para fazer nenhum cálculo, apenas fazer as identificações pedidas.

(A) : μ = 10 (B) : μ 0,037 (C) : μ 3,2 : 10 : 0,037 : μ < 3,2 = 2 % = 5 % = 2,5%

ESTATÍSTICA INFERENCIAL - PSICOLOGIA Página 8

Page 9: e Statistic A

n = 17 n = 26 n = 21

2 - Explique os erros tipo I e II que podem ocorrer quando um gerente de recursos de humanos de uma empresa decide contratar, ou não, determinado candidato.

3 - Uma agência de empregos alega que candidatos por ela colocados nos últimos seis meses têm salários de R$ 9.000,00 anuais, em média. Uma agência governamental extraiu uma amostra aleatória daquele grupo, encontrando um salário médio de R$ 8.000,00 anuais, com desvio padrão de R$ 1.000,00 com base em 30 empregados.

a- Teste a afirmação da agência de empregos, contra a alternativa de que o salário médio é diferente de R$ 9.000,00, ao nível de significância de = 5 %.

b- Teste a mesma afirmação da agência, contra a alternativa de que o salário médio é inferior a R$ 9.000,00, ao nível de significância de = 5 %.

4 – Um estudante do último semestre de Psicologia, escrevendo sua monografia, desconfia que o tempo médio de reação a determinado estímulo em pessoas com neuroticismo (pessoas com instabilidade emocional, raiva, depressão, etc) era diferente de 14 segundos, como afirmava umas das literaturas utilizadas na sua monografia. Para escrever sua teoria, fez uma pesquisa de campo com 25 indivíduos, que revelou um tempo médio de 18 segundos, com desvio padrão de 2 segundos no tempo de reação.

a- O que o estudante irá escrever na conclusão de sua monografia.Teste a alegação da literatura ao nível de significância de = 2,5 %?

b- E se o estudante realizar o teste a um nível de significância de 5%?

5 - Uma companhia de seguros iniciará uma campanha extensa de propaganda para vender apólices de seguro de vida, se verificar que a quantia média segurada por família é inferior a R$ 10.000,00. Tomou-se uma amostra aleatória de 61 famílias, que acusaram um seguro médio de R$ 9.600,00, com desvio padrão de R$ 1.000,00.

a- Com base na evidência amostral, a alegação deve ser aceita ou rejeitada, ao nível de = 5% ?

b- A conclusão a que se chegou, utilizando a evidência amostral, pode estar errada? Qual seria o tipo de erro? Por quê?

6- Um laboratório introduziu no mercado um novo comprimido contra dor de cabeça, retirando de circulação o antigo, com a justificativa de que o efeito do novo produto é mais rápido. O fabricante diz que o remédio que está no mercado tem um tempo médio de 37 minutos para início do efeito. Em uma amostra de 30 pessoas que tomaram o novo comprimido, obteve-se um tempo médio de 36 minutos com desvio-padrão de 4 minutos. Teste ao nível de significância de 5% a alegação do fabricante. (Usar um teste unilateral à esquerda).

7- Em uma pesquisa sobre ansiedade, 16 pacientes ansiosos sorteados ao acaso e que receberam uma nova droga foram submetidos a um teste de ansiedade após o uso da droga. A média no teste foi de 15 pontos com desvio-padrão de 4,3 pontos. Sabendo-se que o escore médio nesse teste para ansiosos é de 12 pontos, estabelecer a hipótese adequada, testá-la ao nível de significância de 5%. (Usar um teste unilateral à direita).

8 - Quando prevemos que a condição A e maior que a condição B fazemos:

(a) Um teste unicaudal(b) Um teste bicaudal(e) Uma teste unidirecional(d) Alternativas (a) e (c)

9 - Para cada um dos itens abaixo, descrever qual das abordagens (unilateral ou bilateral) é a mais apropriada.a) H0: a proporção de homens fumantes é igual à proporção de mulheres fumantes, na população

H1: a proporção de homens fumantes é diferente da proporção de mulheres fumantes, na população

ESTATÍSTICA INFERENCIAL - PSICOLOGIA Página 9

Page 10: e Statistic A

b) H0: em média, as vendas não aumentam com a propagandaH1: em média, as vendas aumentam com a propaganda

c) H0: em média, os dois métodos de ensino produzem os mesmos resultadosH1: em média, os dois métodos de ensino produzem resultados diferentes

TABELA I – TABELA DA DISTRIBUIÇÃO t DE ESTUDENT

Nível de confiança 0,80 0,90 0,95 0,98 0,99 0,995 0,998 0,999 Monocaudal α 0,10 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005

GL Bicaudal α 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001 1 3,078 6,314 12,706 31,820 63,657 127,321 318,309 636,619 2 1,886 2,920 4,303 6,965 9,925 14,089 22,327 31,599 3 1,638 2,353 3,182 4,541 5,841 7,453 10,215 12,924 4 1,533 2,132 2,776 3,747 4,604 5,598 7,173 8,610 5 1,476 2,015 2,571 3,365 4,032 4,773 5,893 6,869 6 1,440 1,943 2,447 3,143 3,707 4,317 5,208 5,959

ESTATÍSTICA INFERENCIAL - PSICOLOGIA Página 10

Page 11: e Statistic A

7 1,415 1,895 2,365 2,998 3,499 4,029 4,785 5,408 8 1,397 1,860 2,306 2,897 3,355 3,833 4,501 5,041 9 1,383 1,833 2,262 2,821 3,250 3,690 4,297 4,781 10 1,372 1,812 2,228 2,764 3,169 3,581 4,144 4,587 11 1,363 1,796 2,201 2,718 3,106 3,497 4,025 4,437 12 1,356 1,782 2,179 2,681 3,055 3,428 3,930 4,318 13 1,350 1,771 2,160 2,650 3,012 3,372 3,852 4,221 14 1,345 1,761 2,145 2,625 2,977 3,326 3,787 4,140 15 1,341 1,753 2,131 2,602 2,947 3,286 3,733 4,073 16 1,337 1,746 2,120 2,584 2,921 3,252 3,686 4,015 17 1,333 1,740 2,110 2,567 2,898 3,222 3,646 3,965 18 1,330 1,734 2,101 2,552 2,878 3,197 3,610 3,922 19 1,328 1,729 2,093 2,539 2,861 3,174 3,579 3,883 20 1,325 1,725 2,086 2,528 2,845 3,153 3,552 3,850 21 1,323 1,721 2,080 2,518 2,831 3,135 3,527 3,819 22 1,321 1,717 2,074 2,508 2,819 3,119 3,505 3,792 23 1,319 1,714 2,069 2,500 2,807 3,104 3,485 3,768 24 1,318 1,711 2,064 2,492 2,797 3,090 3,467 3,745 25 1,316 1,708 2,060 2,485 2,787 3,078 3,450 3,725 26 1,315 1,706 2,056 2,479 2,779 3,067 3,435 3,707 27 1,314 1,703 2,052 2,473 2,771 3,057 3,421 3,690 28 1,313 1,701 2,048 2,467 2,763 3,047 3,408 3,674 29 1,311 1,699 2,045 2,462 2,756 3,038 3,396 3,659 30 1,310 1,697 2,042 2,457 2,750 3,030 3,385 3,646 31 1,309 1,695 2,040 2,453 2,744 3,022 3,375 3,633 32 1,309 1,694 2,037 2,449 2,738 3,015 3,365 3,622 33 1,308 1,692 2,035 2,445 2,733 3,008 3,356 3,611 34 1,307 1,691 2,032 2,441 2,728 3,002 3,348 3,601 35 1,306 1,690 2,030 2,438 2,724 2,996 3,340 3,591 36 1,306 1,688 2,028 2,434 2,719 2,991 3,333 3,582 37 1,305 1,687 2,026 2,431 2,715 2,985 3,326 3,574 38 1,304 1,686 2,024 2,429 2,712 2,980 3,319 3,566 39 1,304 1,685 2,023 2,426 2,708 2,976 3,313 3,558 40 1,303 1,684 2,021 2,423 2,704 2,971 3,307 3,551 42 1,302 1,682 2,018 2,418 2,698 2,963 3,296 3,538 44 1,301 1,680 2,015 2,414 2,692 2,956 3,286 3,526 46 1,300 1,679 2,013 2,410 2,687 2,949 3,277 3,515 48 1,299 1,677 2,011 2,407 2,682 2,943 3,269 3,505 50 1,299 1,676 2,009 2,403 2,678 2,937 3,261 3,496 60 1,296 1,671 2,000 2,390 2,660 2,915 3,232 3,460 70 1,294 1,667 1,994 2,381 2,648 2,899 3,211 3,435 80 1,292 1,664 1,990 2,374 2,639 2,887 3,195 3,416 90 1,291 1,662 1,987 2,369 2,632 2,878 3,183 3,402 100 1,290 1,660 1,984 2,364 2,626 2,871 3,174 3,391 120 1,289 1,658 1,980 2,358 2,617 2,860 3,160 3,373 150 1,287 1,655 1,976 2,351 2,609 2,849 3,145 3,357 200 1,286 1,652 1,972 2,345 2,601 2,839 3,131 3,340 300 1,284 1,650 1,968 2,339 2,592 2,828 3,118 3,323 500 1,283 1,648 1,965 2,334 2,586 2,820 3,107 3,310

1,282 1,645 1,960 2,326 2,576 2,807 3,090 3,291

ESTATÍSTICA INFERENCIAL - PSICOLOGIA Página 11