Testes de Hipóteses

Embed Size (px)

Citation preview

Introduo aos testes estatsticos de hiptesesProf. Mrcio Souza

Testes estatsticos

Introduo

IntroduoO processo de estimao generaliza resultados de amostras para diferentes universos. Um intervalo de confiana costuma ser construdo, apresentando a distribuio dos possveis parmetros do universo. Uma evoluo do uso da estimao apresentada por meio dos testes de hipteses, que buscam confrontar alegaes sobre o todo com resultados obtidos de amostras. Por sua vez, os testes de hipteses podem ser:

Introduo* Paramtricos (calcula as diferenas numricas exatas entre os resultados); assumem premissas sobre a distribuio de parmetros da populao; * No paramtricos (apenas consideram se certos resultados so superiores ou inferiores a outros resultados); utilizados quando no se pode supor ou assumir caractersticas sobre parmetros da populao de onde a amostra foi extrada.

IntroduoAssim como duas peas de um quebra-cabea, ainda que se encaixem, podem no formar uma figura, a diferena entre valores em teste, ainda que exista matematicamente, pode no ser estatisticamente significativa.

Testes estatsticos

Aplicaes

AplicaesExemplo 1: Um pesquisador gostaria de testar a alegao da mdia populacional das alturas de um grupo de alunos ser 1,70 m. Exemplo 2: Um fabricante de lmpadas alega que seus produtos duram, em mdia e no mnimo, 400 horas. Exemplo 3: Um pesquisador deseja saber se a renda mdia diria dos trabalhadores de uma certa cidade superior a R$ 100,00.

Testes estatsticos

Escolhas

A escolha dos testesDiante da grande quantidade de testes e tcnicas estatsticos natural um certo grau de desorientao inicial. Entretanto, para se poder realizar as escolhas adequadas, importante considerar alguns parmetros bsicos dos dados a serem analisados, tais como:

A escolha dos testes

1 2 3 4 5

Nmero de amostras; Relaes entre Amostras; Escala numrica; Distribuio; Dependncia entre variveis;

A escolha dos testesApesar de ser assunto das prximas aulas, vale a pena citar alguns testes estatsticos utilizados em trabalhos cientficos dos mais variados segmentos de estudo.

A escolha dos testesComparao entre duas amostras:Normal No PareadasOrdinal, intervalar ou razo

Teste t de Student Teste Mann-Whitney U, WaldWolfowitz Runs Test, Kolmogorov-Smirnov TwoSample Test Teste de Qui-Quadrado (Homogeneidade)

No normalNominal

A escolha dos testesComparao entre duas amostras:Normal PareadasOrdinal, intervalar ou razo

Teste t de Student Pareado Teste de Friedman, SignTest, Wilcoxon Matched-Pairs Test Teste de McNemar

No normalDicotmica

A escolha dos testesComparao entre trsNormal No PareadasOrdinal, intervalar ou razo

ou mais amostras:ANOVA c/ Grupos Independentes ANOVA de Kruskal-Wallis

No normalNominal

Teste de Qui-Quadrado (Homogeneidade)

A escolha dos testesComparao entre trsNormal PareadasOrdinal, intervalar ou razo

ou mais amostras:ANOVA c/ Medidas Repetidas ANOVA de Friedman Teste Q de Cochran

No normalNominal

A escolha dos testesEntretanto, algumas situaes de testes so mais frequentes do que outras. Por isso, estudaremos (a ttulo de introduo aos testes de hipteses) como testar hipteses sobre mdias de populaes...

Testes estatsticos

Procedimentos

Os procedimentosEstudaremos os procedimentos de um teste estatstico de hipteses utilizando o exemplo: Em uma certa cidade, a renda diria dos trabalhadores segue uma distribuio normal com mdia de R$ 100,00 e desvio padro de R$ 25,00. A partir de uma amostra de 10 trabalhadores, verificamos uma renda mdia diria de R$ 120,00. Podemos rejeitar a hiptese de que a renda mdia diria desses trabalhadores seja igual a R$ 100,00??

Os procedimentos

1

Formulao da hiptese nula (H0) e da hiptese alternativa (H1);

H0: tambm denominada hiptese nula. Alega igualdadede um determinado parmetro;Ex.: = R$ 100,00 vs

H1: tambm denominada hiptese altenativa. Alegadesigualdade de um determinado parmetro;Ex.: > R$ 100,00

Os procedimentos

2

Deve-se escolher a amostral adequada;

distribuio

As regras aplicveis para a escolha da distribuio e os procedimentos empregados so similares aos utilizados na estimao de intervalos de confiana e apresentados a seguir:

Os procedimentos2Deve-se escolher a distribuio amostral adequada;

Baseado em nosso estudo de caso... SIM O valor de n maior que 30? NO

SIM

O valor de conhecido?

NO

SIM

A populao aprox. Normal?

NO

SIMUse s para estimar

O valor de conhecido?

NO

Use s para estimar

xz

n

xz

s n

xz

n

xt

s n

Aumente o tamanho da amostra para n 30.

T.C.L.

Os procedimentos2Deve-se escolher a distribuio amostral adequada;

* Teorema Central do Limite (T.C.L.)" Se tomarmos grandes amostras (n > 30) de uma populao, as mdias amostrais tero distribuio normal mesmo que os dados originais no tenham distribuio normal".

Os procedimentos2Deve-se escolher a distribuio amostral adequada;

*

Teorema Central do Limite (T.C.L.)

Os procedimentos

3

Estabelecer o nvel de significncia e nvel de confiana; O nvel de confiana (geralmente 95%) expressa a probabilidade de acerto da concluso; O nvel de significncia () expressa um dos erros possveis de serem cometidos na concluso; geralmente assume-se 5% ( = 0,05);P.S.: Estudaremos, MAIS A DIANTE, os erros inerentes aos testes estatsticos de hipteses...

Os procedimentos

3

Estabelecer o nvel de significncia e nvel de confiana;

Baseado em nosso estudo de caso...

Monocaudal para direita

Os procedimentos

3

Estabelecer o nvel de significncia e nvel de confiana;

Monocaudal para esquerda

Os procedimentos

3

Estabelecer o nvel de significncia e nvel de confiana;

Bicaudal

Os procedimentos

4

Calcular a estatstica teste; a) Se o desvio padro populacional for conhecido ou o tamanho da amostra for igual ou maior que 30: b) Se o desvio padro populacional for desconhecido e o tamanho da amostra for menor que 30:

Baseado em nosso estudo de caso...

x 0 x 0 zt = z = ou t s n n

tt =

x 0 s n

Os procedimentos

5

Confrontar a estatstica teste com os valores de aceitao/rejeio;

Zcalc

Ztab

Os procedimentos5Confrontar a estatstica teste com os valores de aceitao/rejeio;

Essa comparao pode ser realizada de 3 (trs) formas diferentes, que, contudo, nos levam a tomar a mesma deciso:a) Anlise grfica; b) Anlise do intervalo de confiana; c) Anlise do p-value;

Os procedimentos5Confrontar a estatstica teste com os valores de aceitao/rejeio;

Para o exemplo em questo, temos:Zcalc :

x 0 00 00 0 0 zt = = =00 ,0 0 0 n 0 0

Ztab :

1,64

( = 0,05)

Os procedimentos

Distribuio Normal Padro

0.04

Teste monocaudal a direitaZtab = 1,64; = 0,05

Teste bicaudalZtab = 1,96; /2 = 0,025

1.6

0.9495

Os procedimentos5Confrontar a estatstica teste com os valores de aceitao/rejeio;

H0

a) Anlise grfica:

Zcalc=2,53

Os procedimentos5Confrontar a estatstica teste com os valores de aceitao/rejeio;

b) Anlise do intervalo de confiana:

x zt 0 x + zt n n

Os procedimentos5Confrontar a estatstica teste com os valores de aceitao/rejeio;

H0

b) Anlise do intervalo de confiana:Assumindo um nvel de confiana igual a 95% e usando a frmula de estimao da mdia, temos:

...0

0 0 0 0 00 0 0 0 ,0 0 00 0 0 0 + ,0 0 0 0 0

107

0

133

...

= 100

Os procedimentos5Confrontar a estatstica teste com os valores de aceitao/rejeio;

H0

c) Anlise do p-value:Pela tabela Z, a rea direita de 2,53 (Zcalc) vale 0,0057; logo p = 0,0057. Portanto, existe uma chance de 0,6% (aprox.) de que seja obtida uma mdia maior do que 125 ao acaso, quando so retiradas amostras aleatrias de tamanho 10 desta populao. Comprovamos que p

< 0,05 ().

Os procedimentos

0,5 - 0,4943 = 0,0057

Os procedimentosConcluso para o estudo de caso em questo: Como o valor de Zcalc (2,53) maior que o valor de Ztab (1,64), rejeitamos a Hiptese Nula (H0) de que a renda mdia diria dos trabalhadores (populacional) seja igual a R$ 100,00. De fato, podemos tomar essa deciso baseados em um grau de confiana de 95% ( =0,05).

Testes estatsticos

Erros

Tipos de erros

(PODER DO TESTE)

Tipos de erros

* Um caso de justia:H0: A pessoa inocente; H1: A pessoa culpada; Erro I (): A pessoa condenada mas inocente; Erro II ( ): A pessoa absolvida mas culpada;

Testes estatsticos

Poder

Poder de um teste estatsticoO poder de um teste, denotado por 1 , representa a probabilidade de rejeitarmos a Hiptese Nula (H0) quando a mesma , de fato, falsa.Fatores que influenciam o poder de um teste: B = Beta (quanto menor, maior o poder) E = Efeito da distncia (quanto maior, maior o poder) A = Alpha (quanto menor, menor o poder) N = n (quanto maior a amostra, maior o poder) S = s (quanto maior o desvio padro, menor o poder)

Testes estatsticos

Exerccios

Exerccio 1A temperatura mdia da gua na sada de um tubo de descarga de uma torre de resfriamento de uma planta de energia no deve ser superior a 100F. Experincia passada indica que o desvio-padro da temperatura 2F. A temperatura da gua medida durante nove dias escolhidos aleatoriamente, sendo a temperatura mdia encontrada igual a 98F. H evidncia de que a temperatura da gua seja aceitvel, com alfa=0,05?

Exerccio 2Um fabricante de clipes afirma que suas caixas possuem em mdia 100 g (no mnimo) com um desvio padro de 5 g. Uma amostra com 60 caixas de clipes apontou uma mdia de 95 g. Com um nvel de significncia igual a 3%, o que pode ser dito?

Exerccio 3Uma amostra aleatria de 100 mortes naturais, no Rio Grande do Sul, deu uma mdia de 71,8 anos, com desvio padro de 8,9 anos. Isso indica que o tempo mdio de vida no RS, atualmente, maior eu 70 anos? (assuma alfa = 5%)

Exerccio 4Uma amostra aleatria de 36 copos de suco de cebola mostrou um contedo mdio do lquido de 200 ml, com desvio padro de 26 ml. Teste a hiptese de que = 225 ml contra a hiptese alternativa < 225 ml, assumindo um nvel de confiana de 95%. Refaa o teste a um NC de 99%.

FimNo mais, estudaremos - a seu tempo - os testes estatsticos cabveis a cada situao de nosso contexto de estudo...

Muito obrigado!!

ContatosProf. Mrcio SouzaMestre em Engenharia Biomedica (COPPE/UFRJ)

www.profmsouza.blogspot.com [email protected]