Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Prof. Neli Ortega
Métodos Métodos Quantitativos Quantitativos
em Medicinaem Medicina
Prof. Neli Ortega
Teste de Hipótese
Estatística t-Student
Aula 7
Prof. Neli Ortega
Teste de Hipóteses - Estatística do testeA estatística do teste de hipótese depende da distribuição da variável na população e das informações disponíveis.
SimDist. Normal
(População)Não
“Amostra Grande”
Sim Não
Teste z Teste t
Sim Não
Testes não paramétricos
σconhecido?
Prof. Neli Ortega
Inferência quando σ é desconhecido
Na grande maioria das situações reais σ é desconhecido.
Neste caso, podemos substituir σ pelo desvio padrão amostral, S.
Estaremos introduzindo mais um erro no processo de inferência, o erro de estimação de σ.
• Este novo intervalo será mais largo do que o considerado com a estatística z;
• Surge uma nova distribuição.
Prof. Neli Ortega
Teste de Hipótese para σ Desconhecido
Se uma variável aleatória X for normalmente distribuída em uma população, na qual a variância é desconhecida, é possível comparar a média amostral com a média da população utilizando S no lugar de σ, através da estatística t:
( 1)n
Xt
Sn
µ−
−=
que tem uma distribuição t com (n – 1) graus de liberdade.
Prof. Neli Ortega
Teste de Hipótese para uma Amostra
Xz
n
µσ
−=σ conhecido ⇒ Teste z
Xt
Sn
µ−=σ desconhecido ⇒ Teste t
Prof. Neli Ortega
Distribuição t de Student
William Gosset (1876-1937)
O parâmetro usado para descrever a distribuição t é o número de graus de liberdade,gl, (d.f. degrees of freedom), que é o tamanho da amostra (n) menos 1.
1gl n= −
Prof. Neli Ortega
Distribuição t de Student
Curva de dendidade de Probabilidade
• Simétrica em relação a média;
• Depende do grau de liberdade,gl;
• Quanto mais gl aumenta mais a distribuição t tende a normal padrão.
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
-4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00
NormalT1glT5glT30gl
Prof. Neli Ortega
Teste de Hipóteses para Duas Amostras
σA e σB desconhecidos
É possível comparar duas médias amostrais quando os desvios-padrão das populações são desconhecidos, através da estatística t abaixo:
A B
D
X Xt
EPM−
=
Assim como no caso do teste z, o EPMD pode ser calculado de maneiras diferentes, dependendo se as variâncias nas populações A e B são iguais ou não.
Prof. Neli Ortega
Erro Padrão das Diferenças entre Médias
,A Bσ σ(desconhecidos)
A Bσ σ≠
A Bσ σ=
2 2A B
DA B
S SE P M
n n= +
20
1 1D
A B
E P M Sn n
= +
Variância conjugada
Para decidir se as variâncias são iguais ou diferentes um outro teste estatístico, que será apresentado adiante, é necessário (Teste F).
Prof. Neli Ortega
A variância conjugada representa a média ponderada das variâncias amostrais dos dois grupos, dada por:
( ) ( )( ) ( )
2 22
0
1 11 1
A A B B
A B
n S n SS
n n− + −
=− + −
Erro Padrão das Diferenças entre Médias
Se nA = nB: 2 2
20 2
A BS SS
+=
Note que, se os tamanhos dos grupos são iguais, a expressão paracalcular o EPMD para variâncias iguais é idêntica à usada quando as variâncias são diferentes!
Prof. Neli Ortega
Teste t-Student para Duas Amostras
Situação 1: Em um ensaio clínico comparou-se doisanorexígenos e as perdas de peso foram registradas. Deseja-se testar se a diferença observada nas duas amostras é estatisticamente significante, assumindo-se α de 1%.
Paciente Perda (kg) Paciente Perda (kg)1 0.9 7 3.82 1.3 8 4.93 1.5 9 5.94 2.4 10 6.65 2.9 11 6.76 3.0 12 7.1
13 7.0
Grupo A Grupo B
Não há informações sobre a população →
Teste t-Student.
Prof. Neli Ortega
Teste t-Student para Duas Amostras
1 2:AH X X≠
0 1 2:H X X=
Vamos supor as variâncias iguais:
A B
D
X Xt
E P M−
=2
0
1 1D
A B
E P M Sn n
= +
onde
( ) ( )( ) ( )
2 22
0
1 1 5 0,784 6 1,521,185.
1 1 5 6A A B B
A B
n S n SS
n n− + − ⋅ + ⋅
= = =− + − +
MédiaVariância
n
Grupo A Grupo B6
6 70.784 1.52
2
Prof. Neli Ortega
Teste t-Student para Duas Amostras
20
1 1 1 11,185 0,606
6 7DA B
EPM Sn n
= + = + =
6 26,603
0,606t
−= =
2 6 7 2 11A Bgl n n= + − = + − =
Procurar o valor de tcrítico, tc, para gl igual a
11 e α de 0,005 (bicaudal).
→ Tabela tRegra de Decisão
Se –tc < t < tc → Aceita-se H0
Caso contrário, Rejeita-se H0.
Prof. Neli Ortega
Distribuição t de Student Tabela
0,10 0,05 0,025 0,010 0,005
1 3,078 6,314 12,706 31,821 63,6562 1,886 2,920 4,303 6,965 9,9253 1,638 2,353 3,182 4,541 5,8414 1,533 2,132 2,776 3,747 4,6045 1,476 2,015 2,571 3,365 4,0326 1,440 1,943 2,447 3,143 3,7077 1,415 1,895 2,365 2,998 3,4998 1,397 1,860 2,306 2,896 3,3559 1,383 1,833 2,262 2,821 3,250
10 1,372 1,812 2,228 2,764 3,16911 1,363 1,796 2,201 2,718 3,10612 1,356 1,782 2,179 2,681 3,05513 1,350 1,771 2,160 2,650 3,01214 1,345 1,761 2,145 2,624 2,977
grau de liberdade
Área da cauda superior
tc0,005 3,106t =
nA+nB - 2 = 11gl = 11
t = 6,603
0,0052α =
Como t > tc, rejeita-se H0 e aceita-se que as diferenças são reais.
Prof. Neli Ortega
Teste t-Student para Duas Amostras
Situação 2: Um estudo compara as alturas de crianças de 4 anos de duas populações diferentes. Deseja-se testar se as alturas médias observadas nas duas amostras são estatisticamente diferentes, assumindo-se α de 5%. Os resultados obtidos estão resumidos na tabela abaixo:
MédiaVariância
n
42 45Grupo A Grupo B
4 2510 10
Como nA = nB a expressão para o cálculo de EPMD independe da relação entre as variâncias populacionais.
2 2 4 25 45 421,7 1,76
10 1,7A B
D
S SEPM t
n+ + −
= = = ⇒ = =
Prof. Neli Ortega
Distribuição t de Student Tabela
tc
nA+nB - 2 = 18gl = 18t = 1,76
0,0252α =
0,025 2,101t =
0,10 0,05 0,025 0,010 0,0051 3,078 6,314 12,706 31,821 63,6562 1,886 2,920 4,303 6,965 9,9253 1,638 2,353 3,182 4,541 5,8414 1,533 2,132 2,776 3,747 4,6045 1,476 2,015 2,571 3,365 4,0326 1,440 1,943 2,447 3,143 3,7077 1,415 1,895 2,365 2,998 3,4998 1,397 1,860 2,306 2,896 3,3559 1,383 1,833 2,262 2,821 3,250
10 1,372 1,812 2,228 2,764 3,16911 1,363 1,796 2,201 2,718 3,10612 1,356 1,782 2,179 2,681 3,05513 1,350 1,771 2,160 2,650 3,01214 1,345 1,761 2,145 2,624 2,97715 1,341 1,753 2,131 2,602 2,94716 1,337 1,746 2,120 2,583 2,92117 1,333 1,740 2,110 2,567 2,898
grau de liberdade
Área da cauda superior
18 1,330 1,734 2,101 2,552 2,878
Como t < tc, aceita-se H0 e conclui-se que as alturas são iguais.
Prof. Neli Ortega
Teste de Hipótese
Estatística F
Prof. Neli Ortega
Comparando Variâncias Teste F
Sir Ronald A. Fisher (1890-1962)Mesma idéia dos testes para médias, teste z e t, porém usa-se a razão das variâncias, e não a sua diferença, como no caso dos testes para médias.
Estatística F:2
2A
B
SF
S=
Prof. Neli Ortega
Comparando Variâncias Teste F
Se se supõe que os dados tem distribuição normal, então é possível comparar as variâncias de duas populações através da estatística F dada abaixo, cujos valores descritivos dependem de dois graus de liberdade:
2
2A
B
SF
S=
onde:
= variância da amostra A
= variância da amostra B
2AS
2BS
gl1 = nA – 1 (numerador)
gl1 = nA – 1 (denominador)
2 2 1A BS S F> ⇒ >
Prof. Neli Ortega
Teste de Hipótese para Variâncias
:A A BH σ σ≠0 : A BH σ σ= e
Pode-se recorrer a um teste bicaudal ou monocaudal. Em geral, estamos interessados em testar a diferença.
Se F > FSc ou F < FIc , para gl1 e gl2, onde Fic=1/ Fic, então rejeita-se H0. Caso contrário, aceita-se H0.
A distribuição F não é simétrica e, portanto, não possui a área da cauda superior, FS, igual a área da cauda inferior, FI. Neste caso, a regra de decisão é:
Na prática colocamos no numerador a variância de maior valor e concentramos a decisão na cauda superior.
Prof. Neli Ortega
Teste de Hipótese para Variâncias
Situação 3: Deseja-se comparar a variância do desempenho de duas equipes de atletismo. Particularmente, testar se elas são estatisticamente diferentes, assumindo-se α de 5%. As variâncias observadas são apresentadas na tabela abaixo:
Variâncian
Equipe A Equipe B0,784 1,520
6 7
1,5201,939
0,784F = =
6 1 5 (denominador)
7 1 6 (numerador)A
B
gl
gl
= − == − =
Tabela F → FSc(6,7)=6,98.
Como F < FSc, não rejeitamos a H0. As variâncias são consideradas iguais.
Prof. Neli Ortega
Teste t-Student para Duas AmostrasSituação 4: Em um estudo avaliou-se a eficácia de dois hipnóticos, comparando as horas de sono frente as duas terapias. Deseja-se testar se as médias observadas nas duas amostras são estatisticamente diferentes, assumindo-se α de 5%. Os resultados obtidos estão resumidos na tabela abaixo:
MédiaVariância
n
9,35 8,85Droga A Droga B
0,89 0,788 10
Verificando se as variâncias são diferentes - H0: σA = σB.
0,891,14
0,78F = =
8 1 7 (numerador)
10 1 9 (denominador)A
B
gl
gl
= − == − =
Tabela F → FSc(7,9)= 4,20.
Como F < FSc, não rejeitamos a H0. As variâncias são consideradas iguais.
Prof. Neli Ortega
Teste t-Student para Duas AmostrasCalculamos o valor de EPMD para variâncias iguais:
A B
D
X Xt
E P M−
=2
01 1
DA B
E P M Sn n
= +
onde
( ) ( )( ) ( )
2 22
0
1 1 7 0,89 9 0,780,828.
1 1 7 9A A B B
A B
n S n SS
n n− + − ⋅ + ⋅
= = =− + − +
20
1 1 1 10,828 0, 432
8 10DA B
EPM Sn n
= + = + =
9,35 8,851,157
0, 4322 16A B
t
gl n n
−= =
= + − =
Tabela t → tc2,5% = 2,12.
Como t < tc2,5% , não rejeitamos a H0.
Prof. Neli Ortega
Teste de Hipótese
Para Dados Pareados
Prof. Neli Ortega
Teste t para Dados Pareados
Dados pareados são aqueles registrados em pares (o indivíduo é controle de si mesmo).
Exemplo 1: Um estudo compara o efeito de uma pomada oftálmica com o de simplesmente higienizar o olho. Um grupo de pacientes usa durante um período a pomada no direito, enquanto oolho esquerdo recebe apenas o anti-séptico.
Exemplo 2: Deseja-se verificar o desempenho de um tratamento. Um grupo de pacientes é examinado antes do início do tratamento.Após a conclusão do mesmo são novamente examinados.
Prof. Neli Ortega
Estatística do Teste t Pareado
Como as observações estão relacionadas, construímos o teste sobre as diferenças observadas em cada par.
Seja Di a diferença (no mesmo indivíduo) entre as observações registradas, para n pares. A média das diferenças de todos os indivíduos chamamos , e o desvio padrão das diferenças de SD .
D
: 0A DH µ ≠0 : 0DH µ =
onde µD é a média populacional, sobre a qual desejamos inferir.
e 1D
Dt gl n
EPM= = −
Tabela t-Student
Prof. Neli Ortega
Teste t PareadoSituação 5: Um hipnótico foi aplicado em um grupo de pacientes que tinham se submetido anteriormente a um tratamento padrão. Foi observado o número de horas de sono de cada paciente nos dois momentos. Deseja-se testar se a diferença média observada é não nula, considerando-se um nível de significância de 5%.
Paciente Droga Trat. Padrão Di1 8.6 8.2 0.42 8.8 8.3 0.53 8.1 7.6 0.54 9.8 9.4 0.45 9.7 8.9 0.86 8.0 7.2 0.87 8.4 8.5 -0.18 9.5 9.3 0.29 9.5 9.1 0.4
Horas de sono
0, 433, 0, 27
0, 27 0,099
D
D
D S
EPM
= = →
= =
: 0A DH µ ≠0 : 0DH µ = e
2,5% 0
0, 433=4,81 e 8
0,092,30 Rejeita-se c
t gl
t H
= =
→ = ⇒