Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
Testes de hipóteses para dados numéricos
Introdução à Bioestatística
Marcelo Goulart Correia
Instituto Nacional de Cardiologia
May 11, 2015
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
1 Testes de hipóteses para dados numéricos
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
É importante veri�car qual a distribuição dos dados
Os testes paramétricos precisam atender ao requisito denormalidade
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
Teste de Shapiro WilkSurge em 1965É baseado na estatística W
H0: A amostra provem de uma distribuição normalHA: A amostra não provem de uma distribuição normal
W =b2
n∑i=1
(xi − x̄)2(1)
b =
n∑
i=1
/2an−i+1 ∗ (xn−i+1 − xi ), se n é par
n∑i=1
+1/2an−i+1 ∗ (xn−i+1 − xi ), se n é impar(2)
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
Teste de Kolmogorov-SmirnovAlternativa ao teste de Shapiro-WilkÉ baseado na função distribuição acumulada
H0: A amostra provém de uma distribuição normalHA: A amostra não provém de uma distribuição normal
Dn = max(D+n ,D
−n ) (3)
D+n = max(Fn(x)− F (x)) (4)
D−n = max(F (x)− Fn(x)) (5)
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
CuidadosAlguns testes tem limitação de tamanho amostralCom amostras grandes qualquer desvio resulta numa rejeiçãoda hipótese nulaVeri�que outros aspectos da variável (média, mediana, IQR,intervalo de con�ança, histograma)
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
Teste do t emparelhadoUtilizada para a comparação de médias entre dois gruposemparelhadosH0: Não existem diferenças entre as médias observadas nosdois gruposHA: Existem diferenças entre as médias observadas nos doisgrupos
T =D̄ − µDsD/√n
(6)
s2D =
n∑i=1
(Di − D̄)2
n − 1(7)
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
ExemploPara determinar a e�ciência de um antitérmico, forammensuradas as temperaturas de 20 indivíduos antes e após oconsumo do medicamento
Indivíduo Antes Depois Indivíduo Antes Depois1 37,5 37,8 11 39,3 382 36 36,3 12 37,5 37,13 39 37,6 13 38,5 36,64 38 37,2 14 39 37,55 37,8 36,9 15 36,9 376 38,5 37,7 16 37 36,27 36,9 36,8 17 38,5 37,68 39,4 38,1 18 39 36,89 37,2 36,7 19 36,2 36,410 38,1 37,3 20 36,8 36,8
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
Exemplo
Indivíduo Diferença Indivíduo Diferença1 -0,3 11 1,32 -0,4 12 0,43 1,4 13 1,94 0,8 14 1,55 0,9 15 -0,16 0,8 16 0,87 0,1 17 0,98 1,3 18 2,29 0,5 19 -0,210 0,8 20 0
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
ExemploD̄ = 0, 73 // sD = 0, 7356Tobs = 0,73−0
0,7356/√20
= 4, 438
Valor crítico de T (α = 0, 05) = 2,093 (Bicaudal)Existe diferença entre os pares para um nível de signi�cânciade 5%
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
Exercício
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
Teste do tUtilizada para a comparação de médias entre dois gruposindependentesH0: Não existem diferenças entre as médias observadas nosdois gruposHA: Existem diferenças entre as médias observadas nos doisgrupos
O método consiste em:Calcular a média dos dois grupos (x̄1 e x̄2)Calcular a variância dos dois grupos (s2
1e s2
2)
Calcular a variância ponderada
s2 =
(n1 − 1)s21
+ (n2 − 1)s22
n1 + n2 − 2(8)
Calcular o valor de t
t =x̄2 − x̄1√
s2(1/n1 + 1/n2)(9)
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
ExemploComo forma de veri�car se duas dietas são igualmentee�cientes, foram criados dois grupos de paciente para duasdietas distintas. As perdas de peso foram coletadas conformedescrito abaixo
Dieta 1 Dieta 212 158 1915 1513 1210 1312 1614 15111213
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
Exemplo
x̄1 = 12 + 8 + ...+ 13/10 = 12 // x̄2 = 15 + 19 + ...+ 15/7 = 15s21 = (1476− 1202/10)/9 = 4 // s22 = (1605− 1052/7)/6 = 5
s2 = 9 ∗ 4 + 6 ∗ 5/9 + 6 = 4, 4t = 15− 12/
√4, 4 ∗ (1/10 + 1/7) = 2, 902
Valor crítico de T (α = 0, 05) = 2,131 (Bicaudal)
Existe diferença entre as dietas para um nível de signi�cânciade 5%
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
ANOVA One-Way (Um fator)Utilizada para a comparação de médias entre mais de doisgruposH0: Não existem diferenças entre as médias observadas nosgruposHA: Existem diferenças entre as médias observadas nos grupos
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
ExemploTrês tratamentos são utilizados para uma determinadaenfermidade, deseja-se veri�car se existem diferenças entre osresultados obtidos em cada tratamento
A B C15 23 1910 16 1513 19 2118 18 1415 1613� � �84 76 85
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
ExemploGraus de liberdade
Total �> 15− 1 = 14Tratamentos �> 3− 1 = 2Resíduos �> 14− 2 = 12
Média do quadrado da soma dos valores
C = (84 + 76 + 85)/15 = 4001, 67
Soma dos quadrados
SQT = 152 + 102 + ...+ 162 − 4001, 67 = 159, 33SQE = 84
2
6+ 76
2
4+ 85
2
5− 4001, 67 = 63, 33
SQD = 159, 33− 63, 33 = 96
Quase variâncias
QVE = 63, 33/2 = 31, 67QVD = 96/12 = 8
Estatística F
F = 31, 37/8 = 3, 96
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
ExemploValor crítico de F (α = 0, 05, GLE = 2, GLD = 12) = 3,89Existe diferença entre os tratamentos para um nível designi�cância de 5%
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
Exercício
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
ANOVA One-Way (Um fator) de medida repetidaUtilizada para a comparação de médias entre mais de doisgrupos pareadosH0: Não existem diferenças entre as médias observadas nosgruposHA: Existem diferenças entre as médias observadas nos grupos
A tabela conterá:A interação entre variável e gruposErros de medidas dessa interação
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
ExemploÉ obtida a medida de proteína c-reativa em três momentos(Pré-treinamento, duas semanas de treinamento, �m dotreinamento) num grupo de pacientes.
Marcelo Goulart Correia Introdução à Bioestatística
Testes de hipóteses para dados numéricos
Exemplo
Marcelo Goulart Correia Introdução à Bioestatística