Upload
internet
View
108
Download
1
Embed Size (px)
Citation preview
ME623Planejamento e Pesquisa
ME623A – Aula 5 – 21/08/2013 2
Diagnóstico do ModeloAnálise de Resíduos
A decomposição da variabilidade das observações na Análise de Variância é puramente algébrica
No entanto, para realizar os testes estatísticos de igualdade das médias algumas suposições têm que satisfeitas:
1. As observações são descritas pelo modelo:
2. , ou seja, os erros são normais e independentes, com média 0 e variância σ2 constante.
Na prática, nem sempre essas suposições são válidas
ME623A – Aula 5 – 21/08/2013 3
Análise de ResíduosNão se deve confiar nos resultados da
Análise de Variância até que as suposições sejam validadas
Isso pode ser feito atráves da Análise de Resíduos
O resíduo para a j-ésima observação no i-ésimo tratamento é definido como:
em que é uma estimativa do observação , obtida da seguinte forma
ME623A – Aula 5 – 21/08/2013 4
Análise de ResíduosOs resíduos contém informação sobre a
variabilidade não explicada pelo modeloSe as suposições são válidas, os resíduos
não devem apresentar nenhuma tendência. Eles devem ser:
1. aparentemente normais
2. independentes
3. variância constante, ou seja, a variabilidade dos resíduos não deve mudar com os níveis do fator
Essas características são verificadas através dos Gráficos dos Resíduos
ME623A – Aula 5 – 21/08/2013 5
Gráficos dos Resíduos
1. Gráfico de Probabilidade Normal
◦ resíduos versus os quantis teóricos de uma variável normal
◦ visualmente os pontos devem estar sob uma linha reta
◦ também útil para detectar outliers
2. Resíduos versus Ordem dos Dados
◦ útil para detectar correlação entre os resíduos
◦ qualquer tendência indica não independência
ME623A – Aula 5 – 21/08/2013 6
Gráficos dos Resíduos
3. Resíduos versus Valores Ajustados◦ se o modelo está correto, esse gráfico
não deve apresentar nenhuma tendência
◦ serve para detectar variância não constante
4. Resíduos versus Níveis do Fator◦ detectar se a variância é constante
ME623A – Aula 5 – 21/08/2013 7
Exemplo da Fibra Sintética
%Algod
ão
Resíduos ( )
1 2 3 4 5
15−2.8
(7)
−2.8
(7)
5.2(15
)
1.2(11
)
−0.8
(9)9.8
20−3.4(12)
1.6(17
)
−3.4
(12)
2.6(18
)
2.6(18
)15.4
25−3.6(14)
0.4(18
)
0.4(18
)
1.4(19
)
1.4(19
)17.6
30−2.6(19)
3.4(25
)
0.4(22
)
−2.6
(19)
1.4(23
)21.6
35−3.8
(7)
−0.8
(10)
0.2(11
)
4.2(15
)
0.2(11
)10.8
ME623A – Aula 5 – 21/08/2013 8
Exemplo da Fibra Sintética
Usando a função lm do R:
> dados <- read.table(“DadosAlgodao.txt”, header=TRUE)
> fit <- lm(Obs ~ factor(Algodao), data=dados)
> anova(fit)
Analysis of Variance Table
Response: Obs
Df Sum Sq Mean Sq F value Pr(>F)
factor(Algodao) 4 475.76 118.94 14.757 9.128e-06 ***
Residuals 20 161.20 8.06
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> plot(fit, col=“red”, pch=15)
ME623A – Aula 5 – 21/08/2013 9
Gráficos de Probabilidade Normal
Resíduos Resíduos Padronizados
ME623A – Aula 5 – 21/08/2013 10
Resíduos PadronizadosOs resíduos padronizados são dados por:
Aproximadamente N(0, 1), então um resíduo padronizado maior que 3 ou 4 é um potencial outlier
No Exemplo da Fibra Sintética, o maior resíduopadronizado é:
Então não temos indicação de outliers
ME623A – Aula 5 – 21/08/2013
Gráfico dos Resíduos vs Ordem dos Dados
Nenhuma tendência aparente nesse exemplo
Então não há suspeita de violação da hipótese de independência
Isso é sinal de que a aleatorização foi feita de forma correta
11
ME623A – Aula 5 – 21/08/2013 12
Gráfico dos Resíduos vs Valores Ajustados
Nenhuma tendência aparente nesse exemplo
Se o gráfico apresentar o formato de um cone, temos indicação de variância não constante
Nesse caso, transforma-se os dados para estabilizar a variância
ME623A – Aula 5 – 21/08/2013 13
Gráfico dos Resíduos vs Níveis do Fator
Usado para checar a hipótese de igualdade de variância dentro dos tratamentos
No nosso exemplo, parece razoável assumir que as variâncias são iguais
Podemos usar o teste de Bartlett para testar formalmente a igualdade de variância
ME623A – Aula 5 – 21/08/2013 14
Teste de BartlettHomogeneidade das VariânciasHipóteses
Estatística do Teste
onde
é a variância amostral do i-ésimo tratamento e a variância agrupada (MSE)
ME623A – Aula 5 – 21/08/2013 15
Teste de BartlettHomogeneidade das Variâncias
Quando as a amostras referentes aos tratamentos são normais e independentes, a distribuição amostral de se aproxima de uma distribuição
O valor q é grande quando os s diferem muito e igual a zero quando são todos iguais
Portanto, rejeita-se H0 para também grande, ou seja,
Alerta: O Teste de Bartlett é muito sensitivo à normalidade. Então, não devemos utilizá-lo se a suposição de normalidade não for validada
ME623A – Aula 5 – 21/08/2013 16
Teste de BartlettExemplo da Fibra Sintética
As variâncias para cada tratamento são:
Exercício: Encontrar a estatística do teste . Qual a conclusão dado que ?
No R> bartlett.test(Obs ~ factor(Algodao), data=dados)Bartlett test of homogeneity of variancesdata: Obs by factor(Algodao) Bartlett's K-squared = 0.9331, df = 4, p-value = 0.9198
ME623A – Aula 5 – 21/08/2013 17
Exemplo: Controle da Ansiedade
Pesquisadores querem testar um novo medica-mento no combate a ansiedade
Eles irão testar três dosagens (0mg, 50mg e 100mg)
21 pacientes participa-ram do estudo e foram divididos igualmente
entre os três grupos
Depois de tomar a medi-cação, os pacientes dão uma nota de 1 – 10 para o nível de ansiedade
Pergunta: Existe diferen-ça entre as dosagens da medicação no controle da ansiedade?
ME623A – Aula 5 – 21/08/2013 18
Exemplo: Controle da Ansiedade
Dosagem
(mg)
Nível de Ansiedade
( )
Total
Média1 2 3 4 5 6 7
0 9 8 7 8 8 9 8 57 8.14
50 7 6 6 7 8 7 6 47 6.71
100 4 3 2 3 4 3 2 21 3
=125
=5.95
Exercício Faça a Análise de Variância para esse exemplo e responda a pergunta dos pesquisadores Faça a Análise dos Resíduos (use o R para obter os gráficos)
ME623A – Aula 5 – 21/08/2013 19
Para relembrar as fórmulas... Tabela ANOVA com Um Fator
E as SS podem ser simplificadas como: