View
106
Download
0
Category
Preview:
Citation preview
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Programa:
1. Introdução aos MLG
2. Regressão Logística
3. MLG aplicados a variáveis resposta com distribuição contínua
4. MLG aplicados a dados de contagens
5. Análise de variância (ANOVA) com MLG
1. Programa
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Objectivo da Análise de Variância
Avaliar como uma ou mais variáveis categóricas influenciam uma variável aleatória (resposta).
Modelos disponíveis
MLG Poisson MLG Binomial MLG Binomial Negativa
MLG Normal MLG Gama MLG Gaussiana Inversa
2. Objectivo
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Introdução à Análise de Variância
Uma variável categórica também se designa por Factor.
Os valores que toma são designados Níveis.
Exemplos:
Factor Níveis
Cor Azul, Verde, Vermelho
Sexo Masculino, Feminino
Idade Juvenil, Adulto
3. Introdução
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
ANOVA a um factor
1 1
2 2
3 3
4 4
,
,
,
,
Y N
Y N
Y N
Y N
1 1
2 2
3 3
,
,
,
Y BN k
Y BN k
Y BN k
Y tem distribuição Normal
Y tem distribuição Binomial Negativa
Questão:
As populações têm a mesma distribuição?
ANOVA a um factor
4. ANOVA 1 factor
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
ANOVA a um factor
Hipóteses:
H0: Para todos os p níveis do factor estudado, a variável resposta Y tem a mesma distribuição
1 2 ... p
H1: Para pelo menos um dos p níveis a distribuição de Y é distinta dos restantes (i.e., as médias das p populações não são idênticas).
Pressupostos:
•Foi recolhida uma amostra aleatória (plantas, animais, etc.) de cada uma das p populações.
•Para cada unidade experimental registou-se o valor da variável resposta Y.
•Y tem distribuição pertencente à família exponencial.
•O parâmetro de dispersão é constante.
4. ANOVA 1 factor
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
ANOVA a um factor
Trabalho utilizado como exemplo:
BUZZING BEES (HYMENOPTERA: APIDAE, HALICTIDAE) ON SOLANUM (SOLANACEAE): FLORAL CHOICE AND HANDLING
TIME TRACK POLLEN AVAILABILITY
Entre outros objectivos, pretendeu-se saber se o tempo [s] de recolecção de pólen em flores ‘novas’ de Solanum wendlandi difere entre 3 espécies de abelhas:
Sp1: Pseudaugochloropsis gramineaSp2: Euglossa erythrochlora
Sp3: Bombus pullatus
1
2
3
,
,
,
para a espécie 1
para a espécie 2
para a espécie 3
Shelley, T.E., Villalobos, E., and students of the Fall 1997 OTS-USAP
Florida Entomologist 83(2) June, 2000
4. ANOVA 1 factor
X – espécie para a qual se registou o tempo de recolecção de pólen
– tempo médio de recolecção de pólen
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
1
1
0
, se Sp1
, c.c.I
2
1
0
, se Sp2
, c.c.I
3
1
0
, se Sp3
, c.c.I
Formulação mais simples do modelo
1 1 2 2 3 3|E Y X I I I Y I1 I2 I3
5 0 1 0
3 0 0 1
1 1 0 0
18 1 0 0
7 0 1 0
2 0 0 1
onde
A variável resposta (tempo de recolecção) é uma variável contínua positiva.
O MLG Gama poderá ser adequado
ANOVA a um factor
A análise que se pretende constitui um modelo linear
(generalizado ou não, consoante a distribuição de Y
Configuração dos dados
4. ANOVA 1 factor
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
ANOVA a um factor
Valor médio de Y
1
> summary(glm(e5a$Y~ -1+e5a$I1+ e5a$I2+e5a$I3, family=Gamma (link=identity)))
Estimate Std. Error t value Pr(>|t|) e5a$I1 38.083 4.484 8.494 2.72e-13 ***e5a$I2 18.528 2.918 6.349 7.37e-09 ***e5a$I3 14.660 1.500 9.772 5.08e-16 ***
(Dispersion parameter for Gamma family taken to be 0.4712827)
Null deviance: NaN on 98 degrees of freedomResidual deviance: 53.109 on 95 degrees of freedom
2
3
>1-pchisq(53.1,95)
0.9998438
Com esta formulação, é difícil testar a significância das diferenças entre níveis.
4. ANOVA 1 factor
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
O método de “Reference Cell Coding”
ANOVA a um factor
A espécie 3 pode ser descrita como “não sendo nem a espécie 1 nem a espécie 2”, se essas forem as 3 únicas alternativas
Configuração dos dados
Y I1 I2
5 0 1
3 0 0
1 1 0
18 1 0
7 0 1
2 0 0
RFC
A espécie 3 constitui o nível de referência
Espécie
Sp1
Sp2
Sp3
I1 I2
1 0
0 1
0 0
(exemplo5a.txt)
Eliminação da terceira coluna
4. ANOVA 1 factor
Formulação do modelo
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
ANOVA a um factor
Valor médio de Y
1
2
0
1 0 1
2 0 2
3 0
1
2
3
Estimate Std. Error t value Pr(>|t|) e5a$I1 38.083 4.484 8.494 2.72e-13 e5a$I2 18.528 2.918 6.349 7.37e-09e5a$I3 14.660 1.500 9.772 5.08e-16
Relação entre os ’s e os ’s
Estimate Std. Error t value Pr(>|t|) (Intercept) 14.660 1.500 9.772 5.08e-16 e5a$I1 23.423 4.728 4.954 3.16e-06e5a$I2 3.869 3.281 1.179 0.241
0 1 1 2 2|E Y X I I 1 1 2 2 3 3|E Y X I I I
4. ANOVA 1 factor
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
ANOVA a um factor
Teste à significância do factor
H0: Para todos os p níveis do factor estudado, a variável resposta Y tem a
mesma distribuição
H1: Para pelo menos um dos p níveis a distribuição de Y é distinta dos restantes.
Null deviance: 72.086 on 97 degrees of freedomResidual deviance: 53.109 on 95 degrees of freedom
Modelo Nulo
> 1-pchisq(72.086-53.109,97-95)[1] 7.57176e-05
02~
H
Nulo M n pD D
H0 é rejeitada
4. ANOVA 1 factor
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
ANOVA a dois factores
Objectivo:
Saber se o tempo de recolecção de pólen pelas 3 espécies de abelhas difere entre si e ao longo da manhã.
Sp1
07h-09h Sp2
Sp3Tempo de recolecção
Sp1
09h-11h Sp2
Sp3
Y I1 I2 Iini
5 0 1 1
3 0 0 1
1 1 0 1
18 1 0 0
7 0 1 0
2 0 0 0
07h-09h
exemplo5b.txt
5. ANOVA 2 fact.
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
ANOVA a dois factores
Sp1Sp2Sp3
InícioFim
InícioFim
Sp1Sp2Sp3
Efeito do nível “Início”
Interacção entre “Início” e Sp2
Interacção entre “Início” e Sp1
1 1 2 2 3 40 1 5 2| ini ini iniE Y X I I I I I I I
5. ANOVA 2 fact.
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
0
0
0
1, 1 3 4
2, 2 3 5
3, 3
1, 10
2
,
02,
3 0
Sp1
Início Sp2
Sp3
Sp1
Fim Sp2
Sp3
sp ini
sp ini
sp ini
sp fim
sp fim
sp fim
InícioFim
Sp1Sp2Sp3
1 1 2 2 3 40 1 5 2| ini ini iniE Y X I I I I I I I
ANOVA a dois factores
5. ANOVA 2 fact.
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
0|E Y X
Início
Fim
Sp1Sp2Sp3
H0: Para todas as combinações dos factores estudado, a variável resposta Y tem a mesma distribuição,i.e.
ANOVA a dois factores
Método: Aplicação da estatística de teste para comparar o M. Nulo com o M. Completo
> summary(glm(e5b$Y~e5b$I1*e5b$Iini+ e5b$I2*e5b$Iini,family=Gamma(link=identity)))
Estimate Std. Error t value Pr(>|t|) (Intercept) 8.0062 0.9407 8.510 1.15e-14 ***e5b$I1 7.2080 2.2390 3.219 0.001554 ** e5b$Iini 6.6536 1.7115 3.888 0.000148 ***e5b$I2 0.1993 1.7157 0.116 0.907654 e5b$I1:e5b$Iini 16.2153 5.0314 3.223 0.001537 ** e5b$Iini:e5b$I2 3.6693 3.5667 1.029 0.305123
Null deviance: 131.89 on 166 degrees of freedomResidual deviance: 82.00 on 161 degrees of freedom
> summary(glm(e5b$Y~1,family=Gamma (link=identity)))
Estimate Std. Error t value Pr(>|t|) (Intercept) 18.172 1.327 13.69 <2e-16 ***
1 2 3 4 5 0
> 1-pchisq(131.89-82,5)[1] 1.459511e-09
Rejeita-se H0
Modelo Nulo
5. ANOVA 2 fact.
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Início
Fim
Sp1Sp2Sp3
H0: O factor “Espécie” não afecta a distribuição de Y (tempo de recolecção de pólen), i.e.
ANOVA a dois factores
> 1-pchisq(107.60-82,165-161)[1] 3.809866e-05
Rejeita-se H0
Desvio do M. Completo
g.l. do M. Completo
1 2 4 5 0
> summary(glm(e5b$Y~e5b$Iini, family=Gamma(link=identity)))
Estimate Std. Error t value Pr(>|t|) (Intercept) 10.554 1.015 10.397 < 2e-16 ***e5b$Iini 12.982 2.154 6.028 1.05e-08 ***
Residual deviance: 107.60 on 165 degrees of freedom
0 3| iniE Y X I
5. ANOVA 2 fact.
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Início
Fim
Sp1Sp2Sp3
H0: O factor “Altura do dia” não afecta a distribuição de Y (tempo de recolecção de pólen), i.e.
ANOVA a dois factores
3 4 5 0
> summary(glm(e5b$Y~e5b$I1+e5b$I2, family=Gamma(link=identity)))
Estimate Std. Error t value Pr(>|t|) (Intercept) 11.946 1.070 11.167 < 2e-16 ***e5b$I1 16.674 3.123 5.340 3.06e-07 ***e5b$I2 2.203 2.200 1.001 0.318
Residual deviance: 104.30 on 164 degrees of freedom
1 1 20 2|E Y X I I
> 1-pchisq(104.30-82,164-161)[1] 5.649585e-05
Rejeita-se H0
5. ANOVA 2 fact.
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Início
Fim
Sp1Sp2Sp3
H0: Os dois factores não interagem de forma significativa, i.e.
ANOVA a dois factores
4 5 0
> 1-pchisq(87.131-82,163-161)[1] 0.07688073
Não se rejeita H0
> summary(glm(e5b$Y~e5b$I1+e5b$I2+ e5b$Iini,family=Gamma(link=identity)))
Estimate Std. Error t value Pr(>|t|) (Intercept) 7.3973 0.8553 8.648 4.72e-15 ***e5b$I1 13.1891 2.3367 5.644 7.19e-08 ***e5b$I2 1.0142 1.5380 0.659 0.511 e5b$Iini 9.4337 1.5278 6.175 5.09e-09 ***
Residual deviance: 87.131 on 163 degrees of freedom
1 1 2 2 30| iniE Y X I I I
A ANOVA foi concluída
5. ANOVA 2 fact.
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Análise da qualidade de ajustamento (goodness of fit)
Análise global (Desvio):
> 1-pchisq(87.131,163)[1] 0.9999998
Análise dos resíduos (quantile residuals):
> k<-(glm(e5b$Y~e5b$I1*e5b$Iini+ e5b$I2*e5b$Iini,family= Gamma(link=identity)))> qqnorm(qres.gamma(k, dispersion=0.45))> abline(0,1)
O modelo final parece estar bem ajustado
6. GOF
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
1) As três espécies de abelhas estudadas possuem tempos de recolecção de pólen significativamente distintos.
2) Nas três espécies, o tempo de recolecção de pólen varia de forma significativa do início para o fim da manhã.
3) A alteração no tempo de recolecção discutido em 2) é sensivelmente idêntica para as três espécies
Interpretação do modelo
Para além destas conclusões, típicas de uma análise de variância, pode-se ainda usufruir
dos resultados do modelo final.
7. Interpretação
Conclusões
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Interpretação do modelo
Estimate (Intercept) 7.3973 e5b$I1 13.1891e5b$I2 1.0142e5b$Iini 9.4337
Dispersion parameter taken to be 0.4494806
= 1/=2.22
1,
2,
3,
1,
2,
3,
7.4 13.2 9.4 30.0
7.4 1.0 9.4 17.8
7.4 9.4 16.8
7.4 13.2 20.6
7.4 1.0 8.4
7.4
Sp1
Início Sp2
Sp3
Sp1
Fim Sp2
Sp3
sp ini
sp ini
sp ini
sp fim
sp fim
sp fim
Distribuição do tempo de recolecção [s] para Pseudaugochloropsis graminea (Sp1), no início da manhã
http://ic.net/~jnbohr/java/CdfDemoArgs.html Atenção: /
…no final da manhã
0 60
0 60
0.91
0.98
Pr[Y≤60]=?
7. Interpretação
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Análise de variância e covariância (ANCOVA)
Suponha-se que não foi feita uma categorização do factor “Altura do dia”. Originalmente, esta variável é contínua, podendo ser discretizada p.ex. como o tempo [minutos] decorrido desde as 07:00.
Neste caso, como testar se o tempo de recolecção de pólen pelas 3 espécies de abelhas difere entre si e ao longo da manhã?
1 Preditor Categórico (Espécie) e 1 Preditor Discreto (minutos desde 07:00)
ANCOVA
minuto desde 07:00
Sp1Sp2
Sp3
0
240
8. ANCOVA
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Análise de variância e covariância (ANCOVA)
1 1 2 20 43 1 5 2|E Y X I I T I T I T
Sp1Sp2
Sp3
0
240minuto desde 07:00
1, 1 3
2, 2 3 5
3
0
0
, 0 3
4Sp1
Sp2
Sp3
sp ini
sp ini
sp ini
T T
T T
T
Y I1 I2 T
5 0 1 12
3 0 0 132
1 1 0 198
18 1 0 76
7 0 1 34
2 0 0 19
exemplo5c.txt
> k<-glm(e5c$Y~e5c$I1*e5c$T +e5c$I2*e5c$T, family=Gamma (link=identity))> c(k$deviance,k$df.residual)[1] 70.35788 161.00000
Desvio do M. Completo
g.l. do M. Completo8. ANCOVA
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Análise de variância e covariância (ANCOVA)
H0: A distribuição da variável resposta Y não depende do preditor discreto T, i.e.
43 5 0
Método: Aplicação da estatística de teste para comparar o M. Nulo com o M. Completo
Rejeita-se H0 (para = 0.05)
1 1 20 2|E Y X I I
Sp1Sp2
Sp3
0
240T
> j<-glm(e5c$Y~e5c$I1+e5c$I2, family=Gamma(link=identity))> c(j$deviance,j$df.residual)[1] 80.4074 164.0000> 1-pchisq(j$deviance-k$deviance, j$df.residual-k$df.residual)[1] 0.01814984
8. ANCOVA
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Análise de variância e covariância (ANCOVA)
H0: O efeito do tempo decorrido desde as 07:00 sobre a duração da recolha de polén é idêntico para as três espécies, i.e.
54 0
Não se rejeita H0
1 1 20 2|E Y X I I
Sp1Sp2
Sp3
0
240T
> j<-(glm(e5c$Y~e5c$I1+e5c$I2 +e5c$T,family=Gamma(link=identity)))> summary(j)
Estimate Std. Error t value Pr(>|t|) (Intercept) 22.65989 2.41458 9.385 < 2e-16 ***e5c$I1 21.55560 3.24785 6.637 4.52e-10 ***e5c$I2 2.19150 2.17282 1.009 0.315 e5c$T -0.06103 0.01350 -4.520 1.18e-05 ***
(Dispersion parameter for Gamma family taken to be 0.4227247)
Residual deviance: 72.721 on 163 d.f.
> 1-pchisq(j$deviance-k$deviance, j$df.residual-k$df.residual)[1] 0.3067945
8. ANCOVA
mini-curso mlge
1. Programa
2. Objectivo
5. ANOVA com MLG
3. Introdução
4. ANOVA 1 factor
5. ANOVA 2 fact.
6. GOF
7. Interpretação
8. ANCOVA
9. Bibliografia
Bibliografia
•Fromentin, J.-M., 2003. The East Atlantic and Mediterranean bluefin tuna stock management: uncertainties and alternatives. Scientia Marina 67 (Suppl. 1): 51-62.
•Shelly, T.E., et al., 2000. Buzzing bees (Hymenoptera : Apidae, Halictidae) on Solanum (Solanaceae): floral choice and handling time track pollen availability. Florida Entomologist 83(2): 180-187.
•Terpes, G., et al., 2001. Assessment of the Mediterranean swordfish stock based on Greek and Italian fisheries data. ICCAT Col. Vol. Sci. Pap. 55(1): 94-106.
9. Bibliografia
Recommended