Upload
ellocoloco
View
218
Download
0
Embed Size (px)
Citation preview
1
Análise da Covariância(ANCOVA)
Notas para a disciplina de Análise Notas para a disciplina de Análise Estatística IIIEstatística III
Tomás da SilvaTomás da Silva
© 2003 Universidade de Coimbra
2Análise da Covariância
Pontos principaisPontos principais
•• Regressão, ANOVA e ANCOVA: O modelo linear Regressão, ANOVA e ANCOVA: O modelo linear geral (MLG/GLM)geral (MLG/GLM)
•• Análise da Covariância: ObjectivosAnálise da Covariância: Objectivos✸✸ Um exemploUm exemplo
•• Assunções para a ANCOVA com um factor e Assunções para a ANCOVA com um factor e uma var. concomitante (ANCOVA unifactorial)uma var. concomitante (ANCOVA unifactorial)✸✸ Efectuar uma análise da covariância com o SPSS: Efectuar uma análise da covariância com o SPSS: Abordagem clássicaAbordagem clássica
✸✸ Verificação das assunçõesVerificação das assunções
✸✸ Realizar a ANCOVARealizar a ANCOVA
2
3Análise da Covariância
Regressão, ANOVA e ANCOVARegressão, ANOVA e ANCOVA
•• O “geral” no MLGO “geral” no MLG
•• O “linear” no MLGO “linear” no MLG
•• Comunalidades entre a regressão, a Comunalidades entre a regressão, a ANOVA e a ANCOVAANOVA e a ANCOVA
•• O MLG O MLG
DADOS = MODELO + ERRODADOS = MODELO + ERRO
4Análise da Covariância
RegressãoRegressão
•• YYi = = ββ0 + β1 Xi + εI (regressão linear simples)
A análise da regressão procura explicar os dados (os resultados na var. dependente, VD) a partir de um conjunto de var. independentes (VI) ou preditores (o modelo) e um componente residual (o erro).
Habitualmente o investigador que usa a Regressão está interessado em predizer uma VD quantitativa a partir de uma, ou mais, VI quantitativas e em determinar a contribuição relativa de cada VI para a predição: há interesse na proporção de variância da VD que pode ser atribuída à variação nas VI’s.
A regressão também pode utilizar variáveis categoriais (isto é, nominais ou qualitativas)
Cont.
3
5Análise da Covariância
ANOVAANOVA•• A ANOVA também pode ser conceptualizada como modelo + erro. A ANOVA também pode ser conceptualizada como modelo + erro.
Aqui, os Aqui, os resultados na VDresultados na VD constituem os dados, as constituem os dados, as condições condições experimentaisexperimentais constituem o modelo e o componente dos dados constituem o modelo e o componente dos dados não não acomodado pelo modeloacomodado pelo modelo, mais uma vez representam o temo de erro., mais uma vez representam o temo de erro.
Ao usar a ANOVA o investigador, tipicamente, está interessado em Ao usar a ANOVA o investigador, tipicamente, está interessado em saber se a média dos resultados da VD, obtida em cada uma das saber se a média dos resultados da VD, obtida em cada uma das condições experimentais diferem significativamente. O que se realiza condições experimentais diferem significativamente. O que se realiza determinando quanto da variação na VD é atribuída às diferenças determinando quanto da variação na VD é atribuída às diferenças entreentre os resultados obtidas nas condições experimentais, e os resultados obtidas nas condições experimentais, e comparando esta com o comparando esta com o termo de errotermo de erro, que é atribuído à variação nos , que é atribuído à variação nos resultados dependentes resultados dependentes dentrodentro de cada uma das condições de cada uma das condições experimentais.experimentais.
Há interesse em conhecer a proporção da variação na VD que pode Há interesse em conhecer a proporção da variação na VD que pode ser atribuída à manipulação da(s) VI’s.ser atribuída à manipulação da(s) VI’s.
Portanto, a ANOVA é um tipo particular de análise de regressão que Portanto, a ANOVA é um tipo particular de análise de regressão que recorre a preditores quantitativos para actuarem como variáveis recorre a preditores quantitativos para actuarem como variáveis categoriais.categoriais.
6Análise da Covariância
Análise da Covariância Análise da Covariância (ANCOVA)(ANCOVA)
•• A ANCOVA é a técnica estatística que combina a regressão e a A ANCOVA é a técnica estatística que combina a regressão e a ANOVA, e também pode ser descrita em termos de modelo + erro. ANOVA, e também pode ser descrita em termos de modelo + erro. Como na regressão os resultados na VD constituem os dados, mas o Como na regressão os resultados na VD constituem os dados, mas o modelo inclui não apenas as condições experimentais, mas também modelo inclui não apenas as condições experimentais, mas também uma, ou mais, variáveis preditoras quantitativas.uma, ou mais, variáveis preditoras quantitativas.
•• Estas variáveis quantitativas, conhecidas como Estas variáveis quantitativas, conhecidas como covariatescovariates (também, (também, concomitantesconcomitantes ou de ou de controlocontrolo), representam fontes de variância que ), representam fontes de variância que se julga que influenciam a VD, mas que não foram controladas pelos se julga que influenciam a VD, mas que não foram controladas pelos procedimentos experimentais.procedimentos experimentais.
•• A ANCOVA determina a covariação (correlação) entre as coA ANCOVA determina a covariação (correlação) entre as co--variáveis variáveis e a VD e depois remove a variância associada com as coe a VD e depois remove a variância associada com as co--variáveis variáveis dos resultados da VD, antes de determinar se as diferenças entre as dos resultados da VD, antes de determinar se as diferenças entre as médias nas condições experimentais são estatisticamente médias nas condições experimentais são estatisticamente significativas.significativas.
4
7Análise da Covariância
Modelo da COVARIÂNCIAModelo da COVARIÂNCIA
Valor Valor observadoobservado
na var. na var. dependentedependente
== Constante +Constante +
EfeitoEfeito
do nível de do nível de tratamento tratamento ou grupoou grupo
++ Efeito da Efeito da covariávelcovariável
++ ResíduoResíduo
Algebricamente
( ) ijijiij eXXβτuY +−++=
8Análise da Covariância
OBJECTIVOSOBJECTIVOS•• Aumentar a precisão nas experiências Aumentar a precisão nas experiências completamente aleatorizadas;completamente aleatorizadas;
•• Remover o viés que pode resultar quando as Remover o viés que pode resultar quando as unidades testadas não podem ser distribuídas unidades testadas não podem ser distribuídas aleatoriamente pelas condições experimentais aleatoriamente pelas condições experimentais (utilização de grupos intactos);(utilização de grupos intactos);
•• Remover os efeitos de variáveis “parasitas” nos Remover os efeitos de variáveis “parasitas” nos estudos não experimentais;estudos não experimentais;
•• Para verificar a aderência de rectas de Para verificar a aderência de rectas de regressão no contexto de múltiplas regressão no contexto de múltiplas classificações.classificações.
5
9Análise da Covariância
Um ExemploUm ExemploAndy Field apresenta o seguinte exemplo relacionado com a utilização do VIAGRA.
Considera três grupos experimentais (Placebo, Baixa dose de Viagra (Low), e Alta dose de Viagra (High)). A VD é uma medida comportamental da Líbido do sujeito.
Neste exemplo, é possível especular que outras variáveis, para além do VIAGRA, podem afectar a líbido do sujeito. Algumas dessas influências na líbido podem ser, por exemplo, a líbido do parceiro/a do sujeito (Afinal, são precisas duas pessoas para dançar o tango (!), como refere Field), ou outra medicação que suprima a líbido (por exemplo, anti-depressivos), ou mesmo a fadiga!
Ora, se estas variáveis forem medidas, então é possível controlar a influência que elas podem ter na variável dependente, nomeadamente incluindo-as no modelo de regressão, ou, como no caso aqui discutido, no modelo da ANCOVA. O objectivo é conhecer qual o efeito que a VI tem depois do efeito da variável concomitante ser controlado, ou seja, depois de removermos (parcializarmos) o efeito da co-variável.
10Análise da Covariância
Assunções para a ANCOVA Assunções para a ANCOVA unifactorialunifactorial
•• AplicamAplicam--se todas as assunções da ANOVA unifactorial; se todas as assunções da ANOVA unifactorial;
•• Outras assunções para a ANCOVA:Outras assunções para a ANCOVA:
1.1. A var. concomitante é medida antes da intervenção ou manipulação A var. concomitante é medida antes da intervenção ou manipulação experimental;experimental;
2.2. A var. concomitante é medida sem erro (ou com uma garantia/fiabilidade A var. concomitante é medida sem erro (ou com uma garantia/fiabilidade o mais elevada possível);o mais elevada possível);
3.3. (As concomitantes não estão fortemente correlacionadas umas com as (As concomitantes não estão fortemente correlacionadas umas com as outras) outras) –– Apenas aplicável quando temos duas ou mais concomitantes;Apenas aplicável quando temos duas ou mais concomitantes;
4.4. Existe uma relação linear entre a VD e a concomitante para todos os Existe uma relação linear entre a VD e a concomitante para todos os grupos (linearidade);grupos (linearidade);
5.5. A relação entre a concomitante e a VD é a mesma para cada um dos A relação entre a concomitante e a VD é a mesma para cada um dos grupos (homogeneidade dos declives de regressão).grupos (homogeneidade dos declives de regressão).
6
11Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássicaAbordagem clássica
•• O ExemploO Exemplo
Vamos usar a base de dados, construída por Julie Vamos usar a base de dados, construída por Julie Pallant (2002), experim.sav (ver próximo slide)Pallant (2002), experim.sav (ver próximo slide)
❖❖www.openup.co.uk/spss/datawww.openup.co.uk/spss/data
Estes dados referemEstes dados referem--se a um estudo fictício que se a um estudo fictício que envolve a realização de um teste do impacto de dois envolve a realização de um teste do impacto de dois tipos diferentes de intervenções para ajudar os tipos diferentes de intervenções para ajudar os estudantes a lidarem com a sua ansiedade a respeito estudantes a lidarem com a sua ansiedade a respeito do próximo exame de estatística.do próximo exame de estatística.
12Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássicaAbordagem clássica
•• Experim.sav (nomes das variáveis e etiquetas)Experim.sav (nomes das variáveis e etiquetas)
Nome do Nome do ficheiroficheiro
Nome da Nome da variávelvariável
Etiqueta da Etiqueta da variávelvariável
Instruções de codificaçãoInstruções de codificação
Experim.savExperim.sav GroupGroup Tipo de classeTipo de classe 1=Maths skills1=Maths skills
2=Confidence Building2=Confidence Building
Fost1Fost1 Fear of statistics Fear of statistics –– resultados préresultados pré--testeteste
Pontuações totais no Fost Pontuações totais no Fost administrado antes do programa. administrado antes do programa. Amplitude da escala 20Amplitude da escala 20--60. Pontos 60. Pontos elevados indicam maior medo da elevados indicam maior medo da estatística.estatística.
Fost2Fost2 Fear of statistics Fear of statistics –– resultados pósresultados pós--testeteste
Pontuações totais no Fost Pontuações totais no Fost administrado depois do programa. administrado depois do programa. Amplitude da escala 20Amplitude da escala 20--60. Pontos 60. Pontos elevados indicam maior medo da elevados indicam maior medo da estatística.estatística.
7
13Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássica Abordagem clássica ((cont.)cont.)
•• Quadro resumo para uma ANCOVA unifactorialQuadro resumo para uma ANCOVA unifactorial
Exemplo da questão Exemplo da questão para investigaçãopara investigação
Há uma diferença significativa nos Há uma diferença significativa nos resultados do teste “Fear of Statistics” para resultados do teste “Fear of Statistics” para o grupo de “maths skills” (grupo 1) e o o grupo de “maths skills” (grupo 1) e o grupo de “confidence building” (grupo 2), grupo de “confidence building” (grupo 2), depois de controlarmos os resultados no depois de controlarmos os resultados no prépré--teste nesta variável?teste nesta variável?
14Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássica Abordagem clássica ((cont.)cont.)
•• Quadro resumo para uma ANCOVA unifactorialQuadro resumo para uma ANCOVA unifactorialDo que é que Do que é que precisamos:precisamos:
Pelo menos três variáveis estão envolvidas:Pelo menos três variáveis estão envolvidas:
�� uma var. categórica independente com dois ou uma var. categórica independente com dois ou mais níveis (gr.1/gr.2)mais níveis (gr.1/gr.2)
��Uma var. contínua dependente (resultados no Uma var. contínua dependente (resultados no teste teste Fear of StatisticsFear of Statistics no Tempo 2); eno Tempo 2); e
�� uma ou mais variáveis contínuas concomitantes uma ou mais variáveis contínuas concomitantes (resultados no teste Fost no Tempo 1)(resultados no teste Fost no Tempo 1)
O que é se faz:O que é se faz: A ANCOVA dirá se a média dos resultados no teste A ANCOVA dirá se a média dos resultados no teste Fost, Tempo 2, para os dois grupos são Fost, Tempo 2, para os dois grupos são significativamente diferentes, após os resultados significativamente diferentes, após os resultados iniciais no préiniciais no pré--teste terem sido controlados.teste terem sido controlados.
8
15Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássica Abordagem clássica ((cont.)cont.)
•• Quadro resumo para uma ANCOVA unifactorialQuadro resumo para uma ANCOVA unifactorialAssunções:Assunções: ��Específicas da ANCOVA (1. A concomitante é medida Específicas da ANCOVA (1. A concomitante é medida
antes da manipulação experimental; 2. A concomitante é antes da manipulação experimental; 2. A concomitante é medida sem erro (ou, pelo menos, com elevada medida sem erro (ou, pelo menos, com elevada fiabilidade); 3. As concomitantes não estão fortemente fiabilidade); 3. As concomitantes não estão fortemente correlacionadas; 4. Há uma relação linear entre a VD e a correlacionadas; 4. Há uma relação linear entre a VD e a concomitante para todos os grupos (linearidade); e 5. A concomitante para todos os grupos (linearidade); e 5. A relação entre a concomitante e a VD é a mesma em todos relação entre a concomitante e a VD é a mesma em todos os grupos (homogeneidade dos declives de regressão).os grupos (homogeneidade dos declives de regressão).
��AplicamAplicam--se todas as assunções associadas com a ANOVA se todas as assunções associadas com a ANOVA (independência das observações; distribuição normal; (independência das observações; distribuição normal; homogeneidade da variância).homogeneidade da variância).
Alternativa nãoAlternativa não--paramétrica:paramétrica:
Nenhuma.Nenhuma.
16Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássica Abordagem clássica ((cont.)cont.)
•• Teste das assunçõesTeste das assunçõesAssunção 1: Medição da concomitante
Esta assunção especifica que a concomitante deve ser medida antes do início tratamento ou manipulação experimental. O pressuposto não é testado estatisticamente, pelo contrário é parte integrante do plano e dos procedimentos da investigação.
Assunção 2: Fiabilidade da concomitante
Esta assunção também faz parte do plano da investigação e envolve a selecção dos melhores instrumentos de medida disponíveis. Se usarmos uma escala psicométrica devemos sempre calcular (ver Reliability procedures, no SPSS) a fiabilidade dos resultados através das estatísticas apropriadas (v.g., será desejável um alfa de Cronbach superior a .70).
9
17Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássica Abordagem clássica ((cont.)cont.)
•• Teste das assunçõesTeste das assunçõesAssunção 3: Correlações entre as concomitantes
Se usarmos mais do que uma concomitante, devemos verificar se estas não estão fortemente interrelacionadas (r=.8 e superior). Como neste caso apenas temos uma concomitante, este problema não se coloca.
Assunção 2: Linearidade
Podemos verificar esta assunção de diferentes maneiras: (1) separar a amostra de acordo com os vários grupos do plano usando a opção Split Filedo SPSS, e, depois, gerar diagramas de dispersão entre a variável dependente e cada uma das concomitantes.
(2) Outro procedimento (que será exemplificado de seguida) envolve a criação de um único scatterplot, mas mostrando os grupos separadamente.
18Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássica Abordagem clássica ((cont.)cont.)
Procedimento para verificar a linearidade em cada grupo
1.º Passo
Graphs Scatter Simple Define Y axis fear of stats time 2 X axis fear of stats time 1 Set markers by group OK.
2.º Passo
Viewer Chart Editor Chart Options Display Show subgroups Fit Lines Subgroups Fit Options Regression Options Display R square in legend Continue OK.
10
19Análise da Covariância
fear of stats time1
6050403020
fear
of s
tats
tim
e2
50
40
30
20
type of class
confidence building
Rsq = 0.7655
maths skills
Rsq = 0.7250
20Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássica Abordagem clássica ((cont.)cont.)
•• Teste das assunçõesTeste das assunçõesAssunção 5: Homogeneidade dos declives de regressão
Esta assunção diz respeito à relação entre a concomitante e a variável dependente para cada um dos grupos. O que estamos a testar é a existência de uma interacção entre a concomitante e o tratamento ou manipulação experimental. Também neste caso são possíveis vários modalidades para avaliar este pressuposto.
Graficamente, podemos inspeccionar o diagrama obtido entre a VD e a concomitante quando testámos a assunção 4. As duas linhas obtidas (correspondentes aos dois grupos deste estudo) têm declives semelhantes? Se as rectas são paralelas (ou bastante similares) não há evidência suficiente para rejeitar a hipótese (não há violação da assunção).
Esta assunção também pode ser testada estatisticamente (ver slide 21).
11
21Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássica Abordagem clássica ((cont.)cont.)
Procedimento para verificar a homogeneidade dos declives de regressãoProcedimento para verificar a homogeneidade dos declives de regressão
Estatisticamente, trata-se de testar a existência de uma interacção significativa entre o tratamento e a concomitante. Se a interacção é significante ao nível de alfa de .05, então violámos a assunção.
Analyse General Linear Model Univariate Dependent Variables fear of stats time 2 (fost2) Fixed Factor group Covariate fear of stats time 1 (fost1) Model Custom Build Terms Interaction group � Model fost1 �
Model group fost 1 � Model Continue OK.
22Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássica Abordagem clássica ((cont.)cont.)
Tests of Between-Subjects Effects
Dependent Variable: fear of stats time2
577,689a 3 192,563 26,102 ,000
3,877 1 3,877 ,525 ,475
,846 1 ,846 ,115 ,738
538,706 1 538,706 73,022 ,000
,409 1 ,409 ,055 ,816
191,811 26 7,377
42957,000 30
769,500 29
SourceCorrected Model
Intercept
GROUP
FOST1
GROUP * FOST1
Error
Total
Corrected Total
Type III Sumof Squares df Mean Square F Sig.
R Squared = ,751 (Adjusted R Squared = ,722)a.
Este é o termo de interacção. Na Ancova desejamos que o nível de significância seja maior do que .05
12
23Análise da Covariância
Efectuar uma ANCOVA com o Efectuar uma ANCOVA com o SPSS SPSS –– Abordagem clássica Abordagem clássica ((cont.)cont.)
Procedimento para obter a ANCOVA unifactorial
Analyse General Linear Model Univariate Dependent Variables fear of stats time2(fost2) Fixed Factor group Covariate fear of stats time1 (fost1) Model Full Factorial Continue Options Estimated Marginal Means group � Display Means for Descriptives statistics Estimates of effect size Observed power Homoneigity tests Continue OK.
Descriptive Statistics
Dependent Variable: fear of stats time2
37,67 4,515 15
37,33 5,876 15
37,50 5,151 30
type of classmaths skills
confidence building
Total
Mean Std. Deviation N
Output (abreviado) gerado pelo procedimento anterior:
24Análise da Covariância
Levene's Test of Equality of Error Variances a
Dependent Variable: fear of stats time2
,141 1 28 ,710F df1 df2 Sig.
Tests the null hypothesis that the error variance ofthe dependent variable is equal across groups.
Design: Intercept+FOST1+GROUPa.
Tests of Between-Subjects Effects
Dependent Variable: fear of stats time2
577,279b 2 288,640 40,543 ,000 ,750 81,087 1,000
3,510 1 3,510 ,493 ,489 ,018 ,493 ,104
576,446 1 576,446 80,970 ,000 ,750 80,970 1,000
5,434 1 5,434 ,763 ,390 ,027 ,763 ,135
192,221 27 7,119
42957,000 30
769,500 29
SourceCorrected Model
Intercept
FOST1
GROUP
Error
Total
Corrected Total
Type III Sumof Squares df Mean Square F Sig.
Partial EtaSquared
Noncent.Parameter
ObservedPowera
Computed using alpha = ,05a.
R Squared = ,750 (Adjusted R Squared = ,732)b.
Testa a assunção da homogeneidade da variância
Testa a hipótese de que as médias dos grupos são estatisticamente diferentes
13
25Análise da Covariância
type of class
Dependent Variable: fear of stats time2
37,926a ,690 36,512 39,341
37,074a ,690 35,659 38,488
type of classmaths skills
confidence building
Mean Std. Error Lower Bound Upper Bound
95% Confidence Interval
Evaluated at covariates appeared in the model: fear of stats time1 =40,17.
a.
Estimated marginal means
Estas são as médias ajustadas da variável dependente. Obtêm-se aplicando as seguintes
fórmulas:XBFBAY 3111
ˆˆˆ ++= XBFBAY 3122ˆˆˆ ++=
(ver o próximo slide )
26Análise da Covariância
Parameter Estimates
Dependent Variable: fear of stats time2
2,308 3,953 ,584 ,564 -5,803 10,419
,866 ,096 8,998 ,000 ,668 1,063
,853 ,976 ,874 ,390 -1,150 2,855
0 a , , , , ,
Parameter
Intercept
FOST1
[GROUP=1]
[GROUP=2]
B Std. Error t Sig. Lower Bound Upper Bound
95% Confidence Interval
This parameter is set to zero because it is redundant.a.
93.37
)17.40*866(.)1*853(.308.2
ˆˆˆ3111
≡++=
++= XBFBAYA= Intercept/Ponto de intercepçãoB1=Group1( Maths Skills)B2=Group2 (Confidence Building)F1=Group1=1, Group2=0B3=Fost1Xbarra=média de Fost1
Média ajustada marginal para o grupo 1, maths skills
14
27Análise da Covariância
Referências*
� D’Hainaut, L. (1992). [Vol 2.; 45. Análise da covariância com uma dimensão]
� Howell, D. (1992). [Cap.16; 16.5 The one-way analysis of covariance]
� Pestana & Gageiro (2003). [Cap.4; 1.2 Análise da covariância]
� Porter & Raudenbush (1987). Analysis of covariance: Its model and use in psychological research. Journal of Counseling Psychology, 34, 383-392.
� Stevans, J. (1992). [Cap. 9].
* As Referências bibliográficas completas constam no Guia do Estudante