38
ANOVA

ANOVA. Requisitos dos testes paramétricos O primeiro requisito para utilizar a estatística paramétrica exige que seja possível realizar operações numéricas

Embed Size (px)

Citation preview

ANOVA

Requisitos dos testes paramétricos

O primeiro requisito para utilizar a estatística paramétrica exige que seja possível realizar operações numéricas sobre os dados experimentais. Não é suficiente que se possa apenas ordenar os dados, como nos testes paramétricos. As variáveis devem ser naturalmente numéricas, como uma escala contínua de tempos de leitura, ou a nota de um exame.

 

O segundo requisito obriga a que os resultados se distribuam normalmente. No entanto, como os testes paramétricos são bastante robustos, podem ser utilizados mesmo quando este pressuposto é violado, a menos que os dados tenham uma distribuição muito diferente da normal.

O terceiro requisito designa-se por homogeneidade da variância. Isto significa que a variabilidade dos resultados em cada situação deve ser sensivelmente a mesma. No entanto, este requisito perde a relevância se o número de sujeitos for o mesmo em cada situação de teste.

ANOVA

Quando se utiliza a ANOVA (Análise de variância)

ANOVA

Quando se utiliza a ANOVA (Análise de variância)

ANOVA

A ANOVA é uma técnica estatística que avalia a significância de resultados de teste. Fá-lo calculando, a partir dos resultados de uma investigação, as proporções da variância que são devidas às variáveis independentes e à interacção entre elas, e a proporção devida a todas as outras variáveis (variância de erro). Estes cálculos são designados por rácios F.

DESCRIÇÃO - I

ANOVA

Quanto maiores forem os rácios F maior será a proporção da variância que é devida aos efeitos previstos das variáveis independentes e da interacção entre elas. Quanto menores forem os rácios F maior será a proporção da variância que é devida ao erro, isto é, a variáveis desconhecidas, tal como é postulado pela hipótese nula.

DESCRIÇÃO - II

ANOVA

As tabelas estatísticas utilizadas na ANOVA apresentam--nos a percentagem de probabilidades de obtermos rácios altos ou baixos. Em geral, para um determinado número de sujeitos e de situações de teste, quanto maior for um rácio F menores são as probabilidades de se tratar de um resultado fortuito devido a variáveis irrelevantes.

DESCRIÇÃO - III

ANOVA

Após consultar as percentagens de probabilidades de obter o rácio F observado na sua investigação, pode decidir se a probabilidade de se tratar de um resultado devido ao acaso é suficientemente baixa (p<0,05 ou p<0,01) para que se possa rejeitar a hipótese nula e aceitar que os seus resultados de teste suportam as hipóteses de teste.

DESCRIÇÃO - IV

ANOVA - Método Geral

Quando existem duas ou mais variáveis independentes o objectivo é dividir a variância devida às variáveis independentes na variância devida a cada variável em separado e a quaisquer interacções entre as variáveis.

Para cada caso, a variância devida a cada variável deverá ser comparada com a variância do erro, ou seja, com a variância devido a todas as outras variáveis irrelevantes.

Obtém-se um rácio F para cada fonte de variabilidade. Quanto maior for o rácio F, mais provável será que a variabilidade nos resultados devida a essa variável seja significativa.

ANOVA - Tabela

Exemplo de tabela ANOVA

ANOVA - Tabela

Como se pode observar na tabela anterior, a ANOVA fornece-nos um método para calcular a quantidade de variância devida a todas as possíveis fontes de variabilidade nos resultados.

Permite-nos definir as proporções da variância, ou seja, a quantidade total da variância nas suas diferentes partes componentes.

ANOVA – Método (I)

1. Apresente os resultados da situação de teste numa tabela apropriada (2x2, 2x3, etc.).

2. Verifique se os resultados estão de acordo com os três pressupostos paramétricos (apresentados atrás).

3. Elabore uma tabela ANOVA para as fontes de variância, mostrando as variâncias de cada variável, as interacções, a variância do erro e variância total.

4. Calcule as somas dos quadrados (SQ), graus de liberdade (gl) e as médias dos quadrados (MQ) para cada uma das fontes de variância.

ANOVA – Método (II)

5. Calcule os rácios F para cada fonte de variância, isto é, o MQ para cada variável independente e interacção, sobre o MQ do erro da variância. Para cada rácio F indique os gl apropriados para a variável e os gl para o erro.

6. Consulte os rácios F na Tabela apropriada para verificar as probabilidades de os seus resultados poderem ser devidos a um resultado aleatório devido à variância do erro, tal como é postulado pela hipótese nula. Se essa probabilidade for inferior a 5% ou 1%, rejeite a hipótese nula e aceite que os seus resultados são significativos ao nível de significância de p<0,05 ou p<0,01.

ANOVA – Método

ESCLARECIMENTOS

1. O primeiro passo é calcular as somas dos quadrados (SQ) de todas as fontes de variância. É útil relembrar que o total de SQ para todas as variáveis, interacções e erro deve somar a SQ da variância total.

ANOVA – Método

ESCLARECIMENTOS

2. O passo seguinte é definir os graus de liberdade.

Para cada variável independente existe um número de situações experimentais que são utilizadas para testar essa variável. Assim, o número de graus de liberdade para cada variável é o número de situações menos uma (C-1). O número de graus de liberdade para a variância total é o número de resultados menos um (N-1).Os restantes são calculados como indicado na tabela seguinte:

ANOVA – Método

• Os gl para cada variável independente são calculados subtraindo um ao total das situações utilizadas para testar essa variável.

• Os graus de liberdade para as interacções são calculados pela multiplicação de todos os gl de todas as variáveis relevantes.

• Os gl para a variância total são calculados subtraindo um ao número total dos resultados produzidos por todos os casos/resultados.

• Os gl para a variância do erro são calculados pela subtracção a partir dos gl totais dos gl para todas as variáveis e interacções. É por esta razão que este erro é por vezes designado por erro residual, isto é, o que sobeja depois de todas as outras variâncias e gl terem sido calculados.

• Necessitará dos gl para dividir as somas dos quadrados e obter, assim, a média das variâncias ao quadrado; e também para poder consultar a significância dos rácios F na tabela estatística apropriada.

ANOVA - Exemplo

Considere-se a situação de teste em que se pretende avaliar o número de palavras memorizadas por um grupo de 20 alunos, sendo a situação de teste definida por duas variáveis:

Variável A – texto X ou Y

Variável B – período de estudo curto ou longo

ANOVA - Exemplo

A coluna dos graus de liberdade é preenchida da seguinte forma:

ANOVA – Método

ESCLARECIMENTOS

3. O terceiro passo é o cálculo da média dos quadrados.

Para obter a média dos quadrados (MQ) é necessário dividir a SQ pelo número apropriado de gl.

A MQ representa a quantidade de variância calculada atribuível a cada fonte de variância.

Calcula-se, depois, o rácio F pelo cociente de cada MQ pelo MQ do erro.

ANOVA – Exemplo

No exemplo anterior, os rácios F são calculados da seguinte forma:

Rácio F da variável A:

Rácio F da variável B:

Rácio F da interacção AB:

(erro) MQA) (variável MQ

(erro) MQB) (variável MQ

(erro) MQB)A o(interacçã MQ

ANOVA – Exemplo

Para consultar a tabela de rácios F, é necessário conhecer os graus de liberdade associados às MQ. Assim:

Rácio F da variável A:

Rácio F da variável B:

Rácio F da interacção AB:

(erro) MQA) (variável MQ

16,1 F

(erro) MQB) (variável MQ

16,1 F

(erro) MQB)A o(interacçã MQ

16,1

F

Em que o primeiro índice é o gl da variável ou interacção e o segundo é o gl do erro.

ANOVA – Método

ESCLARECIMENTOS

4. O último passo consiste em consultar a tabela de rácios F. Utilizam-se os gl de cada variável ou interacção, e o gl do erro. É necessário, ainda, saber qual a significância do teste (5% ou 1%).

Por fim, comparam-se os valores consultados com os valores calculados e toma-se uma decisão. Se o valor calculado for superior ao valor da tabela, rejeita-se a hipótese nula, caso contrário, aceita-se a hipótese nula.

ANOVA – Exemplo

Por consulta na tabela, obtém-se:

Supondo que os rácios calculados são:

Rácio F da variável A:

Rácio F da variável B:

Rácio F da interacção AB:

49,4%516,1 F

13,216,1 F

25,716,1 F

91,1%516,1 F

Conclui-se que apenas a variável B tem influência na variância dos resultados, para uma significância de 5%.

ANOVA I (não-relacionado)

Utiliza-se quando está a ser testada uma variável para três ou mais situações, sendo utilizados casos/indivíduos diferentes em cada uma dessas situações.

ANOVA I – Exemplo

Considere-se a variável saldo médio para as seguintes regiões: Norte, Sul, Interior. Os saldos foram obtidos de agências de povoações com menos de 100.000 habitantes.

Consulte o ficheiro

ANOVA I – Tabela

Tabela das fontes de variância para um design não relacionado (ANOVA I):

Fonte de variância SQ gl MQ Rácio F

Variável saldo (entre situações)

SQbet glbet

Erro SQerro glerro

Total SQtot gltot

bet

bet

glSQ

erro

erro

glSQ

erro

bet

MQMQ

ANOVA I – Exemplo

Instruções passo a passo para o cálculo do valor de F

São necessárias os seguintes valores:Tc

2 Soma dos totais de cada situação ao quadrado

Tc2=432+372+242

n Número de casos em cada situação n=6

N Número total de resultados N=18

(x)2 Total dos totais ao quadrado

(x)2/N Constante a subtrair a todos os SQ

x Cada resultado individual

x2 Soma dos quadrados dos resultados individuais

ANOVA I – Passo a passo

1. Cálculo de SQbet

Nx

nT

SQ cbet

22

44,3118

1046

243743 2222

betSQ

ANOVA I – Passo a passo

2. Cálculo de SQtot

Nx

xSQtot

22

11,6318

10442635476

45878659782

22222222

2222222222

totSQ

ANOVA I – Passo a passo

3. Cálculo de SQerro

bettoterro SQSQSQ

67,3144,3111,63 erroSQ

ANOVA I – Passo a passo

4. Cálculo dos graus de liberdade

bettoterro glglgl

1situações de número betgl

1Ngltot

15217 errogl

213 betgl

17118 totgl

ANOVA I – Passo a passo

5. Cálculo dos MQ

bet

betbet gl

SQMQ

erro

erroerro gl

SQMQ

72,15244,31

betMQ

11,215

67,31erroMQ

ANOVA I – Passo a passo

6. Cálculo do rácio F para MQbet

erro

bet

MQMQF 15,2 45,7

11,272,15

15,2 F

ANOVA I – Passo a passo

7. Consultar o rácio F na tabela e concluir.

Na tabela, 1=glbet e 2=glerro. Assim:

Uma vez que o valor calculado (7,45) é superior ao valor da tabela (3,68), rejeita-se a hipótese nula e conclui-se que há diferenças estatisticamente significativas entre os saldos médios das agências das três regiões consideradas.

68,3%)5(15,2 F

ANOVA I – SPSS

No SPSS, os dados devem ser organizados da seguinte forma:

Nota: a variável região tem que ser numérica (nominal).

Consulte o ficheiro

ANOVA I – SPSS

No menu, seleccionar:

Analyze Compare Means One-Way ANOVA...

Colocar a variável saldo na lista de variáveis dependentes.

Utilizar a variável região como factor.

Premir OK.

ANOVA I – SPSS

A caixa de diálogo deverá ficar com a seguinte configuração:

ANOVA I – SPSS

O resultado é o seguinte:

ANOVA

Saldo médio

31,444 2 15,722 7,447 ,00631,667 15 2,11163,111 17

Between GroupsWithin GroupsTotal

Sum ofSquares df Mean Square F Sig.

Uma vez que a significância é inferior a 0,05, rejeita-se a hipótese nula e conclui-se que há diferenças estatisticamente significativas entre os saldos médios das agências das três regiões consideradas.

Consulte o ficheiro