Upload
luciano-madureira-valente
View
242
Download
3
Embed Size (px)
Citation preview
Requisitos dos testes paramétricos
O primeiro requisito para utilizar a estatística paramétrica exige que seja possível realizar operações numéricas sobre os dados experimentais. Não é suficiente que se possa apenas ordenar os dados, como nos testes paramétricos. As variáveis devem ser naturalmente numéricas, como uma escala contínua de tempos de leitura, ou a nota de um exame.
O segundo requisito obriga a que os resultados se distribuam normalmente. No entanto, como os testes paramétricos são bastante robustos, podem ser utilizados mesmo quando este pressuposto é violado, a menos que os dados tenham uma distribuição muito diferente da normal.
O terceiro requisito designa-se por homogeneidade da variância. Isto significa que a variabilidade dos resultados em cada situação deve ser sensivelmente a mesma. No entanto, este requisito perde a relevância se o número de sujeitos for o mesmo em cada situação de teste.
ANOVA
A ANOVA é uma técnica estatística que avalia a significância de resultados de teste. Fá-lo calculando, a partir dos resultados de uma investigação, as proporções da variância que são devidas às variáveis independentes e à interacção entre elas, e a proporção devida a todas as outras variáveis (variância de erro). Estes cálculos são designados por rácios F.
DESCRIÇÃO - I
ANOVA
Quanto maiores forem os rácios F maior será a proporção da variância que é devida aos efeitos previstos das variáveis independentes e da interacção entre elas. Quanto menores forem os rácios F maior será a proporção da variância que é devida ao erro, isto é, a variáveis desconhecidas, tal como é postulado pela hipótese nula.
DESCRIÇÃO - II
ANOVA
As tabelas estatísticas utilizadas na ANOVA apresentam--nos a percentagem de probabilidades de obtermos rácios altos ou baixos. Em geral, para um determinado número de sujeitos e de situações de teste, quanto maior for um rácio F menores são as probabilidades de se tratar de um resultado fortuito devido a variáveis irrelevantes.
DESCRIÇÃO - III
ANOVA
Após consultar as percentagens de probabilidades de obter o rácio F observado na sua investigação, pode decidir se a probabilidade de se tratar de um resultado devido ao acaso é suficientemente baixa (p<0,05 ou p<0,01) para que se possa rejeitar a hipótese nula e aceitar que os seus resultados de teste suportam as hipóteses de teste.
DESCRIÇÃO - IV
ANOVA - Método Geral
Quando existem duas ou mais variáveis independentes o objectivo é dividir a variância devida às variáveis independentes na variância devida a cada variável em separado e a quaisquer interacções entre as variáveis.
Para cada caso, a variância devida a cada variável deverá ser comparada com a variância do erro, ou seja, com a variância devido a todas as outras variáveis irrelevantes.
Obtém-se um rácio F para cada fonte de variabilidade. Quanto maior for o rácio F, mais provável será que a variabilidade nos resultados devida a essa variável seja significativa.
ANOVA - Tabela
Como se pode observar na tabela anterior, a ANOVA fornece-nos um método para calcular a quantidade de variância devida a todas as possíveis fontes de variabilidade nos resultados.
Permite-nos definir as proporções da variância, ou seja, a quantidade total da variância nas suas diferentes partes componentes.
ANOVA – Método (I)
1. Apresente os resultados da situação de teste numa tabela apropriada (2x2, 2x3, etc.).
2. Verifique se os resultados estão de acordo com os três pressupostos paramétricos (apresentados atrás).
3. Elabore uma tabela ANOVA para as fontes de variância, mostrando as variâncias de cada variável, as interacções, a variância do erro e variância total.
4. Calcule as somas dos quadrados (SQ), graus de liberdade (gl) e as médias dos quadrados (MQ) para cada uma das fontes de variância.
ANOVA – Método (II)
5. Calcule os rácios F para cada fonte de variância, isto é, o MQ para cada variável independente e interacção, sobre o MQ do erro da variância. Para cada rácio F indique os gl apropriados para a variável e os gl para o erro.
6. Consulte os rácios F na Tabela apropriada para verificar as probabilidades de os seus resultados poderem ser devidos a um resultado aleatório devido à variância do erro, tal como é postulado pela hipótese nula. Se essa probabilidade for inferior a 5% ou 1%, rejeite a hipótese nula e aceite que os seus resultados são significativos ao nível de significância de p<0,05 ou p<0,01.
ANOVA – Método
ESCLARECIMENTOS
1. O primeiro passo é calcular as somas dos quadrados (SQ) de todas as fontes de variância. É útil relembrar que o total de SQ para todas as variáveis, interacções e erro deve somar a SQ da variância total.
ANOVA – Método
ESCLARECIMENTOS
2. O passo seguinte é definir os graus de liberdade.
Para cada variável independente existe um número de situações experimentais que são utilizadas para testar essa variável. Assim, o número de graus de liberdade para cada variável é o número de situações menos uma (C-1). O número de graus de liberdade para a variância total é o número de resultados menos um (N-1).Os restantes são calculados como indicado na tabela seguinte:
ANOVA – Método
• Os gl para cada variável independente são calculados subtraindo um ao total das situações utilizadas para testar essa variável.
• Os graus de liberdade para as interacções são calculados pela multiplicação de todos os gl de todas as variáveis relevantes.
• Os gl para a variância total são calculados subtraindo um ao número total dos resultados produzidos por todos os casos/resultados.
• Os gl para a variância do erro são calculados pela subtracção a partir dos gl totais dos gl para todas as variáveis e interacções. É por esta razão que este erro é por vezes designado por erro residual, isto é, o que sobeja depois de todas as outras variâncias e gl terem sido calculados.
• Necessitará dos gl para dividir as somas dos quadrados e obter, assim, a média das variâncias ao quadrado; e também para poder consultar a significância dos rácios F na tabela estatística apropriada.
ANOVA - Exemplo
Considere-se a situação de teste em que se pretende avaliar o número de palavras memorizadas por um grupo de 20 alunos, sendo a situação de teste definida por duas variáveis:
Variável A – texto X ou Y
Variável B – período de estudo curto ou longo
ANOVA – Método
ESCLARECIMENTOS
3. O terceiro passo é o cálculo da média dos quadrados.
Para obter a média dos quadrados (MQ) é necessário dividir a SQ pelo número apropriado de gl.
A MQ representa a quantidade de variância calculada atribuível a cada fonte de variância.
Calcula-se, depois, o rácio F pelo cociente de cada MQ pelo MQ do erro.
ANOVA – Exemplo
No exemplo anterior, os rácios F são calculados da seguinte forma:
Rácio F da variável A:
Rácio F da variável B:
Rácio F da interacção AB:
(erro) MQA) (variável MQ
(erro) MQB) (variável MQ
(erro) MQB)A o(interacçã MQ
ANOVA – Exemplo
Para consultar a tabela de rácios F, é necessário conhecer os graus de liberdade associados às MQ. Assim:
Rácio F da variável A:
Rácio F da variável B:
Rácio F da interacção AB:
(erro) MQA) (variável MQ
16,1 F
(erro) MQB) (variável MQ
16,1 F
(erro) MQB)A o(interacçã MQ
16,1
F
Em que o primeiro índice é o gl da variável ou interacção e o segundo é o gl do erro.
ANOVA – Método
ESCLARECIMENTOS
4. O último passo consiste em consultar a tabela de rácios F. Utilizam-se os gl de cada variável ou interacção, e o gl do erro. É necessário, ainda, saber qual a significância do teste (5% ou 1%).
Por fim, comparam-se os valores consultados com os valores calculados e toma-se uma decisão. Se o valor calculado for superior ao valor da tabela, rejeita-se a hipótese nula, caso contrário, aceita-se a hipótese nula.
ANOVA – Exemplo
Por consulta na tabela, obtém-se:
Supondo que os rácios calculados são:
Rácio F da variável A:
Rácio F da variável B:
Rácio F da interacção AB:
49,4%516,1 F
13,216,1 F
25,716,1 F
91,1%516,1 F
Conclui-se que apenas a variável B tem influência na variância dos resultados, para uma significância de 5%.
ANOVA I (não-relacionado)
Utiliza-se quando está a ser testada uma variável para três ou mais situações, sendo utilizados casos/indivíduos diferentes em cada uma dessas situações.
ANOVA I – Exemplo
Considere-se a variável saldo médio para as seguintes regiões: Norte, Sul, Interior. Os saldos foram obtidos de agências de povoações com menos de 100.000 habitantes.
Consulte o ficheiro
ANOVA I – Tabela
Tabela das fontes de variância para um design não relacionado (ANOVA I):
Fonte de variância SQ gl MQ Rácio F
Variável saldo (entre situações)
SQbet glbet
Erro SQerro glerro
Total SQtot gltot
bet
bet
glSQ
erro
erro
glSQ
erro
bet
MQMQ
ANOVA I – Exemplo
Instruções passo a passo para o cálculo do valor de F
São necessárias os seguintes valores:Tc
2 Soma dos totais de cada situação ao quadrado
Tc2=432+372+242
n Número de casos em cada situação n=6
N Número total de resultados N=18
(x)2 Total dos totais ao quadrado
(x)2/N Constante a subtrair a todos os SQ
x Cada resultado individual
x2 Soma dos quadrados dos resultados individuais
ANOVA I – Passo a passo
2. Cálculo de SQtot
Nx
xSQtot
22
11,6318
10442635476
45878659782
22222222
2222222222
totSQ
ANOVA I – Passo a passo
4. Cálculo dos graus de liberdade
bettoterro glglgl
1situações de número betgl
1Ngltot
15217 errogl
213 betgl
17118 totgl
ANOVA I – Passo a passo
5. Cálculo dos MQ
bet
betbet gl
SQMQ
erro
erroerro gl
SQMQ
72,15244,31
betMQ
11,215
67,31erroMQ
ANOVA I – Passo a passo
7. Consultar o rácio F na tabela e concluir.
Na tabela, 1=glbet e 2=glerro. Assim:
Uma vez que o valor calculado (7,45) é superior ao valor da tabela (3,68), rejeita-se a hipótese nula e conclui-se que há diferenças estatisticamente significativas entre os saldos médios das agências das três regiões consideradas.
68,3%)5(15,2 F
ANOVA I – SPSS
No SPSS, os dados devem ser organizados da seguinte forma:
Nota: a variável região tem que ser numérica (nominal).
Consulte o ficheiro
ANOVA I – SPSS
No menu, seleccionar:
Analyze Compare Means One-Way ANOVA...
Colocar a variável saldo na lista de variáveis dependentes.
Utilizar a variável região como factor.
Premir OK.
ANOVA I – SPSS
O resultado é o seguinte:
ANOVA
Saldo médio
31,444 2 15,722 7,447 ,00631,667 15 2,11163,111 17
Between GroupsWithin GroupsTotal
Sum ofSquares df Mean Square F Sig.
Uma vez que a significância é inferior a 0,05, rejeita-se a hipótese nula e conclui-se que há diferenças estatisticamente significativas entre os saldos médios das agências das três regiões consideradas.
Consulte o ficheiro