View
39
Download
2
Embed Size (px)
Citation preview
CENTRO EDUCATIVO E DE FORMAÇÃO
[email protected] - https://espacocrescer2012.wordpress.com/
MATEMÁTICA B
Coeficiente de Correlação Linear de Pearson
Tem-se uma variável estatística bidimensional quando, relativamente a cada elemento da
população, se observa e estuda duas características distintas. Para as variáveis estatísticas X e Y, a
variável estatística bidimensional é representada por (X, Y).
Diagrama de dispersão – “nuvem “ de pontos – é o conjunto dos pontos do tipo (x, y) representados
num referencial, onde x e y são os valores observados das variáveis X e Y, respetivamente.
Quando tomamos as variáveis duas a duas, podemos verificar o que sucede a uma variável, X, quando
outra variável, Y, varia. Existe correlação linear quando é possível ajustar à “nuvem” de pontos uma
reta.
A intensidade da associação linear existente entre as variáveis pode ser quantificada através do
chamado coeficiente de correlação linear de Pearson:
Onde:
- r ∈[-1, 1];
- CXY- Covariância ou variância conjunta das variáveis X e Y;
- SX- desvio padrão da variável X;
- SY- desvio padrão da variável Y.
Covariância ou variância conjunta de variáveis:
- Caso de Dados não agrupados
- Caso de Dados agrupados
CENTRO EDUCATIVO E DE FORMAÇÃO
[email protected] - https://espacocrescer2012.wordpress.com/
Onde:
- é o produto da média de x pela média de y
Representação gráfica de correlação de variáveis:
- Variáveis positivamente correlacionadas. Este exemplo representa a correlação no caso de ser
"perfeita" (como é o caso se considerarmos a correlação da variável x consigo própria), sendo o
coeficiente de correlação será igual a 1.
- As variáveis estão negativamente correlacionadas. Este exemplo representa a correlação caso seja
"perfeita", ou seja, o coeficiente de correlação será igual a -1.
CENTRO EDUCATIVO E DE FORMAÇÃO
[email protected] - https://espacocrescer2012.wordpress.com/
- As variáveis não estão correlacionadas. Este exemplo é no caso de "absoluta independência", o
coeficiente de correlação será igual a 0.
Sobre, este último caso, se não se verificar correlação linear, não significa que não se verifique outro
tipo de correlação, por exemplo, exponencial.
Qualquer que seja a correlação verificada, correlação não significa causalidade, ou seja, que uma
variável acontece porque a outra acontece.
Desvio padrão
A fórmula do desvio padrão (DP) é:
As etapas para cálculo do DP são:
Etapa 1: calcular a média.
Etapa 2: calcular o quadrado da diferença (distância) entre cada ponto e a média.
Etapa 3: somar os valores da Etapa 2.
Etapa 4: dividir pelo número de pontos.
Etapa 5: calcular a raiz quadrada.