Coeficiente de correlação linear

Preview:

Citation preview

CENTRO EDUCATIVO E DE FORMAÇÃO

espacocrescer2012@gmail.com - https://espacocrescer2012.wordpress.com/

MATEMÁTICA B

Coeficiente de Correlação Linear de Pearson

Tem-se uma variável estatística bidimensional quando, relativamente a cada elemento da

população, se observa e estuda duas características distintas. Para as variáveis estatísticas X e Y, a

variável estatística bidimensional é representada por (X, Y).

Diagrama de dispersão – “nuvem “ de pontos – é o conjunto dos pontos do tipo (x, y) representados

num referencial, onde x e y são os valores observados das variáveis X e Y, respetivamente.

Quando tomamos as variáveis duas a duas, podemos verificar o que sucede a uma variável, X, quando

outra variável, Y, varia. Existe correlação linear quando é possível ajustar à “nuvem” de pontos uma

reta.

A intensidade da associação linear existente entre as variáveis pode ser quantificada através do

chamado coeficiente de correlação linear de Pearson:

Onde:

- r ∈[-1, 1];

- CXY- Covariância ou variância conjunta das variáveis X e Y;

- SX- desvio padrão da variável X;

- SY- desvio padrão da variável Y.

Covariância ou variância conjunta de variáveis:

- Caso de Dados não agrupados

- Caso de Dados agrupados

CENTRO EDUCATIVO E DE FORMAÇÃO

espacocrescer2012@gmail.com - https://espacocrescer2012.wordpress.com/

Onde:

- é o produto da média de x pela média de y

Representação gráfica de correlação de variáveis:

- Variáveis positivamente correlacionadas. Este exemplo representa a correlação no caso de ser

"perfeita" (como é o caso se considerarmos a correlação da variável x consigo própria), sendo o

coeficiente de correlação será igual a 1.

- As variáveis estão negativamente correlacionadas. Este exemplo representa a correlação caso seja

"perfeita", ou seja, o coeficiente de correlação será igual a -1.

CENTRO EDUCATIVO E DE FORMAÇÃO

espacocrescer2012@gmail.com - https://espacocrescer2012.wordpress.com/

- As variáveis não estão correlacionadas. Este exemplo é no caso de "absoluta independência", o

coeficiente de correlação será igual a 0.

Sobre, este último caso, se não se verificar correlação linear, não significa que não se verifique outro

tipo de correlação, por exemplo, exponencial.

Qualquer que seja a correlação verificada, correlação não significa causalidade, ou seja, que uma

variável acontece porque a outra acontece.

Desvio padrão

A fórmula do desvio padrão (DP) é:

As etapas para cálculo do DP são:

Etapa 1: calcular a média.

Etapa 2: calcular o quadrado da diferença (distância) entre cada ponto e a média.

Etapa 3: somar os valores da Etapa 2.

Etapa 4: dividir pelo número de pontos.

Etapa 5: calcular a raiz quadrada.

Recommended