3
CENTRO EDUCATIVO E DE FORMAÇÃO [email protected] - https://espacocrescer2012.wordpress.com/ MATEMÁTICA B Coeficiente de Correlação Linear de Pearson Tem-se uma variável estatística bidimensional quando, relativamente a cada elemento da população, se observa e estuda duas características distintas. Para as variáveis estatísticas X e Y, a variável estatística bidimensional é representada por (X, Y). Diagrama de dispersão – “nuvem “ de pontos – é o conjunto dos pontos do tipo (x, y) representados num referencial, onde x e y são os valores observados das variáveis X e Y, respetivamente. Quando tomamos as variáveis duas a duas, podemos verificar o que sucede a uma variável, X, quando outra variável, Y, varia. Existe correlação linear quando é possível ajustar à “nuvem” de pontos uma reta. A intensidade da associação linear existente entre as variáveis pode ser quantificada através do chamado coeficiente de correlação linear de Pearson: Onde: - r [-1, 1]; - CXY- Covariância ou variância conjunta das variáveis X e Y; - SX- desvio padrão da variável X; - SY- desvio padrão da variável Y. Covariância ou variância conjunta de variáveis: - Caso de Dados não agrupados - Caso de Dados agrupados

Coeficiente de correlação linear

Embed Size (px)

Citation preview

Page 1: Coeficiente de correlação linear

CENTRO EDUCATIVO E DE FORMAÇÃO

[email protected] - https://espacocrescer2012.wordpress.com/

MATEMÁTICA B

Coeficiente de Correlação Linear de Pearson

Tem-se uma variável estatística bidimensional quando, relativamente a cada elemento da

população, se observa e estuda duas características distintas. Para as variáveis estatísticas X e Y, a

variável estatística bidimensional é representada por (X, Y).

Diagrama de dispersão – “nuvem “ de pontos – é o conjunto dos pontos do tipo (x, y) representados

num referencial, onde x e y são os valores observados das variáveis X e Y, respetivamente.

Quando tomamos as variáveis duas a duas, podemos verificar o que sucede a uma variável, X, quando

outra variável, Y, varia. Existe correlação linear quando é possível ajustar à “nuvem” de pontos uma

reta.

A intensidade da associação linear existente entre as variáveis pode ser quantificada através do

chamado coeficiente de correlação linear de Pearson:

Onde:

- r ∈[-1, 1];

- CXY- Covariância ou variância conjunta das variáveis X e Y;

- SX- desvio padrão da variável X;

- SY- desvio padrão da variável Y.

Covariância ou variância conjunta de variáveis:

- Caso de Dados não agrupados

- Caso de Dados agrupados

Page 2: Coeficiente de correlação linear

CENTRO EDUCATIVO E DE FORMAÇÃO

[email protected] - https://espacocrescer2012.wordpress.com/

Onde:

- é o produto da média de x pela média de y

Representação gráfica de correlação de variáveis:

- Variáveis positivamente correlacionadas. Este exemplo representa a correlação no caso de ser

"perfeita" (como é o caso se considerarmos a correlação da variável x consigo própria), sendo o

coeficiente de correlação será igual a 1.

- As variáveis estão negativamente correlacionadas. Este exemplo representa a correlação caso seja

"perfeita", ou seja, o coeficiente de correlação será igual a -1.

Page 3: Coeficiente de correlação linear

CENTRO EDUCATIVO E DE FORMAÇÃO

[email protected] - https://espacocrescer2012.wordpress.com/

- As variáveis não estão correlacionadas. Este exemplo é no caso de "absoluta independência", o

coeficiente de correlação será igual a 0.

Sobre, este último caso, se não se verificar correlação linear, não significa que não se verifique outro

tipo de correlação, por exemplo, exponencial.

Qualquer que seja a correlação verificada, correlação não significa causalidade, ou seja, que uma

variável acontece porque a outra acontece.

Desvio padrão

A fórmula do desvio padrão (DP) é:

As etapas para cálculo do DP são:

Etapa 1: calcular a média.

Etapa 2: calcular o quadrado da diferença (distância) entre cada ponto e a média.

Etapa 3: somar os valores da Etapa 2.

Etapa 4: dividir pelo número de pontos.

Etapa 5: calcular a raiz quadrada.