Correlação e Regressão Correlação entre variá .Correlação e Regressão O coeficiente de correlação

  • View
    214

  • Download
    0

Embed Size (px)

Text of Correlação e Regressão Correlação entre variá .Correlação e Regressão O coeficiente de...

1

Correlao e Regresso

Uma vez definida a associao entre duas variveis podemos identificar uma

equacao que melhor se ajusta aos dados e podemos usar essa equacao para

predizer o valor de uma variavel, conhecendo-se a outra.

Correlao entre variveis

Existe uma correlacao entre duas variaveis quando os valores de uma

variavel estao relacionados, de alguma maneira, com os valores da outra

variavel.

2

Correlao e Regresso

Diagramas de disperso

Explorao dos dados

Elementary Statistics, Mario F Triola 11th Edition

(b)

3

Correlao e Regresso

O coeficiente de correlacao linear r mede a forca da correlacao linear entre

valores quantitativos emparelhados de x e y em uma amostra.

Coeficiente de correlao linear

Dada qualquer colecao de dados quantitativos emparelhados, o coeficiente de

correlacao linear (r) pode sempre ser calculado, mas os seguintes requisitos

devem ser satisfeitos ao se usarem dados amostrais para se tirar uma conclusao

sobre correlacao na populacao ():

1) Amostra aleatria simples

2) Distribuio normal bivariada

Exame visual do diagrama de disperso

sugere padro de reta

Ausncia de outliers

4

2222 .)(

yynxxn

yxxynr

Coeficiente de correlao linear (Pearson)

Notao: N: nmero de pares de dados amostrais. x: soma dos valores x. y: soma dos valores y. x2: soma dos valores x2.

xy: soma dos valores dos produtos dos pares xy. r : coeficiente correlao linear para amostras. : coeficiente correlao linear para populao.

Se o valor absoluto de r, denotado por |r|,

exceder o valor na Tabela de valores de r,

conclua que ha uma correlacao linear.

Caso contrario, nao ha evidencia

suficiente para apoiar a conclusao da

existencia de uma correlacao.

5

Correlao e Regresso

Clculo do coeficiente de correlao linear (r)

Coeficiente de correlao linear

6

Correlao e Regresso

1) Os valores de r esto sempre compreendidos no intervalo -1 r +1

2) O valor de r no alterado se todos os valores de qualquer uma das

variveis forem convertidos para outra escala

3) O valor de r no afetado pela escolha de x como y ou vice-versa

4) r mede a intensidade de uma correlao linear

5) r muito sensvel a valores atpicos

Propriedades do coeficiente de correlao r

Encontre o valor do coeficiente de correlacao linear r para os custos

emparelhados pizza/tarifa do metr apresentados na Tabela abaixo e

conclua se existe associao entre eles.

7

Correlao e Regresso

Exemplo

Elementary Statistics, Mario F Triola 11th

Edition

Requisitos (apenas para o caso de teste de hiptese)

1) Os dados so uma amostra aleatria simples de dados quantitativos

2) Os pontos do diagrama de disperso se aproximam de uma reta

3) No h outliers

8

X (pizza) Y (metr) x2 y2 xy

0,15 0,15 0,0225 0,0225 0,0225

0,35 0,35 0,1225 1,1225 0,1225

1,00 1,00 1,00 1,00 1,00

1,25 1,35 1,5625 1,8225 1,6875

1,75 1,5 3,0625 2,25 2,6250

2,00 2,00 4,00 4,00 4,00

x=6,5 y=6,35

x2 =9,77

y2 =9,2175

xy=9,4575

9

2222 .

yynxxn

yxxynr

Usando a frmula do Coeficiente de correlao linear

22 35,62175,96.)5,6()77,9(6

)35,6).(5,6()4575,9(6

r

988,0r

10

Tabela de valores crticos do coeficiente de Correlao de Pearson

11

Correlao e Regresso

Por meio da tabela de valores crticos

Interpretao do coeficiente de correlao linear (r)

Elementary Statistics, Mario F Triola 11th Edition

12

Correlao e Regresso

Aplicao 1

Encontre o valor do coeficiente de correlaca o linear r para os custos

emparelhados pizza/tarifa do metr apresentados na Tabela abaixo e conclua se

existe associao entre eles. Elementary Statistics, Mario F Triola 11th Edition

13

Correlao e Regresso

O valor de r2 e a proporcao da variacao em y que e explicada pela relacao

linear entre x e y.

Por meio do conceito de variao explicada

Interpretao do coeficiente de correlao linear (r)

Cuidado!

1) Correlao no implica causalidade

2) Correlao no pode ser baseada em dados obtidos de mdias. As mdias

suprimem a variao individual e isso pode aumentar o coeficiente de

correlao

3) Se no h correlao linear, pode existir outra correlao que no seja

linear