39
Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Embed Size (px)

Citation preview

Page 1: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Prof. Ivan Balducci

FOSJC / Unesp

CORRELAÇÃO linear de Pearson

( r )

Page 2: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Correlação: Há um Relacionamento entre as variáveis?

Elas vão juntas? Aumentando uma variável, então aumenta também a outra?

Exº de variáveis

X ... Horas de estudo

Y ... Notas na Prova

Page 3: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Exemplo 1: Notas vs Horas de estudo

• Variável independente é o número de horas estudadas.

• A nota do aluno é a var. dependente.

• A nota do aluno depende do nº de horas que ele estuda?

• Essas variáveis se relacionam?

752F

683E

885D

571C

632B

826A

NotaHoras estudadas

Aluno

Page 4: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Diagrama de Dispersão

• Por convenção, a variável independente é considerada no eixo horizontal x.

• A dependente é considerada no eixo vertical y.

Page 5: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Exemplo de Diagrama de Dispersão

Horas Notas

1 57

2 63

2 75

3 68

5 88

6 82

C1

C2

6543210

90

85

80

75

70

65

60

55

50

75

68

88

57

63

82

Diagrama de Dispersão: Notas vs Horas de Estudo

C1: Horas de Estudo ; C2: Notas dos Alunos

Page 6: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Correlação Positiva Linear

x x

yy y

x(a) Positiva (b) Forte

positiva(c) Perfeita positiva

Page 7: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Correlação Negativa Linear

x x

yy y

x(d) Negative (e) Strong

negative(f) Perfect

negative

Page 8: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Correlação Não Linear

x x

yy

(g) Nenhuma Correlação (h) Correlação Não linear

Page 9: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Exemplos Quanto à Intensidade do Relacionamento

Page 10: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Definição:

Coeficiente Correlação Linear r

• Mede a força do relacionamento linear entre valores pareados x e y na amostra

Page 11: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

nxy – (x)(y)

n(x2) – (x)2 n(y2) – (y)2r =

•Calculadoras Científicas (estatística)

podem calcular r

Fórmula do Coeficiente de Correlação Linear

Page 12: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Notação: Coeficiente de Correlação Linear

n número de pares de dados presentes.

soma.

x soma de todos os valores de x.

x2 indica que cada x deve ser elevado ao quadrado e então aqueles quadrados somados.

(x)2 indica que x deve ser somado e o total é elevado ao quadrado.

xy indica que cada x deve ser primeiro multiplicadopor seu

correspondente y. Após obter todos os produtos, somamos.

r coeficiente correlação linear para a amostra

Page 13: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Exemplo 2: Idade vs Pressão

• Dados de idade e pressão sanguínea.

• Calculamos: x, y, xy, x2 e y2.

2310449001064015270F

1124432039947634819345Soma

198814489944714167E

204493721872314361D

182253136756013556C

144002304576012048B

163841849550412843A

BP2age2Age*BP

Blood Pressure

AgeAluno

Page 14: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Exemplo 2: Cálculo de r

• Substituímos na fórmula e resolvemos para r:r= {(6*47634)-(345*819)}/{[(6*20399)-3452]

[(6*112443)-8192]}0.5.

r= 0.897 = 0.90 aprox.

• O coeficiente de correlação sugere um relacionamento forte positivo entre a idade e a pressão sanguínea.

Page 15: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

interpretação do “r”

• A correlação é 0.9• Há um

relacionamento positivo e forte

• entre idade e pressão sanguínea

AgeBlood Pressure 0.90

Page 16: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Propriedades de r

1. –1 r 1

2. Valor de r não muda se todos os valores de ambas variáveis mudam (são convertidos) para a diferentes escalas

3. Trocando todos os valores x e y não mudarão r

4. r mede a força de um relacionamento linear

Page 17: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Erros Comuns sobre Correlação

1. Evite concluir que uma correlação entre duas variáveis implica em causalidade.

2. Nenhum relacionamento linear não implica nenhum relacionamento. Há uma

possibilidade de um relacionamento não linear.

Page 18: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Correlação

O que se pode dizer sobre a intensidade do relacionamento entre x e y ?

A magnitude refere-se à força de associação entre x e y. Por exemplo:

Correlação Interpretação

r = 0.00 Não há relacionamento entre x e y

r = 0.20 Baixo, relacionamento entre x e y

r = 0.40 Moderado relacianamento entre x e y

r = 0.70 Alto relacionamento entre x e y

r = 1.00 Perfeita correspondência entre x e y

Page 19: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Correlação

Quanto à direção da relação entre x e y ?

A direção se refere ao como os altos e baixos valores em x e y estão associados. Por exemplo:

Positiva Negativa NenhumaCorrelação Correlação Correlação r = +1.0 r = -1.0 r = 0.00

x x x

yyy

Page 20: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

RegressãoRegressão

Page 21: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Regressão

• Analisa o relacionamento entre uma dependente variável e uma

independente variável. • Tenta explicar o relacionamento por

ajustar uma linha (relacionamento linear).

• É estabelecida uma equação: Y = a + bx

dependente independente

Page 22: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Linha de Regressão e Equação de RegressãoV

ariá

vel D

epen

den

te (

Y)

Variável Independente (X)

Intercepto = a

Inclinação = b

Regressão equação:

Y = a + b.X

Page 23: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Modelo Regressão Linear

Uma linha reta que melhor ajusta ou descreve os dados é dada pela equação:

Y = a + bX

a = é o intercepto em Y (valor de Y quando X = 0)

b = é a inclinação da linha (taxa de mudança)

Page 24: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Exemplo 1: nº de Frangos vs Batata frita

Predizer o consumo french fries em função do nº de frangos consumidos

Jantar nº Frangos nº fries 1 1 152 3 303 7 404 2 295 4 356 3 32

Page 25: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Exemplo 1: nº de Frangos vs Batata frita

a = 18,34b = 3,55

r = 0,87

0

10

20

30

40

50

0 1 2 3 4 5 6 7 8

Frangos

fri

es

Page 26: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Exemplo 2: Relacionamento

Altura e Teor da droga das folhas

Y: variável Dependente – teor da droga

X: variável Independente – altura da folha

Page 27: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Equação de Regressão

Pode-se predizer o teor da droga a partir da posição

da folha

variável Dependente

Independente

teor da droga posição da folha

Page 28: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

X: Altura (m) Y:Droga (mg/g folha seca)

1.3 811.9 652.4 612.6 693.0 773.7 444.1 454.3 464.9 395.6 496.2 316.8 287.0 467.4 318.6 38

Exemplo 2: Altura das folhas e o teor das drogas

Page 29: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Avaliação

Gráfica Inicial

Fazemos um gráfico para garantir que não estamos

diante de algum relacionamento não linear

Page 30: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

É Importante Traçar o Diagrama de Dispersão

Page 31: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Quarteto de AnscombeEm todos os 4 casos:

Y =3+0,5X e rxy=0,816

Page 32: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

987654321

80

70

60

50

40

30

Height

Dru

gTeor da droga versus Altura

da folhaD

rog

a

( m

g/g

)

Altura (m)

É razoável considerar linear

Exemplo 2

Page 33: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

987654321

80

70

60

50

40

30

20

10

Height

Dru

gEscolhendo a linha de melhor

ajuste

Desvio do ponto à linha

Page 34: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Equação de Regressão

Teor (mg/g) = 79,3 - 6,30 x Altura (m)

987654321

80

70

60

50

40

30

Height

Dru

g

O sinal menos indica um negativo relacionamento entre concentração da droga e altura. A figura apresenta uma inclinação negativa

Exemplo 5

Page 35: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Predizendo o teor da droga

Predizer a concentração da droga em uma folha situada a uma altura de 5 m da árvore …

Teor = 79,3 - 6,30 x Altura

= 79,3 - 6,30 x 5

= 79,3 - 31,5

= 47,8

Concentração Prevista da droga = 47,8 mg/g

Exemplo 2

Page 36: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Extrapolação

Predizer o teor da droga em uma folha colhida a 15 m da árvore …

Teor da droga = 79,3 - 6,30 x Altura

= 79,3 - 6,30 x 15

= 79,3 - 94,5

= -15,2 mg/g !?!?!

resultado sem sentido

Exemplo 2

Page 37: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

121086420

100

90

80

70

60

50

40

30

20

10

0

Height

Dru

g

Interpolação ExtrapolaçãoExtrapolação

Interpolação versus Extrapolação

Exemplo 2

Page 38: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Interpolação vs Extrapolação

A Interpolação, em geral, é muito segura.

A Extrapolação só é válida quando pode-se garantir relacionamento linear além da região de observação.

Exemplo 2 (os teores seriam negativos em qualquer folha acima

de 12 m)

Page 39: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )

Correlaçãobaixa

moderada

forte

Termos que devem ser familiares

Regressão Linearinclinação

interpolação

extrapolação

Diagrama de dispersão