15
Correlação e Regressão Linear Mede o grau de dependência entre duas variáveis X e Y Cov(X,Y)=E Cov(X,Y)= - . = Se X e Y são independentes, então cov(X,Y) = 0. Coeficiente de correlação linear de Pearson: = e =

12 correlação e regressão

Embed Size (px)

Citation preview

Page 1: 12   correlação e regressão

Correlação e Regressão Linear

Mede o grau de dependência entre duas

variáveis X e Y

Cov(X,Y)=E

Cov(X,Y)= - . =

Se X e Y são independentes, então

cov(X,Y) = 0.

Coeficiente de correlação linear de

Pearson:

=

e =

Page 2: 12   correlação e regressão

Exemplo:

Calcular o coeficiente r para os dados:

Pessoa Altura (cm) Peso (kg)

1 174 73

2 161 66

3 170 64

4 180 94

5 182 79

6 164 72

7 156 62

8 168 64

9 176 90

10 175 81

Page 3: 12   correlação e regressão

Testes do Coeficiente de Correlação

: =

: ≠

Este teste pode ser feito através da

estatística :

=

,

Exemplo:

Verificar, ao nível de 5% de significância,

se existe a correlação positiva entre a

altura e o peso das pessoas na população

do exemplo anterior.

Page 4: 12   correlação e regressão

Para testar valor não nulo de :

Fisher sugere a transformação :

£ =

Esta transformação faz com que

os valores de £ tenham distribuição

bastante próxima da normal com média:

μ(£)=

e σ(£)=

Exemplo:

Considerando o exemplo anterior, construir

um intervalo de 95% de confiança para o

coeficiente de correlação populacional

entre a altura e o peso das pessoas

consideradas.

Page 5: 12   correlação e regressão

Regressão Linear Simples

A linha teórica de regressão:

.

Os parâmetros e serão estimados

através dos pontos experimentais

fornecidos pela amostra, obtendo-se uma

reta estimativa na forma:

= a + bx onde a é a estimativa do

parâmetro e b, também conhecido como

coeficiente de regressão linear, é a

estimativa do parâmetro . O símbolo é

utilizado para uma conveniente distinção

dos valores dados pela reta estimativa, em

relação às ordenadas dos pontos amostrais

Page 6: 12   correlação e regressão

Método de mínimos quadrados

Os valores a e b que minimizam esta

expressão serão aqueles que anulam suas

derivadas parciais

=0 e

=0 →

Page 7: 12   correlação e regressão

Algumas vezes é interessante fazer

codificações lineares nos valores das

variáveis para simplificar os cálculos. Por

exemplo, se fizermos as transformações

e . Obteremos a

reta na forma

Exemplo

Obter a equação da reta de mínimos quadrados

para os seguintes pontos experimentais:

X 1 2 3 4 5 6 7 8

Y 0,5 0,6 0,9 0,8 1,2 1,5 1,7 2,0

Calcular o coeficiente de correlação linear.

Reta passando pela origem

O modelo é da forma:

A reta estimativa será

Page 8: 12   correlação e regressão

→ →

Exemplo :

Se considerássemos que a reta de

regressão devesse passar pela origem no

exemplo anterior, o coeficiente seria:

Funções linearizáveis

Exemplo:

Teste de β

H0 : or

H1 : or , or , or

Pode-se demonstrar que:

e

,

Variância

Residual

Page 9: 12   correlação e regressão

Como não conhecemos , usamos

,

→ Teste de uma média

populacional com variância desconhecida

→ usa-se a estatística

p/ →

O mesmo vale para

e

e o teste do fica:

p/ →

Page 10: 12   correlação e regressão

Exemplo do teste de β

Verificar se podemos afirmar, ao nível de

5% de significância, que a reta teórica do

exemplo anterior tem uma inclinação

superior a 10%. Caso afirmativo, construir

um intervalo de confiança de 95% para o

coeficiente angular da reta real da

regressão. Ainda, ao nível de 5% de

significância, verificar se podemos eliminar

a possibilidade de a reta teórica passar

pela origem.

I.C. para e

Exemplo:

Construir Intervalos de 95% de confiança

para o valor médio de y e para a previsão

, quando , para exemplo anterior.

Page 11: 12   correlação e regressão

Regressão Polinomial

Exemplo

Ajustar a parábola de mínimos quadrados

aos dados do exemplo anterior.

Regressão Linear Multipla

Exemplo

Uma reação química foi realizada sob seis

pares de condições de pressão e

temperatura. Em cada caso, foi medido o

tempo necessário para que a reação se

completasse. Os resultados obtidos foram:

Condição Temp. Press. tempo

1 20 1,5 9,4

2 30 1,5 8,2

3 30 1,2 9,7

4 40 1,0 9,5

Page 12: 12   correlação e regressão

5 60 1,0 6,9

6 80 0,8 6,5

Obter a equação da regressão linear do

tempo em função da Temp. e Pressão.

Correlação Linear Multipla

Coeficiente de Correlação Linear Multipla é

definida como:

A Variância residual :

É n-k-1 pois foram estimados k+1 variáveis.

Exemplo

Calcular o coeficiente de correlação linear

múltipla de y em relação a e no

exemplo anterior. Calcular também a

variância residual em torno da regressão.

Correlação Parcial

Page 13: 12   correlação e regressão

Diferença entre manter constante ou

ignorar .

ignora enquanto definida como

coeficiente de correlação parcial entre e

com respeito a

Exemplo

Analisar as correlações totais e parciais no

exemplo anterior.

Problema

1)Oito alunos sorteados entre os da

segunda série de um curso de engenharia

obtiveram as seguintes notas nos exames

de Cálculo e Física

Aluno 1 2 3 4 5 6 7 8

Cálc 4,5 6,0 3,0 2,5 5,0 5,5 1,5 7,0

Fis. 3,5 4,5 3,0 2,0 5,5 5,0 1,5 6,0

Page 14: 12   correlação e regressão

Com base nestes dados, pode-se ter

praticamente 99% de certeza de que os

alunos mais bem preparados em Cálculo

também o sejam em Física?

2) Dados os valores a seguir de t (horas de

tratamento térmico) e de R (resistência à

tração de um aço em kg/mm2), a)pode-se

afirmar, ao nível de 2% de significância,

que R depende de t? b)Admitida uma

dependência linear, qual seria a equação

da reta de regressão de R em função de t?

c)Construir intervalos de 90% de confiança

para o valor médio de R e para a previsão

R’, quando t=9.

3)Um banco possui oito agências em certa

praça. Desejando verificar a afirmação de

que um maior número de funcionários leva

a uma ineficiência maior no serviço, o

gerente geral relacionou o número de

funcionários por agencia (x) e a

Page 15: 12   correlação e regressão

classificação das agências segundo sua

eficiência dentre todas as agências do

banco (y). Ao nível de 5% de significância,

qual a conclusão?

x 9 15 12 12 13 20 22 17

y 8 13 6 22 15 36 29 31

4)Numa determinada experiência, foram

obtidos os seguintes pares de valores (x,y):

a)escreva a equação da melhor reta de

regressão de y em relação a x.

b)verifique, ao nível de 5% de significância,

se existe evidência suficiente a partir dos

dados experimentais para contradizer a

hipótese de que a reta de (a) é paralela à

reta y = 1,5 – 0,45x.