31
1 ESTATÍSTICA MULTIVARIADA Teórica 7 CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

ESTATÍSTICA MULTIVARIADA Teórica 7icm.clsbe.lisboa.ucp.pt/docentes/url/jfr/em/121001 Aula 7...JFR ESTATÍSTICA MULTIVARIADA 6 Podemos então perguntar: Que tipo de associação existe

  • Upload
    hanhu

  • View
    237

  • Download
    0

Embed Size (px)

Citation preview

1

ESTATÍSTICA MULTIVARIADA – Teórica 7 CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES

2 JFR ESTATÍSTICA MULTIVARIADA

Correlação

3 JFR ESTATÍSTICA MULTIVARIADA 3

Que relação existe duas variáveis?

Análise de Correlação Bivariada

4 JFR ESTATÍSTICA MULTIVARIADA

Exemplo

No último ano fiscal registaram-se, para quinze empresas (n=15) dum mesmo sector :

X Cash-flow

Y Resultados Líquidos

Obtiveram-se as seguintes observações (em milhares de

euros):

5 JFR ESTATÍSTICA MULTIVARIADA

(103 € )

Empresa

i

Cash-flow

X

Resultados Líquidos

Y

1 126.5 82.6

2

3

191.2

267.0

89.0

176.0

4

5

137.1

806.8

82.3

413.5

6 35.2 18.1

7 425.5 337.3

8

9

380.0

326.6

145.8

172.6

10

11

355.5

368.1

247.2

86.4

12 240.8 312.3

13 649.6 283.7

14 553.2 212.4

15 523.4 156.1

Exemplo

6 JFR ESTATÍSTICA MULTIVARIADA

Podemos então perguntar:

Que tipo de associação existe entre o cash-flow e os resultados líquidos?

Será que a valores altos do cash-flow correspondem valores também altos para os resultados?

Ou será ao contrário?

Ou será que não há qualquer relação entre a grandeza do cash-flow e dos resultados?

7 JFR ESTATÍSTICA MULTIVARIADA

Averiguar da associação entre as duas variáveis:

– Graficamente;

– Quantificando essa associação através de indicadores

apropriados.

Pressupõe

− Que ambas são quantitativas (escala de intervalos

ou de rácios)

NÃO pressupõe

– qualquer relação de dependência entre as variáveis.

Análise de Correlação

8 JFR ESTATÍSTICA MULTIVARIADA

- empresas com CF mais

baixos têm RL mais baixos;

0

50

100

150

200

250

300

350

400

450

0 200 400 600 800 1000

X

(Cash-flow)

Y

(Resultados

Líquidos)

Representando as duas variáveis:

O gráfico põe em evidência

uma associação positiva:

- empresas com CF mais

altos têm RL mais altos;

É o caso das empresas 6 ou 2

(35.2 , 18.1)

(191.2 , 89.0)

2 6

5

7

É o caso das empresas 5 ou 7

(806.8 , 413.5)

(425.5 , 337.3)

9 JFR ESTATÍSTICA MULTIVARIADA

0

50

100

150

200

250

300

350

400

450

0 200 400 600 800 1000

X

(Cash-flow)

Y

(Resultados

Líquidos)

Empresas com um CF inferior

têm um desvio negativo

(em relação à média do grupo)

A média do CF vem:

15

i

i 1

x5 364.5

X 357.6315 15

X

iX X

Empresas com um CF superior

têm um desvio positivo

(em relação à média do grupo)

E o que são valores “altos” ou “baixos”?

Cash-flows “altos” são os que

forem superiores à respetiva

média; “baixos” são os que

forem inferiores.

10 JFR ESTATÍSTICA MULTIVARIADA

0

50

100

150

200

250

300

350

400

450

0 200 400 600 800 1000

X

(Cash-flow)

Y

(Resultados

Líquidos)

E o que são valores “altos” ou “baixos”?

X

Y

Também os Resultados

Líquidos comparam com a

respetiva média:

A média do RL vem:

15

i

i 1

Y2 834.3

Y 188.9515 15

Ficamos com o desvio conjunto

que pode ser positivo (+ +) (--)

ou negativo (+ -) (- +).

11 JFR ESTATÍSTICA MULTIVARIADA

0

50

100

150

200

250

300

350

400

450

0 200 400 600 800 1000

X

(Cash-flow)

Y

(Resultados

Líquidos)

Com o desvio conjunto calculamos a covariância:

X

Y

n

i i

i 1X,Y

X X Y Y

COVn 1

n

i i

i 1

X Y n XY

n 1

1254 448.5 357.63 188.95

14

17 200.59

12 JFR ESTATÍSTICA MULTIVARIADA

0

50

100

150

200

250

300

350

400

450

0 200 400 600 800 1000

X

(Cash-flow)

Y

(Resultados

Líquidos)

Com a qual podemos calcular uma medida absoluta:

X

Y

X,Y

X,Y

X Y

COVr

s s

17 200.59

210.27 112.18

Coeficiente de correlação

linear de Pearson:

0.7292 72.92%

X,Y-1 r 1

13 JFR ESTATÍSTICA MULTIVARIADA

Regressão Linear Simples

14 JFR ESTATÍSTICA MULTIVARIADA

(103 € )

t PUB VEND

1 8.0 59

2 10.0 65

3 11.5 75

4 13.0 80

5 14.0 88

6 12.7 81

7 13.5 85

8 17.0 100

9 17.9 110

10 19.0 120

15 JFR ESTATÍSTICA MULTIVARIADA

50

60

70

80

90

100

110

120

130

5 10 15 20

PUB 103 €

VEND

103 €

16 JFR ESTATÍSTICA MULTIVARIADA

50

60

70

80

90

100

110

120

130

5 10 15 20

PUB 103 €

VEND

103 €

EMML

2012/13

IMQ - Correlação e Regressão - JFR

17 JFR ESTATÍSTICA MULTIVARIADA

50

60

70

80

90

100

110

120

130

5 10 15 20

PUB 103 €

VEND

103 €

18 JFR ESTATÍSTICA MULTIVARIADA

50

60

70

80

90

100

110

120

130

5 10 15 20

PUB 103 €

VEND

103 €

19 JFR ESTATÍSTICA MULTIVARIADA

50

60

70

80

90

100

110

120

130

5 10 15 20

PUB 103 €

VEND

103 €

20 JFR ESTATÍSTICA MULTIVARIADA

50

60

70

80

90

100

110

120

130

5 10 15 20

PUB 103 €

VEND

103 €

21 JFR ESTATÍSTICA MULTIVARIADA

Modelo linear

i 1 2 i iY X

vai ser estimado por

i 1 2 iY b b X

22 JFR ESTATÍSTICA MULTIVARIADA

Regra: Desvios positivos compensam

erro médio = 0

a reta passa no ponto médio

os desvios negativos i i iˆe (Y Y)

n

i i

i 1

ˆ(Y Y) 0

23 JFR ESTATÍSTICA MULTIVARIADA

50

60

70

80

90

100

110

120

130

5 10 15 20

PUB 103 €

VEND

103 €

24 JFR ESTATÍSTICA MULTIVARIADA

50

60

70

80

90

100

110

120

130

5 10 15 20

PUB 103 €

VEND

103 €

25 JFR ESTATÍSTICA MULTIVARIADA

Regra: Minimização dos erros quadrados

Min ei2

OLS (Ordinary Least Squares)

n n2 2

i i i

i 1 i 1

ˆe (Y Y)

i 1 2 iY b b X

n2

i 1 2 i

i 1

(Y b b X )

26 JFR ESTATÍSTICA MULTIVARIADA

Regra: Minimização dos erros quadrados

Min ei2

OLS (Ordinary Least Squares)

n

i i

i 12 n

22

i

i 1

X Y n X Y

b

X n X

1 2b Y b X

XY

2

X

COV

s

27 JFR ESTATÍSTICA MULTIVARIADA

(103 € )

t PUB (X) VEND (Y) X·Y X2 Y2

1 8.0 59 472,0 64,0 3 481,0

2 10.0 65 650,0 100,0 4 225,0

3 11.5 75 862,5 132,3 5 625,0

4 13.0 80 1 040,0 169,0 6 400,0

5 14.0 88 1 232,0 196,0 7 744,0

6 12.7 81 1 028,7 161,3 6 561,0

7 13.5 85 1 147,5 182,3 7 225,0

8 17.0 100 1 700,0 289,0 10 000,0

9 17.9 110 1 969,0 320,4 12 100,0

10 19.0 120 2 280,0 361,0 14 400,0

136,6 863,0 12 381,7 1 975,2 77 761,0

28 JFR ESTATÍSTICA MULTIVARIADA

2 2

12 381.7 10 13.66 86.3b

1975.2 10 13.66

1b 86.3 5.4293 13.66 12.1358

n

i

i 1

X 136.6

n

i

i 1

Y 863.0

X 13.66

Y 86.3

n

i i

i 1

X Y 12 381.7

n2

i

i 1

X 1975.2

n2

i

i 1

Y 77 761.0

12 381.7 11788.58

1975.2 1865.956

593.125.4293

109.244

i iY 12.1358 5.4293 X

29 JFR ESTATÍSTICA MULTIVARIADA

(103 € )

t PUB (X) VEND (Y) ^Y e

1 8.0 59 55.57 3.42

2 10.0 65 66.43 -1.43

3 11.5 75 74.57 0.43

4 13.0 80 82.72 -2.72

5 14.0 88 88.15 -0.15

6 12.7 81 81.09 -0.09

7 13.5 85 85.42 -0.43

8 17.0 100 104.43 -4.43

9 17.9 110 109.32 0.68

10 19.0 120 115.29 4.71

136.6 863.0 863.00 0.00

30 JFR ESTATÍSTICA MULTIVARIADA

(103 € )

t PUB (X) VEND (Y) ^Y e

1 8.0 59 55.57 3.42

2 10.0 65 66.43 -1.43

3 11.5 75 74.57 0.43

4 13.0 80 82.72 -2.72

5 14.0 88 88.15 -0.15

6 12.7 81 81.09 -0.09

7 13.5 85 85.42 -0.43

8 17.0 100 104.43 -4.43

9 17.9 110 109.32 0.68

10 19.0 120 115.29 4.71

136.6 863.0 863.00 0.00

^Y2 e2

3 088.0 11.764

4 412.8 2.041

5 561.1 0.183

6 842.0 7.380

7 769.7 0.021

6 575.2 0.008

7 298.5 0.186

10 906.4 19.660

11 950.9 0.462

13 292.4 22.160

77 697.1 63.865

31 JFR ESTATÍSTICA MULTIVARIADA

SST SSR SSE

n n n22

2

i i i

i 1 i 1 i 1

ˆY Y Y Y e

n n n

2 22 2 2

i i i

i 1 i 1 i 1

ˆY nY Y nY e

2 277 761.0 10 86.3 77 697.1 10 86.3 63.865

2 3 220.2 63.865R 1 98.1%

3 284.1 3 284.1

3 284.1 3 220.2 63.865