101
1 Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. Prof. Lorí Viali, Dr. [email protected] [email protected] [email protected] [email protected] http://www.mat.ufrgs.br/~viali/ http://www.mat.ufrgs.br/~viali/ http://www.mat.ufrgs.br/~viali/ http://www.mat.ufrgs.br/~viali/

Prof. Lorí Viali, Dr. [email protected] ...euler.mat.ufrgs.br/~viali/estatistica/mat2246/material/laminas/Cor... · 3 Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática

  • Upload
    vucong

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

1

Prof. Lorí Viali, Dr.Prof. Lorí Viali, Dr.Prof. Lorí Viali, Dr.Prof. Lorí Viali, [email protected]@[email protected]@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/

2

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

É o grau de associação entre

duas ou mais variáveis. Pode ser:

correlacionalcorrelacionalcorrelacionalcorrelacional

ou

experimentalexperimentalexperimentalexperimental.

3

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Numa relação experimental os

valores de uma das variáveis são

controlados.

No relacionamento correlacional,por outro lado, não se tem nenhumcontrole sobre as variáveis sendoestudadas.

4

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

5

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Um engenheiro químico está

investigando o efeito da temperatura

de operação do processo no

rendimento do produto. O estudo

resultou nos dados da tabela

seguinte:

6

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Temperatura, C0 (X) Rendimento (Y)100 45110 51120 54130 61140 66150 70160 74170 78180 85190 89

7

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O primeiro passo para

determinar se existe relacionamento

entre as duas variáveis é obter o

diagramadiagramadiagramadiagrama dededede dispersãodispersãodispersãodispersão (scatter

diagram).

8

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

25

50

75

100

100 120 140 160 180 200

Temperatura (X)

Rendimento

(Y)

9

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O diagrama de dispersão

fornece uma idéia do tipo de

relacionamento entre as duas

variáveis. Neste caso, percebe-se que

existe um relacionamentorelacionamentorelacionamentorelacionamento linearlinearlinearlinear.

10

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Quando o relacionamento

entre duas variáveis

quantitativas for do tipo linearlinearlinearlinear,

ele pode ser medido através do:

11

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

12

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Observado um relacionamentorelacionamentorelacionamentorelacionamento

linearlinearlinearlinear entre as duas variáveis é possível

determinar a intensidade deste

relacionamento. O coeficiente que mede

este relacionamento é denominado de

Coeficiente de Correlação (linear).

13

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Quando se está trabalhando com

amostras o coeficiente de correlação é

indicado pela letra “rrrr” e é uma

estimativa do coeficiente de correlação

populacional que é representado por

“ρρρρ” (rho).

14

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

15

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Para determinar o coeficiente de

correlação (grau de relacionamento

linear entre duas variáveis) vamos

determinar inicialmente a variação

conjunta entre elas, isto é, a

covariância.

16

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A covariância entre duas

variáveis X e Y, é representada

por “Cov(XCov(XCov(XCov(X;;;; Y)Y)Y)Y)” e calculada por:

1n

)YY)(XX()Y,X(Cov ii

∑ −−=

17

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Mas

∑ −=

=+∑ −−=

=∑+∑ ∑−∑−=

=∑+∑ ∑−∑−=

=+∑ −−=

=∑ −−

YXnYX

YXnYXnYXnYX

YXXYYXYX

YXYXYXYX

]YXYXYXYX[

)YY)(XX(

ii

ii

iiii

iiii

iiii

ii

18

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Então:

1n

YXnYX

1n

)YY)(XX()Y,X(Cov

ii

ii

∑ −=

=−

∑ −−=

19

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A covariância poderia ser utilizada

para medir o graugraugraugrau e o sinalsinalsinalsinal do

relacionamento entre as duas variáveis,

mas ela é difícil de interpretar por variar

de -∞ a +∞. Assim vamos utilizar o

coeficientecoeficientecoeficientecoeficiente dededede correlaçãocorrelaçãocorrelaçãocorrelação linearlinearlinearlinear dededede

PearsonPearsonPearsonPearson.

20

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O coeficiente de correlação

linear (de Pearson) é definido por:

SS YX

)Y,X(Cov r =

21

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Onde:

1n

YnY S

1n

XnX S

1n

YXnYX )Y,X(Cov

22i

Y

22i

X

ii

∑ −=

∑ −=

∑ −=

22

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Esta expressão não é muito

prática para calcular manualmente o

coeficiente de correlação. Pode-se obter

uma expressão mais conveniente para

o cálculo manual e o cálculo de outras

medidas necessárias mais tarde.

23

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

( )( )∑ −∑ −

∑ −=

=

∑ −

∑ −

∑ −

=

==

YnYXnX

YXnYX

1nYnY

1n

XnX

1n

YXnYX

SS

)Y,X(Cov r

22i

22i

ii

22i

22i

ii

YX

24

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Fazendo:

S.S

S r :seTem

YnYS

XnXS

YXnYXS

YYXX

XY

22iYY

22iXX

iiXY

=−

∑ −=

∑ −=

∑ −=FFFFaaaazzzzeeeennnnddddoooo

25

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A vantagem do coeficiente de

correlação (de Pearson) é ser

adimensional e variar de – 1 a + 1,

que o torna de fácil interpretação.

26

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Assim se r = -1, temos uma

relacionamento linear negativo

perfeito, isto é, os pontos estão todos

alinhados e quando X aumenta Y

decresce e vice-versa.

27

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

10

20

30

40

50

10 15 20 25 30

1r −=

28

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Se r = +1, temos uma

relacionamento linear positivo

perfeito, isto é, os pontos estão todos

alinhados e quando X aumenta Y

também aumenta.

29

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

10

20

30

40

50

10 15 20 25 30

1r +=

30

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Assim se r = 0, temos uma

ausência de relacionamento linear,

isto é, os pontos não mostram

“alinhamento”.

31

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0r =

0

10

20

30

40

50

10 15 20 25 30

32

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Assim se –1 < r < 0, temos uma

relacionamento linear negativo, isto é,

os pontos estão mais ou menos

alinhados e quando X aumenta Y

decresce e vice-versa.

33

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0r1 <<−

0

10

20

30

40

50

10 15 20 25 30

34

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Assim se 0 < r < 1, temos uma

relacionamento linear positivo, isto é,

os pontos estão mais ou menos

alinhados e quando X aumenta Y

também aumenta.

35

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

10

20

30

40

50

10 15 20 25 30

1r0 <<

36

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma correlação amostral não

significa necessariamente uma correlação

populacional e vice-versa. É necessário

testar o coeficiente de correlação para

verificar se a correlação amostral é

também populacional.

37

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Observada uma amostra de seis

pares, pode-se perceber que a correlação é

quase um, isto é, rrrr ≅≅≅≅ 1111. No entanto,

observe o que ocorre quando mais pontos

são acrescentados, isto é, quando se

observa a população!

38

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

0

10

20

30

40

50

10 15 20 25 30

r r r r ≅≅≅≅ 1111

ρ ρ ρ ρ ≅≅≅≅ 0000

39

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

40

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Determinar o “grau de

relacionamento linear” entre as

variáveis X = temperatura de

operação do processo versus Y =

rendimento do produto, conforme

tabela.

41

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

X Y XY X Y100 45 4500 10000 2025110 51 5610 12100 2601120 54 6480 14400 2916130 61 7930 16900 3721140 66 9240 19600 4356150 70 10500 22500 4900160 74 11840 25600 5476170 78 13260 28900 6084180 85 15300 32400 7225190 89 16910 36100 7921

1450145014501450 673673673673 101570101570101570101570 218500218500218500218500 47225472254722547225

42

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Vamos calcular “r”

utilizando a expressão em

destaque vista anteriormente,

isto é, através das quantidades,

SxY, SXX e SYY.

43

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

47225Y 218500X

101570 XY 67,3Y 145X

673 Y 1450X 10n

22 =∑=∑

∑ ===

∑ =∑ ==

Então:

3985

3,67.145.10101570

YXnYXS iiXY

=

=−=

=∑ −=

44

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

8250

145.10218500

XnXS

2

22iXX

=

=−=

=∑ −=

10,1932

3,67.1047225

YnYS

2

22iYY

=

=−=

=∑ −=

45

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

9981,0

10,1932.8250

3985

S.S

S r

YYXX

XY

=

==

==

46

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Apesar de “rrrr” ser um

valor adimensional, ele não é

uma taxataxataxataxa. Assim o resultado

não deve ser expresso em

percentagem.

47

Prof. Lorí Viali, Dr.Prof. Lorí Viali, Dr.Prof. Lorí Viali, Dr.Prof. Lorí Viali, [email protected]@[email protected]@mat.ufrgs.br

http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/http://www.mat.ufrgs.br/~viali/

48

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Em muitas situações duas ou mais

variáveis estão relacionadas e surge

então a necessidade de determinar a

natureza deste relacionamento.

49

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A análise de regressão é uma

técnica estatística para modelar e

investigar o relacionamento entre

duas ou mais variáveis.

50

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

De fato a regressão pode ser

dividida em dois problemas:

(i)(i)(i)(i) o da especificação e

(ii)(ii)(ii)(ii) o da determinação.

51

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O problema da especificação é

descobrir dentre os possíveis modelos

(linear, quadrático, exponencial, etc.)

qual o mais adequado.

52

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O problema da determinação é

uma vez definido o modelo (linear,

quadrático, exponencial, etc.) estimar

os parâmetros da equação.

53

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Normalmente é suposto que exista

uma variável Y (dependente ou

resposta), que está relacionada a “k”

variáveis (independentes ou

regressoras) Xi (i = 1, 2, ..., k).

54

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A variável resposta YYYY é aleatória,

enquanto que as variáveis regressoras

Xi são normalmente controladascontroladascontroladascontroladas. O

relacionamento entre elas é

caracterizado por uma equação

denominada de “equaçãoequaçãoequaçãoequação dededede regressãoregressãoregressãoregressão”

55

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Quando existir apenas uma

variável regressora (X) tem-se a

regressãoregressãoregressãoregressão simplessimplessimplessimples, se Y depender de

duas ou mais variáveis regressoras,

então tem-se a “regressãoregressãoregressãoregressão múltiplamúltiplamúltiplamúltipla”.

56

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Vamos supor que a regressão é do

tipo simplessimplessimplessimples e que o o modelo seja

linearlinearlinearlinear, isto é, vamos supor que a

equação de regressão seja do tipo:

Y = α + βX + U

57

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

x 1 x 2 x nx

y

Y = α + βX + U;

58

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O termo “U” é o termo erro, isto é,

“U” representa outras influências

sobre a variável Y, além da exercida

pela variável “X”. A variação residual

(termo U) é suposto de média zero e

desvio constante e igual a σ.

59

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Ou ainda pode-se admitir que

o modelo fornece o valor médio

de Y, para um dado “x”, isto é,

E(Y/x) = α + βX

60

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Y = α + βX + U;

E(Y/x) = α + βX, isto é, E(U) = 0

V(Y/x) = σ2;

Cov(Ui, Uj) = 0, para i ≠ j;

A variável X permanece fixa em observaçõessucessivas e os erros U são normalmentedistribuídos.

61

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O modelo suposto E(Y/x)E(Y/x)E(Y/x)E(Y/x) ==== αααα ++++ ββββXXXX

é populacional.

Vamos supor que se tenha n pares de

observações, digamos: (x(x(x(x1111,,,, yyyy1111),),),), (x(x(x(x2222,,,, yyyy2222),),),), ............,,,,

(x(x(x(xnnnn,,,, yyyynnnn)))) e que através deles queremos

estimar o modelo acima.

62

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A reta estimada será representada

por:EbXaY ou bXaY ++=+=

Onde “aaaa” é um estimador de α e

“bbbb” é um estimador de β, sendo um

estimador de E(Y/x).Y

63

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Existem diversos métodos para a

determinação da reta desejada. Um deles,

denominado de MMQMMQMMQMMQ (MMMMétodos dos

MMMMínimos QQQQuadrados), consiste em

minimizar a “somasomasomasoma dosdosdosdos quadradosquadradosquadradosquadrados dasdasdasdas

distânciasdistânciasdistânciasdistâncias dadadada retaretaretareta aosaosaosaos pontos”pontos”pontos”pontos”.

64

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

Yi = a + bxi + Ei,

Então:

Ei = Yi - (a + bxi)

65

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Deve-se minimizar:

∑ −−=

=∑ −=∑=φ

=

==

n

1iii

2

n

1iii

2n

1i

2i

)XbaY(

)YY(E

66

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

EXbaY iii ++=

Eiy i

y i

x i

67

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Derivando parcialmente tem-se:

)XbaY(x2b

)XbaY(2a

iin

1ii

n

1iii

−−∑−=∂

φ∂

∑ −−−=∂

φ∂

=

=

68

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Igualando as derivadasparciais a zero vem:

0)XbaY(x

0)XbaY(

iin

1ii

n

1iii

=−−∑

=∑ −−

=

=

69

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Isolando as incógnitas, tem-se:

∑+∑=∑

∑+=∑

XbXnYX

XbnaY

2iii i

ii

70

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Resolvendo para “a” e “b”, segue:

XbYa

S

S

XnX

YXnyXb

XX

XY22

i

ii

−=

=∑ −

∑ −=

71

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Fazendo:

∑ −=

∑ −=

∑ −=

YnYS

XnXS

YXnYXS

22iYY

22iXX

iiXY

Lembrando que:

72

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

73

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Um engenheiro químico está

investigando o efeito da temperaturatemperaturatemperaturatemperatura

dededede operaçãooperaçãooperaçãooperação dodododo processoprocessoprocessoprocesso no

rendimentorendimentorendimentorendimento dodododo produtoprodutoprodutoproduto. O estudo

resultou nos dados da tabela, ao lado.

Determinar a linha de regressão.

74

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Temperatura, C0 (X) Rendimento (Y)100 45110 51120 54130 61140 66150 70160 74170 78180 85190 89

75

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Da mesma forma que para

calcular o coeficiente de correlação é

necessário a construção de três novas

colunas. Uma para X2, uma para Y2 e

outra para XY.

76

X Y XY X Y100 45 4500 10000 2025110 51 5610 12100 2601120 54 6480 14400 2916130 61 7930 16900 3721140 66 9240 19600 4356150 70 10500 22500 4900160 74 11840 25600 5476170 78 13260 28900 6084180 85 15300 32400 7225190 89 16910 36100 7921

1450145014501450 673673673673 101570101570101570101570 218500218500218500218500 47225472254722547225

77

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Tem-se:

47225Y 218500X

101570 XY 67,3Y 145X

673 Y 1450X 10n

22 =∑=∑

∑ ===

∑ =∑ ==

Então:

3985

3,67.145.10101570

YXnYXS iiXY

=

=−=

=∑ −=

78

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

8250

145.10218500

XnXS

2

22iXX

=

=−=

=∑ −=

10,1932

3,67.1047225

YnYS

2

22iYY

=

=−=

=∑ −=

79

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A equação de regressão, será, então:

74,27394,2

145.4830,030,67XbYa

48,04830,08250

3985

S

Sb

XX

XY

−≅−=

=−=−=

≅===

x48,074,2Y +−=

80

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

A pergunta que cabe agora é:

este modelo representa bem os pontos

dados? A resposta é dada através do

erro padrão da regressão.

81

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

82

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O objetivo do MMQ é minimizara variação residual em torno da reta

de regressão. Uma avaliação destavariação é dada por:

2n

)bXaY(

2n

ES

222

∑ −−=

∑=

83

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O cálculo da variância residual,

por esta expressão, é muito trabalhoso,

pois é necessário primeiro determinar

os valores previstos. Entretanto é

possível obter uma expressão que não

requeira o cálculo dos valores

previstos, isto é, de bXaY +=

84

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

SbSb2S

)XX(b)YY)(XX(b2)YY(

)]XX(bYY[]bXXbYY[

]bX)XbY(Y[)bXaY(

XX2

XYYY

222

22

22

+−=

=∑ −+−∑ −∑ −−=

=∑ −−−=∑ −+−=

=∑ −−−=∑ −−

Desenvolvendo o numerador da

expressão, vem:

85

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

SYnY)YY(

SXnX)XX(

SYXnYX

)YY)(XX(

YY22

i2

XX22

i2

XYii

=∑ −=∑ −

=∑ −=∑ −

=∑ −=

=∑ −−

Uma vez que:

86

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Deste modo, tem-se:

Mas:

SbSb2S)bXaY( XX2

XYYY2 +−=∑ −−

SbSS

Sb XXXY

XX

XY =⇒=

Então:

SbSSbSb2S

SbSb2S)bXaY(

XX2

YYXX2

XX2

YY

XX2

XYYY2

−=+−=

=+−=∑ −−

87

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Finalmente:

2n

SbS

2n

SbS

2n

)bXaY(

2n

Es

XYYYXX2

YY

22

−=

−=

=−

∑ −−=

∑=

88

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

89

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Considerando os valores do

exemplo anterior, determinar o erro

padrão da regressão.

10,1932SYY =

4830,08250

3985

S

Sb

XX

XY ===

8250S XX =TemTemTemTem----sesesese::::

90

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

EntãoEntãoEntãoEntão::::

95,09503,0

210

3985.8250

398510,1932

2n

SbSs XYYY

≅=

=−

−=

=−

−=

91

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

92

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

x i

Y

Y

Y

YY −YY −

YY −

YYYYYY −+−=−

∑ −+∑ −=∑ − )YY()YY()YY(222

VEVRVT +=

93

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

(aaaa) Variação Total: VT

(bbbb) Variação Residual: VR

( ) SYYVT YY2 =∑ −=

( ) VEVTSbSYYVR XX2

YY2

−=−=∑ −=

(cccc) Variação Explicada: VE

( ) SbYYVE XX22

=∑ −=

94

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Uma maneira de medir o

grau de aderência (adequação) de

um modelo é verificar o quanto

da variação total de Y é

explicada pela reta de regressão.

95

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

R2 = VE / VT

Para isto, toma-se o quociente

entre a variação explicada, VE, pela

variação total ,VT:

Este resultado é denominado de

“CoeficienteCoeficienteCoeficienteCoeficiente dededede DeterminaçãoDeterminaçãoDeterminaçãoDeterminação”.

96

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Este resultado mede o quanto as

variações de uma das variáveis são

explicadas pelas variações da outra

variável.

SS

S

S

Sb

S

Sb

VT

VER

XX YY

2XY

YY

XY

YY

XX2

2 ====

97

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

Ou ainda, ele mede a parcela davariação total que é explicada pela reta de

regressão, isto é:

SR Sb VE YYXX2 2

==A variação residual corresponde a:

S)R 1( VR YY2−=

Assim 1 – R2 é o Coeficiente deIndeterminação.

98

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

99

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

O % de impurezas no gás oxigênio

produzido por um processo de

destilação supõem-se que esteja

relacionado com o % de hidrocarbono

no condensador principal do

processador. Os dados de um mês de

operação produziram a seguinte tabela

100

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

X Y X Y1,02 86,91 1,46 96,731,11 89,85 1,55 99,421,43 90,28 1,55 98,661,11 86,34 1,55 96,071,01 92,58 1,40 93,650,95 87,33 1,15 87,311,11 86,29 1,01 95,000,87 91,86 0,99 96,851,43 95,61 0,95 85,201,02 89,86 0,98 90,56

101

Prof. Lorí Viali, Dr. – UFRGS – Instituto de Matemática - Departamento de Estatística

(a)(a)(a)(a) Ajuste um modelo linear aos dados;

(b)(b)(b)(b) Teste a existência da regressão;

(c)(c)(c)(c) Determine o valor de R2 para estemodelo;

(d)(d)(d)(d) Determine um IC, de 95%, para o valorda pureza, na hipótese do % de

hidrocarbono ser 1,20% .