Upload
internet
View
111
Download
3
Embed Size (px)
Citation preview
1
ESTATÍSTICA
2
UDIII - Relação Entre Duas ou Mais Variáveis
ESTATÍSTICA
Ass 02: Regressão Múltipla
3
OBJETIVOS ESPECÍFICOS
• Calcular a equação de regressão múltipla de Y sobe X e Z utilizando o critério dos mínimos quadrados
• Grafar a relação de Y para X quando se mantém constante Z
• Usar o plano de regressão para fazer predições
4
SUMÁRIO
1- Introdução
2. O Modelo de Regressão
3. O Plano Ajustado de Mínimos Quadrados
5
1. Introdução
A regressão múltipla nada mais é do que a regressão simples quando se tem em conta mais de um fator X.
É a técnica adequada quando desejamos pesquisar o efeito simultâneo de vários fatores sobre Y.
A regressão múltipla reduz a tendenciosidade que se verificaria no caso de uma regressão simples que não levasse em conta fatores estranhos.
6
Exemplo: Suponhamos que as observações sobre fertilizante e safra já estudadas anteriormente tivessem sido feitas em sete postos agrícolas diferentes em todo o país. Mantidas que fossem as condições do solo e a temperatura, ainda poderíamos perguntar se parte da flutuação de Y não seria explicada pela variação do nível pluviométrico nas diferentes áreas. Poderemos fazer melhor previsão se levarmos em conta tanto o fertilizante como o nível pluviométrico. Assim é que a tabela 1, a seguir, dá os níveis pluviométricos observados, juntamente com as observações originais sobre a safra e fertilizante.
7
Safra(bu/acre)
100200300400500600700
Tabela 1Observações sobre Safra,Fertilizante e
Nível Pluviométrico
Fertilizante(lb/acre)
40505070656580
Nível Pluviométrico
(pols)10201030202030
8
a) Na figura a seguir, atribua a cada ponto seu nível pluviométrico Z. Então, considerando apenas os pontos com baixo nível pluviométrico (Z=10), ajuste a olho uma reta. Repita então o experimento para os pontos com nível pluviométrico moderado (Z=20), e, finalmente, para os pontos com alto nível pluviométrico (Z=30).
9Fertilizante (lb/acre)
Saf
ra (
bu/a
cre)
Y
X100 200 300 400 500 600 700
80
70
60
504030
0
Z=10
20
10
30 20
20
Z=30
SOLUÇÃO
Fig 1- Como a safra depende de duas variáveis (fertilizante X e nível pluviométrico Z)
10
b) Supondo agora constante o nível pluviométrico, estime qual seria o coeficiente angular da safra por libra adicional de fertilizante. Ou seja, qual seria o aumento de safra por libra adicional de fertilizante?
Solução
Note-se que o maior coeficiente angular na Fig.1 é 10/200=0,05 para a reta Z=10, enquanto que o menor coeficiente angular é 10/300=0,033 para a reta Z=30: em média, tais coeficientes são de cerca de 0,04 bushels por libra de fertilizante.
11Fertilizante (lb/acre)
Saf
ra (
bu/a
cre)
Y
X100 200 300 400 500 600 700
80
70
60
504030
0
Z=10
20
10
30 20
20
Z=30
Maior b=10/200=0,05Menor b=10/300=0,033b médio= 0,04 bu/lb
Fig 2- Aumento de safra por libra adicional de fertilizante (Z constante)
12
c) Mantido constante o fertilizante, estime o aumento de safra por polegada adicional de nível pluviométrico.
SoluçãoMantenhamos constante o fertilizante, no centro dos dados, por exemplo onde X=400. Uma reta tracejada mostra a distância vertical entre a reta correspondente ao nível pluviométrico Z=10 e a reta correspondente a Z=30 – cerca de 15 bushels. Como este aumento de 15 bushels decorre de um aumento de 20 polegadas do nível pluviométrico, isto significa que a chuva aumenta a safra em cerca de 15/20 bushels por polegada de nível pluviométrico.
13Fertilizante (lb/acre)
Saf
ra (
bu/a
cre)
Y
X100 200 300 400 500 600 700
80
70
60
504030
0
Z=10
20
10
30 20
20
Z=30
d=15
pol/bu 75,020
15b
Fig 3- Aumento de safra por polegada adicional de nível pluviométrico (X constante)
14
d) Estime a safra no caso de o nível de fertilizante ser de 400 libras e o nível pluviométrico de 10 polegadas.
Solução
Na figura 1 utilizamos a reta correspondente a Z=10, no ponto onde X=400, obtendo uma safra = 55 bushels.
15
Y
X100 200 300 400 500 600 700
80
70
60
504030
0
Z=10
20
10
30 20
20
Z=30
55
X=400 lb; Z=10 pol Safra = 55 bu
Fig 4- Estimativa da safra para X=400 libras e Z=10 polegadas
16
2. O Modelo de Regressão
Devemos considerar agora a regressão da safra Y sobre duas variáveis independentes – fertilizante X e nível pluviométrico Z. Suponhamos que a relação seja da forma
Valor esperado de Y = + X + Z
Geometricamente, esta equação é um plano tridimensional (Fig. 2)
17
Fig.5 - Dispersão dos pontos observados em torno do verdadeiro plano de regressão
Fertilizante X
Nível Pluviométrico Z
Safra YY observado
Valor esperado de Y = + X + Z
(X,Z)
e
18
Naturalmente, a safra efetivamente observada é quase sempre diferente da previsão: a diferença é o erro aleatório. Assim, qualquer valor observado pode ser expresso como seu valor esperado mais um erro aleatório e :
Y = + X + Z + e
Com as mesmas hipóteses sobre e do assunto anterior.
19
coef. ang.
coef. ang.
ZX
Y
0
LXY
LZY
Fig.6 - Um plano como malha de retas paralelas
(intercepto)
20
pode ser interpretado geometricamente como o coeficiente angular do plano quando nos deslocamos na direção X, mantendo Z constante.
Costuma-se designar como efeito marginal do fertilizante X sobre a safra Y.
Analogamente, é o coeficiente angular do plano quando nos deslocamos na direção Z, mantendo X constante; é o efeito marginal de Z sobre Y.
21
2. O Plano Ajustado de Mínimos Quadrados
Tal como na regressão simples, o problema é que o estatístico não conhece e verdadeira relação (o verdadeiro plano), devendo, por isso, ajustar um plano estimado, da forma
cZbXaY a – intercepto do plano ajustado no eixo Y.b – coeficiente angular do plano ajustado,
na direção de X com Z constante.c – coeficiente angular do plano ajustado,
na direção de Z com X constante.
22
Equações Estimadoras(Critério dos Mínimos Quadrados)
cZbXaY
ZcXbYa
zcxzbzy
xzcxbxy2
2
ZZz YYy XXx
23
Tabela 2Cálculos para a Regressão Múltipla de Y sobre X e Z
Dados
Y X
100200300400500600700
y x xy x2
Desvios Produtos
-300-200-100
0100200300
400
X
60
Y
0
y
0
x
40505070656580
-20-10-101055
20
16500
xy
900004000010000
0100004000090000
280000
x2
Z10201030202030
20
Z
z-100
-101000
10
0
z
600020001000
0500
10006000
2000
100100
00
200
zy
1000
100100
00
100
30000
1000000
3000
z2 xz
600
zy
400
z2 7000
xz
24
28,1a
0,833(20)-)0,0381(400-60a
0,833c
0,0381b
400c b 7000 600
c 7000b 28000016500
Z83,0X038,028Y
25
Exemplo: Faça o gráfico da relação de Y para X dada por quando se mantém constante o nível pluviométrico em:
i) Z=10; ii) Z=20; iii) Z=30Solução:
0,038X52,9Y
0,83(30)0,038X82Y30Z para iii)
0,038X44,6Y
0,83(20)0,038X28Y20Z para ii)
0,038X36,3Y
0,83(10)0,038X28Y10Z para )i
Z83,0X038,028Y
26
Fig.7 - A regressão múltipla ajusta os dados com retas paralelas
Fertilizante (lb/acre)
Saf
ra (
bu/a
cre)
Y
X100 200 300 400 500 600 700
80
70
60
504030
0
Z=10Z=20Z=30
27
PRATIQUE COM OS
EXERCÍCIOS .
BOA SORTE!