Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
Mini curso
Método dos Mínimos Quadrados
com ênfase em covariâncias
Otaviano Helene Instituto de Física da USP
Baseado no livro Método dos Mínimos Quadrados com Formalismo Matricial e no blog
https://livrommq.blogspot.com/
Semana Integrada da Física de São Carlos
IFSC – USP Agosto 2019
Conteúdo
• I – Solução do MMQ para um problema sem solução
• II – O desvio padrão e alguns exemplos de ajustes de parâmetros
• III – Variâncias e covariâncias; propagação • IV a – Equações do MMQ com matrizes • IV b – Variâncias e covariâncias dos parâmetros
ajustados • V – Algumas propriedades do MMQ e o TCL • VI – Outros desenvolvimentos
MMQ, agosto/2019 2
Problema sem solução
m=60 m+f=65 SISTEMA INCONSISTENTE f=4
Quanto pesam criança e mãe? 3 MMQ, agosto/2019
m0 60 kg m0+f0 65 kg f0 4 kg
I – Solução do MMQ
• Procurar valores de m e f que minimizem
222 )4()65()60(),( ffmmfmQ
4 MMQ, agosto/2019
Valores de Q para diferentes valores de m e f
222 )4()65()60(),( ffmmfmQ
Mãe, m (kg)
Filho,
f (kg)
58 59 60 61 62
3,5 16,5 7,5 2,5 1,5 4,5
4,0 13,0 5,0 1,0 1,0 5,0
4,5 10,5 3,5 0,5 1,5 6,5
5,0 9,0 3,0 1,0 3,0 9,0
5,5 8,5 3,5 2,5 5,5 12,5 5 MMQ, agosto/2019
Medidas de um quadrado
• Lado = 10 cm
• Área = 120 cm2
• Perímetro = 35 cm
MMQ, agosto/2019 6
Valores evidentemente inconsistentes
Que valor adotar para o lado desse quadrado?
Q(l)= (l-10)2 + (l2-120)2 + (4l-35)2
O “melhor” valor para l é 10,9 cm
0100200300400500600700800900
1000
9 10 11 12 13
l (cm)
Q(l)
7 MMQ, agosto/2019
Solução analítica
• Quando os dados dependem linearmente dos parâmetros a serem ajustados, há uma solução analítica para os valores que minimizam Q. Exemplo
• m 60
• m+f 65
• f 4 222 )4()65()60(),( ffmmfmQ
8 MMQ, agosto/2019
222 )4()65()60(),( ffmmfmQ
0
0
~,~
~,~
fm
fm
f
Q
m
Q
0)4~
(2)65~(2
0)65~~(2)60~(2
ffm
fmm
Os valores ajustados têm um til
9 MMQ, agosto/2019
692~125
~~2
fm
fm
69
125~
~
21
12
f
m
Escrevendo na forma de matrizes
3,4
3,60
69
125
21
12~
~ 1
f
m
A menos de arredondamento, são os mesmo valores obtidos numericamente (60kg e 4,5kg)
10 MMQ, agosto/2019
• Vamos nos restringir ao caso linear.
• O caso não linear é uma aproximação, e algumas propriedades do MMQ não são válidas.
11 MMQ, agosto/2019
Exercício para resolver
MMQ, agosto/2019 12
• Determinar o rendimento (em litros por quilômetro) de um veículo
Distâncias (km) Consumo (l)
A 80 km/h A 120 km/h
200 100 29
100 200 31
500 100 49
R: 0,075 l/km a 80 km/h e 0,12 l/km a 120 km/h
Sobre o MMQ
1) O MMQ é mais geral do que se pensa. Não serve apenas para “ajustar funções” – ajusta parâmetros Os dados não precisam obedecer a distribuições normais (Verbete Método dos mínimos quadrados da Wikipédia em português está errado – jul/2019)
2) O MMQ tem limitações que nem sempre são consideradas (p. ex., nos casos em que há erro na “variável dependente” ou a relação entre dados e parâmetros não é linear).
13 MMQ, agosto/2019
II – O desvio padrão e alguns exemplos de ajustes de parâmetros
Alguns dados são mais precisos do que outros. Exemplos:
• combinar medidas com instrumentos diferentes
• medidas de uma mesma grandeza com técnicas diferentes
• medidas feitas por pessoas com habilidades diferentes
14 MMQ, agosto/2019
Aprendendo o que fazer a partir de medidas equivalentes
• x1, x2 e x3 três medidas equivalentes (mesmos procedimentos, equipamentos, experimentadores, condições externas ...).
3
321 xxxx
15 MMQ, agosto/2019
• O melhor resultado (veremos em breve o que “melhor” quer dizer) é uma média simples:
Suponha, agora, que x2 e x3 tenham sido combinados,
2
323,2
xxx
e não saibamos mais seus valores, apenas o valor médio x2,3. Como combiná-lo com x1?
Como x2,3 foi calculado usando dois dados, é razoável supor que ele tenha peso 2. Assim, a média deve ser
xxxxxx
x
33
23213,21
3,2;1
16 MMQ, agosto/2019
O peso deve refletir a precisão de um dado
• O peso é proporcional ao inverso da variância: 1/σ2.
• σ2 é a variância e σ é o desvio padrão.
• σ é uma medida de quanto um valor flutua em torno do valor verdadeiro (e desconhecido) da grandeza medida.
• Exemplo: σrégua≈0,3 mm; σpaquímetro≈0,05 mm
17 MMQ, agosto/2019
Como saber o valor do desvio padrão σ? (Vamos usar a palavra erro apenas para a
diferença entre o valor experimental e o valor verdadeiro – desconhecido, claro.)
• O fabricante de um equipamento pode informar
• Fazendo várias medidas de uma mesma grandeza
• Estudando as propriedades físicas do processo
• Conhecimento anterior
18 MMQ, agosto/2019
Estimando o d.p. I – Uma forma usual de estimar o d.p. é a partir de medidas independentes de uma mesma grandeza, p. ex., x1, x2, ... xn
n
ii xx
n 1
22
1
1
19 MMQ, agosto/2019
II – O desvio padrão da média de n dados independentes é
III – Eventos contáveis, como o número de decaimentos de uma fonte radioativa (distribuição de Poisson). Se N eventos forem observados, σ2≈N.
nmédia
20 MMQ, agosto/2019
No que segue:
• Vamos nos restringir ao caso em que os parâmetros a serem ajustados dependem linearmente dos dados.
• Vamos supor conhecidos os desvios padrões.
• Abrir mão dessas limitações têm consequências que veremos mais adiante.
21 MMQ, agosto/2019
Dois exemplos
• 1 – Consumo de combustível: gc e ge (litros/km)
distância percorrida
(km) consumo
(l) cidade estrada
100 200 28 300 100 43 400 0 49
22 MMQ, agosto/2019
a equação do MMQ
22
2
)49400()43100300(
)28200100(),(
cec
ecec
ggg
ggggQ
Derivando em relação a gc e ge, igualando a zero
99~500~500
353~500~2600
ec
ec
gg
gg
Solução:
kmlg
kmlg
e
c
/ 077,0~
/ 12,0~
23 MMQ, agosto/2019
• 2 – Ajuste dos parâmetros da função y=a·x2+b·x3 aos dados abaixo
x y -1 3,9 0 -1,6 1 1,4 3 -15
232),( iii bxaxybaQ
24 MMQ, agosto/2019
• Derivando em relação à a e igualando a zero
MMQ, agosto/2019 25
232),( iii bxaxybaQ
𝜕𝑄
𝜕𝑎= −2 𝑦𝑖 − 𝑎 𝑥𝑖
2 − 𝑏 𝑥𝑖3 𝑥𝑖
2 = 0
𝑎 𝑥𝑖2𝑥𝑖
2 + 𝑏 𝑥𝑖2𝑥𝑖
3 = 𝑦𝑖𝑥𝑖2
• Rearranjando os termos
• Derivando em relação a a e b ...
iiiiii
iiiiii
yxxxbxxa
yxxxbxxa
33323
23222
~~
~~
4,1~
6,2~
b
a
Solução
26 MMQ, agosto/2019
27 MMQ, agosto/2019
• Essa forma estranha de escrever é pelo seguinte
A função é y=a·x2+b·x3
iiiiii
iiiiii
yxxxbxxa
yxxxbxxa
33323
23222
~~
~~
iiiiii
iiiiii
yxxxbxxa
yxxxbxxa
33323
23222
~~
~~
28 MMQ, agosto/2019
Isso facilita as coisas y=a0f+b0g+c0h+..., f, g, h...são valores conhecidos e a0, b0, c0 ... parâmetros a serem ajustados.
n
i i
iiii chbgafycbaQ
12
2...
,...),,(
c
b
a
hhghf
hgggf
hfgff
yh
yg
yf
i
i
i
ii
i
ii
i
ii
i
i
i
ii
i
ii
i
ii
i
i
i
ii
i
ii
i
ii
~
~
~
2
2
22
22
2
2
222
2
2
2
2
29 MMQ, agosto/2019
• Suponha que o tempo verdadeiro a ser medido seja de t
• Suponha que haja um medidor de tempo não tendencioso que meça os valores abaixo com as probabilidades indicadas:
Um cuidado importante Tendenciosidade e não tendenciosidade
Exemplo
resultado probabilidade t-5s 25%
T 50% t+5s 25%
30 MMQ, agosto/2019
Não sabemos o valor de t, mas sabemos que, em média, o medidor fornece o valor verdadeiro t, pois o valor esperado da medida é (t-5s)×0,25+t×0,50+(t+5s)×0,25=t que é o valor verdadeiro (e desconhecido) do tempo. Note que se o tempo medido não for muito maior do que 5 s, é possível que alguns valores sejam negativos. Preserve-os No entanto, esse equipamento é tendencioso para o inverso do tempo, pois (1/(t-1s))×0,25+(1/t)×0,50+(1/(t+1s))×0,25≠1/t
31 MMQ, agosto/2019
Dez medidas não tendenciosas das massas do líquido no recipiente e do recipiente vazio.
As diferenças são os dados correspondentes ao líquido apenas
L+R (g) R (g) Diferenças (g) 2,56 1,41 1,15 1,22 2,96 -1,74 3,51 1,91 1,60 3,9 1,74 2,16
4,09 1,84 2,25 2,38 1,84 0,54 2,27 0,67 1,60 3,78 2,25 1,53 2,58 3,05 -0,47 3,99 0,76 3,23
• Outro exemplo de tendenciosidade – medida da massa de um liquido em um recipiente
32 MMQ, agosto/2019
• Se as medidas de massa são não tendenciosas, então as diferenças também não o são.
• A média das diferenças também não é tendenciosa. Essa média é 1,19 g.
• Entretanto, se os dados “não físicos” (massas negativas) fossem descartados, a média seria tendenciosa
• Os valores negativos são não físicos, mas estatisticamente necessários!
33 MMQ, agosto/2019
III – Variâncias e covariâncias
34 MMQ, agosto/2019
Já vimos a origem das variâncias e como estimá-las.
Covariância é uma espécie de variância em comum entre dois dados
Exemplo:
Massa 1= Massa líq. 1 + Massa recipiente
Massa 2= Massa líq. 2 + Massa recipiente
Representando variâncias e covariâncias
2
21
2
2
221
121
2
1
)cov()cov(
)cov()cov(
)cov()cov(
nnn
n
n
yyyy
yyyy
yyyy
YV
35 MMQ, agosto/2019
Propagação de variâncias –uma variável
Esboço de uma dedução. Se z é uma função que depende de y, z(y), expandindo z até primeira ordem em torno de y0
)()()( 00
0
yydy
dzyzyz
y
)()()()( 0000
0
yzyydy
dzyzyzz
y
então
pois <y>=y0
36 MMQ, agosto/2019
• A variância de z pode ser calculada assim:
37 MMQ, agosto/2019
2
00
20
2
yy
dy
dzzzz
2
2
0
20
2
0
2yz
dy
dzyy
dy
dz
Propagação de matrizes de covariância
• Repetindo o procedimento com mais funções e mais variáveis
z1(y1,y2,...yn), z2(y1,y2,...yn), ... zm(y1,y2,...yn),
são m funções de n variáveis:
38 MMQ, agosto/2019
tDVDV YZ
n
mmm
n
n
y
z
y
z
y
z
y
z
y
z
y
z
y
z
y
z
y
z
00201
0
2
02
2
01
2
0
1
02
1
01
1
D
39 MMQ, agosto/2019
Exemplo 1
• Lados de um retângulo: y1=105 (4), y2=48 (3)
90
016V
• Variância do perímetro, z=2(y1+y2)
2221 yzyz D
40 MMQ, agosto/2019
fazendo as contas ..
)100(2
2
90
01622
zV
o desvio padrão do perímetro é
10100 z
Perímetro é 306 (10) ou 306±10
41 MMQ, agosto/2019
Exemplo 2 • Variância da área z=y1×y2. Neste caso não
linear, a variância é aproximada
105481221 yyyzyz D
área = 5040 (368)
)136089(105
48
90
01610548
zV
42 MMQ, agosto/2019
Exemplo 3
• Perímetro e área, z1=2(y1+y2), z2=y1·y2. Variância e covariância
10548
22
2212
2111
yzyz
yzyz
D
1360893426
3426100
1052
482
90
016
10548
22V
43 MMQ, agosto/2019
• As variâncias do perímetro e da área aparecem na diagonal e a covariância entre ambas, fora da diagonal
Perímetro = 306±10 Área = 5040±368 Covariância = 3426
44 MMQ, agosto/2019
1360893426
3426100V
Exemplo importante
Ajuste dos parâmetros de uma reta y=a+bx (mais adiante, veremos como estimar a matriz de covariância dos parâmetros ajustados).
x y
-2 2,9
-1 0,2
0 0,6
1 -0,7
2 -3,6
45 MMQ, agosto/2019
0,20 0
0 0,10
Matriz de covariância dos parâmetros a, b ajustados
Variâncias em interpolações yint=aaj+bajx
)10,020,0(1
10,00
020,01)( 22 x
xxy
46 MMQ, agosto/2019
Incertezas nas interpolações e extrapolações
47 MMQ, agosto/2019
• Covariâncias entre valores interpolados ou extrapolados:
t
b
a
b
a
yyx
x
x
x
ba
1
1
10,00
020,0
1
1V
2
2
10,020,010,020,0
10,020,010,020,0
bba
baayy
xxx
xxxba
V
Valores interpolados ou extrapolados são covariantes; são correlacionados uns com os outros. Isso é importante.
48 MMQ, agosto/2019
Relevância da correlação entre valores interpolados: cálculo da incerteza de Δy=ya-yb
]10,02)(10,0[
1
1
10,020,010,020,0
10,020,010,020,011)(
22
2
22
baba
bba
baay
xxxx
xxx
xxx
Se xa=xb, evidentemente a incerteza em Δy será nula, como esperado.
49 MMQ, agosto/2019
Fontes de covariância
• Cálculos a partir de valores ajustados
• Medidas com um mesmo equipamento (a incerteza do equipamento afetará todos os dados igualmente). Ex: régua, aceleradores
Não confundir covariância com erro sistemático
50 MMQ, agosto/2019
IV a – Equações do MMQ com matrizes
• As equações do MMQ escritas de forma matricial são mais simples do que na forma tradicional. Como isso só ficará totalmente claro daqui a pouco, peço alguma paciência.
51 MMQ, agosto/2019
Estebelecimento do problema a) Peso mãe e criança
m0 60 kg m0+f0 65 kg f0 4 kg
m=60
m+f=65 SISTEMA INCONSISTENTE, POIS HÁ ERROS
f=4
52 MMQ, agosto/2019
m0, f0 valores verdadeiros (e desconhecidos) das massas da mãe e do filho
e1 etc. erros de medida. Essas equações podem ser escritas como
30
200
10
4
65
60
efkg
efmkg
emkg
3
2
1
0
0
10
11
01
4
65
60
e
e
e
f
m
53 MMQ, agosto/2019
• Atenção: erro= diferença entre valor verdadeiro e valor experimental.
• Não confundir erro com desvio padrão
• Erro é desconhecido (desvio padrão é conhecido)
54 MMQ, agosto/2019
b) Parâmetros de uma reta
x1 y1
x2 y2
x3 y3 xbay 00
33003
22002
11001
exbay
exbay
exbay
3
2
1
0
0
3
2
1
3
2
1
1
1
1
e
e
e
b
a
x
x
x
y
y
y
55 MMQ, agosto/2019
y a x a x a x e
y a x a x a x e
y a x a x a x e
m m
m m
n n n m nm n
1 01 11 02 12 0 1 1
2 01 21 02 22 0 2 2
01 1 02 2 0
...
...
...
nmnmnn
m
m
n e
e
e
a
a
a
xxx
xxx
xxx
y
y
y
2
1
0
02
01
21
22221
11211
2
1
Notem: as equações são lineares nos parâmetros (m0, f0, a0, b0).
56 MMQ, agosto/2019
c) Caso geral
nmnmnn
m
m
n e
e
e
a
a
a
xxx
xxx
xxx
y
y
y
2
1
0
02
01
21
22221
11211
2
1
eAXY 0
Escr
eve
nd
o o
pro
ble
ma
57 MMQ, agosto/2019
eAXY 0
O que precisamos minimizar:
V é a matriz de covariância dos dados Quando não há covariância entre os dados, essa expressão se reduz à
n
i i
iiii chbgafycbaQ
12
2...
,...),,(
A)X(YVA)X(YA t 1)(Q
58 MMQ, agosto/2019
Derivando Q(A) em relação a cada um dos parâmetros e igualando a zero obtemos o valor ajustado,
YVXX)V(XA 1t11t ~
Estimativa dos parâmetros pelo MMQ
Vamos chamar o valor ajustado de Ã. Ele é dado por
, ...m , ja
Q
j
21 , 0
59 MMQ, agosto/2019
Exemplo 1: pesos, mãe e filho
• Para continuar o problema, vamos supor que todos os desvios padrões sejam iguais a 1 (V=matriz identidade de ordem n=3) e não haja covariância entre os dados
3
2
1
0
0
10
11
01
4
65
60
e
e
e
f
m
60 MMQ, agosto/2019
10
11
01
X
YVXX)V(XA 1t11t ~
3
2
1
0
0
10
11
01
4
65
60
e
e
e
f
m
3,4
3,60~A
Evidentemente, o mesmo resultado que havíamos obtido
usando o procedimento tradicional
4
65
60
Y
100
010
001
V
61 MMQ, agosto/2019
y1=a0+box1+e1
y2=a0+box2+e2
y3=a0+box3+e3
y4=a0+box4+e4
y5=a0+box5+e5
Exemplo 2: parâmetros de uma reta
x y
-2 1,8
-1 0,4
0 -4,2
2 -7,5
5 -10,8
y=a0+box
51
21
01
11
21
X
8,10
5,7
2,4
4,0
8,1
Y
10000
01000
00100
00010
00001
V
62 MMQ, agosto/2019
YVXX)V(XA 1t11t ~
85,1
57,2Ã
63 MMQ, agosto/2019
a) y1 e y2 com mesmos desvios padrões σ:
• y1= yo+ e1
• y2= yo+ e2
Exemplo 3: média de dois dados
1
1X
YVXX)V(XA 1t11t ~
2
2
0
0
V
2
1
y
yY oy0A
eAXY 0
2
~ 21 yyy
64 MMQ, agosto/2019
b) y1 e y2 com desvios padrões diferentes:
• y1= yo+ e1
• y2= yo+ e2
1
1X
YVXX)V(XA 1t11t ~
2
1
y
yY oy0A
eAXY 0
22
21
222
211
11
~
yyy
65 MMQ, agosto/2019
IV b – Variâncias e covariâncias dos parâmetros ajustados
YVXX)V(XA 1t11t ~
Como à depende de Y, sua matriz de covariância depende da matriz de
covariância de Y. Vamos calcular isso por propagação.
66 MMQ, agosto/2019
• Portanto,
YVXX)V(XA 1t11t ~
1t11t
AVXX)V(XD
n
mmm
n
n
y
A
y
A
y
A
y
A
y
A
y
A
y
A
y
A
y
A
21
2
2
2
1
2
1
2
1
1
1
~
11t
AAAX)V(XDVDV
t~~~
67 MMQ, agosto/2019
11t
AX)V(XV
~
YVXX)V(XA 1t11t ~
68 MMQ, agosto/2019
tDVDV YZ
11t
AX)V(XV
~
YVXX)V(XA 1t11t ~
eAXY 0
Quatro equações básicas
69 MMQ, agosto/2019
Exemplo 1: pesos, mãe e filho
Vamos supor que todos os desvios padrões sejam iguais a 1 e não haja covariância entre os dados
3
2
1
0
0
10
11
01
4
65
60
e
e
e
f
m
1
V
100
010
001
10
11
01
X
70 MMQ, agosto/2019
11t
AX)V(XV
~
67,033,0
33,067,0~A
V
3,4
3,60~A
m 60,3±0,8 kg f 4,3±0,8 kg Covariância (m,f)= - 0,33
71 MMQ, agosto/2019
Exemplo 2: Consumo de combustível: gc e ge (litros/km)
distância percorrida (km)
consumo (l)
cidade estrada 100 200 28 300 100 43 400 0 49
72 MMQ, agosto/2019
Vamos supor que V seja
uma matriz identidade,
e
e
c
g
g
0400
100300
200100
49
43
28
1
V
100
010
001
YVXX)V(XA 1t11t ~
4~ 10
248,0048,0
048,0048,0
077,0
12,0~
AV
A
11t
AX)V(XV
~
73 MMQ, agosto/2019
Consumo em quilômetros/litro?
yc=1/gc=8,27km/l , ye=1/ge=13,0km/l
ty DVDV
2
2
10
01
e
c
e
e
c
e
e
c
c
c
g
g
g
y
g
y
g
y
g
y
D
0.703 0.055-
0.055- 0.022yV
yc=(8,27±0,15) km/l ye=(13,0±0,15) km/l
74 MMQ, agosto/2019
Vale a pena insistir: resumo
Em nenhum momento foi feita qualquer hipótese quanto a forma da função densidade de probabilidade
dos dados.
YVXX)V(XA 1t11t ~ 11t
AX)V(XV
~
eAXY 0 Relação linear entre dados e parâmetros
A matriz de covariância dos dados deve ser conhecida (os erros são desconhecidos)
75 MMQ, agosto/2019
V – Algumas propriedades do MMQ e o TCL
(a) Não tendenciosidade
Espera-se que se y é uma medida de uma grandeza (um dado, uma média, o resultado de um ajuste...), seu valor esperado seja igual ao valor verdadeiro da grandeza,
0yy
76 MMQ, agosto/2019
resultado probabilidade 1,8 s 25% 2,0 s 50% 2,2 s 25%
• O MMQ é não tendencioso quando os dados também são não tendenciosos
Se yi representa os dados e <yi>=y0i, como yi=y0i+ei , onde ei é o erro, então <ei>=0.
YVXX)V(XA 1t11t ~
77 MMQ, agosto/2019
Vamos ver como fica o valor esperado de parâmetros ajustados pelo MMQ:
O valor esperado de à é
eAXY 0
YVXX)V(XA1t11t ~
Como os dados se relacionam com os parâmetros na forma
00 AXeAXY
então
78 MMQ, agosto/2019
portanto,
01t11t
1t11t
AXVXX)V(X
YVXX)V(XA
~
0AA ~
Conclusão: se os dados não são tendenciosos, os parâmetros ajustados pelo MMQ também
não serão tendenciosos
79 MMQ, agosto/2019
(b) Mínima variância
• Entre todas as estimativas não tendenciosas de parâmetros que dependem linearmente dos dados, o MMQ fornece aquelas com menor variância
2
21 xxx
2/22 x
80 MMQ, agosto/2019
• Exemplo: dois dados com mesmo desvio padrão σ e não covariantes. O resultado do MMQ é
Outra estimativa geral, linear nos dados e não tendenciosa:
21 )1( xaaxx
Qual valor de a leva à menor variância dessa estimativa? Por propagação de incerteza,
x a a2 2 2 21( ( ) )
81 MMQ, agosto/2019
• Derivando em relação à a e igualando a zero, obtemos a=1/2 e, portanto,
2
21 xxx
que é o resultado do MMQ:
82 MMQ, agosto/2019
(c) O Teorema Central do Limite
Exemplo: médias de dados uniformemente distribuídos entre zero e um.
0
2
4
6
8
10
a
83 MMQ, agosto/2019
Um só dado
O valor ajustado obedece a uma distribuição normal quando ele é resultado de muitos dados
• Média de dois, quatro e oito dados
0
2
4
6
8
10
12
b
0
5
10
15
20
d
0
5
10
15
c
84 MMQ, agosto/2019
• O TCL garante que
xx x xn n
n
1 12
2 22 2
12
22 21 1 1
tende uma gaussiana com desvio padrão igual a 1, quaisquer que sejam as f.d.p.s dos dados
85 MMQ, agosto/2019
O TCL no contexto do MMQ
à é uma média dos vários dados experimentais yi, com pesos inversamente às respectivas variâncias
YVXX)V(XA 1t11t ~
86 MMQ, agosto/2019
Desde que a quantidade de dados seja suficientemente grande, cada parâmetro deverá obedecer a uma distribuição
normal, independente da forma da f. d. p. de cada dado
Exemplo
y=a+bx, onde os diferentes valores yi obedecem a diferentes f.d.p.s
x y d.p. Tipo
-3 5,0 1,0 gaussiana
-2 3,5 0,3 uniforme
-1 2,3 0,7 tipo qui2
0 1,1 1,0 gaussiana
1 -0,6 0,5 binomial
2 -0,2 0,4 duas uniformes
3 -2,8 0,5 binomial
87 MMQ, agosto/2019
Parâmetros a e b ajustados: 1,20(18); -1,14(9) devem obedecer a uma f,d,p, gaussiana ou bem perto disso,
Seria exatamente gaussiana se a quantidade de dados fosse infinita
88 MMQ, agosto/2019
Ilustração com muitas simulações Valores ajustados de a e b
89 MMQ, agosto/2019
• a) Medida de uma grandeza altera valores de outras
• b) Como incorporar um dado perdido
• c) Vínculos entre parâmetros
• d) Média de dados correlacionados
VI – Outros desenvolvimentos
90 MMQ, agosto/2019
• As próximas transparências discutem esses problemas
MMQ, agosto/2019 91
• Exemplo: a e b foram medidos, obtendo-se os valores 10,0 e 20,0, com matriz de covariância
a) Medida de uma grandeza altera outras
108
810V
Uma medida independente de b forneceu o valor 25,0 com variância igual a 10. Vamos ao MMQ.
92 MMQ, agosto/2019
• Evidentemente, valor adotado para b foi alterado; seu d. p., idem.
• Menos evidente: o valor adotado para a é alterado e seu d.p., idem.
1000
0108
0810
V
25
20
10
Y
3
2
1
0
0
10
10
01
25
20
10
e
e
e
b
a
5,22
0,12 YVX'X)V(X'Ã
111
0,50,4
0,48,6V
93 MMQ, agosto/2019
b) Como incorporar um novo dado a um ajuste
Parâmetros a e b foram ajustados
94 MMQ, agosto/2019
𝑦 = 𝑎 + 𝑏𝑥
𝑨 =𝑎 𝑏
𝑽𝑨 =𝜎𝑎2 𝜌. 𝜎𝑎 . 𝜎𝑏
𝜌. 𝜎𝑎 . 𝜎𝑏 𝜎𝑏2
𝑥, 𝑦, 𝜎
𝑎 𝑏
𝑦 =
1 00 11 𝑥
∙𝑎0𝑏0
+
𝜀1𝜀2𝜀3
𝑽𝒂, 𝒃 ,𝒚 =
𝜎𝑎2 𝜌. 𝜎𝑎 . 𝜎𝑏 0
𝜌. 𝜎𝑎 . 𝜎𝑏 𝜎𝑏2 0
0 0 𝜎2
Novo dado é obtido
c) Vínculos entre parâmetros
• Exemplo: mede-se os três ângulos internos de um triângulo, digamos, 1, 2, e 3, sendo os resultados y1,σ1; y2, σ2; y3, σ3. Mas queremos impor a condição .
• Um procedimento geral é ajustar valores para os parâmetros, 1, 2 e 3, impondo o vínculo.
o180~~~
321
95 MMQ, agosto/2019
• Uma forma geral de escrever vínculo lineares:
g a rij j
j
m
i
1
onde aj são os parâmetros a serem ajustados e gij e ri são valores conhecidos.
No caso do triangulo só há um vínculo (r=180o) e todos os gs são iguais a 1.
96 MMQ, agosto/2019
A equações de vínculo podem ser escritas como
GA R
Solução do MMQ:
~~A V X V Y BC RA
t 1 1
V H BC BA~ 1 1 t
B H G 1 t C GH G 1 tH X V X t 1
97 MMQ, agosto/2019
Exemplo
Ângulos de um triângulo: 48o, 41o, 94º (soma=183o) todos com σ=1 e não covariantes. G=[1 1 1] e R=[180].
1 0 0
0 1 0
0 0 1
V
94
41
48
Y
98 MMQ, agosto/2019
Resultado: Valores ajustados: 47o, 40o, 93o . Soma é 180o: obedece vínculo. As variâncias diminuem
1 0 0
0 1 0
0 0 1
V
0,67 0,33- 0,33-
0,33- 0,67 0,33-
0,33- 0,33- 0,67
V
Vela a pena impor vínculos? Depende. Incertezas diminuem, mas surgem correlações.
P. ex., se o que queremos é apenas um dos ângulos, sim.
99 MMQ, agosto/2019
Breve resumo
• O MMQ deve ser usado: – Sempre que as incertezas dos dados sejam
conhecidas (ou todas sejam iguais)
–Há uma relação linear entre os dados e os parâmetros a serem ajustados
100 MMQ, agosto/2019
d)Média de dados correlacionados
Considere uma situação na qual temos n dados correspondentes à uma mesma grandeza, y1, y2, ... yn.
Para simplificar, vamos supor que todos tenham o mesmo desvio padrão 𝜎.
Método dos Mínimos Quadrados 101
Caso os dados fossem não correlacionados, o valor a ser adotado seria a média simples dos dados e o desvio padrão dessa média seria 𝜎 𝑛
Suponha, entretanto, que a matriz de covariância dos dados seja
Método dos Mínimos Quadrados 102
𝐕 = 𝜎2
1 𝜌 ⋯ 𝜌𝜌 1 ⋱ ⋮
𝜌 𝜌 ⋯⋮1
Todas as variâncias são iguais a σ2.
Todas as covariâncias todas iguais a ρ·σ2.
O problema pode ser colocado dentro do esquema do MMQ, com y y e
y y e
y y en n
1 0 1
2 0 2
0
1
1
1
X
~yn
yi
i
n
1
1
~y
n
n
221
Método dos Mínimos Quadrados 103
Os resultados para o valor adotado e a variância são
~yn
yi
i
n
1
1
Método dos Mínimos Quadrados 104
Como no caso de dados não correlacionados, o valor adotado é a média simples dos dados
Resultado esperado, pois todas as variâncias e covariâncias são iguais e, portanto, nenhum dado poderia ter peso maior que os demais.
~y
n
n
221
Método dos Mínimos Quadrados 105
A variância depende da correlação
Note que se ρ=0, a variância desse valor é 𝜎 𝑛 , como esperado, e tende a zero quando n tende a infinito
Se ρ não é nulo, entretanto, mesmo que n tenda a infinito, ρ·σ2. Conclusão: a covariância é um limite para a variância do valor adotado
• O ajuste é não tendencioso • Os dados não precisam obedecer a nenhum
f.d.p. particular • Se há uma quantidade grande de dados, as
f.d.p.s dos parâmetros ajustados tendem a formas gaussianas
• Não precisa haver uma relação funcional do tipo y=y(x) para usar o MMQ
• As covariâncias são tão importantes quanto as variâncias
106 MMQ, agosto/2019