53
1 Simulação de Sistemas Dinâmicos 4. Análise de Dados Estimação de Parâmetros Em geral, numa simulação, deseja-se conhecer quan- tidades relacionadas a v.a.'s cuja obtenção direta se- ria muito difícil ou impossível. Exemplo: Tempo médio de sistema em regime numa rede de filas complexa. Em geral utilizam-se dois tipos de estimação: estimação pontual: quando se deseja um único valor correpondendo à quantidade de interêsse; estimação de intervalo: quando se deseja co- nhecer um intervalo no qual o parâmetro esti- mado esteja com nível de confiança dado (1). As técnicas de estimação são utilizadas também para determinar parâmetros das distribuições de dados de entrada obtidos experimentalmente.

Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

Embed Size (px)

Citation preview

Page 1: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

1Simulação de Sistemas Dinâmicos

4. Análise de Dados

Estimação de Parâmetros

Em geral, numa simulação, deseja-se conhecer quan-tidades relacionadas a v.a.'s cuja obtenção direta se-ria muito difícil ou impossível.

Exemplo: Tempo médio de sistema em regimenuma rede de filas complexa.

Em geral utilizam-se dois tipos de estimação:

•estimação pontual: quando se deseja um únicovalor correpondendo à quantidade de interêsse;

•estimação de intervalo: quando se deseja co-nhecer um intervalo no qual o parâmetro esti-mado esteja com nível de confiança dado (1−α).

As técnicas de estimação são utilizadas também paradeterminar parâmetros das distribuições de dados deentrada obtidos experimentalmente.

Page 2: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

2Simulação de Sistemas Dinâmicos

4. Análise de Dados

Estimação Pontual

Considere-se uma série de v.a.'s correspondendoà amostragem de n valores de um espaço amostral:

X1, X2, ..., Xn

Caso mais simples: a sequência acima é i.i.d., sendo θ a média da distribuição comum.

Um estimador para θ é:

∑=

=θn

1iin X

n1ˆ

obs.: θn é uma v.a. utilizada para estimar onúmero real θ.

^

Se E[θn] = θ o estimador é dito não-polarizado^

Page 3: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

3Simulação de Sistemas Dinâmicos

4. Análise de Dados

Se as v.a.'s são identicamente distribuídas (nãonecessariamente independentes), o estimador énão polarizado:

θ=θ==θ ∑∑==

n

1i

n

1iin n

1]X[E

n1

]ˆ[E

Se o processo estocástico é contínuo:

∫=θT

0T dt)t(X

T1ˆ

Em geral, E[θn] = θ + βn e o estimador é polarizado^

Qual a variância da v.a. θn ?^

n]ˆ[Var

2

se a sequência Xi for i.i.d. e σ2 = Var[Xi]

Page 4: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

4Simulação de Sistemas Dinâmicos

4. Análise de Dados

Um estimador para a variância σ2 é dado por:

( )∑=

θ−−

=n

1i

2

ni2n

ˆX1n

1S

Prova-se que E[Sn2] = σ2, quando a seq. for i.i.d.

Finalmente, um estimador para Var[θn] é:^

( )∑=

θ−−

==θσn

1i

2

ni

2n

n2 ˆX

)1n(n1

nS

)ˆ(ˆ

obs.: 0)ˆ(ˆlim n2

n=θσ

∞→

Page 5: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

5Simulação de Sistemas Dinâmicos

4. Análise de Dados

n cresce

θ θ

Densidade de probabilidade de θn:^

Teorema forte dos Grandes Números:

Se X1, X2, ..., Xn é uma sequência i.i.d. de v.a.'scom média θ finita, então:

θn → θ com probabilidade 1, quando n → ∞^

Obervações: a) assim como a não polarização, a propriedadeacima denominada "consistência forte" é desejávelem qualquer estimador.

b) um estimador pode ser fortemente consistente eao mesmo tempo não polarizado.

Page 6: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

6Simulação de Sistemas Dinâmicos

4. Análise de Dados

comportamento típico:

θ

θn^Var[θn]

^

n

Em experimentos de simulação, é usual queas sequências de amostras não sejam i.i.d.

Este fato não interfere em geral na estimativade θn, mas afeta Sn

2.^

Alternativas: estimar correlações ou organizaros dados de saída de modo a descorrelacioná-los

Page 7: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

7Simulação de Sistemas Dinâmicos

4. Análise de Dados

Estimação de Intervalos

Problema: Estimar um intervalo dentro do qualo parâmetro θ esteja com grau de confiança 1 − α(p.ex. 95%)

Define-se:

]ˆ[Var

]ˆ[EˆZ

n

nnn

θ

θ−θ=

No caso i.i.d.:

n]ˆ[Var

]ˆ[E2

n

n

σ=θ

θ=θ portanto:

n

ˆZ

2

nn

σ

θ−θ=

Page 8: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

8Simulação de Sistemas Dinâmicos

4. Análise de Dados

Teorema do Limite Central:

∫∞−

τ−

∞→τ

π=Φ=

x2

nnde

21

)x()x(Flim2

Φ(x) é a distribuição normal padronizada

Duas consequências deste teorema:

•A distribuição de θn se aproxima de uma normal

•Esta normal tende à média θ e à variância σ2/n

^

Seja Fn(x) a distribuição da variável aleatória Zn

Page 9: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

9Simulação de Sistemas Dinâmicos

4. Análise de Dados

Utilização para a estimação de intervalos:

x

2x

2

edxd −

1 − α

2zα

2zα−

Quando n é grande: P[−zα/2 ≤ Zn ≤ zα/2] ≅ 1 − α

Equivalentemente:

P[θn − zα/2 √(σ2/n) ≤ θ ≤ θn + zα/2√(σ2/n)] ≅ 1 − α^ ^

Page 10: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

10Simulação de Sistemas Dinâmicos

4. Análise de Dados

P[θn − zα/2 √(σ2/n) ≤ θ ≤ θn + zα/2√(σ2/n)] ≅ 1 − α^ ^

Portanto, a determinação do intervalo de confiançadepende de:

θn: estimação da média;zα/2: tabulado (dado α);σ2: variância da v.a. θn (desconhecida)

^

^

Contudo, σ2 pode ser estimado por:

( )∑=

θ−−

=n

1i

2

ni2n

ˆX1n

1S

Dado que o lim Sn2 = σ2 tem-se que teorema do

limite central vale também para a v.a.:n→∞

nS

ˆT

2n

nn

θ−θ=

Page 11: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

11Simulação de Sistemas Dinâmicos

4. Análise de Dados

θn − zα/2 √(Sn2/n) ≤ θ ≤ θn + zα/2√(Sn

2/n)^ ^

Portanto o intervalo

fica completamente determinado.

Questão: Qual deve ser o valor de n?

Suponha que a sequência X1, X2, ..., Xn seja normal.Se isto fôsse o caso, qual seria a densidade de proba-bilidade da variável aleatória:

?

nS

ˆT

2n

nn

θ−θ=

Observe-se que tanto θn quanto Sn2 dependem

dos Xi. Esta distribuição é conhecida como distribuiçãot de Student

^

Page 12: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

12Simulação de Sistemas Dinâmicos

4. Análise de Dados

Um dos parâmetros da distribuição t de Studenté o número de graus de liberdade.

A distribuição Tn anterior (com a hipótese de quecada Xi seja normal) tem (n − 1) graus de liberdade.

A partir de dados tabulados é possível determi-nar (em função de α e de n) o valor de tn−1,α/2tal que:

P[−tn−1,α/2 ≤ Tn ≤ tn−1,α/2 ] = 1 − α

o que leva a:

P[θn − tn−1,α/2 √(Sn2/n) ≤ θ ≤ θn + tn−1,α/2√(Sn

2/n)] ≅ 1 − α^ ^

Obs.: Esta continua sendo uma aproximação, po-rém melhor que a anterior.

Este é o cálculo implementado na maior partedos simuladores

Page 13: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

13Simulação de Sistemas Dinâmicos

4. Análise de Dados

Page 14: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

14Simulação de Sistemas Dinâmicos

4. Análise de Dados

Análise de Dados de Entrada

Numa simulação a determinação de modelos adequa-dos para as entradas do sistema é ao mesmo tempo:

•Fundamental para a confiabilidade dos resultadosda simulação;

•Exigente, em termo de tempo e recursos.

Etapas na determinação de modelos para os dadosde entrada:

1. Coleta de dados (nem sempre possível);

2. Identificação da distribuição de probabi-lidades do processo de entrada (usual-mente com a ajuda de histogramas);

3. Determinar parâmetros para a distribuiçãoescolhida;

4. Avaliar a distribuição resultante (grafica-mente ou através de testes estatísticos)

Page 15: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

15Simulação de Sistemas Dinâmicos

4. Análise de Dados

Coleta de Dados

Cuidados:•Coleta precisa;•Análise apropriada;•Representatividade do ambiente.

Sugestões:

Planejamento cuidadoso; pré-observação; considera-ção de várias formas de coletar os dados; observaçãode circunstâncias não-usuais.

Análise preliminar durante a coleta; verificação daadequação dos dados; rejeição de dados supérfluos.

Page 16: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

16Simulação de Sistemas Dinâmicos

4. Análise de Dados

Verificação de eventuais relações entre variáveis;p.ex. através da inspeção visual de diagramas deespalhamento.

Consideração da possibilidade de que uma sequên-cia de medidas aparentemente independentes possaapresentar autocorrelação.

Combinação de conjuntos de dados homogêneos;verificação da homogeneidade de dados coletadosem horários ou dias diferentes (p.ex. através de suasmédias)

Atenção à omissão de dados fora dos processos deinterêsse, porém importantes para o processo global.

Page 17: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

17Simulação de Sistemas Dinâmicos

4. Análise de Dados

Identificação da Distribuição

10 passo: Construção de um histograma

•Dividir a faixa de valores dos dados em interva-los (usualmente iguais);

•Rotular o eixo horizontal;

•Determinar a frequência de ocorrência dentrode cada intervalo;

•Plotar as frequências no eixo vertical.

20 passo: Selecionar uma família de distribuições

Esta seleção deve ser feita com base:

•na aparência do histograma;

•na natureza do processo analisado.

Page 18: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

18Simulação de Sistemas Dinâmicos

4. Análise de Dados

Alternativa útil quando há poucos dados:Gráficos Quantile × Quantile

Seja a v.a. X, com função de distribuição F(x); de-fine-se o q-quantile de X (0 ≤ q ≤ 1)como sendo:

γ = F−1(q)

Considere-se agora um conjunto de observações dav.a. X: {y1, y2, ..., yn}, colocados em ordem crescen-te: yj ≤ yj+1, ∀j

É interessante observar que yj é uma estimativapara o [(j − ½)/n]-quantile de X

1

F(x)

y1 y12

n = 12

(12 − ½)/12

(1 − ½)/12

y6 y9

x

Page 19: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

19Simulação de Sistemas Dinâmicos

4. Análise de Dados

Portanto, para verificar se um conjunto de observa-ções, {y1, y2, ..., yn} tem como distribuição F(x),plota-se:

y Fj

nj versus −−

11

2

Se a distribuição for correta o resultado é aproxima-damente uma linha reta com inclinação unitária.

Se a inclinação não for unitária, trata-se da escolhacorreta da família de distribuições, porém com parâ-metros errados.

Observações:•Os valores observados nunca caem exatamente

sobre a curva;

•Devido à ordenação, há dependência, portantose um ponto cai acima da curva, o próximoprovavelmente também cairá.

•As variâncias nos extremos podem ser maiores que no resto da faixa de valores (maior lineari-dade no centro da faixa).

Page 20: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

20Simulação de Sistemas Dinâmicos

4. Análise de Dados

Determinação de Parâmetros

As distribuições usuais tem parâmetros diretamenterelacionados à média e à variância e portanto podemser avaliados a partir de seus estimadores. Em algunscasos outros estimadores podem ser usados.

Exemplos:

Distribuição Parâmetros EstimadoresPoisson α = λt α = θn

Exponencial λ λ = 1/θn

Gama θ, β θ= 1/θn

β: tabelado a partir de MUniforme b(0,b)

Normal θ, σ2 θ = θn

σ2 = Sn2

Mn

Xn ii

n= −

=∑ln( $ ) ln( )θ

1

1

^^^

^^^

^

^^

$ [max( )]bn

nX

ii=

+1

^

Page 21: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

21Simulação de Sistemas Dinâmicos

4. Análise de Dados

Testes de Ajuste de Distribuições

χθ

σn ii

ni

i

nz

X2 2

1

2

21

= =−

= =∑ ∑ ( )

A variável aleatória chi-quadrado com n grausde liberdade é definida como:

onde zi são variáveis normais padrão independentes

Propriedades:

22n1n

22n

21n

2nn

2n

2n

normal lim

n2][Var

n][E

+

∞→

χ=χ+χ

A propriedade de aditividade pode ser generaliza-da para um número arbitrário finito de variáveis.

Page 22: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

22Simulação de Sistemas Dinâmicos

4. Análise de Dados

Page 23: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

23Simulação de Sistemas Dinâmicos

4. Análise de Dados

Sejam:

Ei: frequência esperada de uma variável aleatóriaX no i-ésimo intervalo de valores: Ei = n ∆i;

Oi: frequência observada no mesmo intervalo:Oi = ni (i = 1, 2, ..., k).

f(x)

xi-ésimointervalo

{

densidade deprobabilidade

∆i = área

x

histograma

i-ésimointervalo

{

h(x)

ni

......

Considerem-se n dados observados, agrupados em kintervalos e seja f(x) a densidade que se quer testar.

Page 24: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

24Simulação de Sistemas Dinâmicos

4. Análise de Dados

Pode-se mostrar que a variável aleatória:

( )χ0

22

0=

=∑

O EE

i i

ii

k

é uma distribuição chi-quadrado com p graus deliberdade, onde:•p = k − s − 1;•s é o número de parâmetros estimados a partir

da amostra.

Para verificar se o conjunto de dados coletadoscorresponde à distribuição proposta com nível designificância (α), aplica-se o teste de chi-quadrado:

Hipótese rejeitada se: χ χα02 2> ,p

onde: P p p[ ],χ χ αα2 2> =

P[rejeitar hip. | hip. é verdadeira] = α

Page 25: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

25Simulação de Sistemas Dinâmicos

4. Análise de Dados

Observações:

a) Se o número de observações é muito pequeno, difi-cilmente algum candidato é rejeitado; se é grande, to-do candidato é facilmente é rejeitado.

b) É recomendável que a frequência esperada em cadaintervalo (Ei) seja > 5. Caso isso não aconteça deve-se agrupar intervalos adjacentes. O parâmetro k deve sernesse caso, adequadamente reduzido.

c) Sugere-se que o número de intervalos para variáveiscontínuas obedeça a seguinte tabela:

20 não usar o chi-quadrado

50 5 a 10

100 10 a 20

>100 nn

a 5

tamanho da número de intervalos (k)amostra (n)

Page 26: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

26Simulação de Sistemas Dinâmicos

4. Análise de Dados

Exemplo:

Durante 100 dias úteis observou-se o número de auto-móveis passantes num certo ponto de uma estrada noperíodo entre 7h00 e 7h05. Os número obtidos foram:

n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11

freq. obs.: 12 10 19 17 10 8 7 5 5 3 3 1

Pergunta: É uma distribuição de Poisson ?

p xex

x

( )!

;=−α

α λα

= t; x = 0, 1, 2, K

10 passo: α = θn = 3,64 ^ ^

20 passo: Ei = n p(xi) = 100 p(xi); xi = 0, 1, ..., 11

n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11

freq. esper.: 2,6 9,6 17,4 21,1 19,2 14,0 8,5 4,4 2,0 0,8 0,3 0,1

Page 27: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

27Simulação de Sistemas Dinâmicos

4. Análise de Dados

30 passo: calcular( )

χ02

2

0=

=∑

O EE

i i

ii

k

n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11

Oi: 12 10 19 17 10 8 7 5 5 3 3 1

n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11

Ei: 2,6 9,6 17,4 21,1 19,2 14,0 8,5 4,4 2,0 0,8 0,3 0,1

22 17

12,2 7,6

( )O EE

i i

ii

k −=

=∑

2

027 68,portanto:

40 passo: p = k − s − 1 = 7 − 1 − 1 = 5; α = 0,05

χ0 01 52 111 27 68, ; , ,= < rejeitar hipótese

Page 28: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

28Simulação de Sistemas Dinâmicos

4. Análise de Dados

Dados empíricos indisponíves:

Dados técnicos:Alguns dispositivos simulados podemapresentar informações do fabricantedo tipo: tempo médio entre falhas, taxade produção média, etc..

Opinião de especialistas:Especialistas no processo em simulaçãopodem estimar piores e melhores casospara uma variável, variabilidade de umavariável, fonte de variabilidade, etc..

Limitações físicas e convencionais:A taxa em regime de processos em cas-cata não pode exceder a taxa do compo-nente mais lento; políticas de uma em-prêsa podem limitar durações, etc..

Natureza do processo:As distribuições usuais estão associadasa alguma hipótese, muitas vezes identifi-cável.

Page 29: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

29Simulação de Sistemas Dinâmicos

4. Análise de Dados

Dependência entre variáveis:

Modelos multivariáveis:Quando há um número fixo e finito devariáveis aleatórias

Séries Temporais:Sequência de variáveis aleatórias re-lacionadas

Dadas duas v.a.'s, X1 e X2, respectivamente commédias µ1 e µ2, e variâncias σ1 e σ2 define-se:

cov(X1,X2) = E[(X1 − µ1)(X2 − µ2)] = E[X1X2] − µ1µ2

ρ = corr(X1,X2) = cov(X1,X2)/(σ1 σ2)

−1 ≤ ρ ≤ +1

Page 30: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

30Simulação de Sistemas Dinâmicos

4. Análise de Dados

Se X1 e X2 são duas variáveis aleatórias normaisdependentes, a distribuição conjunta é completa-mente caracterizada por:

•médias: µ1 e µ2;•variâncias: σ1

2 e σ22

•covariância: cov(X1, X2)

Suas estimativas, a partir de n pares de dados{(X11, X21), (X12, X22), ..., (X1n, X2n)}são relacio-nadas por:

c$ov( , ) ( $ ) ( $ )

$ $

X Xn

X X

nX X n

j jj

n

j jj

n

1 2 1 1 2 21

1 21

1 2

11

11

=−

− ⋅ − =

−⋅

− ⋅ ⋅

=

=

µ µ

µ µ

21

21

ˆˆ)X,Xv(ocˆ

σσ=ρ

onde os estimadores de média e de variânciasão idênticos aos considerados anteriormente.

Modelos multivariáveis:

Page 31: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

31Simulação de Sistemas Dinâmicos

4. Análise de Dados

Séries Temporais:

Seja {X1, X2, ...} uma sequência de v.a.'s identica-mente distribuídas, dependentes e com covariânciaestacionária. Alguns modelos são possíveis paradescrever este tipo de processo.

Exemplo:

t1tt )X(X ε+µ−⋅φ+µ= −

t = 2, 3, ...ε2, ε3, ... são v.a.'s normais i.i.d. com média nula evariância σ2

−1 < φ < 1

Se X1 é definida com distribuição normal, média µe variância σε

2/(1 − φ2), então as v.a.'s X2, X3, ...tem a mesma distribuição e ainda:

ρh = corr(Xt, Xt+h) = φh

A estimação do parâmetro φ pode ser obtida de:

φ = ρ1 = corr(Xt, Xt+1)

Page 32: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

32Simulação de Sistemas Dinâmicos

4. Análise de Dados

Exemplo:

Xt = φ Xt−1; com probabilidade φφ Xt−1 + εt ; com probabilidade (1 − φ){

t = 2, 3, ...ε2, ε3, ... são v.a.'s exponenciais i.i.d. com média 1/λ0 < φ < 1

Se X1 é definida com distribuição exponencial, média1/λ, então as v.a.'s X2, X3, ... tem a mesma distribuiçãoe ainda:

ρh = corr(Xt, Xt+h) = φh

Como anteriormente, a estimação do parâmetro φpode ser obtida de:

φ = ρ1 = corr(Xt, Xt+1)

Page 33: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

33Simulação de Sistemas Dinâmicos

4. Análise de Dados

Verificação e Validação

•Reproduzir o comportamento do sistema modeladoo mais realisticamente possível;

•Aumentar a credibilidade do simulador, inclusive frente aos usuários finais;

•Processo pelo qual se adquire confiança de que aanálise de saídas leva a inferências válidas.

Verificação

"Construir o modelo corretamente"

•Comparação entre um modelo conceitual e um modelooperacional, representável em computador;

•O modelo está implementado corretamente nocomputador?

•Os parâmetros de entrada e a estrutura lógica estãocorretamente representados?

Page 34: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

34Simulação de Sistemas Dinâmicos

4. Análise de Dados

Validação

"Construir o modelo correto"

•A representação em computador é um modelo preciso?

•Usualmente atingida via calibração do modelo:

•Calibração: Processo iterativo de comparação entreos comportamentos do modelo e do sis-tema; correção até que se atinja a preci-são desejada.

Etapas na construção de um modelo

A - Observação e questionamento:

•Observação do comportamento geral;•Observação da interação entre os componentes;•Coleta de dados;•Questionamento de pessoas familiares com o sistema(operadores, técnicos, pessoal de manutenção, enge-nheiros, supervisores, gerentes, etc.).

•Esta etapa deve ser revisitada à medida que o desen-volvimento do modelo avança.

Page 35: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

35Simulação de Sistemas Dinâmicos

4. Análise de Dados

B - Construção de um modelo conceitual:

•Coleção de hipóteses sobre os componentes eestrutura do sistema;

•Hipóteses relativas aos valores dos parâmetrosdas entradas do modelo;

•Abstrações e simplificações;•A validação conceitual é a comparação do sis-tema real com o modelo conceitual.

C - Tradução do modelo conceitual para ummodelo operacional:

•O modelo operacional é reconhecível pelalinguagem de simulação - "forma computa-dorizada"

Todas estas etapas devem ser revisitadas perma-nentemente, inclusive nos processos de verifica-ção e validação.

Page 36: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

36Simulação de Sistemas Dinâmicos

4. Análise de Dados

Modelo conceitual:1. Hipóteses sobre os componentes do sist.2. Hipóteses sobre a estrutura, que definem

as interações entre os componentes3. Parâmetros de entrada e hipóteses sobre

os dados

Modelo Operacional(representação com-

putadorizada)

SistemaReal

calibraçãoe validação

validaçãoconceitual

verificaçãodo modelo

Page 37: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

37Simulação de Sistemas Dinâmicos

4. Análise de Dados

Verificação

•Garantir que o modelo conceitual está adquadamen-te representado no modelo operacional;

•É um procedimento dificilmente formalizável;

•As sugestões a seguir derivam da experiência e bom-senso e se aplicam a qualquer construção de software:

1 - Garantir que a representação computadorizada sejaverificada por alguém além do programador;

2 - Construir um fluxograma com todas asações logica-mente possíveis decorrentes da ocorrência de um evento;

3 - Examinar se as saídas do sistema são razoáveis parauma grande variedade de entradas - imprimir muitasestatísticas de saída;

4 - Imprimir os parâmetros de entrada ao fim da simula-ção para detectar mudanças inadvertidas;

Page 38: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

38Simulação de Sistemas Dinâmicos

4. Análise de Dados

5 - Documentar a representação computadorizadada maneira mais completa possível; definir as vari-áveis precisamente; comentar a função de trechosrelevantes de código;

6 - Se há animação, verificar a compatibilidade como sistema real (p. ex. AGV's que se superpõem);

7 - Usar, se houver, um "Controlador de ExecuçãoInterativo" (Interactive Run Controller - IRC oudebugger);

8 - Interfaces gráficas facilitam o processo de vali-dação e verificação (constituem uma forma de do-cumentação - vide Extend)

9 - Uma técnica mais sofisticada é o traço de umsimulador.

Page 39: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

39Simulação de Sistemas Dinâmicos

4. Análise de Dados

Validação e Calibração

Validação: Processo global de comparação entreos comportamentos do sistema e do modelo.

Calibração: Processo iterativo de comparação e ajustes

Modelo inicial

1a revisãodo modelo

2a revisãodo modelo

M

comparação

comparação

comparação

SistemaReal

Page 40: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

40Simulação de Sistemas Dinâmicos

4. Análise de Dados

O processo de comparaçãopode ser feito por testes:

subjetivos: envolvem es-pecialistas e seus julga-mentos sobre o modelo e suas saídas.

objetivos: envolvem dadosdo sistema e do modelo;revisões até a precisão de-sejada.

Crítica: Validação realizada sobre um único conjuntode dados.

Alternativa: Novo conjunto de dados para uma fase finalde validação.

Se discrepâncias muito grandes forem detectadas:revisão do modelo

Page 41: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

41Simulação de Sistemas Dinâmicos

4. Análise de Dados

•Validação não é um processo com fronteira clara;

•Nenhum modelo representa completamente umsistema.

•Há portanto um compromisso:precisão custo

Sugestões:

1. Construir um modelo com boa"validade de rosto";

2. Validar as hipóteses do modelo;

3. Comparar as transformações entrada-saída do mode-lo com as transformações entrada-saída do sistema.

Page 42: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

42Simulação de Sistemas Dinâmicos

4. Análise de Dados

"Validade de rosto":

Qualidade de "parecer razoável" do ponto de vistados usuários e dos conhecedores do sistema;

Os potenciais usuários devem preferencialmenteestar envolvidos desde a conceitualização até aimplementação do modelo;

Usuários e conhecedores podem também ajudar aidentificar deficiências no modelo;

A credibilidade final do simulador é essencial parabasear tomadas de decisão;

Teste: Análise de SensibilidadeSe variáveis de entrada forem alteradas, as saídasvariam conformemente ?(aspecto importante: seleção das relações entrada-saídaa serem testadas)

Page 43: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

43Simulação de Sistemas Dinâmicos

4. Análise de Dados

Validação das hipóteses do modelo:

Hipóteses do modelo:Estruturais

Dados

Estruturais:

•Envolvem simplificações e abstrações da realidade;

•Verificadas por observação do sistema nos períodosapropriados e com conhecedores do sistema.

Dados:

•As hipóteses sobre os dados devem ser baseadas emcoleta de dados confiáveis e análise estatística correta;

•Deve-se tomar cuidado para garantir a não-correlaçãodos dados tratados;

•Os procedimentos para fundamentar e analisar as hi-póteses sobre os dados foram tratados anteriormente.

Page 44: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

44Simulação de Sistemas Dinâmicos

4. Análise de Dados

Validação das transformações Entrada-Saída

•Nesta fase o modelo é visto como uma transformaçãoentrada-saída.

•Técnica: predição do passadoUsar dados passados (diferentes daqueles usados paracalibrar o sistema) ao fazer uma validação final.

1a alternativa:

•Coletar dados de entrada e calcular as respectivas saídas;

•Gerar, via modelo, dados de entrada e obter saídas;

•Comparar estatisticamente as saídas reais com as saídassimuladas (testes de hipótese).

Page 45: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

45Simulação de Sistemas Dinâmicos

4. Análise de Dados

Exemplo:

entradasobservadas Sistema Real saídas

(Intervalos entre chegadas;Tempos de Serviço;)

(E[S];r = utilização do servidor

entradasgeradas Modelo saídas

Teste de hipótese: as saídas calculadas (p. ex. E[S])e as saídas obtidas pelo modelo tem a mesmadistribuição?

Page 46: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

46Simulação de Sistemas Dinâmicos

4. Análise de Dados

2a alternativa:

•Utilizar os dados observados como entradas domodelo e calcular as saídas;

•Comparar estatisticamente (teste de hipótese)com as respectivas saídas calculadas no sistemareal.

3a alternativa:

Teste de Turing: Comparação, por conhecedoresdo sistema, de resultados reais × resultados simulados

Exemplo:

10 relatórios usuais:(embaralhados)

5 simulações

5 reais

Se um especialista reconhecer um número significa-tivo de relatórios obtidos via simulação:

rever o modelo

Page 47: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

47Simulação de Sistemas Dinâmicos

4. Análise de Dados

Análise de Dados de Saída

Um aspecto fundamental para a análise estatítica dedados é que os valores sejam independentes.

Numa sequência: Y1, Y2, ..., Yk, ..., Yn, se:

cov[Yi, Yi+p] = E[(Yi − Y) (Yi+p − Y)] ≠ 0

então a estimativa da variânciaserá polarizada.

−= ∑

=

n

1k

2k )YY(

1n1

Se cov > 0 variância sub-estimada (pior caso)

Se cov < 0 variância sobre-estimada (+seguro)

Page 48: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

48Simulação de Sistemas Dinâmicos

4. Análise de Dados

Em geral, as simulações podem ser divididas em:

a) Simulações terminantes:

Simulações que tem uma finalização bem definida:

tempoeventoestado

b) Simulações não-terminantes:

Simulações sem final definido, estando o interêsseem analisar o funcionamento em regime do sistema.Deseja-se por exemplo estimar parâmetros de distri-buições estacionárias.

Dificuldades:condições iniciais

regra de paradanão há regrasrigorosas

Usualmente, quanto mais longa a simulação, melhor.

Page 49: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

49Simulação de Sistemas Dinâmicos

4. Análise de Dados

Simulações terminantes

Sejam X1, X2, ..., Xk, ..., XM, medidas de algumparâmetro de interêsse numa simulação.

Em geral, esta sequência não é i.i.d. e uma estimativa(p. ex. da média) da sequência seria polarizada.

Pode-se estar interessado numa função de M medi-das L(X1, X2, ..., Xk, ..., XM). Esta função pode in-clusive ser a média.

A pergunta é: como estimar L ?

Uma técnica usual são as "replicações independentes"

Page 50: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

50Simulação de Sistemas Dinâmicos

4. Análise de Dados

Calcula-se L(X1, X2, ..., Xk, ..., XM) para N simula-ções diferentes:

mesmas condições iniciais;diferentes sequências de v.a.'s(variam-se aleatoriamente as sementes)

Obtém-se uma sequência: L1, L2, ..., LN

Estas sequências são praticamente i.i.d.

É possível p. ex. estimar um intervalo de confiançapara a estimativa da média:

∑=

=N

1jjL

N1

L

Page 51: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

51Simulação de Sistemas Dinâmicos

4. Análise de Dados

Simulações não-terminantes

Nesse caso, em geral, deseja-se conhecer algum pa-râmetro referente ao comportamento de alguma se-quência em regime (se o regime existir).

X1, X2, ..., Xk, ...

Quanto maior o número de amostras, melhor o resul-tado, contudo o número deve ser finito.

Uma técnica para melhorar a análise deste tipo desaída é eliminar dados no início da simulação:

X1, X2, ..., Xr, Xr+1, ..., Xm

ignorar considerar

Warm-up (aquecimento)ou

Deleção de dados iniciais

Page 52: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

52Simulação de Sistemas Dinâmicos

4. Análise de Dados

Procede-se então como no caso já analisado, fazendovárias (n) replicações:

Xi,j

Xr,j

r mi

eliminado

M

M(j-ésima simulação)

n,,1j ;Xrm

1L

m

1rij,ij L=

−= ∑

+=

∑=

=θn

1jjL

n1ˆ

Page 53: Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior. Este é o cálculo implementado na maior parte dos simuladores. Simulação de Sistemas

53Simulação de Sistemas Dinâmicos

4. Análise de Dados

Média de bateladas

(técnica mais simples, porém menos segura)

Uma única simulação (mais longa) é realizada esomente um período de "warm-up" é considerado;as estimativas de Lj são obtidas de dados sequenciais.

eliminado bat_1 bat_2 bat_n... i

Xi

n,,1j ;Xm1

Ljmr

1m)1j(riij L== ∑

+

+−+=

∑=

=θn

1jjL

n1ˆ