Estimação de Parâmetros - UNICAMPrafael/ia369/analise_dados.pdf · rém melhor que a anterior....

Preview:

Citation preview

1Simulação de Sistemas Dinâmicos

4. Análise de Dados

Estimação de Parâmetros

Em geral, numa simulação, deseja-se conhecer quan-tidades relacionadas a v.a.'s cuja obtenção direta se-ria muito difícil ou impossível.

Exemplo: Tempo médio de sistema em regimenuma rede de filas complexa.

Em geral utilizam-se dois tipos de estimação:

•estimação pontual: quando se deseja um únicovalor correpondendo à quantidade de interêsse;

•estimação de intervalo: quando se deseja co-nhecer um intervalo no qual o parâmetro esti-mado esteja com nível de confiança dado (1−α).

As técnicas de estimação são utilizadas também paradeterminar parâmetros das distribuições de dados deentrada obtidos experimentalmente.

2Simulação de Sistemas Dinâmicos

4. Análise de Dados

Estimação Pontual

Considere-se uma série de v.a.'s correspondendoà amostragem de n valores de um espaço amostral:

X1, X2, ..., Xn

Caso mais simples: a sequência acima é i.i.d., sendo θ a média da distribuição comum.

Um estimador para θ é:

∑=

=θn

1iin X

n1ˆ

obs.: θn é uma v.a. utilizada para estimar onúmero real θ.

^

Se E[θn] = θ o estimador é dito não-polarizado^

3Simulação de Sistemas Dinâmicos

4. Análise de Dados

Se as v.a.'s são identicamente distribuídas (nãonecessariamente independentes), o estimador énão polarizado:

θ=θ==θ ∑∑==

n

1i

n

1iin n

1]X[E

n1

]ˆ[E

Se o processo estocástico é contínuo:

∫=θT

0T dt)t(X

T1ˆ

Em geral, E[θn] = θ + βn e o estimador é polarizado^

Qual a variância da v.a. θn ?^

n]ˆ[Var

2

se a sequência Xi for i.i.d. e σ2 = Var[Xi]

4Simulação de Sistemas Dinâmicos

4. Análise de Dados

Um estimador para a variância σ2 é dado por:

( )∑=

θ−−

=n

1i

2

ni2n

ˆX1n

1S

Prova-se que E[Sn2] = σ2, quando a seq. for i.i.d.

Finalmente, um estimador para Var[θn] é:^

( )∑=

θ−−

==θσn

1i

2

ni

2n

n2 ˆX

)1n(n1

nS

)ˆ(ˆ

obs.: 0)ˆ(ˆlim n2

n=θσ

∞→

5Simulação de Sistemas Dinâmicos

4. Análise de Dados

n cresce

θ θ

Densidade de probabilidade de θn:^

Teorema forte dos Grandes Números:

Se X1, X2, ..., Xn é uma sequência i.i.d. de v.a.'scom média θ finita, então:

θn → θ com probabilidade 1, quando n → ∞^

Obervações: a) assim como a não polarização, a propriedadeacima denominada "consistência forte" é desejávelem qualquer estimador.

b) um estimador pode ser fortemente consistente eao mesmo tempo não polarizado.

6Simulação de Sistemas Dinâmicos

4. Análise de Dados

comportamento típico:

θ

θn^Var[θn]

^

n

Em experimentos de simulação, é usual queas sequências de amostras não sejam i.i.d.

Este fato não interfere em geral na estimativade θn, mas afeta Sn

2.^

Alternativas: estimar correlações ou organizaros dados de saída de modo a descorrelacioná-los

7Simulação de Sistemas Dinâmicos

4. Análise de Dados

Estimação de Intervalos

Problema: Estimar um intervalo dentro do qualo parâmetro θ esteja com grau de confiança 1 − α(p.ex. 95%)

Define-se:

]ˆ[Var

]ˆ[EˆZ

n

nnn

θ

θ−θ=

No caso i.i.d.:

n]ˆ[Var

]ˆ[E2

n

n

σ=θ

θ=θ portanto:

n

ˆZ

2

nn

σ

θ−θ=

8Simulação de Sistemas Dinâmicos

4. Análise de Dados

Teorema do Limite Central:

∫∞−

τ−

∞→τ

π=Φ=

x2

nnde

21

)x()x(Flim2

Φ(x) é a distribuição normal padronizada

Duas consequências deste teorema:

•A distribuição de θn se aproxima de uma normal

•Esta normal tende à média θ e à variância σ2/n

^

Seja Fn(x) a distribuição da variável aleatória Zn

9Simulação de Sistemas Dinâmicos

4. Análise de Dados

Utilização para a estimação de intervalos:

x

2x

2

edxd −

1 − α

2zα

2zα−

Quando n é grande: P[−zα/2 ≤ Zn ≤ zα/2] ≅ 1 − α

Equivalentemente:

P[θn − zα/2 √(σ2/n) ≤ θ ≤ θn + zα/2√(σ2/n)] ≅ 1 − α^ ^

10Simulação de Sistemas Dinâmicos

4. Análise de Dados

P[θn − zα/2 √(σ2/n) ≤ θ ≤ θn + zα/2√(σ2/n)] ≅ 1 − α^ ^

Portanto, a determinação do intervalo de confiançadepende de:

θn: estimação da média;zα/2: tabulado (dado α);σ2: variância da v.a. θn (desconhecida)

^

^

Contudo, σ2 pode ser estimado por:

( )∑=

θ−−

=n

1i

2

ni2n

ˆX1n

1S

Dado que o lim Sn2 = σ2 tem-se que teorema do

limite central vale também para a v.a.:n→∞

nS

ˆT

2n

nn

θ−θ=

11Simulação de Sistemas Dinâmicos

4. Análise de Dados

θn − zα/2 √(Sn2/n) ≤ θ ≤ θn + zα/2√(Sn

2/n)^ ^

Portanto o intervalo

fica completamente determinado.

Questão: Qual deve ser o valor de n?

Suponha que a sequência X1, X2, ..., Xn seja normal.Se isto fôsse o caso, qual seria a densidade de proba-bilidade da variável aleatória:

?

nS

ˆT

2n

nn

θ−θ=

Observe-se que tanto θn quanto Sn2 dependem

dos Xi. Esta distribuição é conhecida como distribuiçãot de Student

^

12Simulação de Sistemas Dinâmicos

4. Análise de Dados

Um dos parâmetros da distribuição t de Studenté o número de graus de liberdade.

A distribuição Tn anterior (com a hipótese de quecada Xi seja normal) tem (n − 1) graus de liberdade.

A partir de dados tabulados é possível determi-nar (em função de α e de n) o valor de tn−1,α/2tal que:

P[−tn−1,α/2 ≤ Tn ≤ tn−1,α/2 ] = 1 − α

o que leva a:

P[θn − tn−1,α/2 √(Sn2/n) ≤ θ ≤ θn + tn−1,α/2√(Sn

2/n)] ≅ 1 − α^ ^

Obs.: Esta continua sendo uma aproximação, po-rém melhor que a anterior.

Este é o cálculo implementado na maior partedos simuladores

13Simulação de Sistemas Dinâmicos

4. Análise de Dados

14Simulação de Sistemas Dinâmicos

4. Análise de Dados

Análise de Dados de Entrada

Numa simulação a determinação de modelos adequa-dos para as entradas do sistema é ao mesmo tempo:

•Fundamental para a confiabilidade dos resultadosda simulação;

•Exigente, em termo de tempo e recursos.

Etapas na determinação de modelos para os dadosde entrada:

1. Coleta de dados (nem sempre possível);

2. Identificação da distribuição de probabi-lidades do processo de entrada (usual-mente com a ajuda de histogramas);

3. Determinar parâmetros para a distribuiçãoescolhida;

4. Avaliar a distribuição resultante (grafica-mente ou através de testes estatísticos)

15Simulação de Sistemas Dinâmicos

4. Análise de Dados

Coleta de Dados

Cuidados:•Coleta precisa;•Análise apropriada;•Representatividade do ambiente.

Sugestões:

Planejamento cuidadoso; pré-observação; considera-ção de várias formas de coletar os dados; observaçãode circunstâncias não-usuais.

Análise preliminar durante a coleta; verificação daadequação dos dados; rejeição de dados supérfluos.

16Simulação de Sistemas Dinâmicos

4. Análise de Dados

Verificação de eventuais relações entre variáveis;p.ex. através da inspeção visual de diagramas deespalhamento.

Consideração da possibilidade de que uma sequên-cia de medidas aparentemente independentes possaapresentar autocorrelação.

Combinação de conjuntos de dados homogêneos;verificação da homogeneidade de dados coletadosem horários ou dias diferentes (p.ex. através de suasmédias)

Atenção à omissão de dados fora dos processos deinterêsse, porém importantes para o processo global.

17Simulação de Sistemas Dinâmicos

4. Análise de Dados

Identificação da Distribuição

10 passo: Construção de um histograma

•Dividir a faixa de valores dos dados em interva-los (usualmente iguais);

•Rotular o eixo horizontal;

•Determinar a frequência de ocorrência dentrode cada intervalo;

•Plotar as frequências no eixo vertical.

20 passo: Selecionar uma família de distribuições

Esta seleção deve ser feita com base:

•na aparência do histograma;

•na natureza do processo analisado.

18Simulação de Sistemas Dinâmicos

4. Análise de Dados

Alternativa útil quando há poucos dados:Gráficos Quantile × Quantile

Seja a v.a. X, com função de distribuição F(x); de-fine-se o q-quantile de X (0 ≤ q ≤ 1)como sendo:

γ = F−1(q)

Considere-se agora um conjunto de observações dav.a. X: {y1, y2, ..., yn}, colocados em ordem crescen-te: yj ≤ yj+1, ∀j

É interessante observar que yj é uma estimativapara o [(j − ½)/n]-quantile de X

1

F(x)

y1 y12

n = 12

(12 − ½)/12

(1 − ½)/12

y6 y9

x

19Simulação de Sistemas Dinâmicos

4. Análise de Dados

Portanto, para verificar se um conjunto de observa-ções, {y1, y2, ..., yn} tem como distribuição F(x),plota-se:

y Fj

nj versus −−

11

2

Se a distribuição for correta o resultado é aproxima-damente uma linha reta com inclinação unitária.

Se a inclinação não for unitária, trata-se da escolhacorreta da família de distribuições, porém com parâ-metros errados.

Observações:•Os valores observados nunca caem exatamente

sobre a curva;

•Devido à ordenação, há dependência, portantose um ponto cai acima da curva, o próximoprovavelmente também cairá.

•As variâncias nos extremos podem ser maiores que no resto da faixa de valores (maior lineari-dade no centro da faixa).

20Simulação de Sistemas Dinâmicos

4. Análise de Dados

Determinação de Parâmetros

As distribuições usuais tem parâmetros diretamenterelacionados à média e à variância e portanto podemser avaliados a partir de seus estimadores. Em algunscasos outros estimadores podem ser usados.

Exemplos:

Distribuição Parâmetros EstimadoresPoisson α = λt α = θn

Exponencial λ λ = 1/θn

Gama θ, β θ= 1/θn

β: tabelado a partir de MUniforme b(0,b)

Normal θ, σ2 θ = θn

σ2 = Sn2

Mn

Xn ii

n= −

=∑ln( $ ) ln( )θ

1

1

^^^

^^^

^

^^

$ [max( )]bn

nX

ii=

+1

^

21Simulação de Sistemas Dinâmicos

4. Análise de Dados

Testes de Ajuste de Distribuições

χθ

σn ii

ni

i

nz

X2 2

1

2

21

= =−

= =∑ ∑ ( )

A variável aleatória chi-quadrado com n grausde liberdade é definida como:

onde zi são variáveis normais padrão independentes

Propriedades:

22n1n

22n

21n

2nn

2n

2n

normal lim

n2][Var

n][E

+

∞→

χ=χ+χ

A propriedade de aditividade pode ser generaliza-da para um número arbitrário finito de variáveis.

22Simulação de Sistemas Dinâmicos

4. Análise de Dados

23Simulação de Sistemas Dinâmicos

4. Análise de Dados

Sejam:

Ei: frequência esperada de uma variável aleatóriaX no i-ésimo intervalo de valores: Ei = n ∆i;

Oi: frequência observada no mesmo intervalo:Oi = ni (i = 1, 2, ..., k).

f(x)

xi-ésimointervalo

{

densidade deprobabilidade

∆i = área

x

histograma

i-ésimointervalo

{

h(x)

ni

......

Considerem-se n dados observados, agrupados em kintervalos e seja f(x) a densidade que se quer testar.

24Simulação de Sistemas Dinâmicos

4. Análise de Dados

Pode-se mostrar que a variável aleatória:

( )χ0

22

0=

=∑

O EE

i i

ii

k

é uma distribuição chi-quadrado com p graus deliberdade, onde:•p = k − s − 1;•s é o número de parâmetros estimados a partir

da amostra.

Para verificar se o conjunto de dados coletadoscorresponde à distribuição proposta com nível designificância (α), aplica-se o teste de chi-quadrado:

Hipótese rejeitada se: χ χα02 2> ,p

onde: P p p[ ],χ χ αα2 2> =

P[rejeitar hip. | hip. é verdadeira] = α

25Simulação de Sistemas Dinâmicos

4. Análise de Dados

Observações:

a) Se o número de observações é muito pequeno, difi-cilmente algum candidato é rejeitado; se é grande, to-do candidato é facilmente é rejeitado.

b) É recomendável que a frequência esperada em cadaintervalo (Ei) seja > 5. Caso isso não aconteça deve-se agrupar intervalos adjacentes. O parâmetro k deve sernesse caso, adequadamente reduzido.

c) Sugere-se que o número de intervalos para variáveiscontínuas obedeça a seguinte tabela:

20 não usar o chi-quadrado

50 5 a 10

100 10 a 20

>100 nn

a 5

tamanho da número de intervalos (k)amostra (n)

26Simulação de Sistemas Dinâmicos

4. Análise de Dados

Exemplo:

Durante 100 dias úteis observou-se o número de auto-móveis passantes num certo ponto de uma estrada noperíodo entre 7h00 e 7h05. Os número obtidos foram:

n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11

freq. obs.: 12 10 19 17 10 8 7 5 5 3 3 1

Pergunta: É uma distribuição de Poisson ?

p xex

x

( )!

;=−α

α λα

= t; x = 0, 1, 2, K

10 passo: α = θn = 3,64 ^ ^

20 passo: Ei = n p(xi) = 100 p(xi); xi = 0, 1, ..., 11

n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11

freq. esper.: 2,6 9,6 17,4 21,1 19,2 14,0 8,5 4,4 2,0 0,8 0,3 0,1

27Simulação de Sistemas Dinâmicos

4. Análise de Dados

30 passo: calcular( )

χ02

2

0=

=∑

O EE

i i

ii

k

n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11

Oi: 12 10 19 17 10 8 7 5 5 3 3 1

n0 de autos: 0 1 2 3 4 5 6 7 8 9 10 11

Ei: 2,6 9,6 17,4 21,1 19,2 14,0 8,5 4,4 2,0 0,8 0,3 0,1

22 17

12,2 7,6

( )O EE

i i

ii

k −=

=∑

2

027 68,portanto:

40 passo: p = k − s − 1 = 7 − 1 − 1 = 5; α = 0,05

χ0 01 52 111 27 68, ; , ,= < rejeitar hipótese

28Simulação de Sistemas Dinâmicos

4. Análise de Dados

Dados empíricos indisponíves:

Dados técnicos:Alguns dispositivos simulados podemapresentar informações do fabricantedo tipo: tempo médio entre falhas, taxade produção média, etc..

Opinião de especialistas:Especialistas no processo em simulaçãopodem estimar piores e melhores casospara uma variável, variabilidade de umavariável, fonte de variabilidade, etc..

Limitações físicas e convencionais:A taxa em regime de processos em cas-cata não pode exceder a taxa do compo-nente mais lento; políticas de uma em-prêsa podem limitar durações, etc..

Natureza do processo:As distribuições usuais estão associadasa alguma hipótese, muitas vezes identifi-cável.

29Simulação de Sistemas Dinâmicos

4. Análise de Dados

Dependência entre variáveis:

Modelos multivariáveis:Quando há um número fixo e finito devariáveis aleatórias

Séries Temporais:Sequência de variáveis aleatórias re-lacionadas

Dadas duas v.a.'s, X1 e X2, respectivamente commédias µ1 e µ2, e variâncias σ1 e σ2 define-se:

cov(X1,X2) = E[(X1 − µ1)(X2 − µ2)] = E[X1X2] − µ1µ2

ρ = corr(X1,X2) = cov(X1,X2)/(σ1 σ2)

−1 ≤ ρ ≤ +1

30Simulação de Sistemas Dinâmicos

4. Análise de Dados

Se X1 e X2 são duas variáveis aleatórias normaisdependentes, a distribuição conjunta é completa-mente caracterizada por:

•médias: µ1 e µ2;•variâncias: σ1

2 e σ22

•covariância: cov(X1, X2)

Suas estimativas, a partir de n pares de dados{(X11, X21), (X12, X22), ..., (X1n, X2n)}são relacio-nadas por:

c$ov( , ) ( $ ) ( $ )

$ $

X Xn

X X

nX X n

j jj

n

j jj

n

1 2 1 1 2 21

1 21

1 2

11

11

=−

− ⋅ − =

−⋅

− ⋅ ⋅

=

=

µ µ

µ µ

21

21

ˆˆ)X,Xv(ocˆ

σσ=ρ

onde os estimadores de média e de variânciasão idênticos aos considerados anteriormente.

Modelos multivariáveis:

31Simulação de Sistemas Dinâmicos

4. Análise de Dados

Séries Temporais:

Seja {X1, X2, ...} uma sequência de v.a.'s identica-mente distribuídas, dependentes e com covariânciaestacionária. Alguns modelos são possíveis paradescrever este tipo de processo.

Exemplo:

t1tt )X(X ε+µ−⋅φ+µ= −

t = 2, 3, ...ε2, ε3, ... são v.a.'s normais i.i.d. com média nula evariância σ2

−1 < φ < 1

Se X1 é definida com distribuição normal, média µe variância σε

2/(1 − φ2), então as v.a.'s X2, X3, ...tem a mesma distribuição e ainda:

ρh = corr(Xt, Xt+h) = φh

A estimação do parâmetro φ pode ser obtida de:

φ = ρ1 = corr(Xt, Xt+1)

32Simulação de Sistemas Dinâmicos

4. Análise de Dados

Exemplo:

Xt = φ Xt−1; com probabilidade φφ Xt−1 + εt ; com probabilidade (1 − φ){

t = 2, 3, ...ε2, ε3, ... são v.a.'s exponenciais i.i.d. com média 1/λ0 < φ < 1

Se X1 é definida com distribuição exponencial, média1/λ, então as v.a.'s X2, X3, ... tem a mesma distribuiçãoe ainda:

ρh = corr(Xt, Xt+h) = φh

Como anteriormente, a estimação do parâmetro φpode ser obtida de:

φ = ρ1 = corr(Xt, Xt+1)

33Simulação de Sistemas Dinâmicos

4. Análise de Dados

Verificação e Validação

•Reproduzir o comportamento do sistema modeladoo mais realisticamente possível;

•Aumentar a credibilidade do simulador, inclusive frente aos usuários finais;

•Processo pelo qual se adquire confiança de que aanálise de saídas leva a inferências válidas.

Verificação

"Construir o modelo corretamente"

•Comparação entre um modelo conceitual e um modelooperacional, representável em computador;

•O modelo está implementado corretamente nocomputador?

•Os parâmetros de entrada e a estrutura lógica estãocorretamente representados?

34Simulação de Sistemas Dinâmicos

4. Análise de Dados

Validação

"Construir o modelo correto"

•A representação em computador é um modelo preciso?

•Usualmente atingida via calibração do modelo:

•Calibração: Processo iterativo de comparação entreos comportamentos do modelo e do sis-tema; correção até que se atinja a preci-são desejada.

Etapas na construção de um modelo

A - Observação e questionamento:

•Observação do comportamento geral;•Observação da interação entre os componentes;•Coleta de dados;•Questionamento de pessoas familiares com o sistema(operadores, técnicos, pessoal de manutenção, enge-nheiros, supervisores, gerentes, etc.).

•Esta etapa deve ser revisitada à medida que o desen-volvimento do modelo avança.

35Simulação de Sistemas Dinâmicos

4. Análise de Dados

B - Construção de um modelo conceitual:

•Coleção de hipóteses sobre os componentes eestrutura do sistema;

•Hipóteses relativas aos valores dos parâmetrosdas entradas do modelo;

•Abstrações e simplificações;•A validação conceitual é a comparação do sis-tema real com o modelo conceitual.

C - Tradução do modelo conceitual para ummodelo operacional:

•O modelo operacional é reconhecível pelalinguagem de simulação - "forma computa-dorizada"

Todas estas etapas devem ser revisitadas perma-nentemente, inclusive nos processos de verifica-ção e validação.

36Simulação de Sistemas Dinâmicos

4. Análise de Dados

Modelo conceitual:1. Hipóteses sobre os componentes do sist.2. Hipóteses sobre a estrutura, que definem

as interações entre os componentes3. Parâmetros de entrada e hipóteses sobre

os dados

Modelo Operacional(representação com-

putadorizada)

SistemaReal

calibraçãoe validação

validaçãoconceitual

verificaçãodo modelo

37Simulação de Sistemas Dinâmicos

4. Análise de Dados

Verificação

•Garantir que o modelo conceitual está adquadamen-te representado no modelo operacional;

•É um procedimento dificilmente formalizável;

•As sugestões a seguir derivam da experiência e bom-senso e se aplicam a qualquer construção de software:

1 - Garantir que a representação computadorizada sejaverificada por alguém além do programador;

2 - Construir um fluxograma com todas asações logica-mente possíveis decorrentes da ocorrência de um evento;

3 - Examinar se as saídas do sistema são razoáveis parauma grande variedade de entradas - imprimir muitasestatísticas de saída;

4 - Imprimir os parâmetros de entrada ao fim da simula-ção para detectar mudanças inadvertidas;

38Simulação de Sistemas Dinâmicos

4. Análise de Dados

5 - Documentar a representação computadorizadada maneira mais completa possível; definir as vari-áveis precisamente; comentar a função de trechosrelevantes de código;

6 - Se há animação, verificar a compatibilidade como sistema real (p. ex. AGV's que se superpõem);

7 - Usar, se houver, um "Controlador de ExecuçãoInterativo" (Interactive Run Controller - IRC oudebugger);

8 - Interfaces gráficas facilitam o processo de vali-dação e verificação (constituem uma forma de do-cumentação - vide Extend)

9 - Uma técnica mais sofisticada é o traço de umsimulador.

39Simulação de Sistemas Dinâmicos

4. Análise de Dados

Validação e Calibração

Validação: Processo global de comparação entreos comportamentos do sistema e do modelo.

Calibração: Processo iterativo de comparação e ajustes

Modelo inicial

1a revisãodo modelo

2a revisãodo modelo

M

comparação

comparação

comparação

SistemaReal

40Simulação de Sistemas Dinâmicos

4. Análise de Dados

O processo de comparaçãopode ser feito por testes:

subjetivos: envolvem es-pecialistas e seus julga-mentos sobre o modelo e suas saídas.

objetivos: envolvem dadosdo sistema e do modelo;revisões até a precisão de-sejada.

Crítica: Validação realizada sobre um único conjuntode dados.

Alternativa: Novo conjunto de dados para uma fase finalde validação.

Se discrepâncias muito grandes forem detectadas:revisão do modelo

41Simulação de Sistemas Dinâmicos

4. Análise de Dados

•Validação não é um processo com fronteira clara;

•Nenhum modelo representa completamente umsistema.

•Há portanto um compromisso:precisão custo

Sugestões:

1. Construir um modelo com boa"validade de rosto";

2. Validar as hipóteses do modelo;

3. Comparar as transformações entrada-saída do mode-lo com as transformações entrada-saída do sistema.

42Simulação de Sistemas Dinâmicos

4. Análise de Dados

"Validade de rosto":

Qualidade de "parecer razoável" do ponto de vistados usuários e dos conhecedores do sistema;

Os potenciais usuários devem preferencialmenteestar envolvidos desde a conceitualização até aimplementação do modelo;

Usuários e conhecedores podem também ajudar aidentificar deficiências no modelo;

A credibilidade final do simulador é essencial parabasear tomadas de decisão;

Teste: Análise de SensibilidadeSe variáveis de entrada forem alteradas, as saídasvariam conformemente ?(aspecto importante: seleção das relações entrada-saídaa serem testadas)

43Simulação de Sistemas Dinâmicos

4. Análise de Dados

Validação das hipóteses do modelo:

Hipóteses do modelo:Estruturais

Dados

Estruturais:

•Envolvem simplificações e abstrações da realidade;

•Verificadas por observação do sistema nos períodosapropriados e com conhecedores do sistema.

Dados:

•As hipóteses sobre os dados devem ser baseadas emcoleta de dados confiáveis e análise estatística correta;

•Deve-se tomar cuidado para garantir a não-correlaçãodos dados tratados;

•Os procedimentos para fundamentar e analisar as hi-póteses sobre os dados foram tratados anteriormente.

44Simulação de Sistemas Dinâmicos

4. Análise de Dados

Validação das transformações Entrada-Saída

•Nesta fase o modelo é visto como uma transformaçãoentrada-saída.

•Técnica: predição do passadoUsar dados passados (diferentes daqueles usados paracalibrar o sistema) ao fazer uma validação final.

1a alternativa:

•Coletar dados de entrada e calcular as respectivas saídas;

•Gerar, via modelo, dados de entrada e obter saídas;

•Comparar estatisticamente as saídas reais com as saídassimuladas (testes de hipótese).

45Simulação de Sistemas Dinâmicos

4. Análise de Dados

Exemplo:

entradasobservadas Sistema Real saídas

(Intervalos entre chegadas;Tempos de Serviço;)

(E[S];r = utilização do servidor

entradasgeradas Modelo saídas

Teste de hipótese: as saídas calculadas (p. ex. E[S])e as saídas obtidas pelo modelo tem a mesmadistribuição?

46Simulação de Sistemas Dinâmicos

4. Análise de Dados

2a alternativa:

•Utilizar os dados observados como entradas domodelo e calcular as saídas;

•Comparar estatisticamente (teste de hipótese)com as respectivas saídas calculadas no sistemareal.

3a alternativa:

Teste de Turing: Comparação, por conhecedoresdo sistema, de resultados reais × resultados simulados

Exemplo:

10 relatórios usuais:(embaralhados)

5 simulações

5 reais

Se um especialista reconhecer um número significa-tivo de relatórios obtidos via simulação:

rever o modelo

47Simulação de Sistemas Dinâmicos

4. Análise de Dados

Análise de Dados de Saída

Um aspecto fundamental para a análise estatítica dedados é que os valores sejam independentes.

Numa sequência: Y1, Y2, ..., Yk, ..., Yn, se:

cov[Yi, Yi+p] = E[(Yi − Y) (Yi+p − Y)] ≠ 0

então a estimativa da variânciaserá polarizada.

−= ∑

=

n

1k

2k )YY(

1n1

Se cov > 0 variância sub-estimada (pior caso)

Se cov < 0 variância sobre-estimada (+seguro)

48Simulação de Sistemas Dinâmicos

4. Análise de Dados

Em geral, as simulações podem ser divididas em:

a) Simulações terminantes:

Simulações que tem uma finalização bem definida:

tempoeventoestado

b) Simulações não-terminantes:

Simulações sem final definido, estando o interêsseem analisar o funcionamento em regime do sistema.Deseja-se por exemplo estimar parâmetros de distri-buições estacionárias.

Dificuldades:condições iniciais

regra de paradanão há regrasrigorosas

Usualmente, quanto mais longa a simulação, melhor.

49Simulação de Sistemas Dinâmicos

4. Análise de Dados

Simulações terminantes

Sejam X1, X2, ..., Xk, ..., XM, medidas de algumparâmetro de interêsse numa simulação.

Em geral, esta sequência não é i.i.d. e uma estimativa(p. ex. da média) da sequência seria polarizada.

Pode-se estar interessado numa função de M medi-das L(X1, X2, ..., Xk, ..., XM). Esta função pode in-clusive ser a média.

A pergunta é: como estimar L ?

Uma técnica usual são as "replicações independentes"

50Simulação de Sistemas Dinâmicos

4. Análise de Dados

Calcula-se L(X1, X2, ..., Xk, ..., XM) para N simula-ções diferentes:

mesmas condições iniciais;diferentes sequências de v.a.'s(variam-se aleatoriamente as sementes)

Obtém-se uma sequência: L1, L2, ..., LN

Estas sequências são praticamente i.i.d.

É possível p. ex. estimar um intervalo de confiançapara a estimativa da média:

∑=

=N

1jjL

N1

L

51Simulação de Sistemas Dinâmicos

4. Análise de Dados

Simulações não-terminantes

Nesse caso, em geral, deseja-se conhecer algum pa-râmetro referente ao comportamento de alguma se-quência em regime (se o regime existir).

X1, X2, ..., Xk, ...

Quanto maior o número de amostras, melhor o resul-tado, contudo o número deve ser finito.

Uma técnica para melhorar a análise deste tipo desaída é eliminar dados no início da simulação:

X1, X2, ..., Xr, Xr+1, ..., Xm

ignorar considerar

Warm-up (aquecimento)ou

Deleção de dados iniciais

52Simulação de Sistemas Dinâmicos

4. Análise de Dados

Procede-se então como no caso já analisado, fazendovárias (n) replicações:

Xi,j

Xr,j

r mi

eliminado

M

M(j-ésima simulação)

n,,1j ;Xrm

1L

m

1rij,ij L=

−= ∑

+=

∑=

=θn

1jjL

n1ˆ

53Simulação de Sistemas Dinâmicos

4. Análise de Dados

Média de bateladas

(técnica mais simples, porém menos segura)

Uma única simulação (mais longa) é realizada esomente um período de "warm-up" é considerado;as estimativas de Lj são obtidas de dados sequenciais.

eliminado bat_1 bat_2 bat_n... i

Xi

n,,1j ;Xm1

Ljmr

1m)1j(riij L== ∑

+

+−+=

∑=

=θn

1jjL

n1ˆ

Recommended