160
Avalia¸ ao e Desempenho MAB-515, DCC/UFRJ Apostila Paulo Aguiar, DCC/IM 27 de julho de 2013 1

Apostila - Aguiar

Embed Size (px)

DESCRIPTION

Apostila sobre Avaliação e Desenvolvimento, feita pelo professor, Paulo Aguiar da UFRJ

Citation preview

Page 1: Apostila - Aguiar

Avaliacao e DesempenhoMAB-515, DCC/UFRJ

Apostila

Paulo Aguiar, DCC/IM

27 de julho de 2013

1

Page 2: Apostila - Aguiar

Conteudo

1 Motivacao 6

2 Revisao de Analise Combinatoria 10

3 Alocacao de bolas em urnas 14

4 Teoria de Probabilidade 15

5 Eventos igualmente provaveis 18

6 Probabilidade Condicional 21

7 Problemas de Aplicacao 23

8 Aplicacao: Confiabilidade (”Reliability”) 26

9 Experimentos de Bernoulli 28

10 Variaveis Aleatorias 29

10.1 Variavel Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

10.2 Funcao Distribuicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

10.3 Funcoes Singulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

10.4 Variavel Aleatoria Contınua . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

10.5 Propriedade da Falta de Memoria . . . . . . . . . . . . . . . . . . . . . . . . 35

10.6 Relacao entre Distribuicao Exponencial e Processo Poisson . . . . . . . . . . 36

10.7 Variavel Aleatoria Mista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

11 Funcoes de Variaveis Aleatorias 39

11.1 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

11.2 Geracao de Distribuicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

12 Distribuicao Conjunta Cumulativa de V.As. 44

2

Page 3: Apostila - Aguiar

13 Propriedades de Variaveis Aleatorias 49

13.1 Media, Esperanca ou Valor Esperado . . . . . . . . . . . . . . . . . . . . . . 49

13.2 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

13.3 Esperanca Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

13.4 Variancia Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

14 Transformadas 60

14.1 Transformada de Laplace Unilateral para Funcoes Contınuas . . . . . . . . . 60

14.1.1 Analiticidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

14.1.2 Propriedades da Transformada de Laplace . . . . . . . . . . . . . . . 65

14.1.3 Alguns Pares de Transformadas de Laplace . . . . . . . . . . . . . . . 67

14.2 Transformada Z para Funcoes Discretas . . . . . . . . . . . . . . . . . . . . . 68

14.2.1 Analiticidade da Transformada Z dentro do cırculo unitario . . . . . . 73

14.2.2 Propriedades da Transformada Z . . . . . . . . . . . . . . . . . . . . 74

14.2.3 Pares de Transformadas Z . . . . . . . . . . . . . . . . . . . . . . . . 75

15 Teoria de Filas 76

15.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

15.2 A fila M/M/1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

15.3 A fila M/G/1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

15.3.1 A Vida Residual do Servico . . . . . . . . . . . . . . . . . . . . . . . 81

15.3.2 A Media do Perıodo Ocupado . . . . . . . . . . . . . . . . . . . . . . 83

15.3.3 A Transformada de Laplace da pdf do Perıodo Ocupado . . . . . . . 84

15.3.4 A transformada Z do numero presente na fila M/G/1 . . . . . . . . . 85

15.3.5 A transformada de Laplace do tempo gasto na fila M/G/1 FCFS . . . 87

15.4 A Fila M/G/1 com Ferias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

15.4.1 O Perıodo Ocioso na Fila M/G/1 com ferias . . . . . . . . . . . . . . 89

15.4.2 O Perıodo Ocupado na Fila M/G/1 com Ferias . . . . . . . . . . . . 91

15.4.3 A transformada Z do numero presente na fila M/G/1 com ferias . . . 91

3

Page 4: Apostila - Aguiar

15.4.4 A transformada de Laplace do tempo gasto na fila M/G/1 com feriasFCFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

15.5 Fila M/G/1 com disciplina LCFS sem interrupcao de servico . . . . . . . . . 94

15.6 M/G/1 com Disciplina LCFS com interrupcao de servico e continuidade . . . 95

15.7 M/G/1 com disciplina LCFS com interrupcao de servico sem continuidade . 96

15.8 Sistema de Filas com Classes de Usuarios . . . . . . . . . . . . . . . . . . . . 98

15.9 Lei da Conservacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

15.10Redes de Filas M/M/1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

16 Desigualdades e Limites 108

16.1 Normalizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

16.2 Funcao de Gauss ou Distribuicao Normal . . . . . . . . . . . . . . . . . . . . 110

16.3 Teorema do Limite Central . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

16.4 Aproximando Distribuicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

16.5 Percentil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

16.6 Estimadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

16.6.1 Estimando a Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

16.6.2 Estimando a Variancia . . . . . . . . . . . . . . . . . . . . . . . . . . 115

16.7 Intervalo de Confianca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

16.7.1 Intervalo de Confianca para a Media de uma Populacao com VarianciaDesconhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

16.7.2 Intervalo de Confianca para a Media de uma Populacao com VarianciaConhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

16.7.3 Distribuicao χ2 (chi-square) . . . . . . . . . . . . . . . . . . . . . . . 118

16.7.4 Intervalo de Confianca para a Variancia de uma Populacao Normalcom Media Desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . 118

16.7.5 Intervalos Parciais de Confianca . . . . . . . . . . . . . . . . . . . . 120

16.7.6 Intervalo de Confianca para Proporcoes . . . . . . . . . . . . . . . . 121

16.7.7 Comparacao de Alternativas . . . . . . . . . . . . . . . . . . . . . . 123

17 Simulacao 125

4

Page 5: Apostila - Aguiar

17.1 Geracao de Numeros (Pseudo) Aleatorios . . . . . . . . . . . . . . . . . . . . 125

17.2 Simulacao de M/M/1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127

17.3 Medidas de Desempenho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

17.4 Calculo das Estatısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

17.5 Depuracao do Modelo Simulado . . . . . . . . . . . . . . . . . . . . . . . . . 131

17.6 Metodo de Analise de Resultado . . . . . . . . . . . . . . . . . . . . . . . . . 132

17.7 Da Escolha das Sementes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

18 Cadeia de Markov em Tempo Discreto 135

18.1 Classificacao dos Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136

18.2 Teoremas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

18.3 Tempo medio para ir de um estado a outro . . . . . . . . . . . . . . . . . . . 142

18.4 Espaco de Estados Infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

19 Cadeia de Markov em Tempo Contınuo 150

19.1 CMTC Homogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152

19.2 Processo Nascimento e Morte (Birth-Death Processes) . . . . . . . . . . . . . 153

19.3 Processo de Nascimento Puro com taxa constante . . . . . . . . . . . . . . . 156

19.4 Solucao de CMTC em Equilıbrio . . . . . . . . . . . . . . . . . . . . . . . . 157

19.5 Tempo medio entre retornos a um estado . . . . . . . . . . . . . . . . . . . . 158

19.6 Tempo medio para ir de um estado a outro . . . . . . . . . . . . . . . . . . . 160

5

Page 6: Apostila - Aguiar

1 Motivacao

Experimento 1: Duas pessoas, A e B, lancam, a cada vez, uma moeda ao ar. Ganha ojogo quem tira CARA primeiro. Suponhamos que A inicia o jogo. Assuma:

• Probabilidade de dar CARA = P{CARA} = p, 0 < p < 1

• Probabilidade de dar COROA = P{COROA} = 1− p

Pergunta: Seria razoavel ter p = 1 ou p = 0? O que significaria?

Queremos obter:

P{ pessoa A ganhar o jogo } = PA

= P{ quem comeca ganha}= Pinicia

Solucao pelo metodo da enumeracao de todas as possibilidades:

Evento Probabilidade Explicacao

A ganha na jogada 1 pA ganha na jogada 3 (1− p)2p A perde, B perde e A ganhaA ganha na jogada 5 (1− p)4pA ganha na jogada 7 (1− p)6p· · · · · ·PA = Pinicia

∑∞n=0(1− p)2np = 1/(2− p)

Recordacao: Serie Geometrica

∞∑

n=0

qn = 1 + q + q2 + · · ·

= 1 + q(1 + q + q2 + · · · )

= 1 + q∞∑

n=0

qn

e entao∑∞

n=0 qn = 1/(1− q).

OBS.:∑∞

n=0 qn tem que convergir e portanto 0 < q < 1.

Em geral, an = a0qn−1 e

∑∞n=0 an = a0

1−q.

Tambem, Sn =∑n

i=1 ai =a0−anq1−q

, onde an = aoqn−1.

0chap1.tex, 07/09/09

6

Page 7: Apostila - Aguiar

Solucao recursiva:

Se A nao ganhar na primeira jogada, a partir da segunda jogada seria como se B estivesseiniciando o jogo naquele momento e a probabilidade de B ganhar seria igual a Pinicia = PA.

Vamos montar o pensamento recursivo, condicionando na ocorrencia do resultado daprimeira jogada. A tecnica de condicionamento e muito importante na solucao de problemascomplexos.

Podemos entao escrever:

PA = P{A ganhar e deu cara na jogada 1} + P{A ganhar e deu coroa na jogada 1}= P{ A ganhar | deu cara na jogada 1}× P{deu cara na jogada 1} +

P{ A ganhar | deu coroa na jogada 1} × P{deu coroa na jogada 1}= 1× p+ (1− p)× P{ B nao ganha o jogo a partir da jogada 2}= p+ (1− p)(1−P{B ganha o jogo a partir da jogada 2})= p+ (1− p)(1− Pinicia)= p+ (1− p)(1− PA), e entao, PA = 1/(2− p)

Conceito: probabilisticamente o jogo se repete apos o resultado de uma coroa, e tudoacontece como se o proximo jogador estivesse iniciando o jogo novamente.

*

Experimento 2: lance uma moeda tres vezes. Seja X o numero de caras obtido e Y onumero de coroas obtido.

Eventos basicos: {coroa,cara}

Espaco de amostragem do experimento :{(cara,cara,cara), (cara,cara,coroa), · · · , (coroa,coroa,coroa)}

Total de amostras = 23 = 8. Suponha uma moeda honesta, P{cara} = P{coroa} = 1/2.

espaco amostral prob X Y evento X < Yjogada 1 jogada 2 jogada 3cara cara cara 1/8 3 0cara cara coroa 1/8 2 1cara coroa cara 1/8 2 1cara coroa coroa 1/8 1 2 xcoroa cara cara 1/8 2 1coroa cara coroa 1/8 1 2 xcoroa coroa cara 1/8 1 2 xcoroa coroa coroa 1/8 0 3 x

Comprove que:

P{Y = 0} = 1/8, P{Y = 1} = 3/8, P{Y = 2} = 3/8, P{Y = 3} = 1/8.

Vamos analisar o significado do condicionamento. Vamos calcular P{Y = n|X < Y },para os valores possıveis de n. Pela tabela acima, os eventos que garantem X < Y estao

7

Page 8: Apostila - Aguiar

Fila de requisicoes Modulos de Memoria

------+----+-----+----+----

| rn+1 | rn | ... | r2 | r1 | ---

------+----+-----+----+---- -->| 0 |------->

| | | --- / ---

| | ---> | S |-- ---

| --------> | C |----->| 1 |------->

| . | A | ---

| . | N |-- ...

| . | N | \ ---

-------------------> | E | -->|n-1|

| R | ---

---

Figura 1 - Arquitetura da Memoria

marcados com x.

Observe que dos 8 eventos possıveis, apenas 4 satisfazem a condicao X < Y . Isto significaque o espaco amostral ficou reduzido a 4 amostras, igualmente provaveis. Dentro deste novoespaco amostral, cada uma destas amostras tem probabilidade 1/4.

P{Y = n|X < Y } = 0 , n=0= 0 , n=1= 3/4 , n=2= 1/4 , n=3

Observe que P{Y = n|Y > 2} =

{

0 n = 0, 1, 21 n = 3

. Neste caso so um ponto amostral

ocorre e nele Y = 3.

*

Aplicacao: avaliacao de desempenho de memorias entrelacadas

Seja considerada a arquitetura de memoria mostrada na Figura 1.

< endereco de memoria > = < # do modulo >< palavra >

As requisicoes ri ∈ {0, 1, · · · , n− 1}.

A fila de requisicoes e analisada no ciclo anterior. Modulos sao alocados ate que arequisicao a um modulo ja ocupado ocorra. Um maximo de n requisicoes e analisado porvez.

Seja k = numero de modulos alocados por ciclo, com pmf ( probability mass function -funcao de massa de probabilidade, pois a distribuicao e discreta) P (k), k = 1, 2, · · · , n.

8

Page 9: Apostila - Aguiar

Bn =∑n

k=1 kP (k)△=

banda de passagem media da memoria, B − n ≤ n.

M ciclos de processador por ciclo de memoria tal que M ≤ n.

Suposicao: P (ri = j) = 1/n, ∀j. Os ri sao i.i.d. (independentes e identicamentedistribuıdos).

Forma de escolher Possibilidades

2a. req. diferente da 1a. n−1n

3a. 6= 2a. 6= 1a. n−2n

4a. 6= 3a. 6= 2a. 6= 1a. n−3n

......

k 6= = anteriores n−k+1n

k + 1 = um dos k anteriores kn

Entao:

P (k) =(n− 1)(n− 2) · · · (n− k + 1)

nk−1

k

n

=k(n− 1)(n− 2) · · · (n− k + 1)

nk

Bn =n∑

k=1

kP (k) ≈ n0,56, 1 ≤ n ≤ 45.

Neste modelo, instrucoes e dados sao tratados igualmente.

***

9

Page 10: Apostila - Aguiar

2 Revisao de Analise Combinatoria

Motivacao: Calculo do Numero de Placas com tres letras e quatro numerosLLLNNNN

Quantas placas com 7 identificadores sao possıveis, se as 3 primeiras posicoes sao letrase as outras 4 sao numeros?

Assuma: alfabeto com 26 letras.

Resposta: 26.26.26.10.10.10.10 = 175.760.000

E se letras nem numeros podem ser repetidos?

Resposta: 26.25.24.10.9.8.7 = 78.624.000

*

Princıpio Basico de Contagem

Se r experimentos sao realizados nos quais o primeiro pode ter n1 resultados diferentes, epara cada um desses n1 resultados podemos ter n2 resultados do segundo experimento, e paracada um desses possıveis resultados dos 2 primeiros experimentos ha n3 possıveis resultadosdo terceiro experimento e assim sucessivamente, o numero total de resultados possıveis dosr experimentos e n1 × n2 × · · · × nr.

*

Permutacao

Permutacao e um arranjo ordenado.

Dado o conjunto {a,b,c}, quantas permutacoes de 3 letras sao possıveis?

abc bac cabacb bca cba

Use o princıpio basico de contagem:

3 × 2 × 1 = 6 resultados possıveis

Para n posicoes: n(n− 1)(n− 2) · · ·2.1 = n!

*

0chap2.tex, 12/11/2012

10

Page 11: Apostila - Aguiar

Aplicacao

Temos 10 livros: 4 de matematica, 3 de quımica, 2 de historia e 1 de lınguas. Quantosarranjos sao possıveis, considerando que livros do mesmo topico ficam juntos na prateleira?

Resposta: mat. quımica hist. lınguas4! 3! 2! 1!

Arranjo dos topicos:4!

Total: 4! x(4! x 3! x 2! x 1!) = 6912.

*

Permutacao com elementos repetidos

Quantas sao as permutacoes possıveis da palavra PEPPER?

Assumindo todas as letras diferentes, P1E1P2P3E2R, temos 6! permutacoes.

Quando os P s nao sao distintos: 3! das permutacoes acima sao identicas.

P1E1P2P3E2RP1E1P3P2E2RP2E1P1P3E2RP2E1P3P1E2RP3E1P1P2E2RP3E1P2P1E2R

Se os Es nao sao distintos: 2! permutacoes identicas podem ser conseguidas a partir decada uma das acima.

Entao, 6!3!2!

permutacoes sao possıveis.

Generalizando:

Existem n1

n1!n2!···nr!permutacoes de n objetos, onde n1 sao identicos, n2 sao identicos, etc.,

e n = n1 + n2 + · · ·+ nr.

Exemplo: Quantos sinais diferentes podem ser conseguidos com 9 bandeiras de igualformato, sendo 4 brancas, 3 vermelhas e 2 azuis?

Resposta: 9!4!3!2!

.

*

11

Page 12: Apostila - Aguiar

Combinacoes

Dados n objetos, de quantas maneiras posso escolher r objetos?

Exemplo: n=5, conjunto {A,B,C,D,E}, e r=3.

Se a ordem e relevante, ou seja, ABC diferente de CBA, entao:

5 × 4 × 3 = 60 arranjos possıveis

Se a ordem nao e relevante, entao cada uma das 3! permutacoes sao identicas para cadagrupo de 3 letras.

Entao: 5.4.33!

= 10 =

(

53

)

.

As combinacoes possıveis de cinco elementos tres a tres sao mostradas abaixo:

ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE(

53

)

= 5!3!2!

Em geral:(

nr

)

=(

nn−r

)

= n!r!(n−r)!

, r ≤ n

Convencao:(

n0

)

= 1, 0! = 1.

Exemplo: Sistema de cobranca de pedagio com 5 postos. Existem 5 cobradores, dosquais 2 sao surdos e 3 sao saudaveis. Quantas sao as ordenacoes em que duas pessoas surdasnao sao vizinhas?

B = cobrador que ouve bemS = cobrador surdo

Enumerando todas as possibilidades:

BBSBS BSBSB BSBBS SBSBB SBBSB SBBBS

Solucao:

Fixe os que ouvem bem : B B B

Preencha os surdos a vontade nos espacos, ou seja, escolha 2 espacos dentre 4.Resposta:

(

42

)

.

No caso geral de n cobradores saudaveis em surdos a resposta seria(

n+1m

)

, comm ≤ n+1.

*

12

Page 13: Apostila - Aguiar

Identidade Combinatorial(

n

r

)

=

(

n− 1

r − 1

)

+

(

n− 1

r

)

, 1 ≤ r ≤ n

onde convenciona-se que(

kk+1

)

= 0, ∀k ≥ 0.

*

Teorema Binomial

(x+ y)n =

n∑

k=0

(

n

k

)

xkyn−k

Aplicacao: Quantos subconjuntos de um conjunto de n elementos podem ser formados?

n∑

k=0

(

n

k

)

= (1 + 1)n = 2n.

Destes subconjuntos, 2n − 1 contem pelo menos 1 elemento.

*

Expressao Multinomial

De quantas maneiras podemos dividir n objetos distintos em grupos de tamanhos n1, n2, · · · , nr

tal que n =∑r

i=1 ni?

Resposta:(

nn1

)(

n−n1

n2

)(

n−n1−n2

n3

)

· · ·(

n−∑r−1

i=1 ni

nr

)

= n!n1!n2!···nr !

13

Page 14: Apostila - Aguiar

3 Alocacao de bolas em urnas

Problema 1: Dadas n bolas e r urnas, de quantas maneiras podemos alocar as bolas nasurnas, sendo admitido que urnas fiquem vazias?

Solucao: Assuma 5 bolas (n = 5) e 3 urnas (r = 3). Represente o conteudo das urnas pelonumero de bolas em cada urna e separe por vırgula estes numeros. Assim, uma alocacao de3 bolas na primeira urna, 1 bola na segunda urna e 1 bola na terceira urna seria representadapor <000,0,0>. Entao a solucao do problema pode ser colocada como:

, ,- - - - - - -

Escolha dois tracos dentre os 7 tracos para posicionar as vırgulas, ou seja(

72

)

maneiras. Em

geral escolha (r− 1) tracos dentre os (n+ r− 1)tracos, ou seja(

n+r−1r−1

)

=(

n+r−1n

)

maneiras.

*

Problema 2: Assumindo que n ≥ r, de quantas forma podemos alocar as bolas nas urnassendo que cada urna contenha pelo menos uma bola?

Solucao: Apos alocarmos r bolas para garantir a alocacao mınima de 1 bola por urna,sobram (n − r) para serem distribuıdas como no problema 1. Portanto,

(

n−r+r−1r−1

)

=(

n−1r−1

)

maneiras.

Pelos resultados anteriores, assumindo que xi seja o conteudo da i-esima urna, com∑i=r

i=1 xi = N , existem(

n+r−1n

)

vetores (x1, x2, · · · , xr) satisfazendo x1 + x2 + · · · + xr =

N e xi ≥ 0, e existem(

n−1r−1

)

vetores (x1, x2, · · · , xr) satisfazendo x1 + x2 + · · · + xr =N e xi > 0.

*

Aplicacao: Capital para investimento $20. Investimento mınimo $1. Existem 4 oportuni-dades de investimento.

Pergunta: De quantas formas posso investir?

x1 + x2 + x3 + x4 = 20, xi ≥ 0.(

233

)

= 1771 maneiras, se todo o dinheiro necessita ser investido.

Se x5 representa a parte nao investida entao:

x1 + x2 + x3 + x4 + x5 = 20, xi ≥ 0(

244

)

= 10.626 possibilidades.

0chap3-6.tex, 07/09/09

14

Page 15: Apostila - Aguiar

4 Teoria de Probabilidade

A teoria de probabilidade esta baseada na observacao de que uma colecao grande de fatosaleatorios gera regularidade estatıstica.

Modelo

• Espaco de Amostragem S = colecao de todos os eventos basicos exaustivos e exclusivosde um experimento. Os eventos basicos sao chamados pontos do espaco S.Exemplos:

– Experimento: lancar uma moeda.S= { cara, coroa } = { H,T }.

– Experimento: lancar uma moeda 2 vezes.S = { (H,T), (H,H), (T,H), (T,T) }.

– Experimento: tirar uma bola no escuro de uma urna contendo 3 bolas: preta,vermelha, e branca.S = { p, v, b }.

• Famılia de Eventos E .E e um conjunto de pontos de amostragem, satisfazendo determinada propriedade. Cor-responde a uma classe ou resultado no mundo real.

Exemplo:

Dado o experimento: lancar uma moeda 2 vezes.

Evento E = pelo menos uma cara ocorre = { (H,T),(T,H),(H,H) }.Se qualquer um dos eventos basicos acima acontece, entao o evento E acontece.

Evento F = pelo menos uma coroa ocorre = { (H,T),(T,H),(T,T) }.Intersecao de E e F = EF = {(H,T),(T,H) } = pelo menos uma cara e uma coroa.

Diagramas de Venn

*

15

Page 16: Apostila - Aguiar

Leis de DeMorgan

(⋃n

i=1Ei)C

=⋂n

i=1ECi , ou seja, se um ponto nao pertence a nenhum dos eventos Ei,

entao ele tem que pertencer a intersecao dos complementos destes eventos.

(⋂n

i=1Ei)C=⋃n

i=1ECi se um ponto nao pertence a intersecao dos eventos Ei, entao ele

pertence a um dos complementos ECi .

***

Axiomas

1. ∀ evento E, 0 ≤ P (E) ≤ 1.

2. P (S) = 1.

3. Se E1 e E2 sao eventos mutuamente exclusivos E1

E2 = Φ (”disjoint”) entao P (E1

E2) =P (E1) + P (E2).

***

Definicao

{E1, E2, · · · , En} e um conjunto exaustivo de eventos se E1

E2

· · ·⋃

En = S.

O conjunto {Ei} e mutuamente exclusivo se Ei

Ej = Φ para todo i 6= j.

Propriedades

E⋃

EC = S, E⋂

EC = Φ, EΦ = Φ, E⋃

S = S, E⋃

Φ = E,SC = Φ, ΦC = S, E

S = E.

*

Particao

{Ei} e uma particao de S se e somente se {Ei} e exaustivo e mutuamente exclusivo.

Proposicoes

1. P (EC) = 1− P (E).

Demo: 1 = P (S) = P (E⋃

EC) = P (E) + P (EC).

2. Se E ⊂ F , entao P (E) ≤ P (F ).

Demo: Se E ⊂ F , entao F = E⋃

ECF . Sendo E e ECF mutuamente exclusivos,pelo axioma 3 temos P (F ) = P (E) + P (ECF ), o que comprova o resultado poisP (ECF ) ≥ 0.

16

Page 17: Apostila - Aguiar

3. P (E⋃

F ) = P (E) + P (F )− P (EF )

Demo: Faca como exercıcio.

Para tres elementos temos:

P(A⋃

B⋃

C ) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC).

Para quatro elementos temos:

P(A⋃

B⋃

C⋃

D) = P(A) + P(B) + P(C) + P(D) - P(AB) - P(AC) - P(AD) -P(BC) - P(BD) - P(CD) + P(ABC) + P(ABD) + P(BCD) - P(ABCD).

Generalizando:

P (E1

E2

· · ·⋃

En) =n∑

i=1

P (Ei)−∑

i1<i2

P (Ei1Ei2) + · · ·

(−1)r+1∑

i1<i2<···irP (Ei1Ei2 · · ·Eir) + · · ·

(−1)n+1P (E1E2 · · ·En).

A soma∑

i1<i2<···<irP (Ei1Ei2 · · ·Eir) e feita sobre os

(

nr

)

possıveis conjuntos de tama-nho r do conjunto {1, 2, · · · , n}.

17

Page 18: Apostila - Aguiar

5 Eventos igualmente provaveis

Problema 1: Se duas bolas sao retiradas aleatoriamente de uma urna contendo 6 bolasbrancas e 5 pretas, qual e a probabilidade de que uma das bolas seja branca e a outra sejapreta?

Solucao 1: Assuma cada bola marcada individualmente.

Total de resultados possıveis = 11 x 10 = 110 possibilidades.Maneiras em que a 1a bola e branca e a 2a e preta = 6 x 5 = 30.Maneiras em que a 1a bola e preta e a 2a e branca = 5 x 6 = 30.

Probabilidade =# de eventos satisfazendo condicao

# total de eventos= 60

110= 6

11.

Solucao 2: Assuma que a ordem e irrelevante.

Total de resultados possıveis =(

112

)

= 55.

Resultados com uma bola preta e uma branca =(

61

)(

51

)

= 30.Probabilidade = 30

55= 6

11.

*

Problema 2: Assuma um jogo de poquer jogado com 52 cartas. Qual a probabilidade dese receber uma sequencia (as cartas em sequencia e nao todas do mesmo naipe)?

Solucao: Suponha a mao: A, 2, 3, 4 e 5.

Cada carta pode ser de um dos 4 naipes. Existem portanto 45 possibilidades, e destas 4sao com cartas do mesmo naipe (”flush”).

Portanto temos (45 − 4) sequencias do tipo (A 2 3 4 5), que nao sao ”flush”.

De quantas maneiras podemos organizar sequencias ? Resposta: 10 maneiras.(A 2 3 4 5), (2 3 4 5 6), · · · , (10 J Q K A)

Total de combinacoes de 5 cartas =(

525

)

Probabilidade da sequencia = 10(45−4)

(525 )≈ 0, 0039

*

Problema 3: ”Full House”= (par + trinca ). Qual a probabilidade do ”full house”?

Solucao: PPTTT(

42

)(

43

)

possibilidades na escolha dos naipes.

Possibilidades de se escolher o par = 13.

18

Page 19: Apostila - Aguiar

Possibilidades de se escolher a trinca depois de escolhido o par = 12

Probabilidade =12.13.(42).(

43)

(525 )≈ 0, 0014

***

Aplicacao: Suponha que N homens lancem seus chapeus no centro de uma sala. Os chapeussao misturados e entao cada homem seleciona um chapeu aleatoriamente.

Qual e a probabilidade de que nenhum homem selecione seu proprio chapeu?

Se N →∞ para que valor deve convergir a probabilidade?

Solucao: Seja Ei = evento de que o i-esimo homem seleciona seu proprio chapeu.

P (

N⋃

i=1

Ei) =

n∑

i=1

P (Ei)−∑

i1<i2

P (Ei1Ei2) + · · ·

(−1)n+1∑

i1<i2<···inP (Ei1Ei2 · · ·Ein) + · · ·

(−1)N+1P (E1E2 · · ·EN)

= prob. de pelo menos 1 pessoa apanhar seu proprio chapeu.

Seja i1 o numero do chapeu escolhido pelo homem H1. Se i1 = 1, entao H1 escolheuseu proprio chapeu. Em geral, a amostra do experimento pode ser expressa pela n-tupla(i1, i2, · · · , in), onde ii e o chapeu escolhido pelo homem Hi. O total de amostras e N !.

Uma amostra (1, 2, 3, · · · , N) indica que cada homem seleciona o seu proprio chapeu.

Seja (Ei1Ei2 · · ·Ein) o evento em que cada um dos n homens i1, i2, · · · , in seleciona o seuproprio chapeu. Observe que nada e assumido quanto aos outros homens. Dos (N − n) quesobraram, o primeiro pode escolher o chapeu de (N−n) maneiras. O segundo de (N−n−1)e assim sucessivamente. As possibilidades sao (N − n)!.

P (Ei1Ei2 · · ·Ein) =(N−n)!

N !.

Ha(

Nn

)

termos em∑

i1<i2<···<inP (Ei1Ei2 , · · ·Ein), entao

i1<i2<···<inP (Ei1Ei2 · · ·Ein) =

(

Nn

) (N−n)!N !

= 1n!,

e entao

P (⋃N

i=1Ei) = 1− 12!+ 1

3!− · · ·+ (−1)N+1 1

N !.

Portanto a probabilidade de nenhum homem selecionar seu proprio chapeu e12!− 1

3!+ · · ·+ (−1)N 1

N !. Esta probabilidade tende para 1

e= 0, 36755 com N →∞.

***

19

Page 20: Apostila - Aguiar

O problema dos Pontos: Tentativas independentes resultam em sucesso com probabili-dade p e fracasso com probabilidade 1− p. Qual a probabilidade de que n sucessos ocorramantes de m fracassos?

Solucao (Fermat): Pn,m = prob. de n sucessos antes de m fracassos.

Pn,m = pPn−1,m + (1− p)Pn,m−1, n ≥ 1, m ≥ 1, com as condicoes de contorno P0,m = 1e Pn,0 = 0.

Solucao (Pascal): Para que n sucessos ocorram antes de m fracassos e necessario e sufi-ciente que pelo menos n sucessos ocorram em n+m− 1 tentativas.

P (k sucessos em n+m− 1 tentativas ) =(

n+m−1k

)

pk(1− p)n+m−1−k, e entao

Pn,m =∑n+m−1

k=n

(

n+m−1k

)

pk(1− p)n+m−1−k.

Associacao: A e B jogam um jogo em que A ganha 1 ponto quando um sucesso ocorre e Bganha um ponto quando um fracasso ocorre. A probabilidade desejada e a probabilidade deque A ganharia, se ao interromper o jogo, A necessitasse de n e B necessitasse de m pontospara ganhar.

Suponha que cada jogador coloca R$ C e cada um tem chance de ganhar de 1/2 = p. Sen pontos sao necessarios ao vencedor e o jogador A tem 1 ponto e B nenhum, entao, sendoo jogo interrompido nesta situacao, A tem o direito a 2CPn−1,n = 2C

∑2n−2k=n−1

(

2n−2k

)

(12)2n−2.

Mostre que o resultado acima e igual a C[

1 + (1/2)2n−2(

2n−2n−1

)]

.

Explicacao do Raciocınio de Pascal

Suponha 2 sucessos antes de 3 falhas. Analisamos as n+m− 1 = 4 primeiras tentativasno nosso experimento.

Porque?

Enumere todas as possibilidades, que constituem os eventos basicos de nosso espacoamostral: ffff,sfff,fsff,ssff,ffsf,sfsf,fssf,sssf,fffs,sffs,fsfs,ssfs,ffss,sfss,fsss,ssss.

Observe que analisando o resultado de 4 tentativas englobamos todos os eventos basicosque satisfazem o evento 2 sucessos antes de 3 falhas. Se analisassemos apenas 3 tentativasisto nao seria mais verdade, pois terıamos por exemplo o evento basico ffs e ficarıamos naindecisao do que ocorreria na quarta tentativa.

Numero de sequencias com k=2 sucessos =(

42

)

= 6 com prob. associada de p2(1− p)2;

Numero de sequencias com k=3 sucessos =(

43

)

= 4 com prob. associada de p3(1− p);

Numero de sequencias com k=4 sucessos =(

44

)

= 1 com prob. associada de p4(1− p)0.

***

20

Page 21: Apostila - Aguiar

6 Probabilidade Condicional

Definicao: P (A|B) = P (A⋂

B)P (B)

= P (AB)P (B)

, onde P (B) 6= 0.

O condicionamento a ocorrencia do evento B restringe o espaco de amostragem aos pontosque satisfazem B. A divisao por P (B) normaliza a medida.

*

Definicao: eventos estatisticamente independentes.

P (AB) = P (A)P (B) =⇒ P (A/B) = P (A), ou seja o conhecimento da ocorrencia de Bnao afeta a probabilidade do evento A.

*

Teorema da Probabilidade Total

Assuma que {Ai} e uma particao. Entao P (B) =∑n

i=1 P (AiB). Aplicando o conceito deprobabilidade condicional vem:

P (B) =∑n

i=1 P (B|Ai)P (Ai).

A probabilidade P (Ai) pode ser conhecida e a probabilidade P (B|Ai) pode ser mais facilde ser calculada.

*

Teorema de Bayes: P (Ai|B) = P (B|Ai)P (Ai)∑n

j=1 P (B|Aj)P (Aj)= P (AiB)

P (B).

*

Aplicacao: Dois carteadores gemeos jogam em um mesmo cassino, sendo que um deles ehonesto e o outro desonesto. Suponha que voce jogou com um deles aleatoriamente e perdeu.Qual a probabilidade de que tenha jogado com o carteador desonesto?

DH = evento de jogar com o carteador honesto;DD = evento de jogar com o carteador desonesto;L = evento de perder;W = evento de ganhar.

P (L|DH) = 1/2; P (L|DD) = p, p > 1/2.

Quero calcular P (DD|L) = P(ter escolhido o desonesto | perdi).

Solucao: Aplique o Teorema de Bayes:

21

Page 22: Apostila - Aguiar

P (DD|L) = P (L|DD)P (DD)P (L|DD)P (DD)+P (L|DH)P (DH )

= p.1/2p.1/2+1/2.1/2

= 2p2p+1

.

Se p = 1, ou seja, o carteador e totalmente desonesto, entao P (DD|L) = 2/3. Porque?Monte a arvore de eventos.

22

Page 23: Apostila - Aguiar

7 Problemas de Aplicacao

O problema da ruına do jogador (resolvido por Bernoulli e publicado 8 anos apos suamorte em 1713)

Dois jogadores A e B apostam no resultado do lancamento de uma moeda. Com proba-bilidade p da cara e A ganha 1 de B. Com probabilidade 1− p = q da coroa e B ganha 1 deA. O jogo termina, quando um dos jogadores esta falido, e o outro tem todo o capital N .

Qual a probabilidade de A ganhar o jogo, quando ele inicia com i de capital e B comN − i de capital?

Seja Ei o evento em que A fica com todo o dinheiro, quando ele inicia com i e B comN − i. O capital total e de N .

Condicionando no resultado do primeiro lancamento, obtemos:

Pi = P (Ei) = P (Ei|H)P (H) + P (Ei|Hc)P (Hc)

= pP (Ei|H) + (1− p)P (Ei|Hc)

= pP (Ei|H) + qP (Ei|Hc)

Observe que se no primeiro lancamento a moeda der cara, a situacao apos este lancamentosera A com i+ 1 e B com N − (i+ 1). Assim,

P (Ei|H) = Pi+1

P (Ei|Hc) = Pi−1, e entao

Pi = pPi+1 + qPi−1, i = 1, 2, · · · , N − 1

Resolucao da equacao

As condicoes de contorno sao P0 = 0 (se o capital inicial de A e zero, entao B ja esta comtodo o dinheiro, e o jogo termina instantaneamente) e PN = 1 (se o capital de B e zero e ode A e N , entao A inicialmente esta com todo o dinheiro, e o jogo termina instantaneamentecom A vencedor).

Podemos reescrever a equacao como:

pPi + qPi = pPi+1 + qPi−1, ou Pi+1 − Pi =qp(Pi − Pi−1), i = 1, 2, · · · , N − 1.

0chap7-9.tex, 12/11/2012

23

Page 24: Apostila - Aguiar

Desenvolvendo:

P2 − P1 =q

p(P1 − P0) =

q

pP1

P3 − P2 =q

p(P2 − P1) =

(

q

p

)2

P1

...

Pi − Pi−1 =q

p(Pi−1 − Pi−2) =

(

q

p

)i−1

P1

...

PN − PN−1 =q

p(PN−1 − PN−2) =

(

q

p

)N−1

P1

Somando as primeiras i− 1 equacoes, obtemos:

Pi − P1 = P1

[

qp+(

qp

)2

+ · · ·+(

qp

)i−1]

, ou

Pi =

1−( qp)i

1− qpP1, se q

p6= 1 ou p 6= 1/2;

iP1, se qp= 1 ou p = 1/2.

Usando o fato de que PN = 1, obtemos

P1 =

1−( qp)

1−( qp)N, para p 6= 1/2;

1N, para p = 1/2.

E finalmente,

Pi =

1−( qp)i

1−( qp)N, para p 6= 1/2;

iN, para p = 1/2.

Se Qi for a probabilidade de B ficar com todo o dinheiro, quando ele inicia com N − i,por simetria

Qi =

1−(pq)N−i

1−(pq)N

, para q 6= 1/2;

N−iN

, para q = 1/2.

Alem do mais, mostra-se que Pi +Qi = 1, tanto para p = q = 1/2, como para q 6= 1/2.

Interpretacao: os jogadores nao jogam por tempo indefinido.

Valores numericos: Se A comeca com 5, B com 10 e p = 1/2, entao P5 = 1/3. Se p = 0, 6,entao P5 = 0, 87.

24

Page 25: Apostila - Aguiar

***

Teste de Drogas

Duas drogas devem ser analisadas quanto ao seu poder de cura. A droga i tem probabi-lidade de cura Pi, que nao e conhecida. Temos que tentar decidir se P1 > P2 ou P1 < P2.

Experimento: Pares de doentes sao tratados sequencialmente, um membro do parrecebendo a droga 1 e o outro membro a droga 2. Os resultados de cada par sao determinadose o teste para, quando o numero acumulado de curas de uma das drogas supera o numeroacumulado de curas da outra droga por um valor M .

Xj =

{

1 se o paciente do j-esimo par com droga 1 e curado0 em caso contrario

Yj =

{

1 se o paciente do j-esimo par com droga 2 e curado0 em caso contrario

O experimento para no N-esimo par, quando∑N

i=1Xi−∑N

i=1 Yi = M , e entao assumimos

que P1 > P2, ou∑N

i=1 Yi −∑N

i=1Xi = M , e, entao, assumimos que P2 > P1. No primeirocaso, a droga 1 e considerada melhor, e, no segundo caso, a droga 2 e a escolhida, comotendo o melhor desempenho.

Qual a probabilidade do teste apontar uma decisao incorreta? Ou seja, na realidadeP1 > P2 e o teste aponta P2 > P1?

Solucao: Vamos analisar o comportamento da variavel∑

Xi −∑

Yi. Esta variavel eincrementada de 1 com probabilidade P1(1 − P2), decrementada de 1 com probabilidadeP2(1−P1), e permanece inalterada com probabilidade P1P2+(1−P1)(1−P2). Considerandoapenas os pares que provocam incrementos ou decrementos nesta variavel, podemos calcular

PX = P (∑

Xi −∑

Yi subir 1| subiu ou desceu 1) = P1(1−P2)P1(1−P2)+P2(1−P1)

, e

PY = P (∑

Xi −∑

Yi descer 1| subiu ou desceu 1) = P2(1−P1)P1(1−P2)+P2(1−P1)

= 1− PX .

A probabilidade do teste indicar P2 > P1 e igual a probabilidade do jogador 1 que ganhacom probabilidade PX perder M antes de alcancar 2M (significa que o outro jogador e ovencedor, ou seja probabilidade QM ).

P (teste indicar P2 > P1) = 1− P (ganhar 2M antes de atingir zero, comecando com M)= P (alcancar zero antes de atingir 2M , comecando com M)

= 1− 1−(1−PXPX

)M

1−(1−PXPX

)2M= 1− 1−(

PYPX

)M

1−(PYPX

)2M=

1−(PXPY

)M

1−(PXPY

)2M

Se P1 = 0, 6 e P2 = 0, 4 , a probabilidade de decisao incorreta e 0,017 , quando M = 5, ereduz a 0,0003 para M = 10.

***

25

Page 26: Apostila - Aguiar

8 Aplicacao: Confiabilidade (”Reliability”)

i

Evento Ai = componente i funciona perfeitamente.

Ri = confiabilidade do componente i = P (Ai).

21

Sistema S

RS = P (A1A2) = P (A1)P (A2) = R1R2.

1

2

Sistema S

Redundancia: AS = ASc = A1

A2, ou seja, o sistema S so nao funciona, se ambos oscomponentes estiverem com defeito.

RS = P (A1

A2)

1−RS = [1− P (A1)][1− P (A2)]

RS = 1−2∏

i=1

(1−Ri)

Redundancia RS

1 0,802 0,963 0,9924 0,9984

*

26

Page 27: Apostila - Aguiar

Sistema de Redundancia Tripla

Sistema opera com 3 elementos em paralelo, e o sistema esta operacional, quando pelomenos 2 elementos estao OK. Este sistema se chama TMR, ou seja, Triple Module Redun-dancy.

RTMR =∑3

i=2

(

3i

)

Ri(1− R)3−i = 3R2 − 2R3.

RTMR =

> R se R > 12

= R se R = 12

< R se R < 12

***

27

Page 28: Apostila - Aguiar

9 Experimentos de Bernoulli

Experimento:

{

sucessofalha

{

01

{

bomruim

{

caracoroa

{

probabilidade pprobabilidade (1− p)

*

Recordacao: Multinomial

De quantas maneiras podemos dividir n objetos distintos em grupos de tamanhos n1, n2, · · · , nr

t.q. n =∑r

i=1 ni?

R:(

nn1

)(

n−n1

n2

)(

n−n1−n2

n3

)

· · ·(

n−∑r−1

i=1 ni

nr

)

= n!n1!n2!···nr !

*

Sequencia de Experimentos de Bernoulli

Repete-se o experimento de Bernoulli de forma independente.

Pergunta: Qual a probabilidade de k caras em n lancamentos de uma moeda?

R:(

nk

)

pk(1− p)(n−k).

*

Problema: Qual a probabilidade de que em n passadas pelo codigo abaixo, ni execucoes docomando Si sao efetuadas, sendo que CASE i ocorre com probabilidade pi?

CASE I OF1: S1 ;2: S2 ;...k: Sk;

END

R: n!n1!n2!···nk!

pn11 pn2

2 · · · pnkk =

(

nn1n2···nk

)

pn11 pn2

2 · · · pnkk

Observe que∑

∀n=∑ki=0 ni

[

(

nn1n2···nk

)

pn11 pn2

2 · · ·pnkk

]

= (p1 + p2 + · · ·+ pk)n = 1.

***

28

Page 29: Apostila - Aguiar

10 Variaveis Aleatorias

Seja um espaco amostral S, com uma particao formada de tres eventos: ganha, perde eempata. Uma variavel aleatoria X e definida como uma associacao de valores aos pontos doespaco S. Por exemplo,

X(w) =

+5 w ∈ ganha0 w ∈ empata−5 w ∈ perde

P (X = −5) = 3/8 = soma das prob. de todos os pontos ∈ perde

P (X = 0) = 1/4

P (X = +5) = 3/8

Definicao: Uma variavel aleatoria X no espaco amostral S e uma funcao X : S → Rque associa um numero real X(w) a cada ponto de amostra w ∈ S.

Exemplo: Suponha que uma moeda e tal que P (H) = p e P (T ) = 1− p.

A moeda e lancada ate que uma cara ocorra ou um total de n lancamentos ocorram. SeX representa o numero de vezes que a moeda foi lancada, X e uma variavel aleatoria queassume os valores 1, 2, · · · , n com as seguintes probabilidades:

P (X = 1) = P (H) = pP (X = 2) = P (T,H) = (1− p)pP (X = 3) = P (T, T,H) = (1− p)2p...

...P (X = n− 1) = P (T, · · · , T,H) = (1− p)n−2pP (X = n) = P (T, · · · , T,H) = (1− p)n−1p+ (1− p)n−1(1− p) = (1− p)n−1

Mostrar que∑n

i=1 P (X = i) = 1.

Demo:

n∑

i=1

P (X = i) = p+ (1− p)p+ · · ·+ (1− p)n−2p+ (1− p)n−1

= p[

1 + (1− p) + · · ·+ (1− p)n−2]

+ (1− p)n−1

= p1− (1− p)n−1

1− (1− p)+ (1− p)n−1 = 1

X assume um numero finito de valores.

*

Exemplo: X representa o numero de lancamentos ate se obter uma cara. X e uma variavelaleatoria que assume os valores 1, 2, · · · com as seguintes probabilidades:

0chap10.tex, 19/05/2013

29

Page 30: Apostila - Aguiar

P (X = 1) = P (H) = pP (X = 2) = P (T,H) = (1− p)pP (X = 3) = P (T, T,H) = (1− p)2p...

...∑∞

i=1 P (X = i) = p+ (1− p)p+ · · · =∑∞

i=0 p(1− p)i = p1−(1−p)

= 1

X assume um numero infinito, porem contavel, de valores.

***

10.1 Variavel Discreta

Uma variavel aleatoria discreta e aquela que assume um numero finito ou contavel de valores.Definimos P (X = i) como sendo a funcao de massa de probabilidade (PMF - ProbabilityMass Function) de X .

Variavel de Bernoulli

X e uma v.a. de Bernoulli, se P (X = 0) = P (fracasso) = 1 − p e P (X = 1) =P (sucesso) = p, com 0 < p < 1.

Variavel Binomial

Assuma n experimentos de Bernoulli. Seja Y o numero de sucessos nos n experimentos.Y e dita binomial com parametros (n, p).

P (Y = i) =

(

n

i

)

pi(1− p)n−i, i = 0, 1, · · · , nn∑

i=0

P (Y = i) = (p+ (1− p))n = 1

*

Aplicacao da Binomial: Um job executa n vezes pela CPU. Seja Xi o numero de acessosao disco i. No diagrama, p1 + p2 = 1. P (X1 = k) =

(

nk

)

pk1(1− p1)n−k, 0 ≤ k ≤ n.

*

30

Page 31: Apostila - Aguiar

Poisson

Uma variavel aleatoria X e Poisson com parametro λ > 0, se

P (i) = P (X = i) = λi

i!e−λ, λ > 0.

Observe que∑∞

i=0 P (i) = e−λ∑∞

i=0λi

i!= e−λeλ = 1.

Muitos processos no mundo real podem ser aproximados pelo processo Poisson. Sabendoque pessoas podem tomar uma decisao afirmativa com probabilidade p ou uma decisao nega-tiva com probabilidade (1− p), entao o numero de pessoas que tomam a decisao afirmativa,dentre uma populacao com n pessoas, pode ser expresso pela distribuicao binomial, ou seja,probabilidade de i pessoas optarem pela decisao afirmativa =

(

ni

)

pi(1−p)n−i. Mostra-se quea distribuicao binomial tende para Poisson com λ = np, se n >> 1 e λ e moderado.

P (X = i) =(

ni

)

pi(1− p)(n−i)

= n!(n−i)!i!

(

λn

)i (1− λ

n

)n−i

= n(n−1)(n−2)···(n−i+1)ni

λi

i!

(1− λn)n

(1− λn)i

Para n >> 1, (1− λn)n ≈ e−λ, n(n−1)(n−2)···(n−i+1)

ni ≈ 1 e (1− λn)i ≈ 1.

Entao, P (X = i) ≈ λi

i!e−λ.

*

Distribuicao Geometrica

Seja X o tempo de permanencia num estado. Muda-se de estado com probabilidade p epermanece-se no estado com probabilidade 1−p. Transicoes de estado ocorrem em instantesbem definidos de tempo.

Entao:

P (X = n) = (1− p)n−1p, n ≥ 1.

*

Binomial Negativa

Experimentos independentes com probabilidade p de sucesso (sequencia de experimen-tos de Bernoulli). Assuma que X e o numero de experimentos ate que r sucessos sejamalcancados.

P (X = n) =(

n−1r−1

)

pr(1− p)n−r, n ≥ r, pode ser entendida como

P(r-esimo sucesso ocorre no n-esimo experimento)

*

31

Page 32: Apostila - Aguiar

Aplicacao: Problema de Banach

Duas caixas de fosforos, uma no bolso esquerdo e outra no bolso direito. Considere omomento em que se descobre que uma das caixas esta vazia, sendo aleatoriamente escolhidosos bolsos a cada palito. Assumindo que cada caixa tem inicialmente N fosforos, qual e aprobabilidade de que existam exatamente k fosforos na outra caixa?

E = evento de que a caixa da direita esta vazia e ha k fosforos na caixa da esquerda.

O evento E acontece se a (N+1)-esima escolha da caixa da direita e feita na N-k+N+1tentativa, onde (N-k) corresponde ao numero de fosforos ja retirados da caixa da esquerda eN corresponde ao numero de fosforos retirados da caixa da direita. Observe que ja retiramostodos os fosforos da caixa da direita, quando, na tentativa de tirar mais um fosforo do bolsodireito, descobrimos que a caixa naquele bolso esta vazia.

Usando a binomial negativa com p = 1/2, r = N + 1, n = 2N − k + 1 temos

P (E) =(

2N−kN

)

(12)2N−k+1

A probabilidade procurada e 2P(E), porque a (N+1) escolha pode ocorrer ao encontrar-mos vazia tanto a caixa da direita quanto a caixa da esquerda.

***

10.2 Funcao Distribuicao

A funcao de distribuicao de probabilidade (PDF - Probability Distribution Function) oufuncao de distribuicao acumulativa (CDF - Cummmulative Distribution Function) da variavelX e definida como

FX(x) = P (X ≤ x), −∞ < X <∞

Propriedades:

• FX(.) e nao decrescente.

• a < b =⇒ FX(a) ≤ FX(b).

• limx→∞ FX(x) = 1 e limx→−∞ FX(x) = 0.

• P (a < X ≤ b) = FX(b)− FX(a), porque {X ≤ b} = {a < X ≤ b} ⋃ {X ≤ a}.

***

10.3 Funcoes Singulares

Sao uteis para permitir estender o conceito de integracao e derivacao para funcoes comdiscontinuidades. O emprego das funcoes singulares sera exemplificado na descricao das

32

Page 33: Apostila - Aguiar

propriedades associadas as variaveis aleatorias. As funcoes singulares mais uteis sao:

• Funcao Impulso u0(t) ou δ(t) (Delta de Dirac)

u0(t) =⇒∫ 0+

0− u0(t)dt = 1

• Funcao Degrau u−1(t) ou u(t)

u−1(t) =

{

0 , se t < 01 , se t ≥ 0

u−1(t) =∫ t

0−u0(y)dy

• Funcao Rampa u−2(t)

u−2(t) = tu−1(t) =

{

t , se t ≥ 00 , se t < 0

u−2(t) =∫ t

0− u−1(y)dy

***

10.4 Variavel Aleatoria Contınua

Uma variavel aleatoria contınua e aquela que assume um numero infinito e incontavel devalores. Seja X , uma variavel aleatoria contınua. Dado um intervalo B, podemos exprimirP (X ∈ B) da forma abaixo:

P (X ∈ B) =∫

BfX(x)dx

A funcao fX(x) e chamada de densidade de probabilidade ou comumente pdf (probabilitydensity function) de X . Observe que

P (X ∈ (−∞,∞)) =∫∞−∞ fX(x)dx = 1.

Por outro lado, podemos obter FX(a) = P (X ≤ a) = P (X < a) como

FX(a) =∫ a

−∞ fX(x)dx

A funcao FX(.) e definida como a PDF (Probability Distribution Function) de X , oufuncao de distribuicao de probabilidade de X , ou ainda funcao de distribuicao acumulativa(CDF) de X . Observamos ainda que,

P (X > a) = 1− P (X ≤ a) = 1− FX(a) =∫∞a

fX(x)dx

P (a < X ≤ b) =∫ b

afX(x)dx

Simplificando a notacao, representaremos fX(x) = f(x). Entao:

f(x) ≥ 0, f(x) = dF (x)dx

33

Page 34: Apostila - Aguiar

Observe que: P (x < X ≤ x+ dx) = f(x)dx.

E se a funcao f(x) nao possui impulsos em a e b, entao sera sempre valido dizer:

P (a < X < b) = P (a ≤ X < b) = P (a ≤ X ≤ b).

*

Distribuicao Uniforme no intervalo (0,1)

X e uma variavel aleatoria com distribuicao uniforme no intervalo (0,1), se

f(x) = u−1(x)− u−1(x− 1) e F (x) = u−2(x)− u−2(x− 1).

Exercıcio: desenhar a pdf e a PDF de uma distribuicao uniforme em (0,1).

*

Distribuicao Uniforme no intervalo (a,b)

X e uma variavel aleatoria com distribuicao uniforme no intervalo (a,b), se

f(x) = 1b−a

[u−1(x− a)− u−1(x− b)] e F (x) = 1b−a

[u−2(x− a)− u−2(x− b)].

Exercıcio: desenhar a pdf e a PDF de uma distribuicao uniforme em (a,b).

*

Distribuicao Exponencial

X tem distribuicao exponencial, se pdf f(x) =

{

λe−λx , x ≥ 00 , x < 0

= λe−λxu−1(x) e

CDF F (x) =∫ x

−∞ f(y)dy =

{

1− e−λx , x ≥ 00 , x < 0

= (1− e−λx)u−1(x)

*

Uma variavel aleatoria e perfeitamente caracterizada pela sua pdf ou PDF.

*

O uso da funcao degrau na descricao da PDF e da CDF serve para explicitar as restricoesno domınio da funcao de forma clara e concisa.

***

34

Page 35: Apostila - Aguiar

10.5 Propriedade da Falta de Memoria

Uma variavel X nao negativa e sem memoria se

P (X > s+ t | X > t) = P (X > s), para s, t ≥ 0.

Se pensarmos que X e o tempo de vida de um componente, a probabilidade de que elesobreviva mais s segundos dado que ja funcionou t segundos, onde s e independente de t, eigual a probabilidade inicial de que ele funcione por s segundos.

P (X > s+ t | X > t) = P (X>s+t e X>t)P (X>t)

= P (X>s+t)P (X>t)

= P (X > s)

Uma condicao equivalente para definir falta de memoria seriaP (X > s+ t) = P (X > s)P (X > t) ou 1− F (s+ t) = (1− F (s))(1− F (t)),e pode-se provar que so a distribuicao exponencial satisfaz a relacao dentre as funcoescontınuas.

*

Taxa de falha em Distribuicao Exponencial

X e a vida de um componente. Suponha que o componente ja funcionou por t segundos equeremos a probabilidade de que ele falhara num tempo adicional dt, ou seja X ≤ (t, t+ dt).

P (X ∈ (t, t+ dt) | X > t) = P (t<X≤t+dt)P (X>t)

= f(t)dt1−F (t)

λ(t) = f(t)1−F (t)

e chamada taxa de falha e representa a densidade de probabilidade de queum item com t segundos de vida ira falhar.

No caso de distribuicao exponencial,

λ(t) = λe−λt

e−λt = λ , ou seja, a taxa de falha e constante.

*

Falta de Memoria em Distribuicao Discreta

Seja a distribuicao geometrica P (N = k) = p(1 − p)k−1, k ≥ 1. Se N representa otempo de permanencia em um estado, pela propria obtencao de N a distribuicao e semmemoria. A decisao de deixar (probabilidade p) ou permanecer no estado (probabilidade(1− p)) independe do passado.

P (N > k1) =∑∞

k=k1+1 p(1− p)k−1 = p(1− p)k1∑∞

k−k1=1(1− p)k−k1−1

= p(1− p)k1 1p= (1− p)k1

P (N > k2) = (1− P )k2

P (N > k1 + k2) = (1− p)k1+k2 = P (N > k1) P (N > k2)

o que mostra matematicamente que a distribuicao geometrica e sem memoria.

35

Page 36: Apostila - Aguiar

*

Pode-se provar que a unica distribuicao contınua sem memoria e a exponencial. Da mesmaforma, prova-se que a unica distribuicao discreta sem memoria e a geometrica.

***

10.6 Relacao entre Distribuicao Exponencial e Processo Poisson

Suponha que chegadas ocorram num intervalo T , segundo um processo Poisson. O numerode chegadas durante um determinado intervalo de tempo T e dado pela formula de Poisson:

P{k chegadas durante T} = Pk(T ) =(λT )k

k!e−λT

onde λ e a taxa media de chegadas de fregueses por segundo.

Pode-se ver que para o Processo Poisson P{nenhuma chegada em T} = e−λT . Supondoque uma chegada ocorreu no instante zero, a probabilidade de que a proxima chegada ocorraentre T e (T + dt), assumindo independencia entre eventos, e:

P{proxima chegada em (T, T + dt) } == P{nenhuma chegada em (0, T ) e pelo menos 1 chegada em (T, T + dt)}= P{nenhuma chegada em (0, T ) }P{ 1 chegada em (T, T + dt)}= e−λT e−λdtλdt = λe−λ(T+dt)dt = λe−λTdt (dt→ 0)

Observe que a probabilidade de duas ou mais chegadas no intervalo (T, T + dt) e O(dt2),ou seja, cai igual ou mais rapidamente que dt2.

Se f(x) e O(xn) com x→ 0, entao limx→0f(x)xn <∞.

Em geral, a notacao O(g(x)) com x→ x0 refere-se a qualquer funcao que (com x→ x0)decai a zero pelo menos tao rapido quanto g(x) (onde g(x) > 0), isto e,

limx→x0

O(g(x))

g(x)

<∞

Por outro lado, a notacao o(g(x)) com x → x0 refere-se a qualquer funcao que (comx→ x0) decai a zero mais rapido que g(x) (onde g(x) > 0), isto e,

limx→x0

o(g(x))

g(x)

= 0

Se levamos em conta apenas os comportamentos O(dt), isto e, uma aproximacao deprimeira ordem, entao precisamos considerar apenas uma chegada no evento pelo menosuma chegada acima.

Conclusao: um processo Poisson possui tempo entre chegadas exponencial.

36

Page 37: Apostila - Aguiar

*

Se analisarmos o caminho inverso, isto e, supondo o tempo entre chegadas exponencial comparametro λ, e assumindo X1 o instante da primeira chegada (assuma que no instante zeroalguem chegou) e X2 o tempo entre a primeira e a segunda chegada, podemos verificar que:

P{0 chegadas em T} = P (X1 > T ) = e−λT .

P{1 chegada em T} = P (X1 < T e X2 +X1 > T )

=∫∞0

P (X1 < T e X2 +X1 > T | t ≤ X1 ≤ t+ dt)P (X1 ∈ (t, t + dt))

=∫ T

OP (X2 > T − t)λe−λtdt

= λ∫ T

0e−λ(T−t)e−λtdt

= λTe−λT

Estas probabilidades concordam com o resultado dado pela formula de Poisson.

Demonstra-se que se um processo possui tempo entre chegadas exponencial,ele e um Processo Poisson.

O processo Poisson sera estudado em Cadeia de Markov como exemplo de um Processode Nascimento Puro. No capıtulo de Cadeia de Markov, deduziremos a formula de Poisson.

***

10.7 Variavel Aleatoria Mista

Uma variavel aleatoria mista e aquela que engloba tanto o comportamento discreto, comconcentracoes de probabilidades em pontos determinados, como o comportamento contınuoem outros intervalos.

Um bom exemplo de variavel mista e a exponencial truncada X para o intervalo [a, b].Esta exponencial e obtida a partir de uma exponencial X , concentrando no ponto a a pro-babilidade P (X < a) = 1 − e−λa e no ponto b a probabilidade P (X > b) = e−λb. A pdf deX e dada por

fX(x) = (1− e−λa)u0(x− a) + λe−λx[u−1(x− a)− u−1(x− b)] + e−λbu0(x− b)

Para obter a CDF FX = P (X < x), devemos integrar a pdf mista fX(x). Os termos(1− e−λa)u0(x− a) e e−λbu0(x− b), que envolvem uma constante multiplicando um impulso,podem ser integrados diretamente fornecendo os degraus (1−e−λa)u−1(x−a) e e−λbu−1(x−b),respectivamente.

37

Page 38: Apostila - Aguiar

Cuidado maior deve ser tomado ao se integrar λe−λx[u−1(x−a)−u−1(x−b)], que pode serescrita como λe−λxu−1(x−a)−λe−λxu−1(x−b). Vamos integrar cada termo separadamente,respeitando o domınio de integracao definido por cada funcao degrau.

Integrando o primeiro termo de a a x, obtemos (e−λa − e−λx) para x > a, ou seja,(e−λa − e−λx)u−1(x− a).

Integrando o segundo termo de b a x, obtemos (e−λb − e−λx) para x > b, ou seja,(e−λb − e−λx)u−1(x− b).

Entao, FX(x) = (1− e−λa)u−1(x− a) + e−λbu−1(x− b) + (e−λa − e−λx)u−1(x− a)−(e−λb − e−λx)u−1(x− b) = (1− e−λx)u−1(x− a) + e−λxu−1(x− b).

De fato, a CDF FX(x) = (1− e−λx)u−1(x− a) + e−λxu−1(x− b) e nula para x < a. Paraa < x < b, a CDF e dada por e−λa−e−λx, como esperado. Observe que para x > b os termosexponenciais se anulam e a CDF fica constante em 1, como deve ser. A expressao com usodas funcoes singulares simplifica a descricao da funcao, mantendo a clareza matematica.

***

38

Page 39: Apostila - Aguiar

11 Funcoes de Variaveis Aleatorias

Questao:

Assuma Y = G(X) = e−X , onde X e Y sao duas variaveis aleatorias. Se −∞ < X <∞,entao Y > 0. Y e uma funcao decrescente de X . Dado fX(x), como obter fY (y)?

Os passos sao os seguintes:

1. {Y ≤ y} = {e−X ≤ y} = {−X ≤ ln y} = {X ≥ − ln y}

2. FY (y) = P{Y ≤ y} = P{X ≥ − ln y} =∫∞− ln y

fX(x)dx

3. fY (y) =ddy

[

∫∞− ln y

fX(x)dx]

, y > 0

Para realizar o ultimo passo, relembrar a Regra de Leibnitz:

d

dt

[

∫ h(t)

g(t)

f(τ, t)dτ

]

=

∫ h(t)

g(t)

∂f(τ, t)

∂tdτ + f(h(t), t)

dh

dt− f(g(t), t)

dg

dt

Aplicando Leibnitz, temos:

fY (y) =

∫ ∞

− ln y

dfX(x)

dydx+ fX(∞)

d∞dy− fX(− ln y)

d(− ln y)

dy

= 0 + 0− fX(− ln y)(−1

y)

=fX(− ln y)

y, y > o

Observe que Y = G(X) e X = G−1(Y ) = − lnY .

E tambem que dY/dX = dG(X)/dX = −e−X = −Y e dX/dY = dG−1(Y )/dY = −1/Y .

Pelas relacoes obtidas acima, podemos escrever:

fY (y) = −fX(G−1(y))dG−1(y)dy

= −fX(x)dxdy = fX(x)∣

dxdy

A expressao∣

dxdy

∣= dG−1(y)/dy e o chamado Jacobiano da transformacao Y = G(X).

Como G e uma funcao decrescente, surge o sinal negativo.

***

0chap11.tex 17/05/2013

39

Page 40: Apostila - Aguiar

11.1 Metodologia

1. {Y ≤ y} = {X ∈ B(y)}

2. FY (y) = P{Y ≤ y} = P{X ∈ B(y)} =∫

B(y)fX(x)dx

3. fY (y) =ddy

[

B(y)fX(x)dx

]

, (aplicar regra de Leibnitz).

*

Exemplo: Y = X2.

1. {Y ≤ y} = {−√y ≤ X ≤ √y}

2. FY (y) =∫

√y

−√yfX(x)dx

3. fY (y) = fX(√y)(1

2)(y−

12 )− fX(−

√y)(−1

2)(y−

12 ) =

fX(√y)+fX(−√

y)

2√y

*

Exemplo: Seja X uma v.a. com fX(x) e FX(x). Encontre a pdf de Y = FX(X). Observeque FX(.) e uma funcao monotonicamente nao decrescente (pois e uma funcao distribuicao).

1. {Y ≤ y} = {FX(X) ≤ y} = {X ≤ F−1X (y)}

2. FY (y) =∫ F−1

X (y)

−∞ fX(x)dx = FX(F−1X (y)) = y

3. fY (y) =dFY (y)

dy=

{

1 0 ≤ y ≤ 10 outros casos

Conclusao: Y e uniforme em (0,1).

*

Problema: Dadas X com fX(x) e Y com fY (y), e possıvel encontrar a transformacaoY = G(X)?

Z = FX(X) e W = FY (Y ) sao variaveis uniformes em (0,1). Se W e uniforme em (0,1),entao Y = F−1

Y (W ) tem pdf fY (y), assumindo que a inversa existe.

Entao, Y = F−1Y (FX(X)) transforma fX(x) em fY (y).

Exemplo: Seja X uniforme em (0,1). Se Y e exponencial, podemos afirmar que

Y = F−1Y (FX(X)) e lembrando que FX(X) = X, 0 ≤ X ≤ 1, por ser X uma v.a.

uniforme em (0,1), entao Y = F−1Y (X) = − ln(1−X)

λ= − lnX

λ, visto que 1 − X = X para

distribuicao uniforme em (0,1).

40

Page 41: Apostila - Aguiar

*

Exercıcio: Seja fX(x) =

{

e−x, x ≥ 00, x < 0

e fY (y) =

{ 12√y, 0 ≤ y ≤ 1

0, outros casos.

Mostre que Y = (1− e−X)2.

Obtendo as PDFs temos;

FX(X) =

{

1− e−x, x ≥ 00, x < 0

FY (y) =∫ y

01

2√udu =

√u|y0 =

√y, 0 ≤ y ≤ 1

0, y < 01, y ≥ 1

Vimos que Z = FX(X) = 1 − e−X e uniforme em (0,1). Similarmente, W =√Y e

uniformemente distribuıda em (0,1).

Igualando Z = W e resolvendo em Y obtemos Y = (1− e−X)2.

***

11.2 Geracao de Distribuicoes

O fato de Y = FX(X) ser uma distribuicao uniforme e usado em simulacao para gerar amos-tas de variaveis aleatorias com uma determinada distribuicao. Suponhamos que queremosobter uma amostra da variavel aleatoria X , que possui PDF FX(x).

Princıpio: U = FX(X) e uniforme (0,1). Consequentemente F−1X (U) = X .

Procedimento:

• Obter u0, uma amostra da distribuicao uniforme em (0,1), a partir de um gerador denumeros aleatorios

• Obter x0 = F−1X (u0), que e uma amostra de X .

Exemplo:

FX(x) = 1− e−λx, PDF de uma distribuicao exponencial

u0 = 1− e−λx0

1− u0 = e−λx0

ln(1− u0) = −λx0

x0 = − ln(1 − u0)

λ

41

Page 42: Apostila - Aguiar

Como (1 − u0) tem a mesma pdf de u0, na pratica usamos x0 = − ln(u0)λ

, economizando aoperacao de subtracao.

No caso discreto:

Assuma P (N = k) = p1u0(k−a1)+p2u0(k−a2)+p3u0(k−a3), ou seja, N assume valoresai com probabilidade pi, i = 1, 2, 3. Obtemos P (N ≤ k) = p1u−1(k − a1) + p2u−1(k − a2) +p3u−1(k − a3). Entao, a partir de u0 podemos determinar k0 da forma abaixo:

0 < u0 ≤ p1 = P (N ≤ 1) =⇒ k0 = a1

p1 = P (N ≤ 1) < u0 ≤ p1 + p2 = P (N ≤ 2) =⇒ k0 = a2

p1 + p2 = P (N ≤ 2) < u0 ≤ 1 =⇒ k0 = a3

Aplicacao: Gerar uma amostra de uma distribuicao geometrica.

P (N = k) = pk−1(1− p), k ≥ 1;

P (N ≤ k) =

k∑

i=1

pi−1(1− p) = 1− pk = FN(k); (faca esta passagem);

E[N ] =1

1− p.

Deveremos ter:

0 < u0 ≤ P (N ≤ 1) =⇒ k0 = 1

P (N ≤ 1) < u0 ≤ P (N ≤ 2) =⇒ k0 = 2...

P (N ≤ j − 1) < u0 ≤ P (N ≤ j) =⇒ k0 = j

ou seja 1− pj−1 < u0 ≤ 1− pj =⇒ k0 = j.

Facamos 1− pk−1 < u0 ≤ 1− pk. Tirando o logaritmo, obtemos

ln(1− u0)

ln p≤ k <

ln(1− u0)

ln p+ 1

Como a amostra da geometrica e um numero inteiro, e a media da geometrica e dadapor 1

1−p, entao de forma mais geral podemos escrever que

k0 =

ln(1− u0)

ln(1− 1/media)

Como 1− U e tambem uniforme, podemos eliminar uma subtracao e escrever

k0 =

ln u0

ln(1− 1/media)

42

Page 43: Apostila - Aguiar

*

Exercıcio: Mostre como seria gerada uma amostra do tamanho de uma mensagem emuma rede Ethernet, sabendo que a pdf do tamanho da mensagem e dada por P (X = i) =34u0(i− 50) + 1

161

450(u−1(i− 50)− u−1(i− 500)) + 3

16u0(i− 500), i > 0.

Observe que a PDF poderia ser facilmente obtida integrando cada um dos termos da pdf:

P (X ≤ i) = 34u−1(i− 50) + 1

161

450(u−2(i− 50)− u−2(i− 500)) + 3

16u−1(i− 500), i > 0.

***

43

Page 44: Apostila - Aguiar

12 Distribuicao Conjunta Cumulativa de V.As.

A funcao de distribuicao conjunta cumulativa de duas variaveis aleatorias pode ser definidacomo:

FXY (a, b) = P (X ≤ a, Y ≤ b), −∞ < a, b <∞.

A distribuicao de X pode ser obtida a partir de FXY (., .) :

FX(a) = P (X ≤ a) = P (X ≤ a, Y ≤ ∞) = FXY (a,∞)

FX(b) = FXY (∞, b).

No caso discreto temos:

fXY (a, b) = P (X = a, Y = b).

fX(a) = P (X = a) =∑∞

b=−∞ fXY (a, b) =∑∞

b=−∞ P (X = a, Y = b)=∑∞

b=−∞ P (X = a|Y = b)p(Y = b).

*

Se X e Y sao conjuntamente contınuas, entao:

P (X ∈ A, Y ∈ B) =∫

B

AfXY (x, y)dxdy

fXY (., .) = funcao densidade de probabilidade conjunta.

Entao:

P (X ∈ A) = P (X ∈ A, Y ∈ (−∞,∞) =∫∞−∞∫

AfXY (x, y)dxdy =

AfX(x)dx

Consequentemente, fX(x) =∫∞−∞ fXY (x, y)dy

*

Variaveis Aleatorias Independentes

X e Y sao independentes se, ∀a, ∀b

P (X ≤ a, Y ≤ b) = P (X ≤ a)P (Y ≤ b) ou

FXY (a, b) = FX(a)FY (b), ∀a, b ou

fXY (x, y) = fX(x)fY (y)

*

0chap12.tex 12/11/2012

44

Page 45: Apostila - Aguiar

Exercıcio: Encontre a pdf da menor de K variaveis aleatorias, cada uma distribuıdaexponencialmente com parametro λ.

Seja Y = min {X1, X2, · · · , XK}.

P (Y > y) = P (X1 > y,X2 > y, · · · , XK > y)

= P (X1 > y)P (X2 > y). · · · .P (XK > y)

= e−λye−λy · · · e−λy

= e−Kλy.

Portanto, Y e exponencial com parametro Kλ.

Interpretacao:

Se temos K fontes exponenciais, a fonte i com parametro λi, a distribuicao do tempo atea proxima partida (de qualquer uma das fontes) e exponencial com parametro

i λi.

Dizendo de outra forma: a uniao de K fluxos Poisson e tambem um fluxo Poissoncom taxa igual a soma das taxas.

*

Exercıcio: Sejam dadas duas variaveis aleatorias X1 e X2, com parametros λ1 e λ2. CalculeP (X1 > X2).

P (X1 > X2) =

∫ ∞

0

P (X1 > X2|X2 ∈ (t, t + dt))P (X2 ∈ (t, t+ dt))

=

∫ ∞

0

P (X1 > t)λ2e−λ2tdt

= λ2

∫ ∞

0

e−λ1te−λ2tdt

= λ2

∫ ∞

0

e−(λ1+λ2)tdt

= λ2e−(λ1+λ2)t

−(λ1 + λ2)|∞0

=λ2

λ1 + λ2

Significado:

λ2

λ1+λ2e a probabilidade de que uma pessoa com quantidade de servico distribuıda expo-

nencialmente com parametro λ2 termine de ser atendida primeiro que uma segunda pessoacom servico exponencialmente distribuıdo com taxa λ1, dado que num dado instante am-bas as pessoas estao sendo servidas simultaneamente. Observe nao e preciso que ambas aspessoas comecem a ser atendidas no mesmo instante, porque a exponencial e sem memoria.

45

Page 46: Apostila - Aguiar

Aplicacao: Se chegadas ocorrem segundo um Processo Poisson com taxa λ1 e partidasocorrem segundo um processo Poisson com taxa λ2,

λ1

λ1+λ2e a probabilidade de que uma

chegada ocorra antes de uma partida. Estes processos ocorrem em uma fila M/M/1 (chegadaPoisson, servico exponencial).

Tudo se passa como se tivessemos dois fluxos Poisson: um de chegada e outro de partida.O tempo ate o proximo evento (chegada ou partida) e exponencial com parametro igual asoma dos parametros das exponenciais envolvidas.

*

Exercıcio: Dadas tres variaveis aleatorias exponenciais independentes X1, X2 e X3, calculea probabilidade de que X1 seja o maximo entre elas.

Existem duas maneiras de atacar o problema:

1. Pense em cada uma das variaveis como uma fonte Poisson. Para que X1 seja o maximosera preciso que a partida desta fonte ocorra por ultimo. Os eventos possıveis sao:partida de 2, partida de 3 e partida de 1 oupartida de 3, partida de 2 e partida de 1.

Somando as duas probabilidades temos:

P{X1 > X2, X1 > X3} = λ2

λ1+λ2+λ3

λ3

λ1+λ3+ λ3

λ1+λ2+λ3

λ2

λ1+λ2

2.

P{X1 > X2, X1 > X3} =

∫ ∞

x=0

P{X1 > X2, X1 > X3|x < X1 ≤ x+ dx}P{x < X1 ≤ x+ dx}

=

∫ ∞

x=0

P{x > X2, x > X3}λ1e−λ1xdx

=

∫ ∞

x=0

(1− e−λ2x)(1− e−λ3x)λ1e−λ1xdx

=

∫ ∞

x=0

λ1e−λ1xdx− λ1

∫ ∞

x=0

e−(λ1+λ2)xdx−

λ1

∫ ∞

x=0

e−(λ1+λ3)xdx+ λ1

∫ ∞

x=0

e−(λ1+λ2+λ3)xdx

= λ1

[

e−λ1x

−λ1

]∞

0

− λ1

[

e−(λ1+λ2)x

−(λ1 + λ2)

]∞

0

λ1

[

e−(λ1+λ3)x

−(λ1 + λ3)

]∞

0

+ λ1

[

e−(λ1+λ2+λ3)x

−(λ1 + λ2 + λ3)

]∞

0

= 1− λ1

λ1 + λ2− λ1

λ1 + λ3+

λ1

λ1 + λ2 + λ3

=

(

λ2

λ1 + λ2 + λ3

)(

λ3

λ1 + λ3

)

+

(

λ3

λ1 + λ2 + λ3

)(

λ2

λ1 + λ2

)

*

46

Page 47: Apostila - Aguiar

Exercıcio: Dadas tres variaveis aleatorias exponenciais independentes X1, X2 e X3,calcule a probabilidade de P{X1 > X2|X1 > X3, X2 > X3}.

Solucao:

P{X1 > X2|X1 > X3, X2 > X3} =P{X1 > X2, X1 > X3, X2 > X3}

P{X1 > X3, X2 > X3}

Para calcular P{X1 > X2, X1 > X3, X2 > X3} condicione duas vezes: uma em X1 e asegunda em X2, por exemplo. Obtemos

P{X1 > X2, X1 > X3, X2 > X3} =

=

∫ ∞

y=0

P{X1 > X2, X1 > X3, X2 > X3|y < X1 ≤ y + dy}P{y < X1 ≤ y + dy}

=

∫ ∞

y=0

P{y > X2, y > X3, X2 > X3}P{y < X1 ≤ y + dy}

=

∫ ∞

y=0

∫ ∞

z=0

P{y > z, y > X3, z > X3}P{y < X1 ≤ y + dy}P{z < X2 ≤ z + dz}

=

∫ ∞

y=0

∫ y

z=0

P{z > X3}P{y < X1 ≤ y + dy}P{z < X2 ≤ z + dz}

= apos resolver as integracoes e simplificar

=

(

λ2

λ1 + λ2

)(

λ3

λ1 + λ2 + λ3

)

Podemos observar que o primeiro termo da resposta corresponde a probabilidade de X2

ser menor que X1 e o segundo termo corresponde a probabilidade de X3 ser menor dostres Xi. Esta e a resposta esperada quando pensamos em tres fontes Poisson independentese usamos a propriedade da falta de memoria da exponencial e a composicao de processosPoisson.

Como P{X1 > X3, X2 > X3} = λ3

λ1+λ2+λ3, a resposta do problema e λ2

λ1+λ2. A inter-

pretacao e: uma vez que X1 e X2 sao ambos maiores que X3, a relacao entre eles nao einfluenciada por este fato (o que e razoavel ja que a exponencial e sem memoria).

*

Exercıcio: Dado X1 e X2 exponenciais, calcule P (X1 ≤ t|X1 < X2), isto e, calcule adistribuicao de uma v.a. exponencial sabendo que ela e menor que outra v.a. exponencial.

ILUSTRACAO: Se X2 representa o tempo de servico de um fregues num banco, e X1

representa o tempo de chegada do proximo fregues que ainda encontra o fregues em servico,entao a distribuicao do tempo de chegada e dada pela formula solicitada.

47

Page 48: Apostila - Aguiar

Solucao:

P (X1 ≤ t|X1 < X2) =P (X1 ≤ t, X1 < X2)

P (X1 < X2)

=λ1 + λ2

λ1P (X1 ≤ t, X1 < X2)

=λ1 + λ2

λ1

∫ ∞

y=0

P (X1 ≤ t, X1 < X2|y < X2 ≤ y + dy)P (y < X2 ≤ y + dy)

=λ1 + λ2

λ1

[∫ t

y=0

P (X1 ≤ t, X1 < y)fY (y)dy +

∫ ∞

y=t

P (X1 ≤ t, X1 < y)fY (y)dy

]

=λ1 + λ2

λ1

[∫ t

y=0

P (X1 < y)fY (y)dy +

∫ ∞

y=t

P (X1 ≤ t)fY (y)dy

]

=λ1 + λ2

λ1

[∫ t

y=0

(1− e−λ1y)λ2e−λ2ydy +

∫ ∞

y=t

(1− e−λ1t)λ2e−λ2ydy

]

=λ1 + λ2

λ1

[∫ ∞

y=0

λ2e−λ2ydy − λ2

∫ t

y=0

e−(λ1+λ2)ydy − e−λ1t

∫ ∞

y=t

λ2e−λ2ydy

]

=λ1 + λ2

λ1

[

1− λ2

λ1 + λ2(1− e−(λ1+λ2)t)− e−λ1te−λ2t

]

= 1− e−(λ1+λ2)t

que e a distribuicao de uma exponencial com taxa λ1 + λ2.

Observe que o conhecimento de que X1 < X2 afeta a distribuicao de X1

***

48

Page 49: Apostila - Aguiar

13 Propriedades de Variaveis Aleatorias

13.1 Media, Esperanca ou Valor Esperado

Define-se esperanca (media ou valor esperado) da variavel X, repesentada pela notacao Es-peranca de X = E[X ] = X , como

• Caso Discreto: E[X ] =∑

∀k xkP (X = xk).

• Caso Contınuo: E[X ] =∫∞−∞ xfX(x)dx =

∫∞−∞ xP (x < X ≤ x+ dx).

Outra forma de calcular E[X ], obtida a partir da integracao por partes, e a seguinte:

E[X ] =∫∞0(1− FX(x))dx−

∫ 0

−∞ FX(x)dx.

Demonstracao: Para demonstrar o resultado usaremos a definicao de PDF como se segue:

E[X ] =∫∞0(1− FX(x))dx−

∫ 0

−∞ FX(x)dx

=∫∞x=0

P{X > x}dx−∫ 0

x=−∞ FX(x)dx

=∫∞x=0

∫∞y=x

fX(y)dydx−∫ 0

x=−∞∫ x

y=−∞ fX(y)dydx

=∫∞y=0

[∫ y

x=0dx]

fX(y)dy −∫ 0

y=−∞

[

∫ 0

x=ydx]

fX(y)dy

=∫∞y=0

yfX(y)dy −∫ 0

y=−∞(−y)fX(y)dy

=∫∞y=0

yfX(y)dy +∫ 0

y=−∞ yfX(y)dy =∫∞y=−∞ yfX(y)dy

Convem lembrar que a esperanca e um numero.

*

Teorema fundamental

Seja Y = g(X). Entao,

EY [Y ] = EX [g(X)] =∫∞−∞ g(x)fX(x)dx.

EY [.] indica que a esperanca e tomada em relacao a variavel Y .

0chap13.tex 12/11/2012

49

Page 50: Apostila - Aguiar

Importante:

Seja Y = X1 +X2.

E[Y ] =∫∞−∞ yfY (y)dy

=∫∞x1=−∞

∫∞x2=−∞(x1 + x2)fX1X2(x1, x2)dx1dx2

=∫∞x1=−∞

∫∞x2=−∞ x1fX1X2(x1, x2)dx1dx2+

∫∞x1=−∞

∫∞x2=−∞ x2fX1X2(x1, x2)dx1dx2

=∫∞x1=−∞ x1

{

∫∞x2=−∞ fX1X2(x1, x2)dx2

}

dx1+∫∞x2=−∞ x2

{

∫∞x1=−∞ fX1X2(x1, x2)dx1

}

dx2

=∫∞x1=−∞ x1fX1(x1)dx1 +

∫∞x2=−∞ x2fX2(x2)dx2

= E[X1] + E[X2], mesmo se X1 e X2 nao forem independentes

Podemos, entao, afirmar que:

E [∑

i Xi] =∑

iE[Xi].

Observe que uma constante a pode ser definida pela densidade de massa u0(t − a).Aplicando a esperanca, temos E[a] =

∫∞−∞ tu0(t− a)dt = a, como deverıamos esperar.

Por outro lado, se Y = aX , onde a e um numero, entao e facil ver que E[Y ] = E[aX ] =aE[X ].

Estas propriedades mostram que a esperanca e um operador linear.

Aplicando o operador esperanca E a expressao Y = aX+ b , obtemos E[Y ] = aE[X ]+ b.

*

Suponha Y = X1X2 e que X1 e X2 sao independentes.

Pode-se mostrar facilmente que E[Y ] = E[X1]E[X2].

Em geral, E[g(X1).h(X2)] = E[g(X1)]E[h(X2)], se X1 e X2 forem independentes.

***

50

Page 51: Apostila - Aguiar

13.2 Momentos

Definicao:

n-esimo momento de X = E[Xn] = Xn =

{ ∫∞−∞ xnfX(x)dx , no caso contınuo∑

x xnP (X = x) , no caso discreto

Observe que:

E[X0] = 1

E[X1] = E[X ] = esperanca.

E[X2] = momento de inercia.

Definicao:

n-esimo momento central de X = E[(X − E[X ])n] = (X −X)n

=

{ ∫∞−∞(x−E[X ])nfX(x)dx no caso contınuo∑

∀x(x− E[X ])nP (X = x) no caso discreto

*

O momento central pode ser escrito em termos dos n-esimos momentos

(X − E[X ])n =∑n

k=0

(

nk

)

Xk(−E[X ])n−k

Tirando a media dos dois lados:

E[(X − E[X ])n] =∑n

k=0

(

nk

)

E[Xk](−E[X ])n−k

Lembre-se que a esperanca e um numero.

*

Variancia = 2o momento central = σ2X = V(X).

σX = desvio padrao.

σ2X = E[(X −E[X ])2]

= E[X2 − 2XE[X ] + (E[X ])2]

= E[X2]− 2E[X ]E[X ] + (E[X ])2

= E[X2]− (E[X ])2

Coeficiente de variacao = CX = σx

E[X].

51

Page 52: Apostila - Aguiar

*

Covariancia

Cov(X, Y ) = E[(X − E[X ])(Y − E[Y ])]

= E[XY −E[X ]Y −XE[Y ] + E[X ]E[Y ]]

= E[XY ]−E[X ]E[Y ]

Se X e Y forem independentes, entao

Cov(X, Y ) = E[X ]E[Y ]− E[X ]E[Y ] = 0.

Se X = Y , entao

Cov(X,X) = E[(X − E[X ])2] = V (X).

*

Para Y = a1X1 + a2X2 + · · ·+ anXn

E[Y ] = a1E[X1] + a2E[X2] + · · ·+ anE[Xn]

V (Y ) = E[(Y − E[Y ])2]

= E[(∑

i

aiXi −∑

i

aiE[Xi])2]

= E[(∑

i

(aiXi − aiE[Xi]))2]

=n∑

i=1

n∑

j=1

aiajE[(Xi − E[Xi])(Xj −E[Xj ])]

=

n∑

i=1

n∑

j=1

aiajCov(Xi, Xj)

Observe que :

(∑n

i=1Xi)2 =

∑ni=1Xi

∑nj=1Xj =

∑ni=1

∑nj=1XiXj

Se Xi sao independentes

V (Y ) =∑n

i=1 a2iV (Xi) porque Cov(Xi, Xj) = 0, se X1 6= Xj.

Assim, para Y = X1 +X2,

V (Y ) = V (X1) + V (X2) + 2Cov(X1, X2).

Para este caso, se X1 e X2 forem independentes, V (Y ) = V (X1) + V (X2).

52

Page 53: Apostila - Aguiar

*

Exemplo: Variancia de uma variavel binomial X com parametros n e p. X mede o numerode sucessos em n experimentos de Bernoulli. Seja Xi o resultado do i-esimo experimento:

Xi =

{

1 , se o i-esimo experimento tem sucesso com probabilidade p0 , se o i-esimo experimento falha com probabilidade 1− p

X pode ser escrita como:

X = X1 +X2 + · · ·+Xn, e, consequentemente, V (X) =∑

i V (Xi).

Mas,

V (Xi) = E[X2i ]− (E[Xi])

2

= E[Xi]− (E[Xi])2, pois X2

i = Xi

= p− p2

Entao, V (X) = np(1− p).

*

Exercıcio: Mostre que para X exponencial com parametro λ, E[X ] = 1/λ e V (X) = 1/λ2.

E[X ] =

∫ ∞

0

λxe−λxdx = λ

∫ ∞

0

d

(

−e−λx)

dx

= −λ d

∫ ∞

0

e−λxdx = −λ d

[

e−λx

−λ

]∞

0

= −λ d

(

1

λ

)

λ2=

1

λ

E[X2] =

∫ ∞

0

λx2e−λxdx = λd

dλ2

(∫ ∞

0

e−λxdx

)

= λd

dλ2

(

1

λ

)

= λd

(−1λ2

)

= λ

(

λ4

)

=2

λ2

Variancia = σ2X = E[X2]− (E[X ])2 =

2

λ2− 1

λ2=

1

λ2

*

53

Page 54: Apostila - Aguiar

Problema: Calcule a media de uma variavel aleatoria binomial negativa.

E[X ] =∞∑

n=k

n

(

n− 1

k − 1

)

(1− p)n−kpk, 1 ≤ k ≤ n

=

∞∑

n=k

n!

(n− k)!(k − 1)!(1− p)n−kpk

=

∞∑

n−k=l=0

(l + k)!

l!(k − 1)!qlpk (fazendo l = n− k)

= kpk∞∑

l=0

(

l + k

k

)

ql

Observando que∑∞

l=0

(

l+kk

)

ql = 1(1−q)k+1 (mostre esta propriedade, derivando k vezes a ex-

pressao∑∞

i=0 qi = 1

1−q), podemos escrever que E[X ] = kpk

pk+1 = kp.

Uma outra forma de se chegar ao resultado seria seguir os passos abaixo:

E[X ] =∞∑

n=k

n

(

n− 1

k − 1

)

(1− p)n−kpk, 1 ≤ k ≤ n

=∞∑

n=k

n!

(n− k)!(k − 1)!(1− p)n−kpk

=pk

(k − 1)!

∞∑

n=k

n(n− 1)(n− 2) · · · (n− k + 1)(1− p)n−k

=pk

(k − 1)!

∞∑

n=k

dk

dqk(qn)

=pk

(k − 1)!

dk

dqk

∞∑

n=k

(qn)

=pk

(k − 1)!

dk

dqk

∞∑

n=0

qn (alterar o limite inferior do somatorio facilita!)

=pk

(k − 1)!

dk

dqk

(

1

1− q

)

=pk

(k − 1)!× k!

(1− q)k+1

=pkk

pk+1=

k

p

*

54

Page 55: Apostila - Aguiar

Problema: Assuma uma sequencia de eventos de Bernoulli, onde P (sucesso) = p e P (falha) =1 − p. Seja Tc a variavel aleatoria que expressa o tempo necessario para se obter c falhasconsecutivas.

Mostre que E[Tc] =1−(1−p)c

p(1−p)c.

Procedimento: determinar Tc em funcao de Tc−1.

S S S F

|----------|-|----------|-|----------|-|--...--|----------|-|

|<--Tc-1-->| |<--Tc-1-->| |<--Tc-1-->| |<-...->|<--Tc-1-->| |

| |

|<-------------------------Tc------------------------------>|

Seja N = numero de subciclos com c−1 falhas consecutivas em Tc, com Pk = P (N = k).

E facil ver que Pk = pk−1(1− p), k ≥ 1, e que E[N ] = 11−p

.

E[Tc] =∞∑

k=1

E[Tc|N = k]P{N = k}

=∞∑

k=1

(kE[Tc−1] + k)P{N = k}

= (E[Tc−1] + 1)

∞∑

k=1

kP{N = k}

=1

1− p(E[Tc−1] + 1)

Observe que E[T1] = numero medio de tentativas ate se obter 1 falha = 11−p

.

Recursivamente:

E[T2] =1

(1− p)2+

1

1− p

E[T3] =1

(1− p)3+

1

(1− p)2+

1

1− p... =

E[Tc] =1

(1− p)c+

1

(1− p)c−1+ · · ·+ 1

(1− p)2+

1

(1− p)

Lembrando que a soma de n termos de uma PG, cujo n-esimo termo an = a0qn−1 e a0

e o primeiro termo, e dada por Sn = anq−a0q−1

, podemos escrever diretamente que E[Tc] =1−(1−p)c

p(1−p)c.CQD.

55

Page 56: Apostila - Aguiar

*

Exercıcio: Dado X1 e X2 exponenciais, obter E[X1|X1 > X2].

ILUSTRACAO: Se X2 representa o tempo de atendimento exponencial de um freguesnum banco, e X1 representa o tempo de chegada do proximo fregues, entao E[X1|X1 > X2]representa o tempo medio de chegada do proximo fregues, dado que ele chega apos a saıdado fregues anteriormente em servico.

Solucao:

Para calcular E[X1|X1 > X2], vamos inicialmente calcular P (X1 ≤ t|X1 > X2) = 1 −P (X1 > t|X1 > X2). Mas,

P (X1 > t|X1 > X2) =P (X1 > t,X1 > X2)

P (X1 > X2)

=λ1 + λ2

λ2P (X1 > t,X1 > X2)

=λ1 + λ2

λ2

∫ ∞

y=0

P (X1 > t,X1 > X2|y < X1 ≤ y + dy)P (y < X1 ≤ y + dy)

=λ1 + λ2

λ2

∫ ∞

y=t

P (y > t, y > X2)λ1e−λ1ydy

=λ1 + λ2

λ2

∫ ∞

y=t

P (X2 < y)λ1e−λ1ydy

=λ1 + λ2

λ2

∫ ∞

y=t

(1− eλ2y)λ1e−λ1ydy

=λ1 + λ2

λ2

[∫ ∞

y=t

λ1e−λ1ydy − λ1

∫ ∞

y=t

e−(λ1+λ2)ydy

]

=λ1 + λ2

λ2

[

e−λ1t − λ1

λ1 + λ2e−(λ1+λ2)t

]

=λ1 + λ2

λ2e−λ1t − λ1

λ2e−(λ1+λ2)t, t ≥ 0

Entao, P (X1 ≤ t|X1 > X2) = 1 + λ1

λ2e−(λ1+λ2)t − λ1+λ2

λ2e−λ1t, t ≥ 0.

A densidade pode ser obtida derivando a PDF:

fX1(x|X1 > X2) =λ1 + λ2

λ2

[

λ1e−λ1t

]

− λ1

λ2

[

(λ1 + λ2)e−(λ1+λ2)t

]

, t ≥ 0

onde os termos entre colchetes correspondem a densidades exponenciais. Podemos, entao,obter a media diretamente:

E[X1|X1 > X2] =λ1 + λ2

λ2× 1

λ1− λ1

λ2× 1

λ1 + λ2

=1

λ1 + λ2+

1

λ1

56

Page 57: Apostila - Aguiar

Este resultado poderia ser diretamente obtido observando que o primeiro termo e o tempomedio para X2 ocorrer, dado que X1 > X2. O segundo termo e o tempo medio de X1, aposa ocorrencia de X2, lembrando a falta de memoria da exponencial. E[X1|X1 > X2] pode sertambem interpretado como o tempo medio para a emissao de duas fontes exponenciais comtaxas λ1 e λ2, sabendo que a fonte com taxa λ1 emite por ultimo.

***

13.3 Esperanca Condicional

Definicao: E[X|y < Y ≤ y + dy] =∫∞−∞ xfX|Y (x|y)dx onde fX|Y (x|y) = fXY (x,y)

fY (y)

*

Teorema: E[X ] = EY [E[X|y < Y ≤ y + dy]] =∫∞−∞E[X|y < Y ≤ y + dy]fY (y)dy

Demonstracao:

EY [E[X|y < Y ≤ y + dy]] =

∫ ∞

−∞E[X|y < Y ≤ y + dy]fY (y)dy

=

∫ ∞

−∞

∫ ∞

−∞xfXY (x, y)

fY (y)fY (y)dxdy

=

∫ ∞

−∞x

∫ ∞

−∞fXY (x, y)dydx

=

∫ ∞

−∞xfX(x)dx = E[X ] C.Q.D.

No caso discreto, E[X ] = EY [E[X|Y = y]] =∑

y E[X|Y = y]P (Y = y).

*

Vamos lembrar que:

P (x < X ≤ x+ dx, A) =∑

∀Bi

P (x < X ≤ x+ dx, A,Bi)

=∑

∀Bi

P (x < X ≤ x+ dx|A,Bi)P (A,Bi)

=∑

∀Bi

P (x < X ≤ x+ dx|A,Bi)P (Bi|A)P (A)

57

Page 58: Apostila - Aguiar

De maneira semelhante,

E[X|A] =

x

xP (x < X ≤ x+ dx|A)

=

x

xP (x < X ≤ x+ dx, A)

P (A)

=∑

Bi

x

xP (x < X ≤ x+ dx, A,Bi)

P (A)

=∑

Bi

x

xP (x < X ≤ x+ dx|A,Bi)P (A,Bi)

P (A)

=∑

Bi

x

xP (x < X ≤ x+ dx|A,Bi)P (Bi|A)

***

13.4 Variancia Condicional

Definicao:V (X|Y ) = E[(X −E[X|Y ])2|Y ]

Desenvolvendo a expressao de V (X|Y ), obtemos:

VX(X|Y ) = EX

[

(X −EX [X|Y ])2|Y]

= EX

[

(X2 − 2XEX [X|Y ] + E2X [X|Y ]|Y

]

= EX [X2|Y ]− 2EX [X|Y ]E[X|Y ] + E2

X [X|Y ]

= EX [X2|Y ]− E2

X [X|Y ]

*

Teorema: V (X) = EY [VX(X|Y )] + VY (EX [X|Y ])

Demonstracao:

EY [VX(X|Y )] = EY

[

EX [X2|Y ]− E2

X [X|Y ]]

= EY

[

EX [X2|Y ]

]

−EY

[

E2X [X|Y ]

]

= EX [X2]− EY

[

E2X [X|Y ]

]

.

Por outro lado,

VY (EX [X|Y ]) = EY

[

E2X [X|Y ]

]

− (EY [EX [X|Y ]])2

= EY

[

E2X [X|Y ]

]

− (EX [X ])2 .

Entao:

EY [V (X|Y )] + VY (E[X|Y ]) = EX [X2]− (EX [X ])2 = V (X). C.Q.D.

58

Page 59: Apostila - Aguiar

*

Aplicacao: Assuma que num intervalo de tamanho X , X∗(s) qualquer, chegadas Poissoncom taxa λ possam ocorrer. Seja Y uma variavel exponencialmente distribuıda com taxa λ.Qual seria o instante medio da primeira chegada, dado que pelo menos uma chegada ocorreuem X? Em outras palavras, estamos procurando determinar a media da variavel Y , dadoque ela e menor do que X .

E[Y |Y < X ] =

∫ ∞

0

yP (y < Y < y + dy|Y < X)

=1

P (Y < X)

∫ ∞

0

yP (y < Y < y + dy, Y < X)

=1

1−X∗(λ)

∫ ∞

y=0

yP (Y < X|y < Y < y + dy)fY (y)dy

=1

1−X∗(λ)

∫ ∞

y=0

yP (X > y)λe−λydy

1−X∗(λ)

∫ ∞

y=0

ye−λyP (X > y)dy

1−X∗(λ)

∫ ∞

y=0

ye−λy

∫ ∞

y

fX(x)dxdy

1−X∗(λ)

∫ ∞

x=0

∫ x

y=0

ye−λydyfX(x)dx

1−X∗(λ)

∫ ∞

x=0

−ddλ

(

1

λ

∫ x

y=0

λe−λydy

)

fX(x)dx

1−X∗(λ)

∫ ∞

x=0

−ddλ

(

1− e−λx

λ

)

fX(x)dx

1−X∗(λ)

∫ ∞

x=0

(

1− e−λx

λ2− xe−λx

λ

)

fX(x)dx

1−X∗(λ)

(

1−X∗(λ)

λ2+

1

λ

d

∫ ∞

x=0

e−λxfX(x)dx

)

=1

λ+

X∗′(λ)

1 +X∗(λ)

59

Page 60: Apostila - Aguiar

14 Transformadas

14.1 Transformada de Laplace Unilateral para Funcoes Contınuas

Definimos a transformada de Laplace (T.L.) unilateral da funcao densidade de uma variavelaleatoria X contınua definida para valores nao negativos, como sendo:

X∗(s) = E[e−sX ] =

∫ ∞

0−e−sxP (x < X ≤ x+ dx) =

∫ ∞

0−e−sxfX(x)dx

A integracao pode ser assumida de 0 a ∞ se a funcao for bem comportada e nao possuirimpulso (concentracao de probabilidade) no ponto 0.

Propriedades:

• Se Y = aX , entao E[e−sY ] = E[e−saX ] = X∗(as)

• Se X1 e X2 sao independentes e Y = X1 +X2, entao

Y ∗(s) = E[e−sY ] = E[e−s(X1+X2)] = E[e−sX1 ]E[e−sX2] = X∗1 (s)X

∗2 (s)

• Se Y = T = constante, entao E[e−sY ] = e−sT

• X∗(s)|s=0 = X∗(0) = E[1] = 1

• Obtencao de momentos

X∗′(s) =d

dsX∗(s) =

d

dsE[e−sX ] = E[−Xe−sX ]

Entao, X∗′(s)|s=0 = X∗′(0) = E[−X ] = −E[X ].

X∗′′(s) =d2

ds2X∗(s) =

d2

ds2E[e−sX ] = E[X2e−sX ]

Entao, X∗(2)(s)|s=0 = X∗′′(0) = E[X2].

Generalizando: dn

dsnX∗(s)|s=0 = (−1)nE[Xn]

• Um resultado importante envolvendo os momentos e a T.L. pode ser obtido fazendo aexpansao de Taylor da exponencial em torno do ponto 0:

E[e−sX ] = E[

∞∑

i=0

(−sX)i

i!] =

∞∑

i=0

(−s)ii!

E[X i]

E em termos dos momentos da variavel aleatoria, temos

E[e−sX ] = 1− sE[X ] +s2

2E[X2]− s3

3!E[X3] + · · ·

mostrando que a transformada pode ser obtida como uma funcao de todos os momentosda variavel aleatoria.

0chap14.tex 17/05/2013

60

Page 61: Apostila - Aguiar

• A Transformada de Laplace de uma pdf e unica; dada a pdf obtemos a T.L., e dada aT.L. podemos obter, pelo processo inverso (geralmente atraves da expansao em fracoesparciais e uso de tabelas de pares f(t) ⇔ F ∗(s)), a pdf, que sera unica tambem.Consequentemente, uma variavel aleatoria contınua e perfeitamente caracterizada poruma das funcoes: T.L. da pdf, funcao densidade ou funcao distribuicao.

*

Exercıcio: Obter a T.L. de uma exponencial com taxa λ.

E[e−sX ] =

∫ ∞

0

e−stλe−λtdt

λ+ s

∫ ∞

0

(λ+ s)e−(s+λ)tdt =λ

λ+ s

Observe que a ultima integral vale 1, pois corresponde a FX(∞), para X com distribuicaoexponencial e taxa (s+ λ).

*

Exercıcio: Mostrar que a soma de duas variaveis exponenciais independentes nao e umaexponencial.

Se X1 e X2 sao exponenciais independentes e Y = X1+X2, entao Y∗(s) =

(

λ1

λ1+s

)(

λ2

λ2+s

)

,

que nao pode ser expressa como a transformada de uma exponencial.

*

Exercıcio: Mostrar que a probabilidade de 0 chegadas Poisson em um intervalo X , comT.L. X∗(s), e dada por X∗(λ).

P(0 chegadas em X) =

∫ ∞

0

P(0 chegadas em X |x < X ≤ x+ dx)P (x < X ≤ x+ dx)

=

∫ ∞

0

P(0 chegadas em x)fX(x)dx =

∫ ∞

0

e−λxfX(x)dx

= X∗(λ)

Se Y e uma variavel exponencial com taxa λ, entao P(0 chegadas em X) = P (Y > X).

*

61

Page 62: Apostila - Aguiar

Aplicacao: Assuma que num intervalo de tamanho X , X∗(s) qualquer, chegadas Poissoncom taxa λ possam ocorrer. Seja Y uma variavel exponencialmente distribuıda com taxaλ. Qual seria o instante da primeira chegada, dado que uma chegada ocorreu em X? Emoutras palavras, estamos procurando determinar a variavel Y , dado que ela e menor do queX . Para determinar este instante, precisa-se calcular E[e−sY |Y < X ].

E[e−sY |Y < X ] =

∫ ∞

0

e−syP (y < Y < y + dy|Y < X)

=1

P (Y < X)

∫ ∞

0

e−syP (y < Y < y + dy, Y < X)

=1

1−X∗(λ)

∫ ∞

y=0

e−syP (Y < X|y < Y < y + dy)fY (y)dy

=1

1−X∗(λ)

∫ ∞

y=0

e−syP (X > y)λe−λydy

1−X∗(λ)

∫ ∞

y=0

e−(s+λ)yP (X > y)dy

1−X∗(λ)

∫ ∞

y=0

e−(s+λ)y

∫ ∞

y

fX(x)dxdy

1−X∗(λ)

∫ ∞

x=0

∫ x

y=0

e−(s+λ)ydyfX(x)dx

(1−X∗(λ))(s+ λ)

∫ ∞

x=0

(∫ x

y=0

(s+ λ)e−(s+λ)ydy

)

fX(x)dx

(1−X∗(λ))(s+ λ)

∫ ∞

x=0

(

1− e−(s+λ)x)

fX(x)dx

=λ(1−X∗(s+ λ))

(1−X∗(λ))(s+ λ)

Derivando no ponto s = 0, obtemos

E[Y |Y < X ] =1

λ+

X∗′(λ)

1−X∗(λ)

A partir do valor acima, sabendo que E[Y ] = 1λ= E[Y |Y < X ]P (Y < X) + E[Y |Y >

X ]P (Y > X) e P (Y < X) = 1−X∗(λ), obtemos

E[Y |Y > X ] =1

λ− X∗′(λ)

X∗(λ)

Como E[Y |Y > X ] = E[X|Y > X ] +E[Y ], pois a exponencial e sem memoria, obtemos que

E[X|Y > X ] = −X∗′(λ)

X∗(λ)

E a partir do resultado acima e considerando que E[X ] = E[X|Y > X ]P (Y > X) +E[X|Y < X ]P (Y < X), temos

E[X|Y < X ] =E[X ] +X∗′(λ)

1−X∗(λ)

62

Page 63: Apostila - Aguiar

Importante tambem lembrar que E[X − Y |Y < X ] = E[X|Y < X ]− E[Y |Y < X ].

*

As transformadas condicionais de X tambem podem ser obtidas:

E[e−sX |Y < X ] =

∫ ∞

0

e−sxP (x < X < x+ dx|Y < X)

=1

P (Y < X)

∫ ∞

0

e−sxP (x < X < x+ dx, Y < X)

=1

1−X∗(λ)

∫ ∞

x=0

e−sxP (Y < X|x < X < x+ dx)f(x)dx

=1

1−X∗(λ)

∫ ∞

x=0

e−sxP (Y < x)f(x)dx

=1

1−X∗(λ)

∫ ∞

x=0

e−sx(1− e−λxf(x)dx

=1

1−X∗(λ)

(∫ ∞

x=0

e−sxf(x)dx−∫ ∞

x=0

e−(s+λ)xf(x)dx

)

=X∗(s)−X∗(s+ λ)

1−X∗(λ)

E[e−sX |Y > X ] =

∫ ∞

0

e−sxP (x < X < x+ dx|Y > X)

=1

P (Y > X)

∫ ∞

0

e−sxP (x < X < x+ dx, Y > X)

=1

X∗(λ)

∫ ∞

x=0

e−sxP (Y > X|x < X < x+ dx)f(x)dx

=1

X∗(λ)

∫ ∞

x=0

e−sxP (Y > x)f(x)dx

=1

X∗(λ)

∫ ∞

x=0

e−(s+λ)xf(x)dx

=X∗(s+ λ)

X∗(λ)

14.1.1 Analiticidade

As transformadas de Laplace de pdfs sao funcoes racionais N(s)/D(s) em s e apresentam apropriedade de serem analıticas no semiplano real positivo, isto e, para σ = ℜ(s) > 0. Umafuncao e analıtica numa regiao se for diferenciavel em toda a regiao. Uma funcao analıticanao pode apresentar discontinuidades ou polos na regiao de analiticidade, devendo, portanto,ser limitada. Vamos considerar funcoes para as quais f(t) = 0, t < 0, que e o nosso caso de

63

Page 64: Apostila - Aguiar

maior interesse. Observe que,

X∗(s) =

∫ ∞

0

e−sxfX(x)dx

≤∫ ∞

0

|e−sxfX(x)|dx ≤∫ ∞

0

|e−(σ+jw)x|fX(x)dx ≤∫ ∞

0

|e−σx||ejwx|fX(x)dx

=

∫ ∞

0

|e−σx|fX(x)dx

No semiplano positivo, σ = ℜ(s) > 0, e |e−σx| < 1, consequentemente, X∗(s) <∫∞0

fX(x)dx = 1, implicando que a transformada e limitada e certamente analıtica nestesemiplano.

No semi-plano negativo, existirao valores σi para os quais a funcao decresce mais rapida-mente do que a exponencial e a integral convergira para um determinado valor finito. Nestascondicoes, a transformada existira e sera limitada, sendo, portanto, uma funcao analıtica des.

O limitante inferior do conjunto de valores {σi}e denominado abcissa de convergenciaabsoluta da T.L. e sera representado por σa. O semi-plano ℜ(s) > σa representa a regiaode analiticidade da T.L., e, nessa regiao, a funcao X∗(s) , em geral uma fracao racionalN(s)/D(s), nao podera ter polos. A determinacao da abcissa de convergencia absolutada T.L. pode nao ser viavel, todavia sabemos que a T.L. e sempre analıtica no semiplanopositivo.

Caso exista alguma raiz do denominador D(s) dentro do semi-plano positivo, essa raizdeve ser tambem uma raiz do numerador N(S), de modo a cancelar o possıvel polo.

Esta propriedade pode ser explorada para eliminar alguma indeterminacao que exista naformula da transformada de Laplace, quando da busca de solucao para um problema.

64

Page 65: Apostila - Aguiar

14.1.2 Propriedades da Transformada de Laplace

f(t), t ≥ 0 ⇐⇒ F ∗(s) =

∫ ∞

0−e−stf(t)dt

af(t) + bg(t), t ≥ 0 ⇐⇒ aF ∗(s) + bG∗(s) (1)

g(t) =

∫ t

0

f(y)dy, t ≥ 0 ⇐⇒ G∗(s) =F ∗(s)

s(2)

g(t) = df(t)/dt, t ≥ 0 ⇐⇒ G∗(s) = −f(0) + sF ∗(s) (3)

g(t) = f(−t), t ≤ 0 ⇐⇒ G∗(s) = F ∗(−s) (4)

g(t) = f(t/a), t ≥ 0, a > 0 ⇐⇒ G∗(s) = aF ∗(as) (5)

g(t) = f(t− a), t ≥ a, a ≥ 0 ⇐⇒ G∗(s) = e−asF ∗(s) (6)

g(t) = e−atf(t), t ≥ 0 ⇐⇒ G∗(s) = F ∗(s+ a) (7)

g(t) = tf(t), t ≥ 0 ⇐⇒ G∗(s) = −dF ∗(s)/ds (8)

g(t) = tnf(t), t ≥ 0 ⇐⇒ G∗(s) = (−1)ndnF ∗(s)/dsn (9)

f(t)⊛ g(t)(convolucao) =

∫ ∞

0

f(t− x)g(x)dx ⇐⇒ F ∗(s)G∗(s) (10)

Teorema do valor inicial lims→∞

sF ∗(s) = limt→0

f(t) (11)

Teorema do valor final lims→0

sF ∗(s) = limt→∞

f(t) (12)

se sF ∗(s) for analıtica em ℜ(s) ≥ 0

Prova de (2):

g(t) =

∫ t

0

f(y)dy, t ≥ 0 ⇐⇒ G∗(s) =

∫ ∞

t=0

e−st

∫ t

y=0

f(y)dydt

=

∫ ∞

y=0

∫ ∞

t=y

e−stf(y)dtdy =1

s

∫ ∞

y=0

(∫ ∞

t=y

se−stdt

)

f(y)dy

=1

s

∫ ∞

y=0

e−syf(y)dy =F ∗(s)

s

Prova de (3):

g(t) = df(t)/dt, t ≥ 0 ⇐⇒ G∗(s) =

∫ ∞

0

e−stf′(t)dt =

= e−stf(t)|∞0 −∫ ∞

0

(−s)e−stf(t)dt = −f(0) + sF ∗(s)

Prova de (4):

g(t) = f(−t), t ≤ 0 ⇐⇒ G∗(s) =

∫ 0

−∞e−stg(t)dt =

∫ 0

−∞e−stf(−t)dt =

∫ 0

∞esyf(y)(−dy)

= −∫ 0

∞esyf(y)dy =

∫ ∞

0

esyf(y)dy = F ∗(−s)

65

Page 66: Apostila - Aguiar

Prova dos Teoremas (11) e (12):

De (3),∫∞0

e−stf′(t)dt = sF ∗(s)− limt→0 f(t).

Para s→ 0:

lims→0

∫ ∞

0

e−stf′(t)dt =

∫ ∞

0

f′(t)dt = lim

t→∞f(t)− lim

t→0f(t)

Consequentemente, limt→∞ f(t) = sF ∗(s) (Teorema do Valor Final).

Para s→∞:

lims→∞

∫ ∞

0

e−stf′(t)dt = 0 = lim

s→∞

(

sF ∗(s)− limt→0

f(t))

, ou seja, se sF ∗(s) for analıtica em ℜ(s) ≥ 0), temos o Teorema do Valor Inicial

limt→0

f(t) = lims→∞

sF ∗(s)

*

Como mostrado a seguir na tabela de pares de transformadas, a T.L do impulso unitariodeslocado u0(t− a) e dada por e−as, o que permite concluir, pelo uso das propriedades (6) e(10), que f(t − a), t ≥ a, a funcao f(t) deslocada no tempo de a, e obtida pela convolucaoda funcao com o impulso deslocado do valor desejado, i.e. f(t)⊛ u0(t− a).

***

66

Page 67: Apostila - Aguiar

14.1.3 Alguns Pares de Transformadas de Laplace

f(t), t ≥ 0 ⇐⇒ F ∗(s) =

∫ ∞

0−e−stf(t)dt

u0(t) ⇐⇒ 1

u0(t− a) ⇐⇒ e−as

u−1(t) = 1, t ≥ 0 ⇐⇒∫ ∞

0

e−stdt =1

s

u−1(t− a) = 1, t ≥ a ⇐⇒ e−as

s

Au−1(t) = A, t ≥ 0 ⇐⇒ A

s

Ae−at, t ≥ 0 ⇐⇒ A

s+ a

λe−λt, t ≥ 0 ⇐⇒ λ

λ+ s

e−λt, t ≥ 0 ⇐⇒ 1

λ+ s

te−λt, t ≥ 0 ⇐⇒ 1

(λ+ s)2

tne−λt

n!, t ≥ 0 ⇐⇒ 1

(λ+ s)n+1

tn−1

(n− 1)!, t ≥ 0 ⇐⇒ 1

sn

Qual a grande utilidade da tabela de transformadas? Obter a pdf a partir da inversa datransformada, usando a tabela para isso.

Passo 1: Fatore a transformada em fracoes parciais usando as raızes do denominador datransformada.

Lembrar que X∗(s) = f(s)g(s)

. Se g(s) tem raızes x1, x1, x1, x2 e x3, com x1 de grau 3, entaofatorando

X∗(s) =A1

x− x1

+A2

(x− x1)2+

A3

(x− x1)3+

B1

x− x2

+C1

x− x3

67

Page 68: Apostila - Aguiar

Passo 2: Determine os valores dos coeficientes Ai, B1 e C1 de raızes multiplas e simples.

(x− x2)X∗(s) = B1 + (x− x2)

(

A1

x− x1+

A2

(x− x1)2+

A3

(x− x1)3+

C1

x− x3

)

B1 = (x− x2)X∗(s)|x=x2

C1 = (x− x3)X∗(s)|x=x3

(x− x3)3X∗(s) = A3 + A1(x− x1)

2 + A2(x− x1) + (x− x1)3

(

B1

x− x2+

C1

x− x3

)

A3 = (x−X1)3X∗(s)|x=x1

Para determinar A2 e A1, temos que derivar:

A2 =d

ds

[

(x− x1)3X∗(s)

]

|x−x1

A1 =1

2!

d2

ds2[

(x− x1)3X∗(s)

]

|x−x1

*

Aplicacao: Seja dada uma variavel W = X − Y , onde X e Y sao variaveis exponenciaisindependentes igualmente distribuıdas com parametro λ. para obter a pdf de W , podemospartir de

W ∗(s) = E[e−s(X−Y )] = E[e−sX ]E[esY ] = X∗(s)Y ∗(−s) =(

λ

s+ λ

)(

λ

λ− s

)

=λ/2

s+ λ+

λ/2

λ− s

Usando a tabela de pares de transformadas e a propriedade f(−t), t ≤ 0 ⇐⇒ F ∗(−s) ,podemos ver imediatamente que o primeiro termo corresponde a λ

2e−λt, t ≥ 0 e o segundo

termo corresponde a λ2eλt, t ≤ 0.

14.2 Transformada Z para Funcoes Discretas

Definimos a transformada Z da densidade de massa de uma variavel aleatoria N discreta,definida por conveniencia para n ≥ 0, como sendo:

N(z) = E[zN ] =

∞∑

n=0

znP (N = n)

68

Page 69: Apostila - Aguiar

Para que a transformada exista e necessario que os termos da sequencia nao crescam maisrapido do que geometricamente, isto e, que exista a > 0 tal que limn→∞

|fn|an

= 0.

Propriedades:

• Se M = aN , entao M(z) = E[zM ] = E[zaN ] = N(za)

• Se N1 e N2 sao independentes e N = N1 +N2, entao

N(z) = E[zN ] = E[z(N1+N2)] = E[zN1 ]E[zN2 ] = N1(z)N2(z)

• Se N = K = constante, entao E[zN ] = zK

• N(z)|z=1 = N(1) = E[1] = 1

• Obtencao de momentos

N′(z) =

d

dzE[zN ] = E[NzN−1]

Entao, N′(z)|z=1 = E[N ].

N′′(z) =

d2

dz2N(z) =

d2

dz2E[zN ] = E[N(N − 1)zN−2]

Entao, N′′(z)|z=1 = E[N(N − 1)] = E[N2 −N ] = E[N2]−E[N ]

• A Transformada Z de uma pdf e unica; dada a pdf obtemos a transformada Z, e dada atransformada Z podemos obter, pelo processo inverso (geralmente atraves da expansaoem fracoes parciais e uso de tabelas de pares fn ⇔ F (z)), a pdf, que sera unica tambem.Consequentemente, uma variavel aleatoria discreta e perfeitamente caracterizada poruma das funcoes: transformada Z da pmf, funcao de massa de probabilidade ou funcaodistribuicao.

*

Observe que, para pi = P (N = i),

N(1) = p0 + p1 + p2 + p3 + · · · , e

N(−1) = p0 − p1 + p2 − p3 + · · · . Entao,N(1) +N(−1) = 2(p0 + p2 + · · · ) eN(1)−N(−1) = 2(p1 + p3 + · · · ).

Podemos tambem observar que dn

dznN(z)|z=0 = n!pn permitindo que as probabilidades de

massa sejam diretamente obtidas a partir da transformada Z.

69

Page 70: Apostila - Aguiar

*

Seja Y =∑N

i=1Xi, onde as variaveis aleatorias Xi sao independentes e identicamente dis-tribuıdas, com X e σ2

X , e N e independente dos Xi, com N e σ2N . FY (y) e dita uma

distribuicao composta.

Obtemos,

Y ∗(s) = E[e−s∑N

i=1 Xi ]

=∞∑

n=0

E[e−s∑N

i=1 Xi|N = n]P (N = n)

=∞∑

n=0

E[e−s∑n

i=1 Xi]P (N = n)

=∞∑

n=0

E[e−sX1]E[e−sX2 ] · · ·E[e−sXn]P (N = n)

=

∞∑

n=0

(X∗(s))nP (N = n) = N(X∗(s))

onde N(z) e a transformada Z de N .

Podemos mostrar, calculando a derivada primeira e a derivada segunda de Y ∗(s) no pontos = 0, que :

E[Y ] = E[N ]E[X ]

σ2Y = E[N ]σ2

X + (E[X ])2σ2N

*

Exemplo: A T.Z. de uma distribuicao geometrica, com P (N = k) = pk−1(1− p), k ≥ 1,e dada por:

N(z) =

∞∑

k=1

zkP (N = k)

=

∞∑

k=1

zkpk−1(1− p)

= (1− p)z∞∑

k=1

(pz)(k−1)

=(1− p)z

1− pz

A partir de N(z)(1 − pz) = (1 − p)z, podemos, derivando sucessivamente, obter a media eo segundo momentos de N . Derivando uma vez, obtemos N

′(z)(1− pz)− pN(z) = (1− p).

70

Page 71: Apostila - Aguiar

Fazendo z = 1, temos N′(1)(1− p)− pN(1) = (1− p). Consequentemente, E[N ] = N

′(1) =

11−p

.

Derivando duas vezes, temos N′′(z)(1−pz)−pN

′(z)−pN

′(z) = 0. Fazendo z = 1, temos

N′′(1)(1− p) = 2pN

′(1) e E[N2]−E[N ] = 2p

(1−p)2. Consequentemente, E[N2] = 1+p

(1−p)2.

*

Exemplo: A T.Z. de uma distribuicao binomial, com

P (Y = i) =(

ni

)

pi(1− p)n−i, 0 ≤ i ≤ n, e dada por:

Y (z) =

n∑

i=0

zi(

n

i

)

pi(1− p)n−i

=

n∑

i=0

(

n

i

)

(pz)i(1− p)n−i

= (pz + 1− p)n

A partir de Y (z), podemos obter a media e o segundo momentos de Y :

Y′(1) = E[Y ] = pn(pz + 1− p)n−1|z=1 = np

Y′′(1) = E[Y 2]−E[Y ] = p2n(n− 1)(pz + 1− p)n−2|z=1 = n(n− 1)p2

Consequentemente, E[Y 2] = n(n− 1)p2 + np e V (Y ) = σ2Y = E[Y 2]−E[Y ]2 = np(1 − p).

Estes resultados conferem com os obtidos anteriormente.

*

Exercıcio: Calcule a transformada Z do numero de chegadas Poisson em um intervalode tamanho fixo e mostrar que a soma de duas variaveis Poisson (ou soma de dois fluxosPoisson) e tambem uma variavel (ou fluxo) Poisson.

N(z) =

∞∑

k=0

zkP (N = k)

=

∞∑

k=0

zk(λT )k

k!e−λT

= e−λT∞∑

k=0

(zλT )k

k!

= e−λ(1−z)T

Se N1 e N2 sao dois fluxos Poisson e N = N1 + N2 e o fluxo soma resultante da com-binacao destes dois fluxos, entao N(z) = N1(z)N2(z) = e−(λ1+λ2)(1−z)T , que corresponde atransformada de uma variavel Poisson com parametro λ = λ1 + λ2.

71

Page 72: Apostila - Aguiar

A partir de N(z) e derivando no ponto z = 1, podemos obter a media do numero dechegadas Poisson em um intervalo T = λT , isto e, a taxa versus o tamanho do intervalo.Esta expressao faz sentido, ja que na media as chegadas ocorrem a cada 1

λsegundos.

*

Aplicacao: Calcule a transformada Z do numero de chegadas em um intervalo X compdf fX(x) e T.L. X∗(s).

Seja N = numero de chegadas em X , e seja N(z) a transformada Z de N .

N(z) = E[zN ]

=

∞∑

k=0

E[zN |N = k]P (N = k) =?

Na expressao acima, o problema e como calcular P (N = k), ja que somente sabemosquando o intervalo e de tamanho fixo, que da a formula de Poisson. Para usarmos diretamentea transformada Z calculada quando o intervalo e de tamanho fixo, vamos condicionar noevento X ∈ (x, x+ dx).

N(z) = E[zN ]

=

∫ ∞

0

E[zN |X ∈ (x, x+ dx)]P (X ∈ (x, x+ dx))

=

∫ ∞

0

e−λ(1−z)xfX(x)dx = X∗(λ− λz)

A partir deste resultado mais geral, a T.Z. do numero de chegadas Poisson em um in-tervalo de tamanho fixo T pode ser obtida se considerarmos a pdf do intervalo fixo comofX(x) = u0(x−T ), fazendo uso do impulso deslocado. Tomando a T.L., temos, X∗(s) = e−sT ,implicando que N(z) = e−(λ−λz)T , como esperado.

Exemplo: Seja X com distribuicao exponencial com taxa µ. Entao, X∗(s) = µµ+s

e a

transformada Z do numero de chegadas em X sera N(z) = X∗(λ− λz) = µλ−λz+µ

.

Para obter o numero medio de chegadas, fazemos:

N′(z)|z=1 =

λµ

(λ+ µ− λz)2

z=1

=λµ

µ2=

λ

µ= E[N ]

Este resultado poderia ser calculado da seguinte forma:

taxa media de chegada (fregueses/s) = numero medio de chegadas/intervalo medio

72

Page 73: Apostila - Aguiar

ou seja, numero medio de chegadas = λE[X ] = λµ, que confirma o resultado obtido atraves da

transformada. A transformada, entretanto, caracteriza perfeitamente o processo de chegada,permitindo obter outros parametros, como variancia e pdf.

*

Aplicacao: Calcule a transformada Z do numero de chegadas em um intervalo X , comT.L. X∗(s), e dada por X∗(λ), dado que pelo menos uma chegada ocorreu, isto e, calculeE[zN |N > 0].

E[zN ] = E[zN |N = 0]P (N = 0) + E[zN |N > 0]P (N > 0)

E[zN ] = P (N = 0) + E[zN |N > 0]P (N > 0)

E[zN |N > 0] =E[zN ]− P (N = 0)

1− P (N = 0)=

X∗(λ− λz)−X∗(λ)

1−X∗(λ)

E[N |N > 0] pode ser obtido calculando a derivada da T.Z. acima no ponto z = 1, ou, entao,diretamente a partir de

E[N ] = E[N |N = 0]P (N = 0) + E[N |N > 0]P (N > 0)

E[N ] = E[N |N > 0]P (N > 0)

E[N |N > 0] =E[N ]

P (N > 0)=

λE[X ]

1− P (N = 0)=−λX∗′(0)

1−X∗(λ)

14.2.1 Analiticidade da Transformada Z dentro do cırculo unitario

A transformada Z da funcao de massa de probabilidade de uma variavel discreta L e definidacomo L(z) = E[zL]. A transformada Z e uma funcao de z, parametro escolhido como sendoum numero complexo arbitrario. L(z) e, em geral, uma fracao racional N(z)/D(z).

Assumindo |z| ≤ 1, isto e, trabalhando dentro do cırculo unitario no plano complexo,obtemos: L(z) = E[zL] =

∑∞k=0 z

kP (L = k) ≤∑∞

k=0 |z|kP (L = k) ≤∑∞

k=0 P (L = k) = 1

A transformada Z da funcao de massa de probabilidade de uma variavel aleatoria discretae entao limitada dentro do cırculo unitario e, portanto, analıtica neste cırculo, nao podendoexistir polos nessa regiao. As raızes do denominador D(z) sao os polos da funcao. Casoexista alguma raiz do denominador dentro do cırculo unitario, essa raiz deve ser tambemuma raiz do numerador N(z), de modo a cancelar o possıvel polo.

Esta propriedade pode ser explorada para eliminar alguma indeterminacao que exista naformula da transformada Z, quando da busca de solucao para um problema.

73

Page 74: Apostila - Aguiar

14.2.2 Propriedades da Transformada Z

fn, n = 0, 1, 2, ... ⇐⇒ F (z) =∞∑

n=0

znfn

afn + bgn ⇐⇒ aF (z) + bG(z)

gn = anfn ⇐⇒ G(z) = F (az)

gn = fn−k, n ≥ k, k > 0 ⇐⇒ G(z) = zkF (z)

gn = nfn ⇐⇒ G(z) = zd

dzF (z)

gn =

n∑

k=0

fk, n = 0, 1, 2, ... ⇐⇒ G(z) =F (z)

1− z

fn ⊛ gn (convolucao) =∞∑

k=0

fn−kgk ⇐⇒ F (z)G(z)

Teorema do valor inicial F (0) = f0

Teorema do valor intermediario1

n!

dnF (z)

dsn|z=0 = fn

Teorema do valor final limz→1

(1− z)F (z) = f∞

Provas de algumas propriedades:

gn = anfn ⇐⇒ G(z) =∞∑

n=k

znanfn =∞∑

n=k

(az)nfn = F (az)

gn = fn−k, n ≥ k, k > 0 ⇐⇒ G(z) =

∞∑

n=k

zngn

= zk∞∑

n=k

zn−kfn−k = zk∞∑

j=0

zjfj = zkF (z)

gn = nfn ⇐⇒ G(z) =∞∑

n=0

znnfn

= z∞∑

n=0

nzn−1fn = zd

dz

∞∑

n=0

znfn = zd

dzF (z)

74

Page 75: Apostila - Aguiar

14.2.3 Pares de Transformadas Z

fn, n = 0, 1, 2, ... ⇐⇒ F (z) =

∞∑

n=0

znfn

1, n = 0, 1, 2, ... ⇐⇒ F (z) =1

1− z

Aαn ⇐⇒ A

1− αz

nαn ⇐⇒ αz

(1− αz)2

n ⇐⇒ z

(1− z)2

n2αn ⇐⇒ (αz)(1 + αz)

(1− αz)3

(n+ 1)αn ⇐⇒ 1

(1− αz)2

(n+ 1) ⇐⇒ 1

(1− z)2

αn

n!⇐⇒ eαz

75

Page 76: Apostila - Aguiar

15 Teoria de Filas

15.1 Introducao

Uma fila e caracterizada por:

• Processo de chegada dos fregueses a fila

• Tempo de servico dedicado pelo servidor a cada fregues

• Numero de servidores

• Espaco disponıvel para espera na fila

• Polıtica de atendimento da fila

Em geral a fila e representada por uma abreviatura:

[processo de chegada]/[tipo de servico]/[numero de servidores]/[espaco na fila].

Caso o espaco seja finito, fregueses que chegam e nao encontram lugar na fila de espera saoperdidos. Se o espaco for infinito, nao ha perda de fregueses. O espaco infinito nao precisaser indicado e e o default.

O processo de chegada e caracterizado pela distribuicao do tempo entre chegadas. Porexemplo:

• Determinıstico ou Tempo entre Chegadas Fixo (D)Supondo que uma chegada a cada 10 s, entao a taxa media de chegada λ e igual a 1

10

(chegadas/s) = 0,1 (chegadas/s).

• Exponencial (M)A letra M vem de Markov e indica que o processo de chegada e Poisson. O processoPoisson e e um caso particular de um Processo de Markov, com tempo entre chegadasexponencialmente distribuıdo.

• Geral, apresentando uma distribuicao qualquer (G)

O tempo gasto no servidor depende da distribuicao de servico. Assim, o servico pode ser fixoou determinıstico (D), como pode ter uma distribuicao exponencial (M) ou geral (G). Assim,um sistema M/G/1/K seria uma fila com processo de chegada Poisson, servico qualquer, umunico servidor e espaco limitado para K pessoas, incluindo a fila de espera e o servidor. Sea disciplina de atendimento nao for explicitada, assume-se que seja FCFS.

0chap15.tex 25/07/2013

76

Page 77: Apostila - Aguiar

Dois resultados sao extremamente importantes para a analise das filas. O primeiro delese o Resultado de Little, que se aplica a um sistema qualquer em equilıbrio, no qual chegadase partidas ocorrem a uma taxa media λ(fregueses

s). O sistema estando em equilıbrio significa

que o numero medio de pessoas no sistema N e finito, que a taxa media de saıda e igual ataxa media de entrada e tambem que o tempo medio T gasto dentro do sistema e finito. A

λ(freguesessegundo

)⇒ N fregueses ⇒ λ(freguesessegundo

)

expressao conhecida como Resultado de Little (Little’s Result) afirma que:

E[N ] = λE[T ].

O segundo resultado aplica-se a processos de chegada Poisson e afirma que o instante dechegada de um processo Poisson corresponde a uma amostragem aleatoria, indicando queuma chegada Poisson encontra o sistema em um estado que e a media no tempo. Esta pro-priedade e conhecida pelo acronimo PASTA, do ingles Poisson Arrivals See Time Averages.

15.2 A fila M/M/1

A primeira letra M caracteriza o processo de chegada, que e Poisson. A segunda letra Mcaracteriza o processo de servico que tem distribuicao exponencial. O numero 1 indica quetemos somente um servidor. Assumiremos o seguinte:

• Processo de chegada Poisson, com tempo entre chegadas exponencialmente distribuıdocom taxa λ.

• A funcao densidade de probabilidade do tempo de servico de um servidor exponencialdada por bX(x) = µe−µx, x ≥ 0, onde X e a variavel aleatoria que representa o servicode um fregues generico.O tempo medio de servico e entao dado por E[X ] = X = 1/µ.

Seja W a variavel aleatoria que representa o tempo gasto na fila de espera. Seja T = W +Xa variavel aleatoria que representa o tempo gasto na fila. Seja Nq o numero de pessoas nafila de espera. Seja N o numero de pessoas na fila. As metricas de interesse sao:

• E[W ] = tempo medio gasto na fila de espera

• E[Nq] = tamanho medio da fila de espera

• E[T ] = E[W ] + E[X ] = tempo medio gasto na fila

• E[N ] = numero medio de pessoas na fila

77

Page 78: Apostila - Aguiar

Para obter a correlacao entre as metricas acima, aplica-se o Resultado de Little a fila comoum todo, a fila de espera e ao servidor.

• Considerando a fila completa: N = λT = λ(W +X) = λW + λX.

• Considerando apenas a fila de espera: Nq = λW .

• Considerando apenas o servidor: Ns = λX .

e pode-se escrever que N = Nq + λX .

A grandeza λX = λ/µ e chamada ρ e representa a utilizacao do sistema. Observe que:

P{ sistema esta ocupado} = P{ pelo menos uma pessoa no sistema}= P{ servidor ocupado }= % do tempo que o servidor esta ocupado= ρ

P{ sistema esta vazio} = % do tempo que o servidor esta vazio= 1− ρ.

Podemos entao afirmar que um fregues generico encontrara a fila ocupada com probabi-lidade ρ, e com probabilidade 1−ρ encontrara a fila vazia. Vale lembrar que a fila passa porestados alternados de ociosidade e ocupacao, e uma amostragem aleatoria cai num intervaloocupado com probabilidade ρ e num intervalo vazio com probabilidade 1− ρ.

Como calcular E[W ] para a fila M/M/1?

Assuma um fregues generico chegando na fila. O seu tempo medio de espera W sera otempo medio para servir os fregueses que sao encontrados em espera na fila (chegaram antesdele e sao servidos na ordem de chegada, com um servico medio igual a X) mais o tempomedio para terminar o servico (servico residual de um servidor exponencial) do fregues even-tualmente encontrado em servico (com probabilidade ρ). Assim:

W = Nq X + ρX

= λW X + ρX

= ρW + ρX

=ρX

1− ρ

Consequentemente:

T = W +X =X

1− ρ=

1

µ− λ, e

N = λT (por Little) =λ

µ− λ=

ρ

1− ρ

78

Page 79: Apostila - Aguiar

*

Aplicacao: Modelando um canal de comunicacao de capacidade C bps

Suponha pacotes de dados de tamanho exponencial, com tamanho medio igual a 1/µbits. O tempo medio de transmissao de um pacote (que pode ser encarado como um tempo

de servico) sera dado por 1/µC

= 1µC

.

Modelando o canal como uma fila M/M/1, obtemos T = 1µC−λ

, com ρ = λµC

.

Esta modelagem usando M/M/1 e baseada na suposicao de independencia defendidapor Kleinrock [1964] para redes de comunicacao. Num no, os pacotes considerados paratransmissao num determinado canal de comunicacao podem ser pacotes locais originados deaplicacoes no proprio no ou serem pacotes em transito pelo no e oriundos de nos vizinhos. Aanalise matematica exata de um sistema complexo em que pacotes de diferentes tamanhoscirculam por uma rede de comunicacao e, em muitos casos, intratavel. Para que haja trata-bilidade nos sistemas de comunicacao de dados e simplicidade das expressoes matematicas, oprincıpio da independencia assume que o pacote perde a sua identidade ao se propagar pelarede de comunicacao, e que um novo tamanho e escolhido em cada no intermediario (nor-malmente segundo uma distribuicao exponencial) para efeito de modelagem. Esta suposicaode independencia foi validada atraves de simulacoes e medidas feitas em sistemas reais temdemonstrado a eficacia da aproximacao.

*

Exercıcio: Concentrador de Comunicacao

Suponha um no concentrador que recebe 4 fluxos Poisson de 4800 bps com taxa λi = 2pacotes/s e transmite-os em um unico canal de 9600 bps.Assuma que o tamanho medio de pacote e L = 1000 bits e que a distribuicao e exponencialcom taxa µ = 1/1000.A taxa total e λt = 4λi = 8 pacotes/s. Queremos determinar E[T ], o tempo medio gasto noconcentrador por um pacote.

Calculando T diretamente das formulas para M/M/1 da tempo medio no concentrador= T = 1

µC−λ= 1

9,6−8= 0, 625.

O numero medio de pacotes no concentrador e dado por N = λtT = 8× 0, 625 = 5.

A utilizacao da linha = ρ = λµC

= 89,6≈ 83 %.

A linha e vista como sendo o servidor e o tempo de servico e o tempo de transmissao dopacote.

Podemos ir um pouco mais alem e perguntar: Quantos buffers devo manter no concen-trador?

N nao indica o numero maximo de pacotes que podem se enfileirar no concentrador,mas serve como uma indicacao. Na pratica, o numero de buffers teria um valor B, tal que

79

Page 80: Apostila - Aguiar

a probabilidade de encontrar o sistema com B ou mais pacotes fosse menor que um valordeterminado α, ou de forma equivalente, a probabilidade de encontrar o sistema com menosde B buffers ocupados seria igual ou maior que 1− α.

Para a fila M/M/1, Pk = probabilidade de encontrar o sistema com k pacotes = (1−ρ)ρk.Modelando o sistema como uma fila M/M/1, entao deverıamos ter

∑B−1k=0 Pk = 1−ρB ≥ 1−α.

Entao, ρB ≤ α e Blog ρ ≤ logα, mas como log ρ < 0, resulta

B ≥ logα

log ρ

α ρ N B ≥0,01 0,83 5 260,01 0,90 9 440,01 0,95 19 90

Assim, a tabela acima mostra que para uma probabilidade de 99% de encontrar espaco embuffer (α = 1%), um numero de buffers da ordem de pelo menos 5 vezes o numero medio depacotes no sistema seria razoavel, como uma primeira aproximacao.

*

Aplicacao: Dedicado versus Compartilhado

Suponha que tenhamos uma linha de 64 Kbps e oito sessoes abertas nesta linha.

Se cada sessao tem trafego de pacotes Poisson com taxa λs = 2 pacotes/s e tamanhomedio L = 1/µ = 2000 bits, divido a linha em 8 fatias (usando TDM ou FDM), ou tentocompartilhar usando ATDM? Ambas as solucoes tem a mesma utilizacao nas filas.

• Usando TDM ou FDM

Temos: λs = 2 e capacidade do canal dedicado = Cs = 8 Kbps.Logo: Ts =

1µC−λ

= 12= 500 ms.

• Compartilhando

Temos: λc = 8λs = 16 pacotes/s e Cc = 64 Kbps.Logo: Tc =

1µCc−λc

= 62, 5 ms

e portanto o sistema compartilhado e 8 vezes melhor.

*

A teoria de filas mostra que sistemas maiores sao mais eficientes.

Assuma um sistema A que atende a uma populacao de N pessoas e usa um canal decomunicacao com capacidade de C bps e um sistema B que atende a uma populacao k vezes

80

Page 81: Apostila - Aguiar

maior (kN) e possui um canal tambem k vezes mais rapido (kC bps), com a mesma utilizacaodo sistema A.

Do ponto de vista do usuario e melhor ser atendido pelo sistema A ou pelo sistema B?

Seja 1/µ o tamanho medio dos pacotes e vamos modelar os sistemas por uma fila M/M/1.

Entao, TA = 1µC−λ

e TB = 1µkC−kλ

= TA

k. O sistema B e portanto k vezes melhor!

15.3 A fila M/G/1

Para calcular E[W ] para M/G/1 seguimos exatamente o mesmo raciocınio empregado nocalculo de M/M/1. Para um fregues generico chegando a fila, o seu tempo medio de esperaE[W ] sera o tempo medio para servir os fregueses que sao encontrados em espera na filamais o tempo medio para terminar o servico (servico residual = xr) do fregues eventualmenteencontrado em servico (com probabilidade ρ). Assim:

W = Nq X + ρXr = ρW + ρXr

= ρXr

1−ρ

Mostraremos que E[Xr] =E[X2]2E[X]

, o que implica E[W ] = λX2

2(1−ρ)para M/G/1.

Devemos lembrar que TM/G/1 = WM/G/1 +X , N = λT e Nq = λW .

• Para M/D/1 (servico determinıstico), X = X = 1/µe X2 = 1/µ2. Entao:

WM/D/1 =λ

2µ2(1− ρ)=

ρ

2µ(1− ρ)

• Para M/M/1, com X = 1/µ, temos

WM/M/1 =ρ

µ(1− ρ)

15.3.1 A Vida Residual do Servico

Suponhamos que amostramos aleatoriamente uma fila durante seu perıodo ocupado. Seja Xs

o intervalo do servico selecionado, Xr a vida residual do intervalo selecionado e Xi a idadedo intervalo selecionado. Temos, Xs = Xi +Xr. Pela simetria e reversibilidade do tempo,podemos afirmar que Xi e Xr tem a mesma distribuicao.

Seja fXs(t) a pdf de Xs. Os intervalos maiores terao maior probabilidade de seremselecionados e, entao, intuitivamente, podemos esperar que a probabilidade do intervaloselecionado estar em (t, t + dt) deve ser diretamente proporcional a t vezes a probabilidadede ocorrencia de intervalos deste tamanho, ou seja, proporcional a

81

Page 82: Apostila - Aguiar

t P{t ≤ X ≤ t + dt}. Assim,

P{t ≤ Xs ≤ t+ dt} =t

mP{t ≤ X ≤ t + dt}, ou fXs(t) =

t

mfX(t)

A constante m serve para normalizacao. De∫∞0

fXs(t)dt = 1, obtemos m = E[X ].Consequentemente,

fXs(t) =tfX(t)

E[X ]e

E[Xs] =

∫ ∞

0

tfXs(t)dt =

∫∞0

t2fX(t)dt

E[X ]=

E[X2]

E[X ]

Como E[Xs] = 2E[Xr], temos

E[Xr] =E[X2]

2E[X ]

A pdf da vida residual pode ser obtida condicionando na ocorrencia do intervalo selecio-nado, ou seja, pode-se escrever

P{Xr ≤ y} =∫ ∞

x=0

P{Xr ≤ y|x < Xs ≤ x+ dx}P{x < Xs ≤ x+ dx}

Observando que a amostragem aleatoria cai uniformemente em qualquer ponto do inter-valo Xs, podemos entao afirmar que:

P{Xr ≤ y|x < Xs ≤ x+ dx} =

{

1 para x < yyx

para 0 ≤ y ≤ x

Substituindo o valor da probabilidade condicional, e lembrando que a pdf do intervalo esco-lhido fXs(x) =

xfX(x)E[X]

, obtemos:

P{Xr ≤ y} =

∫ y

0

P{x < Xs ≤ x+ dx}+∫ ∞

y

y

xP{x < Xs ≤ x+ dx}

=

∫ y

0

fXs(x)dx+

∫ ∞

y

y

xfXs(x)dx

= FXs(y) +

∫ ∞

y

yfX(x)

E[X ]dx

= FXs(y) +y

E[X ]

∫ ∞

y

fX(x)dx

= FXs(y) +y

E[X ](1− FX(y))

fXr(y) e obtida derivando P{Xr ≤ y} em relacao a y. Lembrando que fXs(y) = yfX(y)E[X]

,temos:

fXr(y) =dP{Xr ≤ y}

dy=

yfX(y)

E[X ]+

1− FX(y)

E[X ]− yfX(y)

E[X ]

=1− FX(y)

E[X ]

82

Page 83: Apostila - Aguiar

Das propriedades da transformada de Laplace, temos que se f(t), t ≥ 0⇐⇒ F ∗(s), entao∫ t

0f(y)dy ⇐⇒ F ∗(s)

s. Usando esta propriedade e o fato de u−1(t) ⇐⇒ 1

s, podemos inverter

fXr(t) =1−FX(t)E[X]

e obter diretamente X∗r (s). Assim,

X∗r (s) =

1

sE[X ]− X∗(s)

sE[X ]=

1−X∗(s)

sE[X ]

onde fX(t)⇐⇒ X∗(s) e a T. L. da pdf do tempo de servico X .

Um outro caminho seria a deducao direta:

X∗r (s) =

∫ ∞

0

e−st(1− FX(t))dt

E[X ]

=

∫ ∞

0

e−stdt

E[X ]− 1

E[X ]

∫ ∞

0

e−stdt

∫ t

0

fX(y)dydt

=1

sE[X ]− 1

E[X ]

∫ ∞

y=0

(∫ ∞

t=y

e−stdt

)

fX(y)dy

=1

sE[X ]− 1

E[X ]

∫ ∞

y=0

(

1

s

∫ ∞

t=y

se−stdt

)

fX(y)dy

=1

sE[X ]− 1

sE[X ]

∫ ∞

y=0

e−syfX(y)dy

=1−X∗(s)

sE[X ]

15.3.2 A Media do Perıodo Ocupado

Uma fila passa por ciclos, formados por um perıodo ocupado seguido de um perıodo ocioso.Para um sistema que passa por ciclos pode-se aplicar a teoria da renovacao, que afirmaque estatısticas de grandezas no tempo podem ser obtidas analisando estas estatısticas emum ciclo medio. Por causa da falta de memoria da exponencial, o perıodo ocioso medio e1/λ. Chamando de G o perıodo ocupado medio, e aplicando a teoria de renovacao, podemosafirmar:

P(sistema ocupado) = ρ

=perıodo ocupado medio

ciclo medio

=E[G]

E[G] + 1/λ

Entao,

E[G] =E[X ]

(1− ρ)

Observe que o perıodo ocupado medio so depende do tempo medio de servico e nao dependeda ordem em que os fregueses sao servidos.

83

Page 84: Apostila - Aguiar

A evolucao do servico pendente numa fila (”unfinished work”) ao longo do tempo so de-pende dos processos de chegada e da capacidade do servidor em servir a fila, sendo completa-mente independente da disciplina de atendimento. O unico requisito para esta independenciae que o servidor nao fique ocioso frente a uma fila de espera, no que denominamos sistemaconservativo.

15.3.3 A Transformada de Laplace da pdf do Perıodo Ocupado

Um perıodo ocupado G e formado pelo servico inicial X0 e pelos servicos de todos os quechegam e ainda encontram o servidor ocupado. Para analisar a formacao do servico ocupado,vamos considerar que houve um numero N de chegadas durante o servico inicial. Como aordem de servico nao altera o tamanho do perıodo ocupado, podemos reorganizar os servicos,servindo o primeiro fregues que chegou durante o perıodo inicial e todos os outros quechegam durante o subperıodo ocupado iniciado por este primeiro fregues. Iremos designarde G1 este primeiro subperıodo ocupado. O importante e observar que o subperıodo ocupadoforma-se estocasticamente da mesma forma que um perıodo ocupado: um servico inicial etodos os outros servicos decorrentes de chegadas que ainda encontram o servidor ocupado.Assim, G∗

i (s) = G∗(s). Apos o termino de G1, restam na fila apenas os outros fregueses quechegaram ainda no servico inicial. Inicia-se agora o segundo subperıodo ocupado G2 e assimsucessivamente ate o termino do ultimo subperıodo ocupado GN . Podemos entao escrever:

G = X0 +G0 +G1 +G2 + ...GN

com G0 = 0. Para obter G∗(s) = E[e−sG] condicionamos na ocorrencia do servico inicial eno numero de chegadas neste servico:

G∗(s) = E[e−s(X0+G0+G1+G2+...+GN)]

=

∫ ∞

0

∞∑

n=0

E[e−s(X0+∑N

i=0 Gi|x < X0 < x+ dx,N = n]P (N = n|x < X0 < x+ dx)fX0(x)dx

=

∫ ∞

0

∞∑

n=0

E[e−s(x+∑n

i=0 Gi)](λx)n

n!e−λx0fX0(x)dx

=

∫ ∞

0

∞∑

n=0

e−sx(G∗(s))n(λx)n

n!e−λxfX0(x)dx

=

∫ ∞

0

( ∞∑

n=0

(λG∗(s)x)n

n!

)

e−(s+λ)xfX0(x)dx

=

∫ ∞

0

eλG∗(s)xe−(s+λ)xfX0(x)dx

=

∫ ∞

0

e−(λ+s−λG∗(s))xfX0(x)dx

= X∗0 (s+ λ− λG∗(s))

Numa M/G/1 normal, todos os servicos tem a mesma distribuicao. Neste caso,

G∗(s) = X∗ (s+ λ− λG∗(s))

84

Page 85: Apostila - Aguiar

O perıodo ocupado e dado recursivamente em funcao dele proprio. Derivando esta expressaouma vez e fazendo s = 0, obtemos a media do perıodo ocupado ja obtida anteriormente:

E[G] = −G∗′(0) = −X∗′ (s + λ− λG∗(s)) (1− λG∗′(s))|s=0

= −X∗′(0)(1− λG∗′(0)) = E[X ] + ρE[G]

=E[X ]

1− ρ

Derivando duas vezes no ponto s = 0 nos permite obter o segundo momento do perıodoocupado:

E[G2] = G∗′′(0) =[

X∗′′ (s+ λ− λG∗(s)) (1− λG∗′(s))2 +X∗′ (s+ λ− λG∗(s)) (−λG∗′′(s))]

s=0

= X∗′′(0)(1 + λE[G])2 + E[X ]λE[G2]

= E[X2]

(

1 +ρ

1− ρ

)2

+ ρE[G2]

=E[X2]

(1− ρ)3

Quando o servico inicial tem distribuicao diferente dos outros servicos, entao dizemos quetemos um perıodo ocupado modificado e que designaremos por G0. Neste caso,

G∗0(s) = X∗

0 (s+ λ− λG∗(s))

E[G0] =E[X0]

1− ρ

E[G20] =

E[X20 ]

(1− ρ)3

As expressoes relacionadas ao perıodo ocupado modificado serao utilizadas para obterresultados para disciplinas LCFS e filas com prioridades.

15.3.4 A transformada Z do numero presente na fila M/G/1

Existe um resultado estatıstico que diz que a distribuicao limite do numero de pessoas dei-xadas para tras por uma partida em uma fila M/G/1 e igual a distribuicao limite do numerode pessoas encontradas na fila por uma chegada, que equivale tambem a distribuicao encon-trada por uma amostragem aleatoria. Observando pois a evolucao do numero de pessoasnos instantes de partida, seremos capazes de obter a transformada Z do numero de pessoaspresentes em um fila M/G/1. Esta tecnica e conhecida como cadeia embutida de Markovnos instantes de partida da fila.

Vamos analisar a evolucao do numero deixado para tras nos instantes da i-esima e i+1-esima partidas. Seja Ni e Ni+1 os numeros de pessoas deixadas para tras nestes instantes,respectivamente. Seja K o numero de chegadas Poisson durante um servico X , com K(z) =X∗(λ− λz). E facil ver que

Ni+1 =

{

K , se Ni = 0Ni +K − 1 , se Ni > 0

85

Page 86: Apostila - Aguiar

Usando transformadas e condicionamento, temos

E[zNi+1 ] = E[zK |Ni = 0]P (Ni = 0) + E[zNi+K−1|Ni > 0]P (Ni > 0)

No comportamento limite, Ni → N e Ni+1 → N com i → ∞, e para ρ < 1 havera umadistribuicao estacionaria do numero de pessoas na fila com T.Z. dada por N(z) = E[zN ].Rescrevendo a expressao acima para a situacao limite e lembrando que P (N = 0) = 1 − ρ,temos

E[zN ] = E[zK |N = 0]P (N = 0) + E[zN+K−1|N > 0]P (N > 0)

= K(z)(1 − ρ) +K(z)

zE[zN |N > 0]ρ

Como

E[zN ] = E[zN |N = 0]P (N = 0) + E[zN |N > 0]P (N > 0)

= 1− ρ+ ρE[zN |N > 0]

entao E[zN |N > 0] = N(z)−(1−ρ)ρ

. Substituindo este valor acima na expressao anterior de

E[zN ] e simplificando obtemos

N(z) =(1− ρ)(1− z)K(z)

K(z)− z=

(1− ρ)(1− z)X∗(λ− λz)

X∗(λ− λz)− z

Esta e a expressao para a T.Z. da pmf de N , numero de pessoas presentes na fila emum instante aleatorio. Cabe observar que a distribuicao do numero de pessoas na fila eindependente da disciplina de atendimento, se ela nao leva em consideracao nenhum aspectorelativo ao numero de pessoas presentes.

*

De N(z), podemos, como exercıcio, obter E[N ] = N′(1).

Partindo de N(z)(K(z) − z) = (1− ρ)(1− z)K(z) e derivando duas vezes

N′(z)(K(z) − z) +N(z)(K

′(z)− 1) = (1− ρ)

(

−K(z) + (1− z)K′(z))

N′′(z)(K(z) − z) + 2N

′(z)(K

′(z)− 1) +N(z)K

′′(z) = (1− ρ)

(

−2K ′(z) + (1− z)K

′′(z))

Lembrando que K′(1) = λE[X ] = ρ,K

′′(1) = λ2E[X2], N(1) = 1 e N

′(1) = E[N ], fazendo

z = 1 na expressao acima e substituindo pelos valores conhecidos, obtemos

E[N ] = E[Nq] + ρ =λ2E[X2]

2(1− ρ)+ ρ =

λρE[Xr]

1− ρ+ ρ =⇒ E[W ] =

ρE[Xr]

1− ρ

A expressao obtida para o tempo medio de espera em M/G/1 via transformada obviamentee a mesma que ja havia sido anteriormente deduzida por outros meios.

86

Page 87: Apostila - Aguiar

15.3.5 A transformada de Laplace do tempo gasto na fila M/G/1 FCFS

Acompanhando um fregues tıpico em uma fila M/G/1 FCFS, podemos observar que o numerodeixado para tras e exatamente o numero de pessoas que chegou durante o tempo T que ofregues tıpico passou no sistema. Como o processo de chegada e Poisson e relacionando aschegadas ao intervalo de tempo em que as chegadas ocorreram, pode-se escrever

N(z) = T ∗(λ− λz)

Fazendo s = λ− λz e substituindo z = (λ− s)/λ, obtemos

T ∗(s) =(1− ρ)sX∗(s)

s− λ + λX∗(s)

Lembrando que T = W + X e que W e X sao independentes em FCFS, entao T ∗(s) =W ∗(s)X∗(s) e claramente podemos deduzir que, para M/G/1 FCFS, temos que a transfor-mada de Laplace da pdf do tempo de espera na fila e dada por

W ∗(s) =(1− ρ)s

s− λ+ λX∗(s)

Podemos facilmente obter por derivacao que

E[W ] =λE[X2]

2(1− ρ)

E[W 2] = 2E[W ]2 +λE[X3]

3(1− ρ)

*

Exercıcio: Para a fila M/G/1 modificada em que apenas o primeiro servico do perıodoocupado X0 e diferente dos outros, procure, usando o metodo da cadeia embutida, analisare deduzir a transformada Z do numero de pessoas presentes nesta fila M/G/1 modificada e,a partir desta transformada, obtenha as transformadas para o tempo total no sistema e nafila de espera. Mostre que para esta fila modificada as seguintes expressoes sao validas:

N(z) = P (N = 0)X∗(λ− λz)− zX∗

0 (λ− λz)

X∗(λ− λz)− z

com P (N = 0) = 1−λE[X]1−λE[X]+λE[X0]

.

E[W ] =λE[X2]

2(1− λE[X ])+

λE[X20 ]− λE[X2]

2(1− λE[X ] + λE[X0])

Mostre tambem que o servico medio e dado por E[X0]1−λE[X]+λE[X0]

.

87

Page 88: Apostila - Aguiar

15.4 A Fila M/G/1 com Ferias

Esta fila e uma variacao da fila M/G/1. Ao final de um perıodo ocupado o servidor ausentade ferias. Chegadas que encontram o servidor em ferias esperam ate o seu retorno. Se aoretornar de ferias nao existem fregueses na fila, o servidor sai de ferias novamente e o processose repete. As ferias sao variaveis aleatorias independentes e identicamente distribuıdas,representadas pela variavel V , com media V e segundo momento V 2.

Pode ser provado que:

E[Wferias] = E[WM/G/1] +V 2

2V= E[WM/G/1] + vida residual media das ferias

Este tipo de fila e util na analise de sistemas como TDM e FDM.

Aplicacao: Obtencao do Atraso em Fila para TDM

quadro TDM quadro TDM

1 2 · · · m 1 2 · · · m

• m subcanais, cada um com taxa de chegada λ/m (pacotes/s).

• Pacotes de tamanho fixo, transmitidos a taxa de C bps (taxa nominal do canal)

• Cada subcanal ocupa um tempo fixo igual ao tempo de transmissao do pacote (usadocomo unidade de tempo) por quadro. Se nao houver nada a transmitir num subcanal,o tempo do subcanal fica ocioso e nao pode ser ocupado por outro subcanal.

• O tempo de espera na fila e obtido modelando cada subcanal como M/D/1 com ferias,onde as ferias e o servico tem tamanho fixo igual ao tempo do quadro, ou seja,

X = V = m, X2 = V 2 = m2

88

Page 89: Apostila - Aguiar

Para a fila de espera de um canal, servicos somente ocorrem em intervalos fixos dotamanho do quadro. Assim, tudo se passa como se o servico fosse do tamanho doquadro, isto e, m unidades de tempo. Ao entrar no perıodo ocioso, a chance de trans-mitir um novo pacote acaba sendo sincronizada com o quadro e tudo se passa, para afila de espera, como se o servidor tivesse tirado ferias fixas do tamanho do quadro (munidades de tempo).

Obtemos entao:

W TDM = WM/D/1 +v2

2v=

λm2

2(1− ρ)+

m2

2m=

m

2(1− λ),

T TDM = W TDM + 1

***

Aplicacao: Obtencao do Atraso em Fila para FDM

←− canal FDM com banda W hz (C bps) −→

W/m hz (C/m bps) W/m hz (C/m bps) · · · W/m hz (C/m bps)

• m subcanais, cada um com taxa de chegada λ/m pacotes/s e banda C/m bps

• Para comparacao com TDM, vamos assumir pacotes de tamanho fixo com tempo detransmissao X = m e X2 = m2

• O tempo de espera na fila e obtido modelando cada subcanal diretamente como M/D/1Obtemos entao:

W FDM = WM/D/1

=ρm

2(1− ρ)

=λm

2(1− λ),

T FDM = W FDM +m

= W TDM +m/2

• Comparando com os resultados anteriores, observamos que o desempenho do TDM esuperior ao FDM.

15.4.1 O Perıodo Ocioso na Fila M/G/1 com ferias

Assumindo que a variavel K represente o numero de perıodos de ferias que ocorrem dentrode um perıodo ocioso e N represente o numero de chegadas Poisson durante um intervalo deferias, o perıodo ocioso na fila pode ser definido como Iferias = V1 + V2 + ...+ VK .

89

Page 90: Apostila - Aguiar

Lembrando que os intervalos de ferias observados sao condicionados a chegada ou nao defregueses, pelos resultados obtidos no capıtulo de transformadas temos

V ∗(s|N = 0) = E[e−sV |N = 0] =V ∗(λ+ s)

V ∗(λ)

V ∗(s|N > 0) = E[e−sV |N > 0] =V ∗(s)− V ∗(λ+ s)

1− V ∗(λ)

com medias iguais a

E[Vi] = E[V |N = 0] =−V ∗′(λ)

V ∗(λ), i < K

E[VK ] = E[V |N > 0] =E[V ] + V ∗′(λ)

1− V ∗(λ)

Observe que existe dependencia entre o tamanho dos intervalos de ferias e o processo dechegada. Um intervalo de ferias em que nao tenha acontecido qualquer chegada nao tem adistribuicao incondicional das ferias, o mesmo acontecendo com o intervalo de ferias ondepelo menos uma chegada ocorre.

Das propriedades ja estudadas, sabemos que N(z) = V ∗(λ − λz), P (N = 0) = V ∗(λ) eP (N > 0) = 1 − V ∗(λ). Durante o perıodo ocioso, as ferias se sucedem a medida que naoocorram chegadas nos (K − 1) intervalos de ferias e somente alcancamos o final do perıodoocioso quando pelo menos uma chegada ocorra em VK .

O numero de intervalos de ferias no perıodo ocioso e entao uma variavel aleatoria Kcom distribuicao geometrica dada por P (K = k) = (V ∗(λ))k−1(1 − V ∗(λ)), k ≥ 1, com

E[K] = (1− V ∗(λ))−1 = 1/P (N > 0) e K(z) = z(1−V ∗(λ))1−zV ∗(λ) .

Calculando o perıodo ocioso medio temos

E[Iferias] = E[K − 1]E[V |N = 0] + E[V |N > 0]

=

(

1

P (N > 0)− 1

)

E[V |N = 0] + E[V |N > 0]

=P (N = 0)

P (N > 0)E[V |N = 0] + E[V |N > 0]

=1

P (N > 0)(E[V |N = 0]P (N = 0) + E[V |N > 0]P (N > 0))

=E[V ]

P (N > 0)= E[V ]E[K] =

E[V ]

1− V ∗(λ)

Interessante observar que para a media tudo se passa como tivessemos uma soma de variaveisaleatorias onde o numero a ser somado e independente das variaveis.

O numero de chegadas esperando pelo servidor ao final das ferias e representado pelavariavel aleatoria L. L pode ser interpretada como sendo o numero de chegadas que aconte-ceram durante o perıodo ocioso e sua media e dada por

E[L] = λE[Iferias] =λE[V ]

1− V ∗(λ)

90

Page 91: Apostila - Aguiar

Uma outra forma de obter esta media seria interpretar L como sendo o numero de che-gadas em um intervalo de ferias, dado que pelo menos uma chegada tenha ocorrido. Entao,

E[L] = E[N |N > 0] =E[N ]

P (N > 0)=

λE[V ]

P (N > 0)=

λE[V ]

1− V ∗(λ)

.

Caso seja necessario obter outros momentos de L, podemos obter a transformada Z como

L(z) = E[zN |N > 0] =N(z)− P (N = 0)

1− P (N = 0)=

V ∗(λ− λz)− V ∗(λ)

1− V ∗(λ)

A transformada de Laplace do perıodo ocioso pode ser calculada como:

I∗ferias(s) = E[e−s(V1+...+VK−1+VK)] = E[e−s(V1+...+VK−1)]E[e−sV |N > 0]

= M(V ∗(s|N = 0))V ∗(s|N > 0)

com M = K − 1, e lembrando que os intervalos de ferias exceto o ultimo sao i.i.d com T.L.dada por V ∗(s|N = 0).

Usando as transformadas dos intervalos de ferias e lembrando que M(z) = K(z)/z,substituindo na expressao de I∗ferias(s), obtemos, apos simplificar:

I∗ferias(s) =V ∗(s)− V ∗(s+ λ)

1− V ∗(s+ λ)

Se obtivermos a media do perıodo ocioso como E[I∗ferias] = −I∗′ferias(0), veremos que coincide

com o valor obtido anteriormente.

15.4.2 O Perıodo Ocupado na Fila M/G/1 com Ferias

O perıodo ocupado na M/G/1 com ferias pode ser facilmente obtido observando que ele seraformado por tantos perıodos ocupados quantas sejam as chegadas esperando pelo final dasferias do servidor. E como as variaveis envolvidas sao independentes, temos:

Gferias = G1 +G2 + ... +GL

E[Gferias] = E[L]E[G] =

(

λE[V ]

1− V ∗(λ)

)(

E[X ]

1− ρ

)

=ρE[V ]

(1− V ∗(λ))(1− ρ)

G∗ferias(s) = L(G∗(s)) =

V ∗(λ− λG∗(s))− V ∗(λ)

1− V ∗(λ)

15.4.3 A transformada Z do numero presente na fila M/G/1 com ferias

Para obter a transformada Z do numero presente na fila M/G/1 com ferias usaremos ometodo da cadeia embutida de Markov nos instantes de partida da fila, como feito para afila M/G/1.

91

Page 92: Apostila - Aguiar

Vamos analisar a evolucao do numero deixado para tras nos instantes da i-esima e i+1-esima partidas. Seja Ni e Ni+1 os numeros de pessoas deixadas para tras nestes instantes,respectivamente. Seja K o numero de chegadas Poisson durante um servico, com K(z) =X∗(λ − λz). Seja L o numero de pessoas esperando no inıcio do perıodo ocupado, com

L(z) = V ∗(λ−λz)−V ∗(λ)1−V ∗(λ)

. E facil ver que

Ni+1 =

{

K + L− 1 , se Ni = 0Ni +K − 1 , se Ni > 0

Usando transformadas e condicionamento, temos

E[zNi+1 ] = E[zK+L−1|Ni = 0]P (Ni = 0) + E[zNi+K−1|Ni > 0]P (Ni > 0)

No comportamento limite, Ni → N e Ni+1 → N com i → ∞, e para ρ < 1 havera umadistribuicao estacionaria do numero de pessoas na fila com T.Z. dada por N(z) = E[zN ].Rescrevendo a expressao acima para a situacao limite e lembrando que P (N = 0) nao econhecido a priori, temos

E[zN ] = E[zK+L−1|N = 0]P (N = 0) + E[zN+K−1|N > 0]P (N > 0)

= E[zK−1|N = 0]E[zL|N = 0]P (N = 0) + E[zK−1|N > 0]E[zN |N > 0]P (N > 0)

= z−1K(z)L(z)P (N = 0) + z−1K(z)E[zN |N > 0]P (N > 0)

Lembrando que E[zN |N > 0]P (N > 0) = N(z) − P (N = 0), obtemos

N(z) = K(z)P (N = 0)

(

L(z)− 1

z −K(z)

)

De N(1) = 1 e apos aplicar l’Hospital temos

P (N = 0) =1− ρ

L′(1)=

(1− ρ)(1− V ∗(λ))

λE[V ]

Finalmente, substituindo os valores conhecidos obtemos

N(z) =(1− ρ)(1− V ∗(λ− λz))

λE[V ]

(

X∗(λ− λz)

X∗(λ− λz)− z

)

Esta e a expressao para a T.Z. da pmf de N , numero de pessoas presentes na fila emum instante aleatorio. Cabe observar que a distribuicao do numero de pessoas na fila eindependente da disciplina de atendimento, se ela nao leva em consideracao nenhum aspectorelativo ao numero de pessoas presentes.

Se calcularmos E[N ] = N′(1) (apos derivar duas vezes), obtemos

E[N ] = λE[X ] +λ2E[X2]

2(1− ρ)+ λ

E[V 2]

2E[V ]

Como E[N ] = ρ+ λE[Wferias] temos

E[Wferias] = E[W ] + E[Vr]

92

Page 93: Apostila - Aguiar

15.4.4 A transformada de Laplace do tempo gasto na fila M/G/1 com feriasFCFS

Acompanhando um fregues tıpico em uma fila M/G/1 com ferias FCFS, podemos observarque o numero deixado para tras e exatamente o numero de pessoas que chegou durante otempo T que o fregues tıpico passou no sistema. Como o processo de chegada e Poissone relacionando as chegadas ao intervalo de tempo em que as chegadas ocorreram, pode-seescrever

N(z) = T ∗(λ− λz)

Fazendo s = λ− λz e substituindo z = (λ− s)/λ, obtemos

T ∗(s) =(1− ρ)(1− V ∗(s))

E[V ](s− λ+ λX∗(s))X∗(s)

Lembrando que T = W + X e que W e X sao independentes em FCFS, entao T ∗(s) =W ∗(s)X∗(s), e a transformada de Laplace da pdf do tempo de espera na fila pode ser obtidacomo

W ∗ferias(s) =

(1− ρ)(1− V ∗(s))

E[V ](s− λ+ λX∗(s))

=

(

(1− ρ)s

s− λ + λX∗(s)

)(

1− V ∗(s)

sE[V ]

)

= W ∗(s)V ∗r (s)

Se a partir da transformada for obtida a media, o resultado sera o mesmo ja obtido anteri-ormente

E[Wferias] = E[W ] + E[Vr]

*

Exercıcio: Existe a possibilidade de variacoes na tomada de ferias pelo servidor. Por exem-plo, o servidor ao inves de tomar novas ferias sempre que ao retornar nao encontrar nenhumfregues em espera, ele pode tomar um unico perıodo de ferias apos o termino do perıodoocupado. Se ao retornar ele nao encontrar nenhum fregues em espera, ele fica aguardandoa proxima chegada para iniciar imediatamente o perıodo ocupado. A indisponibilidade doservidor seria apenas durante este unico perıodo de ferias. Procure, usando o metodo dacadeia embutida, analisar e deduzir a transformada Z do numero de pessoas presentes nestafila M/G/1 com ferias com um unico perıodo de ferias, e, a partir desta transformada, ob-tenha as transformadas para o tempo total no sistema e na fila de espera. Mostre que paraesta fila com um unico perıodo de ferias as seguintes expressoes sao validas:

N(z) = P (N = 0)

[

X∗(λ− λz) [V ∗(λ− λz)− (1− z)V ∗(λ)− 1]

z −X∗(λ− λz)

]

com

P (N = 0) =1− ρ

λE[V ] + V ∗(λ).

E[W ] =λE[X2]

2(1− ρ)+

λE[V 2]

2(λE[V ] + V ∗(λ))

e ρ = λE[X ].

93

Page 94: Apostila - Aguiar

15.5 Fila M/G/1 com disciplina LCFS sem interrupcao de servico

Na disciplina LCFS (Last Come First Serve), tambem conhecida como LIFO (Last In FirstOut), os fregueses que chegam a fila sao organizados na fila de espera em ordem inversa dechegada. Quando um servico termina e ainda existem fregueses presentes na fila de espera,o fregues que chegou por ultimo e colocado em servico, que sera executado ate o final seminterrupcao.

Estamos interessados em calcular o tempo medio de espera na fila WLCFS. O tempomedio gasto no sistema, por seu lado, pode ser obtido a partir de TLCFS = WLCFS +E[X ].

Quando um fregues tıpico chega a fila, o instante de chegada e equivalente a uma amos-tragem aleatoria no tempo (PASTA) e a fila e encontrada com seus valores medios no tempo,tanto na fila de espera quanto no servico. O servico medio pendente neste instante e dadopor U 0 = E[Nq]E[X ] + E[Ns]E[Xr], com E[Nq] = λE[W ] (Little).

Deste servico pendente, a fracao W 0 = E[Ns]E[Xr] = ρE[Xr] sera executada antes daentrada do fregues tıpico em servico. Caso novas chegadas nao ocorressem apos a chegadado fregues tıpico, o tempo medio de espera seria dado simplesmente pelo atraso W 0. Aexpressao para W 0 pode ser tambem obtida condicionando no estado ocupado ou ociosoencontrado ao chegar:

W 0 = E[W0] = E[W0|ocupado]P (ocupado) + E[W0|ocioso]P (ocioso) = ρE[Xr]

Claro que se a fila e encontrada ociosa o atraso ate entrada em servico e zero e se o servidoresta ocupado o servico residual e o atraso mınimo a ser observado.

Todavia, toda nova chegada que ocorre enquanto o fregues tıpico ainda esta na fila deespera sera servida antes do fregues tıpico. O tempo medio de espera na fila pode ser vistocomo um perıodo ocupado diferenciado iniciado por W 0 e entao

E[WLCFS] =W 0

1− ρ=

ρE[Xr]

1− ρ

Interessante observar que os tempos medios de espera nas filas com disciplinas LCFS e FCFSsao iguais.

Podemos calcular W ∗LCFS(s) diretamente da T.L. do perıodo ocupado, condicionando no

estado ocupado ou ocioso que a fila e encontrada pelo fregues tıpico. Quando o sistemae encontrado ocupado, o servico inicial do perıodo ocupado e dado pela vida residual doservico. Usaremos a expressao para X∗

r (s) = 1−X∗(s)sE[X]

derivada em M/G/1, bem como a

94

Page 95: Apostila - Aguiar

expressao para T.L. do perıodo ocupado modificado G∗0(s) = X∗

0 (s+ λ− λG∗(s)).

W ∗LCFS(s) = E[e−sWLCFS |ocioso]P (ocioso) + E[e−sWLCFS |ocupado]P (ocupado)

= (1− ρ) + ρG∗0(s)

= (1− ρ) + ρX∗r (s+ λ− λG∗(s))

= (1− ρ) + ρ1 −X∗(s+ λ− λG∗(s))

(s+ λ− λG∗(s))E[X ]

= (1− ρ) + ρ1−G∗(s)

(s + λ− λG∗(s))E[X ]

= (1− ρ) +λ(1−G∗(s))

s+ λ− λG∗(s)

A partir da transformada acima pode-se obter a variancia do tempo de espera σ2LFCS. E

interessante comparar LCFS com FCFS e avaliar qual disciplina tem maior variancia. Pode-se mostrar que

σ2FCFS = (1− ρ)σ2

LFCS − ρE[W ]2

onde E[W ] = W FCFS = WLCFS, implicando que σLCFS > σFCFS.

A explicacao para este fato e que com LCFS chegadas que encontram um servico residuallongo tendem a ter um tempo de espera maior que no caso de um servico residual pequeno.Com isso, a variancia do tempo de espera na fila fica maior comparada com FCFS, onde oimpacto do servico residual nao realimenta o atraso em fila, mas impacta igualmente a todosque estao em espera.

15.6 M/G/1 com Disciplina LCFS com interrupcao de servico e

continuidade

Nesta disciplina, a fila de espera e mantida na ordem inversa da chegada, dando preferenciaaos fregueses que chegaram por ultimo. Um fregues ao chegar interrompe o servico em an-damento e inicia seu proprio servico imediatamente. O fregues interrompido vai para a filade espera, onde aguarda a vez com prioridade sobre os demais que chegaram a mais tempoao sistema. Quando retornar ao servico, ele e retomado do ponto em que foi interrompidoanteriormente. Uma interrupcao de servico inicia um subperıodo ocupado e o fregues inter-rompido so retornara ao servico apos o final do subperıodo ocupado. Um fregues podera serinterrompido e retornar para a fila de espera varias vezes enquanto esta no sistema.

O tempo total de um fregues tıpico neste sistema pode ser visto como o tempo de umperıodo ocupado iniciado pelo seu proprio servico. O final do servico do fregues tıpico e suasaıda da fila ira coincidir com o termino do perıodo ocupado iniciado pelo seu proprio servico.Convem lembrar que o tamanho do perıodo ocupado independe da ordem de atendimento.Entao, considerando que um fregues tıpico tem servico medio E[X ], temos

E[TLCFS c/int] =E[X ]

1− ρ

95

Page 96: Apostila - Aguiar

Para se obter o tempo medio de espera na fila, fazemos

E[WLCFS c/int] = E[TLCFS c/int]−E[X ]

O fregues tıpico e interrompido em media λE[X ] vezes. A cada interrupcao ele fica aguar-dando na fila de espera por um tempo G, de modo que poderıamos ter chegado ao tempomedio no sistema atraves do seguinte raciocınio:

E[TLCFS c/int] = E[X ] + λE[X ]E[G] = E[X ] +ρE[X ]

1− ρ=

E[X ]

1− ρ

Se o servico for conhecido a priori, e.g. X = a, entao terıamos T (a) = a1−ρ

.

Como o tempo total e dado pelo perıodo ocupado, temos imediatamente que

T ∗LCFS c/int

(s) = G∗(s) = X∗(s+ λ− λG∗(s))

15.7 M/G/1 com disciplina LCFS com interrupcao de servico semcontinuidade

Nesta disciplina, como na anterior, o fregues e interrompido por uma chegada. Todavia,ao retornar ao servico, um novo servico e iniciado, a partir de uma nova amostragem davariavel X . Tudo se passa como o servico antes recebido tenha sido perdido totalmente e umnovo servico e iniciado. Um exemplo deste tipo de reinıcio de novo servico apos interrupcaopode ser observado em sistemas de atendimento ao consumidor feitos por telefone. Emgeral, durante o atendimento, fatos sao relatados e o consumidor explica suas razoes pelareclamacao. Todavia, caso a ligacao caia, todo o processo tera que ser reiniciado do zero,com um novo atendente. Somente quando o atendente finaliza e protocola a reclamacao doconsumidor e que o servico pode ser dado por terminado.

Vamos assumir que em nossa fila LCFS o servico e dado por X e o processo de chegadaseja Poisson com taxa λ. Seja Y uma variavel exponencialmente distribuıda com taxa λ. Ycorresponde ao intervalo entre chegadas Poisson. Seja GLCFS c/int,s/cont o perıodo ocupadonesta fila.

O tempo total de um fregues tıpico no sistema sera representado por

TLCFS c/int,s/cont = Y1 +G1 + Y2 +G2 + ...+ YN +GN + YN+1

Na expressao acima Yi corresponde ao servico recebido ate ocorrer uma interrupcao. Aposa interrupcao, o fregues tıpico tera que aguardar o tempo de um perıodo ocupado Gi atepoder entrar novamente em servico. Estamos assumindo que o numero de interrupcoes euma variavel N e que o servico YN+1 ocorre ate o seu final sem interrupcoes, quando, entao,termina o atendimento ao fregues tıpico. Devemos observar que Yi, 1 ≤ i ≤ N , e o tempoate uma chegada, dado que esta chegada ocorre antes do termino do servico. Por outro lado,YN+1 e o tempo de servico, dado que nenhuma chegada ocorre durante este servico.

96

Page 97: Apostila - Aguiar

Usando resultados anteriores do capıtulo de transformadas, temos

E[Yi] = E[Y |Y < X ] =1

λ+

X∗′(λ)

1−X∗(λ), 1 ≤ i ≤ N

E[YN+1] = E[X|Y > X ] = −X∗′(λ)

X∗(λ)

Sabendo que P (Y < X) = 1−X∗(λ) e P (Y > X) = X∗(λ), entao o numero N de perıodosocupados (numero medio de vezes que o servico sera interrompido e reamostrado) sera umav.a. com pmf, T.Z. e media dadas por

P (N = n) = (1−X∗(λ))nX∗(λ), n ≥ 0 (geometrica)

N(z) =X∗(λ)

1− z(1−X∗(λ))

E[N ] =1−X∗(λ)

X∗(λ)

Entao,

E[TLCFS c/int,s/cont] = E[Y1 +G1 + Y2 +G2 + ...+ YN +GN + YN+1]

= E[N ](E[Y |Y < X ] + E[G]) + E[X|Y > X ]

= E[N ]E[Y |Y < X ] + E[X|Y > X ] + E[N ]E[G]

=1−X∗(λ)

X∗(λ)

(

1

λ+

X∗′(λ)

1−X∗(λ)

)

− X∗′(λ)

X∗(λ)+ E[N ]E[G]

=1−X∗(λ)

λX∗(λ)+ E[N ]E[G]

= E[N ]

(

1

λ+ E[GLCFS c/int,s/cont]

)

O tempo total de um fregues tıpico neste sistema, como anteriormente visto na disciplinaLCFS com interrupcao e continuidade, pode ser visto como o tempo de um perıodo ocupadoiniciado pelo seu proprio servico. O final do servico do fregues tıpico e sua saıda da filaira coincidir com o termino do perıodo ocupado iniciado pelo seu proprio servico. Assim,E[TLCFS c/int,s/cont] = E[GLCFS c/int,s/cont] e entao

E[TLCFS c/int,s/cont] =E[N ]

λ+ E[N ]E[TLCFS c/int,s/cont]

implicando que

E[TLCFS c/int,s/cont] =E[N ]

λ(1−E[N ])

Para estabilidade temos que ter E[N ] < 1, o que implica em P (N = 0) = X∗(λ) > 1/2,ou seja, a probabilidade de ocorrer um servico sem ser interrompido deve ser maior que 1/2para que o perıodo ocupado tenha media finita.

97

Page 98: Apostila - Aguiar

15.8 Sistema de Filas com Classes de Usuarios

Num sistema de filas nem todos os fregueses tem as mesmas demandas de servico e nemsempre sao servidos com a mesma prioridade. Vamos assumir um sistema de filas ondeos fregueses sao organizados em classes, a i − esima classe chegando segundo um processoPoisson com taxa λi e demandando servico Xi, com media E[Xi] e segundo momento E[X2

i ]conhecidos. As variaveis Xi sao independentes.

Assumiremos P classes, sendo a classe 1 a mais prioritaria, ficando a classe P como amenos prioritaria. Os fregueses sao servidos segundo uma determinada disciplina de atendi-mento para sua classe que podera ser FCFS, LCFS ou LCFS com interrupcao e continuidade.Uma classe mais prioritaria ao chegar ao sistema pode ou nao interromper os servicos dasclasses menos prioritarias, independente de sua disciplina de atendimento. Assim, freguesesde uma classe podem, apos entrar em servico, nunca serem interrompidos, como podem serinterrompidos por chegadas de classes mais prioritarias ou devido a chegada da propria classeno caso de LCFS com interrupcao. As classes menos prioritarias so recebem servico caso naohaja fregueses mais prioritarios no sistema.

Estamos interessados em obter E[Wi] e E[Ti], respectivamente, o tempo medio de esperana fila e o tempo medio total na fila para a classe i. A obtencao destas grandezas sera feitaacompanhando um fregues tıpico da classe i no sistema e lembrando que chegadas Poissonsempre encontram o sistema com suas medias no tempo.

No instante de uma chegada, a classe i estara com E[Nqi] = λiE[Wi] fregueses na fila deespera, usando Little. Aplicando Little ao servidor, o numero medio de fregueses da classei encontrado em servico sera de E[Nsi] = λiE[Xi] = ρi.

Assumindo o servico como a variavel X , λ =∑P

i=1 λi, entao podemos afirmar que

X∗(s) = E[e−sX ] =

P∑

i=1

E[e−sX |classe i]P (classe i)

=P∑

i=1

λi

λE[e−sXi ] =

P∑

i=1

λi

λX∗

i (s)

E[X ] =

P∑

i=1

λi

λE[Xi] =

1

λ

P∑

i=1

ρi

E[X2] =P∑

i=1

λi

λE[X2

i ]

No instante de chegada, o servico residual pendente sera dado por

E[Ns]E[Xr] = λE[X2]/2 =

P∑

i=1

λiE[X2i ]

2=

P∑

i=1

ρiE[Xir]

Este servico residual pode ser visto como a soma dos servicos residuais de cada classe en-contrada em servico, lembrando que o numero medio de fregueses da classe i encontrado em

servico e dado por ρi e que a vida residual media deste servico e dada por E[Xir] =E[X2

i ]

2E[Xi].

98

Page 99: Apostila - Aguiar

Se uma classe nao sofre interrupcao, entao o procedimento e calcular E[Wi] diretamente.Caso a classe sofra algum tipo de interrupcao, deve ser calculado E[Ti] primeiro e depoisobter E[Wi] = E[Ti]− E[Xi].

Metodologia para o calculo de E[Wi], para classe que nao sofre interrupcao de servico:

1. Calcular E[W0i] , servico pendente encontrado ao chegar e que tera que ser executadoantes do fregues tıpico entrar em servico. Se assumıssemos que nenhuma outra chegadaocorreria apos o fregues tıpico, este valor seria o tempo medio de espera para a classei.

2. Como o fregues tıpico pode ser atrasado ainda pelas chegadas da classe j que ocorremenquanto ele ainda esta na fila de espera, j podendo ser sua propria classe como algumaclasse mais prioritaria, calculamos σi =

∀j ρj , onde a soma e feita sobre todas asclasses cujos fregueses chegam depois e sao servidos antes do fregues tıpico. Entao,pensando no perıodo ocupado modificado iniciado por E[W0i] e que termina quando ofregues tıpico entra em servico, podemos escrever

E[Wi] =E[W0i]

1− σi

Pela expressao de E[Wi] e possıvel determinar as condicoes para que a classe sofraatrasos medios de espera finitos. A condicao necessaria e σi < 1. Pode acontecer dotermo da direita da expressao acima envolver direta ou indiretamente a variavel E[Wi].Neste caso, e necessario isolar E[Wi] para obter as condicoes corretas de estabilidadepara a classe. Obtido E[Wi], obtem-se E[Ti] = E[Wi] + E[Xi]

Metodologia para o calculo de E[Ti], para classe que sofre interrupcao de servico comcontinuidade:

1. Calcular E[T0i] = E[W0i] +E[Xi] , soma do servico pendente encontrado ao chegar eque tera que ser executado antes do fregues tıpico entrar em servico com o tempo deservico medio do fregues tıpico. Se assumıssemos que nenhuma outra chegada ocorreriaapos o fregues tıpico, este valor seria o tempo medio no sistema para a classe i.

2. Como o fregues tıpico pode ainda ser atrasado pelas chegadas da classe j que ocorremenquanto ele ainda esta no sistema, j podendo ser sua propria classe como algumaclasse mais prioritaria, calculamos σi =

∀j ρj , onde a soma e feita sobre todas asclasses cujos fregueses chegam depois e sao servidos antes do fregues tıpico deixar osistema. Entao, pensando no perıodo ocupado modificado iniciado por E[T0i] e quetermina quando o fregues tıpico deixa o sistema, podemos escrever

E[Ti] =E[T0i]

1− σi

Pela expressao de E[Ti] e possıvel determinar as condicoes para que a classe sofraatrasos medios finitos. E comum que o termo da direita da expressao acima envolvadireta ou indiretamente a variavel E[Ti]. Caso isso ocorra, e necessario isolar E[Ti]para obter as condicoes corretas de estabilidade para a classe. Obtido E[Ti], obtem-seE[Wi] = E[Ti]− E[Xi]

99

Page 100: Apostila - Aguiar

*

Aplicacao: HOL ou Head-of-Line Assuma um sistema com P classes, sendo a classe ialimentada por um processo Poisson com taxa λi e servico Xi, com X∗

i (s), E[Xi] e E[X2i ]

conhecidos. As classes sao servidas FCFS, sem interrupcao entre classes, P e a classe menosprioritaria, com 1 sendo a mais prioritaria. Este sistema e chamado de head-of-line ou HOL.

Aplicando a metodologia vista acima para uma classe 1 ≤ k ≤ P , e considerando queσk =

∑ki=1 ρi, obtemos facilmente que

E[W0k] =

k∑

i=1

ρiE[Wi] +

P∑

i=1

ρiE[Xir]

E[Wk] =E[W0k]

1− σk−1=

∑ki=1 ρiE[Wi] +

∑Pi=1 ρiE[Xir]

1− σk−1

=

∑k−1i=1 ρiE[Wi] +

∑Pi=1 ρiE[Xir]

1− σk

, σk < 1, 1 ≤ k ≤ P

Para obter explicitamente cada E[Wk], podemos resolver inicialmente para k = 1, que e otempo de espera medio apara a fila mais prioritaria.

E[W1] =

∑Pi=1 ρiE[Xir]

1− σ1=

∑Pi=1 ρiE[Xir]

1− ρ1, ρ1 < 1

Tendo E[W1], podemos obter E[W2]. Assim

E[W2] =ρ1E[W1] +

∑Pi=1 ρiE[Xir]

1− σ2

=

ρ1∑P

i=1 ρiE[Xir]

1−ρ1+∑P

i=1 ρiE[Xir]

1− σ2

=

∑Pi=1 ρiE[Xir]

(1− σ1)(1− σ2), σ2 < 1

E assim sucessivamente, podemos mostrar que

E[Wk] =

∑Pi=1 ρiE[Xir]

(1− σk)(1− σk−1), σk < 1, 1 ≤ k ≤ P

*

Exemplo: Classe 1 LCFS, classe 2 FCFS. Classe 1 nao interrompe a classe 2.

Classe 1: Como nao sofre interrupcao, calcula-se E[W1].

• E[W01] = ρ1E[X1r] + ρ2E[X2r]

100

Page 101: Apostila - Aguiar

• E[W1] =E[W01]1−ρ1

= ρ1E[X1r]+ρ2E[X2r ]1−ρ1

, ρ1 < 1.

Convem observar que chegadas na fila 2 a posteriori nao interferem com a fila 1.

E, E[T1] = E[W1] + E[X1].

Classe 2: Como nao sofre interrupcao, calcula-se E[W2].

• E[W02] = ρ1E[X1r] + ρ2E[X2r] + E[Nq1]E[X1] + E[Nq2]E[X2]

• E[W2] =E[W02]1−ρ1

= ρ1E[X1r]+ρ2E[X2r ]+ρ1E[W1]1−ρ1−ρ2

, ρ1 + ρ2 < 1.

Convem observar que apenas as chegadas na fila 1 a posteriori interferem.

E, E[T2] = E[W2] + E[X2].

*

Exemplo: Classe 1 FCFS, classe 2 LCFS com interrupcao na propria classe. Classe 1interrompe a classe 2. A classe 2 opera sempre com continuidade do servico em caso dequalquer interrupcao.

Classe 1: Como nao sofre interrupcao, calcula-se E[W1].

• E[W01] = ρ1E[X1r] + E[Nq1]E[X1]

• E[W1] = E[W01] = ρ1E[X1r] + E[W1]ρ1. Portanto, E[W1] =ρ1E[X1r]1−ρ1

, ρ1 < 1 .

E, E[T1] = E[W1] + E[X1].

Classe 2: Como sofre interrupcao na propria classe e da classe 1, calcula-se E[T2].

• E[T02] = ρ1E[X1r] + E[Nq1]E[X1] + E[X2]

• E[T2] =E[T02]

1−(ρ1+ρ2)= ρ1E[X1r]+ρ1E[W1]+E[X2]

1−ρ1−ρ2, ρ1 + ρ2 < 1

E, E[W2] = E[T2]−E[X2].

*

Exemplo: Classes 1 e 2 ambas LCFS com interrupcao com continuidade na propria classe.Classe 1 interrompe a classe 2 com continuidade. Classe 1: Como sofre interrupcao napropria classe, calcula-se E[T1].

• E[T01] = E[X1]

• E[T1] =E[T01]1−ρ1

= E[X1]1−ρ1

, ρ1 < 1

E, E[W1] = E[T1]−E[X1].

101

Page 102: Apostila - Aguiar

Classe 2: Como sofre interrupcao na propria classe e da classe 1, calcula-se E[T2].

• E[T02] = ρ1E[X1r] + E[Nq1]E[X1] + E[X2]

• E[T2] =E[T02]

1−(ρ1+ρ2)= ρ1E[X1r]+ρ1E[W1]+E[X2]

1−ρ1−ρ2, ρ1 + ρ2 < 1

E, E[W2] = E[T2]−E[X2].

*

Solucoes podem ser apenas aproximacoes e funcionar como limitantes do atraso

Convem salientar que nem sempre a metodologia apresentada da resultados exatos, masapenas um limitante superior nos tempos medios. Analise o exemplo em que a classe 1 eFCFS e a classe 2 e LCFS. Assuma ainda que a classe 1 interrompe a classe 2. A dificuldadesurge ao se tentar calcular o tempo medio gasto na classe 2.

Como a classe 2 sofre interrupcao, temos que calcular E[T2]. Aplicando a metodologia,escreverıamos

E[T02] = ρ1E[X1r] + ρ2E[X2r] + E[Nq1]E[X1] + E[X2]

Ao colocar o termo ρ2E[X2r] estamos assumindo que o fregues da classe 2 encontrado emservico atrasara o fregues tıpico da classe 2 do tempo residual de servico. Este fregues declasse 2 encontrado em servico pode ja ter estado outras vezes em servico e seu tempo deservico pendente pode ser inferior a X2 e o uso da vida residual E[X2r] e uma aproximacao.Alem disso, mesmo que este fregues estivesse pela primeira vez em servico, nada garante queele nao seja interrompido por uma chegada da classe 1. Caso haja uma chegada da classe 1durante o tempo de vida residual deste fregues, ele sera retirado do servico e retornado a filade espera da classe 2. Todavia, como este fregues chegou ao sistema antes do fregues tıpico,ele nao mais interferira com o fregues tıpico, enquanto este estiver no sistema. Vemos entaoque o atraso do valor da vida residual para o fregues de classe 2 encontrado em servico e umpior caso por mais de um motivo, de modo que o correto sera indicar

E[T02] ≤ ρ1E[X1r] + ρ2E[X2r] + E[Nq1]E[X1] + E[X2]

O erro de aproximar E[T02] pela igualdade diminui a medida que a taxa de chegadada classe 1 diminui. A probabilidade de nao haver chegada da classe 1 durante o servicoresidual da classe 2 e X∗

2r(λ1). Quando maior esta probabilidade menor o erro. Obviamente,esta probabilidade cresce com a diminuicao da vida residual do servico da classe 2 e com adiminuicao da taxa de chegada da classe 1.

No passo seguinte, usando a metodologia, a tendencia seria de fazer

E[T2] =E[T02]

1− (ρ1 + ρ2)

Aqui tambem temos um problema. O fator do denominador pressupoe que todos das classes1 e 2 que chegam a posteriori serao servidos enquanto o fregues tıpico ainda estiver no

102

Page 103: Apostila - Aguiar

sistema. Embora este fato seja verdade para os fregueses da classe 1, ele nao e completamenteverdadeiro para os fregueses da classe 2. Se acompanhamos o fregues tıpico da classe 2 nosistema, vemos que ele pode visitar o servidor mais de uma vez, caso seja interrompido pelachegada de fregueses da classe 1 enquanto esta em servico. Todos os fregueses da classe 2 quechegaram ao sistema a posteriori terao prioridade sobre ele. Todavia, durante sua ultimavisita ao servidor, os fregueses da classe 2 que chegarem durante este final de servico naointerferirao com o fregues tıpico, pois ele nao sera interrompido e saira do sistema. O fatornegativo de ρ2 no denominador assume que todos que chegarem depois sairao antes, o quemostramos nao ser verdade.

Entao, deixando o denominador da forma mostrada causa um pior caso. Entao, por maisesta razao, o correto e considerar E[T2] ≤ E[T02]

1−(ρ1+ρ2)e assumirmos que temos apenas um

limitante superior para o atraso medio da classe 2.

Usar o limite como estimativa do atraso medio sera tao mais razoavel quanto maior fora taxa de chegada da classe 1, acarretando maior probabilidade de interrupcao do servicoresidual. Isso e o oposto do que vimos no passo anterior, quando o erro aumenta com oaumento da taxa da classe 1.

Embora as duas aproximacoes contribuam para um limitante menos preciso, a simplici-dade da metodologia recomenda o uso como primeira aproximacao. Em certos casos, o erropode ser estimado.

15.9 Lei da Conservacao

Assuma um sistema com P classes, sendo a classe i alimentada por um processo Poisson comtaxa λi e servico Xi, com X∗

i (s), E[Xi] e E[X2i ] conhecidos. Para sistemas conservativos, a

distribuicao do perıodo ocupado independe da ordem de atendimento, de modo que podemosobter uma relacao entre os tempos medios de espera em fila para as diferentes classes.

Assuma que as classes sejam servidas FCFS, sem interrupcao entre classes, P sendo aclasse menos prioritaria e 1 a mais prioritaria. Este sistema e chamado de head-of-line ouHOL.

No instante de uma chegada de qualquer classe, o servico pendente medio encontrado nosistema como um todo E[U ] e dado por

E[U ] =P∑

i=1

(E[Nqi]E[Xi] + ρiE[Xir]) =P∑

i=1

ρiE[Wi] +P∑

i=1

ρiE[Xir]

Por outro lado, este servico pendente medio e equivalente ao servico pendente medio de umafila M/G/1 FCFS alimentada pelas P classes, ja que o servico medio pendente e independenteda ordem de atendimento para sistemas conservativos. Para uma fila M/G/1, o servicopendente medio encontrado por uma chegada e igual ao tempo medio de espera na fila, jaque os instantes de chegadas Poisson correspondem a uma amostragem aleatoria no tempo(PASTA). Usando a formula do tempo medio de espera para a fila M/G/1 alimentada pelas

103

Page 104: Apostila - Aguiar

P classes temos

E[W ] =ρE[Xr]

1−∑P

i=1 ρi=

∑Pi=1 ρiE[Xir]

1− ρ, ρ < 1

Igualando as duas expressoes acima e isolando∑P

i=1 ρiE[Wi], temos

P∑

i=1

ρiE[Wi] =ρ∑P

i=1 ρiE[Xir]

1− ρ, ρ < 1

Esta e a chamada Lei da Conservacao. Mantidas as utilizacoes das classes, e,consequentemente,a utilizacao global do sistema, o termo da direita da igualdade e uma constante. A Lei daConservacao indica que nao se pode beneficiar uma classe alterando a disciplina de atendi-mento sem prejudicar as demais, mantidas as utilizacoes das classes constantes.

Raciocınio semelhante pode ser aplicado a um fregues tıpico da classe k, 1 ≤ k ≤ P . Paraesta classe, o servico pendente medio encontrado por uma chegada tıpica sera dado por

E[Uk] =

k∑

i=1

E[Ni]E[Xi] +

P∑

i=1

ρiE[Xir] =

k∑

i=1

ρiE[Wi] +

P∑

i=1

ρiE[Xir]

Por outro lado, para a classe k o sistema se comporta como uma fila M/G/1 alimentadapelas classes de 1 a k, mas com o servidor podendo ser ocupado por fregueses de todas asclasses. Para esta fila, o tempo medio de espera e dado por

E[W ] =ρE[Xr]

1−∑k

i=1 ρi=

∑Pi=1 ρiE[Xir]

1− σk

, σk < 1, 1 ≤ k ≤ P

onde σk =∑k

i=1 ρi. Igualando as duas expressoes para o tempo medio de espera para a classe

k, e isolando∑k

i=1 ρiE[Wi], temos

k∑

i=1

ρiE[Wi] =σk

∑Pi=1 ρiE[Xir]

1− σk

, σk < 1, 1 ≤ k ≤ P

Esta e uma generalizacao da Lei de Conservacao.

15.10 Redes de Filas M/M/1

Muitas situacoes podem ser modeladas como uma rede de filas M/M/1, onde partidas deuma fila podem retornar probabilisticamente para o inıcio da propria fila ou seguir paraoutra fila, ou partir definitivamente do sistema de filas.

Focando na fila M/M/1 vamos analisar o processo de partida desta fila. SejaD o intervaloentre partidas e vamos calcular D∗(s), condicionando no fato da partida deixar para trasuma fila ociosa ou ocupada.

Para a fila M/M/1 em equilıbrio, podemos observar que ela passa por perıodos ociosose ocupados, de forma intercalada. Pela fato de termos chegadas Poisson, cada inıcio de

104

Page 105: Apostila - Aguiar

perıodo ocupado pode ser considerado como um ciclo. O numero medio de partidas duranteo perıodo ocupado e dado por E[G]/E[X ] = 1

1−ρ. Destas partidas apenas uma deixa para

tras a fila ociosa.

Aplicando a teoria da renovacao, a probabilidade de uma partida deixar para tras umafila ociosa sera entao 1/E[partidas num ciclo] = 1− ρ e a probabilidade de deixar para trasuma fila ocupada sera ρ.

Este raciocınio pode ser repetido para um numero qualquer de pessoas na fila, demons-trando que os instantes de chegada e partida sao equivalentes para o numero de pessoasobservado no sistema.

Considerando uma taxa de chegada λ Poisson e taxa de servico µ exponencial e condici-onando no estado deixado pela partida, obtemos

D∗(s) = D∗(s|fila ociosa)P (ociosa) +D∗(s|fila ocupada)P (ocupada)

=

(

λ

s+ λ

)(

µ

s+ µ

)

(1− ρ) +

(

µ

s+ µ

)

ρ

s+ λ

comprovando que o intervalo entre partidas da fila tem uma distribuicao exponencial, edemonstrando que o processo de partida da fila M/M/1 e tambem Poisson com taxa λ.

Em cadeia de Markov sera provado que o numero de pessoas presentes numa fila M/M/1tem pmf P (N = k) = (1 − ρ)ρk. Para uma rede de filas M/M/1 sem realimentacao eonde as partidas das filas sao encaminhadas probabilisticamente, uma vez calculada as taxade alimentacao das filas, cada uma delas pode ser analisada separadamente como uma filaM/M/1.

Em geral, a metrica de maior interessa e o tempo medio gasto no sistema de filas. Amaneira mais simples de se obter este valor e utilizar o resultado de Little. Calcula-se onumero medio de pessoas no sistema somando o numero medio de pessoas em cada fila (paraa fila i seria E[Ni] = ρi/(1− ρi) e dividindo pela taxa de chegada ao sistema de filas.

Quando o sistema de filas e alimentado por n diferentes fluxos Poisson com taxa λi cada,se tomarmos λ =

∑ni=1 λi, entao se tivermos um numero k de filas no sistema, o tempo medio

E[T ], considerando todos os fluxos, seria dado por

E[T ] =

k∑

j=1

E[Nj ]/λ =1

λ

k∑

j=1

ρj1− ρj

Como cada fluxo pode visitar um numero diferenciado de filas, de forma compartilhada ounao, o tempo medio experimentado por cada fluxo ainda pode ser obtido, mas e precisocalcular o numero medio de pessoas de cada fluxo no sistema. Este calculo pode em geralser feito observando as taxas de cada fluxo que alimentam cada fila e fazendo a proporcaodo numero pela razao das taxas, assumindo que cada fila tem uma distribuicao exponencialde servico que e independente do fluxo, ja que tratamos de filas M/M/1.

Para uma rede de k filas M/M/1 sem realimentacao, considerando Nj o numero de pessoas

105

Page 106: Apostila - Aguiar

na fila j, a pmf conjunta do numero de pessoas no sistema e dada por

P (N1 = n1, ..., Nk = nk) =k∏

j=1

(1− ρj)ρnj

j

Esta solucao tem a forma de produto.

Quando as partidas de uma fila M/M/1 sao realimentadas probabilisticamente para aentrada, pode-se mostrar que o processo de partida nao e mais Poisson, implicando que oprocesso composto de chegada tambem nao pode ser Poisson, por reducao ao absurdo. Parademonstrar esta propriedade, vamos assumir que uma partida do servico retorne para o inıcioda fila com probabilidade p. Continuamos a considerar D o tempo entre partidas do servico,taxa de chegada Poisson λ e taxa de servico exponencial µ. A probabilidade de retorno parao inıcio da fila e p.

Devido a propriedade da falta de memoria da distribuicao exponencial, o numero depessoas na fila com realimentacao e o mesmo que seria com o fregues retornando com pro-babilidade p imediatamente para um novo servico. Neste caso, o tempo no servidor seriaformado pela soma geometrica de servicos exponenciais, com o numero de execucoes K dadopor P (K = k) = pk−1(1−p), k ≥ 1. Observe que passa-se pelo menos uma vez pelo servidor.

Pode ser mostrado que K(z) = z(1−p)1−zp

e E[K] = 11−p

.

Se calcularmos a T.Z. do tempo de servico para a realimentacao geometrica ao servidor,obtemos

X∗(s) = K

(

µ

s+ µ

)

=µ(1− p)

s+ µ(1− p)

, mostrando que a fila se comporta como uma M/M/1 com taxa de servico exponencialµ(1− p) e utilizacao ρ = λ

µ(1−p).

Dessa forma, a probabilidade de uma fila ociosa, que e dada por 1 − ρ, e tambem aprobabilidade de fila ociosa para a situacao em que a realimentacao se da para o inıcio dafila, o mesmo podendo se dizer da probabilidade de fila ocupada que e ρ.

Para a fila com realimentacao, podemos calcular D∗(s), condicionando na partida deixarpara tras uma fila ocupada ou ociosa. Temos

D∗(s|fila ocupada) =µ

s+ µ

D∗(s|fila ociosa) = p

(

µ

s+ µ

)

+ (1− p)

(

λ

s+ λ

)(

µ

s+ µ

)

A expressao para D∗(s|fila ociosa) decorre do fato de que se a partida resolve retornarpara a fila, entao observaremos um tempo exponencial com taxa µ ate a proxima partida.Por outro lado, se nao existe o retorno com probabilidade (1 − p), entao ha que se esperaro intervalo de uma chegada e depois mais um intervalo de servico, e temos o produto dastransformadas pela independencia entre estes intervalos.

Obtendo

D∗(s) = D∗(s|fila ociosa)

(

1− λ

µ(1− p)

)

+D∗(s|fila ocupada)

(

λ

µ(1− p)

)

106

Page 107: Apostila - Aguiar

pode-se verificar que este resultado nao pode ser de uma distribuicao exponencial, implicandoque o processo de partida da fila M/M/1 com realimentacao nao e Poisson.

Apesar disso, como a probabilidade do numero de pessoas nesta fila se comporta comose a fila fosse M/M/1, uma vez calculada a utilizacao desta fila ρ =, o numero de pessoas nafila e dado por P (N = k) = (1− ρ)ρk.

A teoria mostra que os fluxos de entrada nas filas de uma rede de filas com servidoresexponenciais e com realimentacao nao possuem a propriedade de Poisson, todavia para adistribuicao conjunta do numero de pessoas nas filas tudo se passa como se cada fila fosse defato M/M/1, alimentada pela taxa de entrada calculada pelas realimentacoes probabilısticasdos fluxos. A pmf conjunta continua a ter a forma produto.

Numa rede de filas, ao crescer a taxa de entrada, a fila cuja utilizacao chegar primeiroa 1 se tornara o gargalo do sistema e se tornara, com o crescimento da fila de espera parainfinito, em um servidor exponencial sempre ocupado, gerando um fluxo Poisson com taxaigual a taxa do servidor. Embora esta fila gargalo tenha se tornado instavel, o resto dosistema pode operar com utilizacao menor que 1 e estavel, com valores finitos de media paraas grandezas da fila.

E interessante observar que embora a fila com servidor exponencial e com realimentacaopara o inıcio da fila (sistema I) e a fila com realimentacao direta ao servidor (sistema II)tenham ambas o mesmo tempo de espera, a variancia para o sistema I deve ser maior.

No sistema I, para um fregues que tenha sofrido mais retornos a fila, o seu tempo deespera medio sera bem maior do que aquele de um fregues que retorna menos vezes. Poroutro lado, ambos fregueses sofreriam o mesmo tempo medio de espera no sistema II, comretorno imediato ao servidor.

Na realidade, quando uma chegada tıpica ocorre, ela encontra sempre o sistema comsuas medias no tempo, independente da forma de realimentacao. Como a utilizacao nos doissistemas e a mesma, o numero medio de pessoas no servidor e o mesmo, ja que e igual autilizacao.

O numero medio de pessoas na fila de espera encontrado pela chegada tıpica tambem eo mesmo e pode ser calculado pela formula de M/M/1 com ρ = λ

µ(1−p)e vale E[Nq] =

ρ2

1−ρ.

Para o sistema I, o tempo medio gasto pela chegada tıpica ate a sua saıda do servidorpela primeira vez e dado E[Nq]/µ+ ρ/µ+ 1/µ = 1

µ(1−ρ).

Ja no sistema II, o tempo medio na fila e dado por 1(1−p)µ(1−ρ)

, que e maior que o anterior

pelo fator 1/(1− p).

Portanto, um fregues que passe apenas uma vez pelo servidor gasta em media menostempo que a media do sistema II. Outros fregueses no sistema I, que tenham sofrido retornosa fila terao que ter media de tempo no sistema acima daquela do sistema II, ja que a mediados tempos no sistema nos dois sistemas e a mesma, comprovando que a variancia do sistemaI sera alta.

107

Page 108: Apostila - Aguiar

16 Desigualdades e Limites

• Desigualdade de Markov

P (X ≥ x) ≤ E[X ]

xPorque so considera a media, a desigualdade e fraca.

• Desigualdade de Chebyshev

P (|X − E[X ]| ≥ x) ≤ σ2X

x2

16.1 Normalizacao

Seja {Xi} um conjunto de variaveis aleatorias independentes e identicamente distribuıdas(i.i.d), tais que E[Xi] = E[X ] e σ2

Xi= σ2

X . Definamos:

Sn =X1 +X2 + · · ·+Xn

n=

∑ni=1Xi

n, chamada a media das amostras ou sample mean

E[Sn] = E[X ] , σ2Sn

= σ2X/n

O resultado acima decorre do fato de que se Y =∑n

i=1Xi, entao E[Y ] = nE[X ] eσ2Y = nσ2

X . Por outro lado, V (aX) = a2V (X).

Aplicando Chebyshev temos:

P (|Sn − E[X ]| ≥ x) ≤ σ2Sn

x2=

σ2X

nx2

Significado: a media aritmetica de um conjunto de amostras tende para a media da distri-buicao a medida que o numero de observacoes cresce.

Lei Fraca dos Grandes Numeros

limn→∞

P (|Sn −E[X ]| ≥ ǫ) = 0

Lei Forte dos Grandes Numeros

limn→∞

Sn = E[X ] com probabilidade 1

A Lei Forte garante que a media das amostras nao somente converge para a mediaverdadeira, mas que se torna ela com 100% de probabilidade.

Aplicacao da lei dos grandes numeros

Problema: Quantas observacoes de uma variavel aleatoria devem ser feitas para se teruma probabilidade de pelo menos 0,95 de que a media das amostras nao desviara mais queσ/10 da media verdadeira?

0chap16.tex 25/07/2013

108

Page 109: Apostila - Aguiar

Solucao:

Sn =

∑ni=1Xi

n

P (|Sn − E[X ]| ≥ σ/10) = 1− P (|Sn −E[X ]| < σ/10) ≤ σ2

n(σ2/100), ou

P (|Sn −E[X ]| < σ/10) ≥ 1− 100

n≥ 0, 95

n ≥ 100

0, 05= 2000.

Problema: Uma pagina de um livro grosso e escolhida aleatoriamente. Assume-se quecom probabilidade θ ela contem pelo menos um erro tipografico. Se n paginas sao escolhidase Sn e a fracao destas paginas contendo erro, que valor deve ter n para que esta fracao difirado valor real θ por menos de 0,01 e com probabilidade de pelo menos 0,95%?

Solucao:

Assuma um experimento de Bernoulli com Y =∑n

i=1Xi, sendo Xi a variavel discreta queindica a presenca ou nao de erro na pagina i. Entao, P{Xi = 1} = θ e P{Xi = 0} = 1 − θ.Observe que E[Xi] = θ, E[X2

i ] = θ, V (Xi) = θ(1− θ) e Xi(z) = θz + 1− θ.

Y representa o numero de paginas com erro com P (Y = k) =(

nk

)

θk(1−θ)n−k, 0 ≤ k ≤ n,ou seja, Y tem distribuicao binomial com parametros n e θ. Como Y e a soma de n variaveisindependentes e identicamente distribuıdas, Y (z) =

∏ni=1Xi(z) = (θz + 1− θ)n.

A variavel Sn =∑

Xi/n representa a fracao das paginas com erro. Aplicando a desigual-dade de Chebyshev temos

P (|Sn − θ|) ≥ ǫ) ≤ σ2

nǫ2=

θ(1− θ)

nǫ2

P (|Sn − θ|) < ǫ) ≥ 1− θ(1− θ)

nǫ2

Como o problema pede que a probabilidade acima deva ser igual ou maior que 0,95 paraǫ = 0, 01, a restricao em n e dada por

1− θ(1− θ)

nǫ2≥ 0, 95;

n ≥ 2θ(1− θ)× 105.

109

Page 110: Apostila - Aguiar

Valores de n para alguns valores de θ

θ = 0, 01,=⇒ n > 1.980

θ = 0, 02,=⇒ n > 3.920

θ = 0, 10,=⇒ n > 18.000

θ = 0, 20,=⇒ n > 32.000

θ = 0, 50,=⇒ n > 50.000

θ = 0, 80,=⇒ n > 32.000

θ = 0, 90,=⇒ n > 18.000

16.2 Funcao de Gauss ou Distribuicao Normal

Uma variavel aleatoria X com PDF ΦX(x) =∫ x

−∞1√2πe−

y2

2 dy, possui E[X ] = 0 e V (X) = 1,

e e chamada distribuicao Normal unitaria ou N(0, 1).

Em geral, uma variavel aleatoria X com distribuicao Normal com media E[X ] = µ evariancia V (X) = σ2 (σ > 0), designada N(µ, σ2), tem

pdf fX(x) =1√2πσ

e−(x−µ)2

2σ2 , −∞ ≤ x ≤ ∞

PDF FX(x) =1√2πσ

∫ x

−∞e−

(y−µ)2

2σ2 dy, −∞ ≤ x ≤ ∞.

A transformada de Laplace da pdf da Normal pode ser facilmente obtida:

E[e−sX ] =1√2πσ

∫ ∞

−∞e−sxe−

(x−µ)2

2σ2 dx

=1√2πσ

∫ ∞

−∞e−

2σ2sx+(x−µ)2

2σ2 dx

=1√2πσ

∫ ∞

−∞e−

(x−(µ−σ2s))2+µ2−(µ−σ2s)2

2σ2 dx

= e−sµ+s2 σ2

21√2πσ

∫ ∞

−∞e−

(x−(µ−σ2s))2

2σ2 dx

= e−sµ+s2 σ2

2 .

Por esta expressao da transformada de Laplace da Distribuicao Normal e facil verificarque a soma de variaveis com distribuicao Normal e tambem uma variavel Normal com mediaigual a soma das medias e variancia igual a soma das variancias.

16.3 Teorema do Limite Central

Seja {Xi} um conjunto de n variaveis aleatorias independentes e identicamente distribuıdas(i.i.d), tais que E[Xi] = E[X ] e σ2

Xi= σ2

X .

110

Page 111: Apostila - Aguiar

Defina Y =∑n

i=1Xi, com E[Y ] = nE[X ] e V (Y ) = σ2Y = nV (X) = nσ2

X .

A variavel Zn = Y−E[Y ]σY

=∑n

i=1 Xi−nE[X]

σX√n

e chamada soma normalizada das variaveisaleatorias Xi.

Observe que E[Zn] = 0 e V (Zn) = 1.

O Teorema do Limite Central afirma que :

limn→∞

P (Zn ≤ x) = Φ(x)

A soma normalizada de variaveis aleatorias independentes tem uma PDF que se aproximada distribuicao Normal unitaria.

Demonstracao: O resultado do Teorema do Limite Central pode ser demonstrado demaneira simples usando o conceito de transformada.

A variavel Zn pode ser expressa como 1σX

√n

∑ni=1 (Xi −E[X ]) = 1

σX√n

∑ni=1Wi, onde as

variaveis Wi, 1 ≥ i ≥ n, sao i.i.d, com E[Wi] = 0 e V (Wi) = E[W 2i ] = V (X) = σ2

X .

Assim, E[

e−sZn]

= E[

e− s

σX√

n

∑ni=1 Wi

]

=(

E[

e− s

σX√nWi

])n

=(

W ∗i

(

sσX

√n

))n

.

A T.L. W ∗i (s) pode ser expandida em torno do ponto s=0 (dentro da regiao de analiti-

cidade da transformada) em funcao de seus momentos - vide propriedades da T.L. - e serexpressa como W ∗

i (s) = 1− sE[Wi] +s2

2E[W 2

i ]− s3

3!E[W 3

i ] + · · · = 1+ s2

2E[W 2

i ] + o(s2), ondeagrupamos os fatores dependentes de potencias de 3 ou maior de s em o(s2), que ira para zerocom s→ 0. Tomando a aproximacao desta transformada em torno do ponto 0, considerandoapenas ate o segundo momento, podemos escrever que W ∗

i (s) = 1 + s2

2E[W 2

i ] = 1 + s2

2σ2X .

Usando esta aproximacao em E[

e−sZn]

=(

W ∗i

(

sσX

√n

))n

, obtemosE[e−sZn ] =(

1 + s2

2n

)n

.

Para n → ∞, E[

e−sZn]

= es2

2 (T.L. da N(0,1)), ou seja, Zn → N(0, 1) com n → ∞.CQD.

Nao e necessario que todas as variaveis aleatorias tenham a mesma pdf. Na pratica,sempre que uma variavel aleatoria e a soma de um numero grande de variaveis aleatoriasbem comportadas, entao a soma normalizada tem distribuicao Normal unitaria. Exemplo:ruıdo sideral.

Problema: Em um milhao de lancamentos de uma moeda, qual a probabilidade de seobter mais de 510.000 caras?

A probabilidade de se obter exatamente 510.000 caras em 106 lancamentos e:

(

106

510.000

)

(0, 5)510.000(0, 5)490.000 = 1.08978× 10−90.

A solucao exata do problema e

111

Page 112: Apostila - Aguiar

P (# de caras > 510.000) =∑106

k=510.001

(

106

k

)

(0, 5)106= 26, 642× 10−90.

Esta solucao pode ser obtida atraves de um programa em computador.

Para resolver de forma aproximada usando o Teorema do Limite Central, vamos trataros lancamentos como um experimento de Bernoulli, onde o resultado do i-esimo lancamentoe uma variavel Xi, que assume valores 1 (cara) ou 0 (coroa) com igual probabilidade 0,5(moeda nao viciada). E facil ver que E[Xi] = 0, 5 e V (Xi) = 0, 25. Y =

Xi expressa onumero de caras obtido.

Seja Zn = Y−106×0,50,5×103

.

Verifica-se diretamente que P (Y > 510.000) = P (Zn > 20).

Olhando em uma tabela de distribuicao Normal, obtemos P (Zn > 20) = 1 − Φ(20) =25 × 10−90. Comparando o resultado obtido com a solucao exata, vemos que, neste caso, oTeorema do Limite Central e uma excelente aproximacao.

Se usarmos a desigualdade de Chebyshev, podemos afirmar:

P (|Sn −E[X ]| ≥ x) ≤ σ2X

nx2

P (|nSn − nE[X ]| ≥ nx) = P (|Y − 500.000| ≥ 106x)

Fazendo 106x = 10.000, obtemos x = 0.01. Entao:

P (|Y − 500.000| ≥ 10.000) ≤ σ2X

10610−4= 0, 25× 10−2, e entao

P (Y − 500.000 ≥ 10.000) ≤ 12, 5× 10−4

Se aproximarmos o valor da probabilidade pelo limite superior dado por Chebyshev verifi-camos que teremos uma resposta extremamente incorreta, pois o limite de Chebyshev paraeste caso e muito frouxo.

Problema: Em um jogo de dados um jogador pode ganhar 6 ou perder 1, ou 2, ou 3.Todas as probabilidades sao igualmente provaveis. Quantas vezes o jogador deve jogar paramanter a sua perda ou ganho medio por jogada menor do que 2 com probabilidade de pelomenos 0,95?

Seja Xi o ganho ou perda de uma jogada. Entao, E[Xi] = 0 e V (Xi) = E[X2] = 50/4.

(a) Aproximando por Chebyshev

P

(

| 1n

Xi| ≥ ǫ

)

≤ σ2

nǫ2

1− P

(

| 1n

Xi| < ǫ

)

≤ σ2

nǫ2

P

(

| 1n

Xi| < ǫ

)

≥ 1− σ2

nǫ2= 0, 95

112

Page 113: Apostila - Aguiar

Fazendo ǫ = 2, obtemos n ≥ 63.

(b) Pelo teorema do Limite Central

P

(

1√n

n∑

i=1

Xi

σ≤ x0

)

= Φ(x0)

P

(

1

n

n∑

i=1

Xi ≤σx0√n

)

= Φ(x0)

P

(

−2 ≤ 1

n

n∑

i=1

Xi ≤ 2

)

= 0, 95 = Φ(x0)− Φ(−x0)

Lembrando que a distribuicao Normal e simetrica em relacao a origem, para determi-narmos x0 procuramos na tabela da distribuicao Normal Φ(x0) = P (X ≤ x0) = 0, 975, eobtemos

x0 = 1, 96

σx0√n

= 2, n =σ2 × 1, 962

4=

50

4× 1, 962

4= 12

O valor n = 12 nao e suficientemente grande para justificar o uso do Teorema do LimiteCentral. Devemos pois assumir que a resposta da aproximacao de Chebyshev deva ser amais adequada.

16.4 Aproximando Distribuicoes

Uma variavel Poisson Y com parametro λ pode ser vista como a soma de n variaveis PoissonXi, com λi = λ/n.

Y =∑n

i=1Xi, com E[X ] = λi = λ/n = V (X).

Pelo teorema do Limite Central:

Z =Y − E[Y ]

σY

=Y − λ√

λ= N(0, 1)

P (Z ≤ z) = Φ(z)

P (Y ≤ k) = P

(

Z ≤ k − λ√λ

)

= Φ

(

k − λ√λ

)

Para efeito de aproximacao, como Poisson e uma variavel discreta e Φ e contınua, usa-seuma correcao de continuidade e adota-se :

113

Page 114: Apostila - Aguiar

P (Y ≤ k) = Φ(

k+1/2−λ√λ

)

Esta aproximacao melhora com aumento de λ.

16.5 Percentil

Definicao: F−1X (p) = min{t : FX(t) ≥ p}, 0 < p < 1 = t0 e chamado 100p%-percentil.

O 50%-percentil e chamado mediana. Se tomarmos o grafico da pdf, a area a esquerda do100p%-percentil vale p.

16.6 Estimadores

Inferencia Estatıstica: concluir certas propriedades de uma variavel aleatoria a partir de umconjunto de observacoes randomicas.

{X1, X2, · · · , Xn} e o conjunto de n observacoes (ou amostras) independentes da v.a. X ,que tem media u, variancia σ2 e pdf f(x).

16.6.1 Estimando a Media

µ = 1n

∑ni=1Xi e uma variavel aleatoria denominada media das amostras (ou sample mean).

µ e um estimador de µ.

Propriedades dos Estimadores

• Nao tendencioso

E[µ] = 1n

∑ni=1E[Xi] = E[Xi] = µ

Quando a media do estimador e igual ao valor estimado, entao o estimador e dito naotendencioso ou unbiased.

• Consistente

V (µ) = V

(

1

n

n∑

i=1

Xi

)

=1

n2V

(

n∑

i=1

Xi

)

=1

n2

n∑

i=1

V (Xi)

=nσ2

n2=

σ2

n

V (µ) = σ2

n→ 0 com n→∞

Interpretacao: com o aumento do numero de observacoes, a media das amostras tendepara a media da distribuicao com variancia zero. Esta propriedade e chamada con-sistencia.

114

Page 115: Apostila - Aguiar

16.6.2 Estimando a Variancia

Assuma o seguinte estimador da variancia σ2 = 1n

∑ni=1(Xi − µ)2.

Vamos verificar se este estimador e nao tendencioso.

E[σ2] =1

n

n∑

i=1

E[(Xi − µ)2]

=1

n

n∑

i=1

E[(X2i − 2Xiµ) + µ2]

=1

n

n∑

i=1

{E[X2i ]− 2E[Xiµ] + E[µ2]}

Da definicao de µ = 1n

∑ni=1Xi podemos dizer que V (µ) =

σ2X

ne entao E[µ2] =

σ2X

n+

(E[µ])2 = σ2

n+ µ2.

Vamos calcular E[Xiµ].

E [Xiµ] = E

[

Xi

Xj

n

]

=1

nE

[

X2i +

n∑

j=1,j 6=i

XiXj

]

=1

n

[

σ2 + µ2 + (n− 1)µ2]

Substituindo os valores calculados na expressao de E[

σ2]

:

E[

σ2]

= σ2(1− 2/n+ 1/n) + µ2(1− 2 + 1) =n− 1

nσ2

Conclusao: o estimador e tendencioso!

Para evitar tendencia, usamos σ2 = 1n−1

∑ni=1(Xi − µ)2.

Mostra-se que:

E[

σ2]

= σ2, nao tendencioso

V (σ2) → 0 com n→∞, consistente

σ2 e chamada variancia das amostras (sample variance). σ e o desvio padrao da media dasamostras, tambem conhecido como erro padrao.

Pode-se mostrar que a funcao µ−µσ/

√ne N(0, 1).

Pode-se tambem mostrar que a funcao µ−µσ/

√ntem distribuicao t-Student com (n−1) graus

de liberdade. A distribuicao t-Student com n graus de liberdade tem media µ = 0 e varianciaσ2 = n

n−2e e aproximadamente N(0, 1) para n ≥ 25. Seu 100p%-percentil, para p > 0, 5,

e maior que o da distribuicao Normal, mas se aproxima deste com o aumento dos graus deliberdade.

115

Page 116: Apostila - Aguiar

Com efeito, seja tα;n o 100α%-percentil da distribuicao t-Student. Entao a area a esquerdade tα;n no grafico da pdf vale α. Para a distribuicao Normal o 99,95%-percentil vale z99,95% =3, 29. Para a distribuicao t-Student temos:

n (graus de liberdade) t99,95%;n

25 3,72560 3,460120 3,373∞ 3,291

16.7 Intervalo de Confianca

Definicao: Sejam {X1, X2, · · · , Xn} amostras independentes de uma populacao com pdff(x, θ), onde θ e um parametro desconhecido (pode ser a media, a variancia, o n-esimomomento, etc).

(L(α), U(α)) e um intervalo de confianca (IC) de 100(1− α)% para o parametro θ se

P{L(α) ≤ θ ≤ U(α)} ≥ 1− α, 0 < α < 1

Assim, o intervalo de confianca de 95% e obtido com α = 0, 05 e P (L(α), U(α)) ≥ 0, 95.Em outras palavras, se 100 intervalos sao construıdos, 100(1−α)% deles contera o valor realθ.

O intervalo de confianca de 90% e obtido com α = 0, 1, enquanto o intervalo de confiancade 99% e obtido com α = 0, 01. Os intervalos de confianca de 95% e 90% sao os de uso maiscomum.

16.7.1 Intervalo de Confianca para a Media de uma Populacao com VarianciaDesconhecida

Nesta situacao, sejam {X1, X2, · · · , Xn} amostras independentes de um parametro X , quetem media verdadeira E[X ] = µ. Queremos calcular o intervalo de confianca para µ, quesera um intervalo em torno da media das amostras µ. Observe que o parametro X podeser uma grandeza qualquer como o numero medio de fregueses no sistema ou a varianciamedia do tempo de espera na fila. O essencial e que tenhamos n amostras independentes doparametro a ser avaliado.

Tomando como exemplo o tempo medio de espera em uma fila, as amostras teriam que serobtidas selecionando fregueses aleatoriamente de modo a nao ter correlacao entre as medidase garantir a total independencia entre as amostras.

Quando as amostras sao obtidas por simulacao, obter o tempo medio de espera em filaa cada fregues e considerar estes tempos como amostras independentes do tempo medio deespera em fila nao satisfaz, pois fregueses servidos proximos terao alta correlacao entre suas

116

Page 117: Apostila - Aguiar

medidas. Isto pode levar intervalos de confianca sub-dimensionados, pois o estimador davariancia das amostras sera menor do que deveria ser.

A forma correta de obter as amostras e coletar a media das amostras dos tempos dosfregueses a cada rodada da simulacao e considerar esta media amostral por rodada como umaamostra independente do tempo medio de espera na fila. Para que tenhamos n amostras, nrodadas da simulacao tem que ser feitas. Simulacao sera o objeto do proximo capıtulo.

Seja tx;n o 100x-esimo percentil da distribuicao t-Student com n graus de liberdade.

Da definicao de percentil, podemos afirmar que:

P

(

tα/2;n−1 ≤µ− µ

σ/√n≤ t1−α/2;n−1

)

= 1− α

A distribuicao t-Student e simetrica em relacao a origem e entao

tα/2;n−1 = −t1−α/2;n−1.

Consequentemente,

P

(

µ− t1−α/2;n−1.σ√n≤ µ ≤ µ+ t1−α/2;n−1.

σ√n

)

= 1− α

Dado (1 − α), obtemos t1−α/2;n−1 da tabela da distribuicao t-Student. O intervalo deconfianca de 100(1− α)% e simetrico em torno de µ, com largura total de 2t1−α/2;n−1σ/

√n.

Em geral, intervalos de confianca de 90% ou 95% sao os mais utilizados utilizados.

Para valores de n ≥ 30, o percentil t1−α/2;n−1 tende para valores assintoticos, que sao ospercentis z1−α/2 da Normal unitaria. Veja a tabela de valores assintoticos:

1− α 100(1− α/2)%− percentil0,90 t0,95 ≈ z0,95 = 1, 6450,95 t0,975 ≈ z0,975 = 1, 9600,99 t0,995 ≈ z0,995 = 2, 576

Intervalos de confianca com coeficientes de confianca maiores tem multiplicadores maiores.

A precisao do intervalo de confianca e de p por cento quando o tamanho do intervalo e2pµ/100, implicando em p = 100.t1−α/2;n−1.

σµ√n.

*

Exemplo: Suponha que 4 medidas da largura de um terreno dao media µ = 585, 145 m eσ2 = 0, 010 m2. Qual o intervalo de confianca de 99%?

Para 1− α = 0, 99, t1−α/2;n−1 = t0,995;3 = 5, 841.

Entao: U = µ+ 5, 841× 0, 05 e L = µ− 5, 841× 0, 05. A largura do intervalo e 0,584 m,com uma precisao de 0,05%.

117

Page 118: Apostila - Aguiar

16.7.2 Intervalo de Confianca para a Media de uma Populacao com VarianciaConhecida

Se a variancia e conhecida, usando o Teorema do Limite Central e considerando zx como o100x%-percentil da distribuicao Normal unitaria, pode-se afirmar que:

P

(

zα/2 ≤µ− µ

σ/√n≤ z1−α/2

)

= 1− α

e o intervalo de confianca para a media sera dado por

P(

µ− z1−α/2σ/√n ≤ µ ≤ µ+ z1−α/2σ/

√n)

= 1− α

A unica diferenca em relacao ao caso anterior e o uso do percentil da Normal unitaria nolugar do percentil da distribuicao t-Student.

16.7.3 Distribuicao χ2 (chi-square)

Seja {Xi} um conjunto de variaveis normais com media 0 e variancia σ2, isto e,Xi = N(0, σ2).

Entao, Y = X21 +X2

2 + · · ·+X2n tem pdf fY (y) =

(

12σ2

)n2 y

n−22

Γ(n2)e−

y

2σ2 .

Y e χ2 central com n graus de liberdade, para σ = 1.

*

Seja {Xi} um conjunto de amostras de X = N(µ, σ2).

Considere µ = 1n

∑ni=1Xi. µ e Normal com media E[µ] = µ e variancia V (µ) = σ2

n, isto e,

µ = N(

µ, σ2

n

)

.

Como Xi e uma amostra de X = N(µ, σ2), entao Xi−µσ

e N(0, 1) e, como explicitado acima,

Y =∑n

i=1

(

Xi−µσ

)2e χ2 com n graus de liberdade.

Pode-se mostrar que Z =∑n

i=1

(

Xi−µσ

)2e χ2 com (n− 1) graus de liberdade.

De fato, tomando σ2 = 1n−1

∑ni=1(Xi− µ)2, entao a variavel aleatoria (n−1)σ2

σ2 = 1σ2

∑ni=1(Xi−

µ)2 =∑n

i=1

(

Xi−µσ

)2tera uma distribuicao χ2 com (n− 1) graus de liberdade.

16.7.4 Intervalo de Confianca para a Variancia de uma Populacao Normal comMedia Desconhecida

O intervalo de confianca da media e o mais usado, pois estimar a media de uma grandezae em geral o objetivo. Todavia, pode-se querer ter o intervalo de confianca da variancia

118

Page 119: Apostila - Aguiar

desconhecida da populacao, lembrando que sempre partimos do conjunto de n observacoesindependentes {Xi} de uma variavel X , com E[X ] = µ e V (X) = σ2, valores desconhecidos.

Assuma que a variavel X e N(µ, σ2). Defina χ2ν;n−1 como sendo o ν-esimo percentil da

distribuicao χ2 com (n− 1) graus de liberdade. Entao,

P

(

(n− 1)σ2

σ2≤ χ2

ν;n−1

)

= ν

A expressao acima implica que

P

(

χ2α/2;n−1 ≤

(n− 1)σ2

σ2≤ χ2

1−α/2;n−1

)

= 1− α/2− α/2 = 1− α

P

(

(n− 1)σ2

χ21−α/2;n−1

≤ σ2 ≤ (n− 1)σ2

χ2α/2;n−1

)

= 1− α

Pela expressao acima, os limites inferior e superior do IC de 100(1−α)% para a variancia

sao, respectivamente, (n−1)σ2

χ21−α/2;n−1

= l1−α.σ2 e (n−1)σ2

χ2α/2;n−1

= u1−α.σ2.

O tamanho do intervalo de confianca para a variancia e dado por σ2.(n − 1).f1−α, com

f1−α =χ21−α/2;n−1

−χ2α/2;n−1

χ21−α/2;n−1

.χ2α/2;n−1

. O termo f1−α depende apenas dos percentis da distribuicao χ2

para um determinado grau de confianca.

A Tabela 1 mostra a variacao de f90% e f95% em funcao do numero de amostras. Osfatores u1−α e l1−α que multiplicados por σ2 determinam os limites inferior e superior parao intervalo sao tambem mostrados.

Como σ2 converge para a variancia, entao o tamanho do intervalo de confianca para avariancia do parametro X sera determinado pelo produto (n − 1)f1−α. Da Tabela 1, paran− 1 = 100, pode-se ver que o tamanho do intervalo de confianca de 90% da variancia serade 0,4790 σ2, ou seja, tera uma precisao de 23,95%, enquanto o intervalo de confianca de95% da variancia tera uma precisao de 28,77% apenas. Para obter precisoes com valoresmenores e preciso usar valores maiores de n. Interessante observar que a relacao entre ostamanhos dos intervalos de confianca de 95% e 90% e aproximadamente de 1,19, assintotico.

Pode-se ver tambem que o estimador da variancia esta sempre dentro do intervalo e oaumento de n leva a aproximacao entre os limites inferior e superior.

Para exemplificar o uso deste intervalo de confianca para a variancia, vamos supor queestamos querendo estimar a variancia do tempo medio de espera W numa fila. Para aplicaro intervalo de confianca da variancia como mostrado acima, a cada rodada e calculadoWi =

1k

∑kj=1Wij , o atraso medio estimado na i-esima rodada sobre k fregueses por rodada.

Se os atrasosWij fossem independentes, Wi convergiria para a NormalN(E[W ], V (W )/k),onde k e o numero de amostras na rodada. Todavia, cabe aqui ressaltar que os valores de Wij

nao sao independentes e possuem alta correlacao. Se um fregues teve um tempo de esperaem fila alto, o fregues seguinte acaba tendo um tempo alto tambem, com forte correlacao.Para podermos assumir o comportamento da Normal e preciso que k seja bem grande.

119

Page 120: Apostila - Aguiar

(n − 1) 30 40 50 60 70 80 90 100

(n− 1).f90% 0,9369 0,7915 0,6976 0,6306 0,5797 0,5394 0,5065 0,4790(n− 1).f95% 1,1481 0,9631 0,8452 0,7618 0,6990 0,6495 0,6091 0,5755

f95%/f90% 1,2255 1,2167 1,2116 1,2082 1,2058 1,2040 1,2026 1,2015

l90% 0,6854 0,7174 0,7407 0,7587 0,7732 0,7853 0,7954 0,8042u90% 1,6222 1,5089 1,4383 1,3893 1,3529 1,3247 1,3020 1,2832

l95% 0,6386 0,6741 0,7001 0,7203 0,7367 0,7503 0,7618 0,7718u95% 1,7867 1,6371 1,5452 1,4822 1,4357 1,3998 1,3710 1,3473

(n − 1) 200 300 400 500 1000 2000 3000 4000

(n− 1).f90% 0,3338 0,2712 0,2343 0,2093 0,1476 0,1042 0,0850 0,0736(n− 1).f95% 0,3994 0,3241 0,2798 0,2498 0,1760 0,1242 0,1013 0,0877

f95%/f90% 1,1965 1,1948 1,1940 1,1935 1,1926 1,1921 1,1919 1,1918

l90% 0,8547 0,8788 0,8936 0,9040 0,9305 0,9501 0,9589 0,9643u90% 1,1885 1,1500 1,1279 1,1132 1,0781 1,0542 1,0439 1,0379

l95% 0.8297 0,8575 0,8747 0,8868 0,9178 0,9408 0,9513 0,9576u95% 1,2290 1,1815 1,1545 1,1365 1,0938 1,0650 1,0526 1,0453

Tabela 1 - Percentis para calculo do IC da variancia

Obtido o conjunto {Wi} de amostras independentes do atraso W , o intervalo de confiancaestara definido em funcao do estimador da variancia σ2 = 1

n−1

∑ni=1(Wi− µ)2 como definido

acima.

Como σ2 = V (W )/k, pode-se escrever P

(

k(n−1)σ2

χ21−α/2;n−1

≤ V (W ) ≤ k(n−1)σ2

χ2α/2;n−1

)

= 1−α, que e

o intervalo com (1− α)% de confianca para V (W ).

Pode-se ver que um aumento de k levara a uma convergencia dos valores dos Wi, comconsequente diminuicao da variancia destas amostras σ2.

Para o mesmo exemplo, um segundo procedimento seria partir da estimativa da variancia

do tempo de espera em cada rodada Vi = σ2i = 1

k−1

∑kj=1

(

Wij − 1k

∑kj=1Wij

)2

e plotar

o intervalo de confianca da media para o conjunto {Vi}. Aqui a variancia e consideradadiretamente como o parametro de interesse. Tambem aqui a variancia estimada por rodadapode ser muito imprecisa se o valor de k for pequeno, devido a correlacao de medidas dentroda propria rodada.

16.7.5 Intervalos Parciais de Confianca

Quando se calcula um intervalo de confianca de 100(1 − α)%, ha 100α/2 de probabilidadede que o parametro µ sera menor do que o limite inferior e igual probabilidade de que o

120

Page 121: Apostila - Aguiar

parametro sera maior que o limite superior. Assumindo simetria nas caldas da pdf, temos:

P{L(α) ≤ µ ≤ U(α)} = 1− α→ P{µ < L(α)} = P{µ > U(α)} = α/2

Ou

P{µ ≥ L(α)} = P{µ ≤ U(α)} = 1− α/2

Para se testar se a media e maior do que um determinado valor com 90% de cer-teza, entao queremos 1 − α/2 = 0, 90 e o intervalo parcial de confianca sera dado por(µ− t90%;n−1σ/

√n,∞) e por construcao teremos P{µ > L(α)} = 1 − α/2 = 0, 90, que e o

que queremos determinar.

Exemplo: Uma empresa mantem um portfolio de possıveis interessados em determinadavaga tecnica. Sabe-se que a media de idade considerando todos os inumeros candidatos ede 30 anos com desvio padrao de 10 anos. Quantos candidatos devem ser aleatoriamentechamados para que a idade media dos chamados seja de pelo menos 28 anos com 99% decerteza?

A solucao do problema e obtida com o intervalo parcial de confianca, pois se quer P{µ ≥L(α)} = 1− α/2 = 0, 99, e o limite inferior deve ser de pelo menos 28 anos.

No calculo do intervalo de confianca, como estaremos usando a variancia da populacaopara formar a variavel Zn = µ−µ

σ/√ne assumir o comportamento de uma N(0, 1), o percentil da

Normal unitaria devera ser usado no lugar do percentil da t-Student. Espera-se que o valorde n seja grande o suficiente para que a aproximacao do comportamento de Zn seja boa.

Obtendo o percentil de 99% da distribuicao Normal, z0,99 = 2, 33, temos que o limiteinferior do intervalo parcial sera dado por µ− z0,99.σ/

√n, ou seja, devemos ter z0,99.σ/

√n ≤

(µ− 28) = 2, implicando em n = ⌈(z0,99.σ/2)2⌉ = ⌈(2, 33.10/2)2⌉ = ⌈(11, 65)2⌉ = ⌈135, 72⌉.

A resposta, entao sera 136 pessoas.

16.7.6 Intervalo de Confianca para Proporcoes

Sejam dadas n observacoes de uma populacao. Assuma que n1 destas observacoes indicamtipo 1. A fracao da populacao que e do tipo 1 pode ser estimada como a proporcao p = n1

n.

O intervalo de confianca para a proporcao precisa ser construıdo para sabermos com queprecisao estamos avaliando a proporcao.

O intervalo de confianca de 100(1 − α)% sera dado por

[

p± z1−α/2

p(1−p)n

]

= [p± r],

onde r e a precisao.

Demonstraremos, a seguir, a obtencao deste intervalo de confianca para a proporcao.

121

Page 122: Apostila - Aguiar

Cada observacao Xi pode ser considerada como uma variavel de Bernoulli.

P (Xi do tipo 1) = P (Xi = 1) = p

P (Xi diferente do tipo 1) = P (Xi = 0) = 1− p

E[Xi] = p, E[X2i ] = p, V (Xi) = p(1− p)

O estimador da proporcao e dado por

Sn =1

n

n∑

i=1

Xi, E[Sn] = E[Xi] = p, V (Sn) =V (Xi)

n=

p(1− p)

n

Para n >> 1, Zn = Sn−E[Sn]σSn

tende para N(0,1).

Tomando zx como o 100x%-percentil da distribuicao Normal unitaria, temos:

P(

zα/2 ≤ Zn ≤ z1−α/2

)

= 1− α

P

(

−z1−α/2 ≤Sn − E[Sn]

σSn

≤ z1−α/2

)

= 1− α

P

−z1−α/2 ≤Sn − p√

p(1−p)n

≤ z1−α/2

= 1− α

P

(

p− z1−α/2

p(1− p)

n≤ Sn ≤ p+ z1−α/2

p(1− p)

n

)

= 1− α

Como n e finito, para que o intervalo de confianca possa ser considerado valido e necessarioter np ≥ 10.

Exemplo: Se 10 dentre 1000 paginas sao impressas com erro, a proporcao de paginas comerro e de p = 0, 01. Como np = 10, pode-se apresentar o IC para a proporcao e o resultado

sera[

0, 01± z√

0,01.0,991000

]

= [0, 01± 0, 003z]. Para confianca de 90% obtemos [0, 5%, 1, 5%] e

para 95% de confianca obtemos [0, 4%, 1, 6%].

Podemos entao afirmar com 90% de confianca que 0,5% a 1,5% das paginas terao erro.

Exemplo: Uma impressora apresenta erro com 1/10.000 de probabilidade. Quantaspaginas devem ser observadas para se obter uma precisao de 1 em 1.000.000 com 95% deconfianca?

[p± r] =

[

p± z√

p(1−p)n

]

, r = z√

p(1−p)n

, n = p(1−p)z2

r2

Usando p = 10−4 (1 em 104), r = 10−6 (1 em 106) e z = 1, 96 (z1−α/2 = z0,975, com

α = 0, 05 para obter 95% de confianca) obtemos n = (1,96)210−4(1−10−4)(10−6)2

= 384.160.000.

122

Page 123: Apostila - Aguiar

16.7.7 Comparacao de Alternativas

Caso duas alternativas para um sistema estejam disponıveis e seja preciso buscar qual dasalternativas e a melhor, pode-se recorrer aos intervalos de confianca.

Se as alternativas A e B podem ser testadas em n condicoes diferentes do sistema, massempre as duas no mesmo cenario de cada vez, possibilitando a obtencao de n pares deresultados (XAi, XBi), pode-se formar o conjunto {Di = XAi −XBi} e obter o intervalo deconfianca da media da diferenca (com centro em D), com a confianca desejada.

Se o intervalo de confianca obtido contiver o valor ZERO, entao nada se pode concluirsobre qual alternativa e a melhor. Caso o intervalo de confianca nao contenha o valor ZERO,entao se D > 0, e o intervalo de confianca esta acima do ZERO, a alternativa A e consideradaa melhor, assumindo o interesse em maximizar o resultado. Caso contrario, quando o IC ficaabaixo de ZERO, a alternativa B e considerada a melhor. Caso o interesse seja em minimizaro resultado, a decisao fica invertida.

Quando as alternativas sao testadas separadamente, em condicoes diferentes, e apenas oIC de cada uma delas esta disponıvel como resultado final de avaliacao, pode-se comparar aposicao dos intervalos de confianca em relacao a sobreposicao completa ou parcial. Sobre-posicao completa ocorre quando o centro de cada intervalo esta contido no outro intervalo.Sobreposicao parcial ocorre quando os intervalos se sobrepoem, mas o centro de cada um dosintervalos nao esta contido no outro IC. Se apenas um dos centros estiver contido no outroIC, entao temos uma situacao intermediaria entre sobreposicao completa e parcial.

Quando nao houver sobreposicao ou quando houver apenas a sobreposicao parcial, amelhor alternativa sera aquela que apresentar a media maior, se o interesse e em maximizar.Se o interesse for em minimizar, a alternativa com menor media sera a escolhida.

Todavia, no caso de sobreposicao completa ou intermediaria entre parcial e completa, naoha apontar uma alternativa claramente vencedora e o teste-t deve ser conduzido. O teste-ttambem deve ser utilizado quando o numero de observacoes de cada uma das alternativasnao for o mesmo.

Teste-t

Assuma amostras XiA e XjB das alternativas A e B com tamanhos diferentes nA e nB.Nao ha correspondencia entre as amostras e uma diferenca simples nao pode ser obtida. Oprocedimento envolve estimar a variancia da diferenca e o numero equivalente de graus deliberdade.

1. Calcule a media das amostras: XA = 1nA

∑nA

i=1XAi, XB = 1nB

∑nB

j=1XBj

2. Calcule a variancia das amostras: σ2A =

(∑nA

i=1 X2Ai)−nA(XA)

2

nA−1

σ2B =

(∑nB

i=1 X2Bi)−nB(XB)

2

nB−1

3. Calcule a diferenca das medias: XA − XB

123

Page 124: Apostila - Aguiar

4. Calcule o desvio padrao da media da diferenca: σ2 = σA2

nA+ σB

2

nB

5. Calcule o numero efetivo de graus de liberdade: ν = (σ2)2

1nA+1

(

σ2A

nA

)2

+ 1nB+1

(

σ2B

nB

)2 − 2

6. Calcule o intervalo de confianca para a media da diferenca:(

XA − XB

)

± t1−α/2;ν .σ

7. Se o intervalo de confianca contiver o valor ZERO, a diferenca entre as alternativas Ae B nao e significativa com confianca de 100(1− α)%. Se o intervalo de confianca naocontiver o valor ZERO, entao o sinal da diferenca indicara o procedimento melhor.

124

Page 125: Apostila - Aguiar

17 Simulacao

17.1 Geracao de Numeros (Pseudo) Aleatorios

Um gerador de numeros pseudo-aleatorios e um algoritmo que produz uma sequencia denumeros (que se repetem num determinado ciclo - daı a denominacao de pseudo) e seguemuma determinada distribuicao de probabilidade e possuem a aparencia de aleatoriedade.

Referencias: Capıtulo 3 do Knuth (1969), Capıtulo 6 do Kennedy & Gentle (1980), livrodo Ahrens e Dieter (1973).

Metodo basico para a geracao de numeros com distribuicao uniforme.: Geradores Con-gruenciais Lineares de Lehmer.

Gerador Misto: Zn = (bZn−1 + c)MOD(m), n ≥ 1.b e o multiplicador; m e o modulo; c e o incremento. Z0 e a semente inicial (seed). Obtem-

se numeros uniformemente distribuıdos no intervalo (0, 1) fazendo Un = Zn

m. O perıodo do

gerador e o intervalo ate a repeticao da sequencia de numeros.

Exemplo:c = 0 b = 9 X0 = 1Passo Zn−1 bZn−1 modulo m = 64

1 1 9 92 9 81 173 17 153 254 25 225 335 33 297 416 41 368 497 49 441 578 57 513 19 1 9 9...

......

...

No exemplo acima o perıodo e 8.

O perıodo depende da escolha de m, b e c, e independe da escolha de Z0. O objetivo eser o mais longo possıvel.

Perıodo maximo possıvel = m.

Para m primo, a escolha conveniente de b produz perıodo de m− 1.

Exemplo: Gerador do Sistema /360

Palavra de 32 bits, com um bit de sinal. m = 231 − 1, (maior inteiro, primo).

0chap17.tex 25/07/2013

125

Page 126: Apostila - Aguiar

Zn = (75Zn−1)MOD(231 − 1) ou seja Zn = (16807Zn−1)MOD (2147483647).

Este gerador foi usado em varios pacotes:

• IMSL - International Mathematics and Statistics Library

• IBM SL/MATH (versao IBM de APL)

• IBM SIMPL/1

• IBM Fortran subrotina GGL

Outros multiplicadores sao usados: SIMSCRIPTII =⇒ 630360016.

Eficiencia: tempo para gerar o numero aleatorio e depende da escolha de m e b.

Testes estatısticos mostraram algumas deficiencias neste gerador. Para aprimora-lo foimontada uma tabela intermediaria com 128 valores, que e inicializada a partir de umasemente arbitraria. Os 7 bits menos significativos do numero aleatorio gerado sao usadospara indexar a tabela. O valor lido e a nova amostra aleatoria e a amostra anterior, usadapara a indexacao, e escrita na posicao do valor lido. Assim se garante uma aleatoriedademaior na geracao dos numeros.

Graficamente:

** desenho do procedimento a incluir futuramente **

Programacao do Algoritmo

Obter Z = (A*Z) MOD MEm Pascal: Z := TRUNC(A*Z - (TRUNC((A*Z)/M)*M))

CONST M = 2147483647;A = 16807.0;TYPE RANDINT = 1..2147483646;VAR Z: RADINT;TABLE: ARRAY[0..127] OF RADINT;I:INTEGER;FUNCTION RANDOM (VAR Z:RADINT) : REALBEGINZ:= TRUNC(A*Z)-(TRUNC((A*Z)/M)*M));RANDOM := TABLE[Z MOD 128 ]/M;TABLE[Z MOD 128] := ZEND; (*RANDOM*)

...

Z := 314159; (* VALOR ARBITRARIO *)FOR I:=0 TO 127 DO (* INICIALIZACAO DA TABELA *)

126

Page 127: Apostila - Aguiar

BEGINZ:= TRUNC(A*Z) -(TRUNC((A*Z)/M)*M));TABLE [I] := ZEND;

17.2 Simulacao de M/M/1

desenho da fila M/M/1 (a incluir)

Processo de chegadas Poisson com taxa λ, implicando que o tempo entre chegadas temPDF A(t) = 1− e−λt, t ≥ 0 e pdf a(t) = λe−λt, t ≥ 0.

O servico e exponencial com PDF B(x) = 1− e−µx, x ≥ 0 e pdf b(x) = µe−µx, x ≥ 0.

Eventos basicos:

• Chegada de um novo fregues

• Termino de servico

Os eventos sao armazenados em ordem cronologica em uma lista com ponteiros. Oprimeiro evento desta lista deve ser o proximo evento a ser tratado pelo simulador. O tempode simulacao e entao avancado ate o tempo deste evento. Para uma determinada simulacaoteremos que ter uma unica lista de eventos, que comandara o avanco do tempo global desimulacao. Sistemas complexos de simulacao distribuıda podem permitir mais de uma listade eventos, existindo entretanto a necessidade de implementar mecanismos de sincronizacaoe regressao temporal, eventualmente.

+-----+------+-----+--------+

entrada da lista |tempo|evento|dados|ponteiro|

+-----+------+-----+--------+

Campo TEMPO: indica o instante de chegada do fregues a fila

Campo EVENTO: indica qual o tipo de evento

Campo DADOS: armazena quaisquer outras informacoes pertinentes ao fregues e ne-cessarias para o tratamento da lista de eventos. Uma prioridade associada ao fregues podeser uma informacao que tenha que ser mantida associada ao evento respectivo.

Em geral, dependendo do problema a ser simulado, e necessario associar variaveis deestado ou montar estruturas de dados especıficas para caracterizar parte do sistema. Assim,num sistema que envolva varias filas, a lista de eventos tem que ser unica para o simulador.As estruturas de dados de cada fila devem, no entanto, ser especıficas. A chegada de um

127

Page 128: Apostila - Aguiar

fregues e tratada na lista de eventos e a informacao pertinente ao fregues e armazenada emestrutura particular da fila ou sistema a que pertence o fregues neste momento da simulacao.Assim, ao se salvar o tempo de chegada do fregues a fila, poderemos calcular, quando estefregues entrar em servico, o tempo de espera em fila que ele sofreu.

Campo PONTEIRO: aponta para o proximo evento, em ordem cronologica.

+------+ +-----+------+-----+--------+

|inicio|------> |30,34|evento|dados| . |

+------+ +-----+------+-----+---|----+

+-------------------+

V

+-----+------+-----+--------+

|44,02|evento|dados| . |

+-----+------+-----+---|----+

+-------------------+

V

+-----+------+-----+--------+

|87,13|evento|dados| . |

+-----+------+-----+---|----+

+-----+ |

|final|----------->+

+-----+

As operacoes que teremos de fazer nesta lista sao de insercao e exclusao. Caso sejanecessario, pode-se implementar uma lista duplamente encadeada, para permitir percorrer alista a partir do inıcio ou do final. Algumas linguagens e pacotes de simulacao podem ofereceruma estrutura de lista de eventos ja pronta, em que as operacoes de insercao e exclusao saooperacoes basicas nesta estrutura lista. Estruturas ja prontas facilitam a criacao do simuladore diminuem a ocorrencia de erros. Entretanto, e necessario verificar a eficiencia da estruturae sua adequabilidade ao problema sendo tratado.

Quando um evento e tratado, procuramos realizar os passos abaixo:

• Gerar todos os eventos futuros provocados por este evento

Um evento pode gerar um ou mais eventos futuros. Dependendo do problema sendosimulado poderao ser gerados eventos simultaneos. O simulador deve garantir queeventos simultaneos possam ser tratados em qualquer ordem, sem que isso provoqueresultados diversos na simulacao.

Como ilustracao, ao se tratar o evento de uma chegada a uma fila M/M/1, aconselha-se, neste momento, gerar o evento Proxima Chegada usando-se uma amostra dadistribuicao do tempo entre chegadas. Seria um desperdıcio gerar todos os eventosde chegada de uma so vez. Isto criaria uma lista de eventos por demasiado longacom grande ineficiencia em sua manipulacao. Caso a disciplina da fila M/M/1 naoleve em conta nenhum aspecto relacionado ao tempo de servico do fregues, entao este

128

Page 129: Apostila - Aguiar

tempo de servico podera ser gerado apenas quando da entrada no servidor, evitando oarmazenamento de dados ociosos nas estruturas internas, com desperdıcio de memoria.

O termino de um servico deve implicar na verificacao de existencia de outros freguesespara serem servidos. O estado da fila deve ser verificado e caso haja um freguesdisponıvel, este deve ser colocado em servico, o que na simulacao correspondera aarmazenar este instante de entrada em servico na estrutura de dados do fregues einserir o evento Termino de Servico na lista de eventos, com o tempo calculado apartir da distribuicao de tempo de servico.

Em alguns casos, e necessario cancelar eventos. Por exemplo, em uma rede Ethernetum quadro pode ter sua transmissao iniciada e o evento Termino de Transmissaoinserido na lista de eventos. O tempo deste evento Termino de Transmissao de-pendera da taxa de transmissao do meio e do tamanho do quadro sendo transmitido.Entretanto, caso ocorra colisao com uma transmissao de outra estacao, o evento Fimde Transmissao previamente escalonado deve ser cancelado e gerado um novo eventoFim de Transmissao, que correspondera ao aborto de transmissao. Simultaneamentepodera ser escalonado um evento de inıcio de reforco de colisao, que seguira a trans-missao do quadro. Numa simulacao enxuta pode ser dispensavel o escalonamento doevento inıcio de reforco de colisao, se o estado colisao e salvo neste instante e perduraate o tratamento do evento final de transmissao de reforco de colisao. Como simuladortem controle sobre o que esta acontecendo, pode nao ser necessario diferenciar entreum final de transmissao de quadro e um final de transmissao de reforco de colisao,com a criacao de eventos distintos. Variaveis de estado podem caracterizar o estadodo sistema. A solucao a ser adotada dependera do problema a ser simulado.

Via de regra, aconselha-se implementar o programa de simulacao da forma a mais clarae estruturada possıvel, obter resultados que confirmem a exatidao da simulacao, e soentao partir para otimizacao de programacao, se isto for indispensavel.

• Colher todas as estatısticas relevantes para a simulacao

Ao final de um termino de servico pode ser importante obter o tempo de servico dofregues, se este nao tiver sido obtido anteriormente. Ao se considerar um novo freguespara ser servido, neste instante e aconselhavel obter o tempo de espera em fila destefregues que sera calculado como a diferenca entre o instante de chegada e o tempoatual da simulacao. Pode ser necessario tambem neste instante decrementar o numerono sistema (pela partida do fregues que acaba de terminar o servico) e o numero defregueses na fila de espera.

Se por exemplo estamos calculando a area do grafico Numero de Fregueses (N) versusTempo, os instantes de chegada e termino de servico sao os instantes relevantes paraprocedermos a acumulacao gradativa do produto N*intervalo de tempo, onde inter-valo de tempo corresponde a diferenca entre o instante do ultimo evento (chegada outermino) e o instante atual (evento de chegada ou termino). Observe que chegada outermino provocam alteracoes no numero de fregueses no sistema. Procedendo destaforma, quando tratarmos o ultimo fregues, ja teremos o computo final da area.

Numa fila M/M/1, o estado inicial trivial e a inicializacao do sistema com a fila vazia esem nenhum evento na lista de eventos. Programamos entao a chegada inicial, que sera o

129

Page 130: Apostila - Aguiar

primeiro evento da lista de eventos. A partir deste evento os outros eventos serao gerados.Claro que quando o evento da primeira chegada e tratado, imediatamente o fregues que chegasera colocado em servico, pois a fila esta vazia. Sera programada uma nova chegada e umtermino de servico, associado ao fregues que acaba de entrar no servidor. Se a nova chegadaocorrer antes do termino do servico, teremos a formacao de uma fila de espera. Apos tratarum evento completamente, o simulador sempre avanca o tempo de simulacao ate o instantedo evento cabeca da lista de eventos.

Este procedimento e o que chamamos de simulacao orientada a eventos discretos.Observe que o tempo de simulacao pode ser contınuo ou discreto. O tratamento e o mesmo.

17.3 Medidas de Desempenho

Geralmente em filas utilizamos as seguintes medidas de desempenho:

• Numero medio de pessoas no sistema

• Numero medio de pessoas na fila de espera

• Tempo medio no sistema

• Tempo medio na fila de espera

• Utilizacao: percentagem do tempo em que o servidor esta ocupado

• Throughput: numero de fregueses servidos por segundo

Queremos a distribuicao do numero de clientes no sistema. Achar a distribuicao gastamemoria e normalmente nao e necessaria.

Questao: Como obter o tamanho medio da fila em cada estacao?

Resposta: Nosso ponto de partida e o grafico do Numero de Pessoas versus Tempo.

Numero medio no sistema: areatempo total

.

O grafico sofre transicao nas chegadas e partidas do sistema. O calculo da area pode serfeito cumulativamente assim que um novo pacote e gerado ou uma partida ocorre. Vamosconsiderar uma sequencia de qualquer um destes eventos.

Se N(ti) e o numero no sistema imediatamente antes da ocorrencia do i-esimo evento noinstante ti e N(ti+1) e o numero no sistema imediatamente antes da ocorrencia do i+1-esimoevento no instante ti+1, entao podemos calcular a area da seguinte forma:

area = area + (ti+1 − ti)Ni+1

Como calcular o tempo medio no sistema T ?

130

Page 131: Apostila - Aguiar

Pode ser feito diretamente, computando a cada termino de servico o tempo gasto nosistema por um fregues, subtraindo o instante do termino do servico do instante de chegadaao sistema.

Uma forma alternativa de computar T e usar o resultado de Little:

N = λT =numero de fregueses servidos

tempo total× T =

area

tempo total

T =area

numero de fregueses servidos

17.4 Calculo das Estatısticas

O procedimento mais usual e colher as estatısticas e tentar obter os resultados cumulati-vamente ao longo do tratamento de cada evento. Os resultados medios por simulacao saoentao salvos e usados conjuntamente com os resultados de outras rodadas de simulacao paraeventualmente obter os intervalos de confianca das varias medidas de interesse.

Uma outra forma de trabalhar e formar um log com informacoes dos fregueses por cadafila, como por exemplo: instante de chegada, tempo na fila de espera, duracao do servico,etc. Apos o fim da simulacao roda-se o programa de estatıstica.

Guardar log do comportamento do sistema individualmente por fregues e por fila e dis-pendioso, mas pode ser interessante caso se queira fazer uma animacao do sistema com oresultado da simulacao. Nestes casos, a estrutura do log deve ser otimizada para este objetivoespecıfico.

17.5 Depuracao do Modelo Simulado

Um dos problemas usuais de simulacao e saber se o programa de simulacao esta fiel aocomportamento que se quer simular. Normalmente introduzimos erros conceituais ou deprogramacao, fazendo com que a simulacao apresente erros grosseiros ou nao. Erros podempassar desapercebidos e causar resultados inverıdicos.

Se certas condicoes da simulacao gerarem resultados que possam ser aferidos por ummodelo analıtico ou por medidas experimentais, esta e uma forma de atestar a exatidao dasimulacao e validar seus resultados.

Um procedimento recomendado e testar o simulador em condicoes bem especıficas e quegerem comportamentos conhecidos. Assim num sistema de filas pode-se exercitar o sistemacom taxas muito baixas de modo que o tempo de espera em filas seja nulo e o tempo totalgasto na fila seja o tempo de servico. Nestas condicoes pode-se avaliar os resultados obtidosmais facilmente. Entretanto, nada pode ser garantido ja que um teste exaustivo do sistemanormalmente nao e possıvel.

Para se avaliar a correcao do simulador e recomendado roda-lo por um numero pequenode eventos e incluir pontos de depuracao com impressao de resultados intermediarios que

131

Page 132: Apostila - Aguiar

possam ser usados para aferir a correcao do sistema. Quando o sistema estiver depurado,estes pontos podem ser comentados ou retirados.

17.6 Metodo de Analise de Resultado

Um princıpio basico em simulacao e que todas as medidas devem ser feitas com o sistemaem equilıbrio. Um dos problemas principais em simulacao e avaliar a fase transiente, quandoo sistema ainda nao entrou em equilıbrio.

O tempo para o sistema entrar em equilıbrio depende do estado inicial do sistema. Assimse uma fila estiver em equilıbrio operando com uma utilizacao de 80%, entao se iniciamosesta fila completamente vazia, teremos que esperar um numero de chegadas razoavel, antesde iniciarmos a coleta das estatısticas. Se a fila e inicializada com um numero de pessoasja proximo ao do equilıbrio, certamente o equilıbrio sera alcancado apos um numero bemmenor de chegadas.

Para um sistema simples pode ser facil identificar as condicoes de equilıbrio. Para umsistema mais complexo, esta identificacao pode nao ser tao imediata. Um procedimentopratico e rodar a simulacao uma vez por um longo tempo para se ter uma ideia dos va-lores em equilıbrio. Entao, pode-se empiricamente desprezar um numero de chegadas quecaracterizam a fase transiente e, rodando por um tempo mais curto, verificar se o resultadoesta proximo. Apos algumas tentativas pode-se estabelecer uma certa estimativa da fasetransiente.

Vamos assumir que a cada i-esima rodada (seja pelo metodo batch ou replicativo), 1 ≤1 ≤ n, um numero fixo k de coletas e usado para estimar a media da rodada. Estas coletassao com o sistema sempre em equilıbrio, apos termino da fase transiente. Os passos paraobter o intervalo de confianca sao:

1. Calcule a media da rodada: Xi =1k

∑kj=1Xij e forme o conjunto das amostras {Xi}.

2. Calcule a media das amostras: µ = 1n

∑ni=1Xi

3. Calcule a variancia das medias das rodadas: σ2 = 1n−1

∑ni=1(Xi − µ)2

A partir destes valores pode-se calcular o intervalo de confianca da media estimada.

Vamos comentar tres metodos para obtencao de resultados.

• Batch

As medidas sao tomadas apos certo intervalo de tempo. A simulacao continua poroutro perıodo de tempo e novas medidas sao tomadas. Nao se reinicia a simulacao,logo independencia entre medidas nao e total. Como o sistema geralmente ja esta emequilıbrio apos cada medida, nao ha a necessidade de se desprezar a fase transiente.Na pratica nao ha problema com a dependencia entre as medidas, se o tamanho dasrodadas for grande o suficiente.

132

Page 133: Apostila - Aguiar

Para se saber se o valor de k do tamanho da rodada escolhido e adequado, pode-secalcular a covariancia entre rodadas sucessivas:

Cov(Xi, Xi+1) =1

n−2

∑n−1i=1 (Xi − µ)(Xi+1 − µ)

Este valor e tambem chamado de autocovariancia.

Repete-se o procedimento de calculo da autocovariancia com k crescente, ate que aautocovariancia seja pequena em relacao a variancia. Um procedimento que pode seradotado e dobrar o valor de k ao inves de incremento lineares.

Vale lembrar que o custo da simulacao sera funcao do produto kn, somado ao numero deeventos descartados da fase transiente. Como neste caso so temos uma fase transiente,este metodo e o mais eficiente neste particular.

• Replicacao

Neste caso reinicializa-se a simulacao com novas sementes a cada medida. Deve-se tercuidado com a estimativa da fase transiente e ter sementes bastante distantes umas dasoutras para se evitar qualquer dependencia estocastica entre as medidas. O desperdıciocausado pela fase transiente e multiplicado pelo numero de rodadas.

• Regenerativo

Procura-se iniciar a simulacao num estado que se repetira no futuro e pode caracterizarum novo perıodo estatisticamente igual ao anterior.

O problema e encontrar um estado regenerativo que se repita com frequencia. Seo tempo entre ocorrencias do estado regenerativo for curto, podem ocorrer grandesvariacoes entre as medidas efetuadas para cada perıodo regenerativo, e teremos queusar varios perıodos para se conseguir intervalos de confianca aceitaveis. Em sistemascomplexos a determinacao do estado regenerativo pode ser difıcil e de custo elevado,pois teremos que estar testando o estado do sistema constantemente.

O custo da simulacao sera funcao do produto kn, somado ao numero de eventos descar-tados das fases transientes. O intervalo de confianca sera inversamente proporcional a

√kn,

para rodadas com boa qualidade. A diminuicao do intervalo de confianca pode ser alcancadacom aumento de n ou k. Em geral a simulacao continua ate que a precisao do intervalo deconfianca seja alcancada.

17.7 Da Escolha das Sementes

Pode-se em geral ter duas opcoes na geracao de distribuicoes. Na primeira opcao, pode-mos usar o gerador de numeros aleatorios inicializando-o a partir de uma unica semente echamando-o consecutivamente para a geracao de numeros aleatorios para todos os eventosda simulacao, indistintamente.

Uma segunda opcao seria usar sementes diferentes para, por exemplo, a geracao daschegadas e geracao de servicos.

133

Page 134: Apostila - Aguiar

Na pratica, nao se verifica vantagem no uso de multiplas sementes para diferentes tiposde eventos.

Na geracao de intervalos de confianca usando o metodo de replicacoes, pode-se gerar anova replicacao sem reinicializar o gerador de numeros aleatorios ou pode-se usar uma novasemente a cada replicacao, neste caso tomando-se o cuidado de garantir que as sementesiniciais estejam bastante distantes umas da outras, para se evitar qualquer dependenciaestocastica.

134

Page 135: Apostila - Aguiar

18 Cadeia de Markov em Tempo Discreto

Definicao: A sequencia de variaveis discretas {Xn}, onde Xn representa o estado da cadeiade Markov imediatamente apos a n-esima transicao e X0 representa o estado inicial da cadeia,forma uma Cadeia de Markov em Tempo Discreto (CMTD), se para todo valor de n e paratodos os valores da variavel aleatoria temos:

P (Xn = j|X1 = i1, X2 = i2, · · · , Xn−1 = in−1) = P (Xn = j|Xn−1 = in−1)

Estas probabilidades sao denominadas probabilidades de transicao de um passo. Astransicoes na CMTD ocorrem em tempos determinados, indicados pelo subındice. O estadoda Cadeia de Markov e sempre uma variavel aleatoria discreta.

*

Definicao: Cadeia de Markov Homogenea

Uma CMTD e dita homogenea, quando a probabilidade de transicao de um passo inde-pende de n. Assim temos,

pij = P (Xn = j|Xn−1 = i)

As probabilidades pij sao ditas estacionarias. Observe que o processo pode nao ser esta-cionario.

Quando m passos sao considerados:

p(m)ij = P (Xn+m = j|Xn = i)

Fazendo a transicao de estado passar por um estado intermediario k em m − 1 passos,podemos escrever:

p(m)ij =

∀kp(m−1)ik pkj, m ≥ 2

*

Definicao: A CMTD e irredutıvel, se todo estado pode ser alcancado a partir de qualqueroutro estado, ou seja,

∃m0, tal que, p(m0)ij > 0, ∀i, j

Seja A o conjunto de estados da CMTD. A1 ⊆ A e dito fechado(closed), se nenhumatransicao de um passo e possıvel de A1 para A1

C .

Se A1 consiste de um unico estado Ei, este estado e dito absorvente(absorbing) e pii = 1(condicao necessaria e suficiente).

Se A nao contem nenhum subconjunto proprio A1 que e fechado, entao a CMTD eirredutıvel.

0chap18.tex 11/07/2013

135

Page 136: Apostila - Aguiar

Se A contem subconjuntos A1 que sao fechados, entao a CMTD e dita redutıvel.

A1 forma uma subcadeia de Markov irredutıvel, se A1 nao contem nenhum subconjuntofechado.

18.1 Classificacao dos Estados

Seja f(n)jj = P( primeiro retorno ao estado Ej ocorre n passos apos deixar Ej).

Entao,

fjj = P ( retornar a Ej algum dia apos sair dele ) =∞∑

n=1

f(n)jj

• Ej e recorrente, se fjj = 1.

Certamente a cadeia passara por este estado em algum tempo no futuro. Isto tambemimplica que o estado sera visitado um numero infinito de vezes, durante um tempoinfinito.

• Ej e transiente, se fjj < 1.

Existe uma probabilidade, igual a 1−fjj , do estado nao ser visitado no futuro. Assim,o estado sera visitado um numero finito de vezes, durante um tempo infinito. Por outrolado, a probabilidade do estado Ej ser visitado exatamente k vezes apos sair dele sera

dada por (fjj)k(1 − fjj), k ≥ 0, que e geometrica, com media

fjj1−fjj

. O numero medio

de visitas ao estado Ej , dado que o estado e visitado pelo menos uma vez, e dado por

1 +fjj

1−fjj= 1

1−fjj.

*

Criterio de Periodicidade

Seja γ o maior divisor comum do conjunto de todos os n ≥ 1, para os quais p(n)jj > 0.

Se γ = 1, entao j e aperiodico.

Se γ ≥ 2, entao j e periodico, com perıodo γ.

136

Page 137: Apostila - Aguiar

Exemplo 1: [pij] =

0 1 01/2 0 1/20 1 0

, 0 ≤ i, j ≤ 2

p(1)00 = 0

p(2)00 = 1/2

p(3)00 = 0

p(4)00 = P (E1E0E1E0) + P (E1E2E1E0) = 1/4 + 1/4 = 1/2...

p(2k)00 = 1/2 para k ≥ 1

Entao M.D.C = 2 e E0 e periodico com perıodo γ = 2.

p(2k+1)11 = 0, ∀k ≥ 0

p(2k)11 = 1, ∀k ≥ 1

Entao M.D.C = 2 e E1 e periodico com perıodo γ = 2.

Exemplo 2: [pij] =

0 1 0 01/2 0 1/2 00 0 0 10 1 0 0

p(1)00 = 0

p(2)00 = 1/2

p(3)00 = 0

p(4)00 = 1/4

p(5)00 = P (E1E2E3E1E0) = 1/4

Entao, E0 e aperiodico.

137

Page 138: Apostila - Aguiar

Exemplo 3: [pij] =

0 1 0 0 01/2 0 1/2 0 00 0 0 1 00 0 0 0 10 1 0 0 0

p(1)22 = 0

p(2)22 = 0

p(3)22 = 0

p(4)22 = 1/2

p(5)22 = 0

p(6)22 = 1/4

p(7)22 = 0

p(8)22 = 1/4

p(9)22 = 0

p(10)22 = P (E1E0E1E2E3E4E1E0E1E0) + P (E1E2E3E4E1E2E3E4E1E0) +

P (E1E2E3E4E1E0E1E0E1E0) + P (E1E0E1E0E1E2E3E4E1E0)

=

(

1

2× 1

2× 1

2× 1

2

)

+

(

1

2× 1

2× 1

2

)

+

(

1

2× 1

2× 1

2× 1

2

)

+

(

1

2× 1

2× 1

2× 1

2

)

= 5/16

Entao M.D.C = 2 e E2 e periodico com perıodo γ = 2.

*

Proposicao : O estado Ej e recorrente se e somente se∑∞

n=1 p(n)jj =∞.

Prova:

Ej e recorrente se retornarmos a ele com probabilidade 1. Isto significa que o numeroesperado de visitas a Ej e infinito e portanto temos esperanca infinita.

Por outro lado, se Ej e transiente existe uma probabilidade positiva 1−fjj de nao retornara Ej e, portanto, o numero medio de visitas a Ej, dado que uma visita ocorreu, e geometricocom media 1

1−fjj.

Sabemos entao que se Ej e recorrente, entao E[ # de visitas a Ej |X0 = j] =∞.

Seja In =

{

1 se Xn = j0 , caso contrario

, implicando que∑∞

n=1 In = # de visitas a Ej. Entao

E

[ ∞∑

n=1

In|X0 = j

]

=

∞∑

n=1

E [In|X0 = j] =

∞∑

n=1

p(n)jj =∞

138

Page 139: Apostila - Aguiar

Se, por outro lado,∑∞

n=1 p(n)jj =∞, entao o numero medio de visitas ao estado e infinito

num tempo infinito e o estado nao pode ser transiente. Logo, tera que ser recorrente.

*

Consideremos apenas estados recorrentes ou fjj = 1. Seja Mj o tempo entre retornos aestado Ej .

O tempo de recorrencia medio de Ej , ou o tempo medio (em transicoes) para retornar a

Ej , sera dado por E[Mj ] =∑∞

n=1 nf(n)jj .

• Ej e recorrente nulo, se E[Mj ] =∞.

• Ej e recorrente nao nulo ou recorrente positivo, se E[Mj ] <∞.

18.2 Teoremas

Seja π(n)j = P (Xn = j) a probabilidade do sistema estar no estado Ej no n-esimo passo.

Estas probabilidades dependem obviamente do estado inicial. Entretanto, como veremosem seguida, sob certas condicoes, estas probabilidades em equilıbrio convergem para valoresindependemente do estado inicial. Desta forma, nao explicitaremos a dependencia do estadoinicial.

Teorema 1:

Os estados de uma CMTD irredutıvel tem todos a mesma classificacao, isto e, ou sao

1. todos transientes ou

2. todos recorrentes nulos ou

3. todos recorrentes nao nulos

Se periodicos, todos os estados tem o mesmo perıodo γ.

Teorema 2:

Em uma CMTD irredutıvel, homogenea, (e aperiodica, pode ser requisito em alguns casosexcepcionais) as probabilidades limites

πj = limn→∞

π(n)j

πj = P (encontrar o sistema no estado Ej) = limn→∞

p(n)ij

sempre existem e sao independentes da distribuicao de probabilidade do estado inicial{

π(0)i

}

.

Alem do mais, ou

139

Page 140: Apostila - Aguiar

1. todos os estados ou sao transientes ou sao recorrentes nulos, para os quais πj = 0, ∀j,e nao existe distribuicao estacionaria.

2. todos os estados sao recorrentes nao nulos e πj > 0, ∀j

πj =1

E[Mj ],∑

i

πi = 1, πj =∑

i

πipij

Exemplo:

[pij ] =

[

0 11 0

]

E[M0] = tempo medio de recorrencia do estado E0 = E[M1] = 2.

Entao, π0 = 1/E[M0] = 0, 5 e π1 = 1/[M1] = 0, 5.

Em termos de matrizes, πj =∑

i πipij pode ser escrita como

π = πP, onde π = [π1 π2] .

Como exemplo, seja a CMTD dada por:

P =

[

0 11 0

]

[π1 π2] = [π1 π2]

[

0 11 0

]

π1 = π2,∑

i

πi = 1, implicando em π1 = π2 = 0, 5

Podemos verificar que os estados desta CMTD sao recorrentes nao nulos e periodicos, comperıodo γ = 2.

p(1)11 = 0, p

(2)11 = 1, p

(3)11 = 0, p

(4)11 = 1, p

(5)11 = 0, p

(6)11 = 1

∑∞n=1 p

(n)11 =∞ → E1 e recorrente.

f(1)11 = 0, f

(2)11 = 1, f

(n)11 = 0, n > 2. Consequentemente, E[M1] =

∑∞n=1 nf

(n)11 = 2.

*

Exemplo: Seja P =

[

1/2 1/21/4 3/4

]

a matriz de transicao de probabilidades.

π = [π1π2] , probabilidades limites

π = πP

[π1π2] = [π1π2]

[

1/2 1/21/4 3/4

]

π1 =12π1 +

14π2

π2 =12π1 +

34π2

, π1 + π2 = 1

140

Page 141: Apostila - Aguiar

Solucao do sistema acima conduz a π1 = 1/3 e π2 = 2/3.

Desenvolvendo interativamente a expressao π(n) =[

π(n)1 π

(n)2

]

, obtemos:

π(0) = [1 0] , ou seja, estado inicial e E1, por exemplo.

π(1)1 =

1

2π(0)1 +

1

4π(0)2 =

1

2

π(1)2 =

1

2π(0)1 +

3

4π(0)2 =

1

2

π(1) =

[

1

2

1

2

]

π(2)1 =

1

2π(1)1 +

1

4π(1)2 =

3

8

π(2)2 =

1

2π(1)1 +

3

4π(1)2 =

5

8

π(2) =

[

3

8

5

8

]

Observe que, π(n) = π(n−1)P e π(n) = π(0)Pn. Por outro lado, limn→∞ π(n) = limn→∞ π(n−1)Pimplica em π = πP, como ja anteriormente assinalado no Teorema 2.

Para a condicao inicial π(0) = [1 0], temos:

n 0 1 2 3 4 · · · ∞π(n)1 1 0,5 0,375 0,344 0,336 · · · 0,333

π(n)2 0 0,5 0,625 0,656 0,664 · · · 0,666

Para a condicao inicial π(0) = [0 1], temos:

n 0 1 2 3 4 · · · ∞π(n)1 0 0,25 0,312 0,320 0,332 · · · 0,333

π(n)2 1 0,75 0,680 0,672 0,668 · · · 0,666

Observe a mesma convergencia das probabilidades limites, em ambos os casos.

*

Ergodicidade

O estado Ej e ergodico se ele for aperiodico (γ = 1), recorrente (fjj = 1) e nao nulo(E[Mj ] <∞).

Uma CMTD e ergodica se todos os estados sao ergodicos. Observe que π(n)j → πj ,

independentemente do estado inicial.

Uma CMTD finita, irredutıvel e aperiodica e ergodica.

141

Page 142: Apostila - Aguiar

*

Criterio de Foster

Se para uma CMTD irredutıvel e homogenea∑

i πi = 1, πj =∑

i πipij tem solucao naotrivial (a solucao trivial tem πi = 0, ∀i), entao a CMTD tem estados recorrentes positivos eas probailidades de estado em equilıbrio sao dadas pela solucao encontrada. Mais alem, seos estados forem aperiodicos, eles serao ergodicos.

Este e o chamado criterio de Foster e se aplica a cadeias com espaco de estado finitoou infinito. No caso de cadeias com espaco de estado infinito, caso haja apenas a solucaotrivial, entao os estados serao transientes ou recorrentes nulos.

*

18.3 Tempo medio para ir de um estado a outro

Para calcular o tempo medio para ir de um estado Ei a outro estado Ej, E[Tij ], deve-seresolver as probabilidades de estado em equilıbrio para a seguinte cadeia modificada, cujosestados serao indicados com *:

1. Mantenha todas as probabilidades de transicao de Ek∗ para Ej∗ como na cadeia original,∀k 6= j;

2. Elimine todas as probabilidades de transicao para fora do estado Ej∗ existentes nacadeia original, incluindo transicoes de volta para o proprio estado, isto e, eliminepjk∗, ∀k na cadeia original;

3. Acrescente pji∗ = 1 na cadeia modificada;

4. Elimine estados que nao forem mais alcancaveis e fique apenas com o conjunto fechadoque engloba os estados Ei∗ e Ej∗, que constituirao a cadeia modificada de interesse;

5. Resolva para as probabilidades de estado em equilıbrio da cadeia modificada, obtendoπj∗.

6. Observando queE[Tij ] = E[Mj∗]− 1

Observe que todas as probabilidades de transicao ate se visitar o estado Ej∗ sao exatamenteas mesmas da cadeia original e como deste estado se retorna a Ei∗ com probabilidade 1, onumero medio de transicoes ate ocorrer o retorno a Ej∗ sera E[Tij ] + 1.

142

Page 143: Apostila - Aguiar

18.4 Espaco de Estados Infinito

Considere uma sequencia independente de lancamentos de uma moeda, onde P (cara) = p eP (coroa) = 1− p.

Seja Xn a variavel aleatoria que designa o numero de caras menos o numero de coroasapos n lancamentos. Considere X0 = 0. Xn e uma Cadeia de Markov em tempo discretocom espaco de estado sendo o conjunto de numeros inteiros e probabilidades de transicao deum passo dadas por:

pij =

p j = i+ 1 ganha 11− p j = i− 1 perde 10 outros casos

O desenho da cadeia e mostrado abaixo:

Esta cadeia e irredutıvel. Nao existem conjuntos fechados e os estados sao periodicos comperıodo igual a 2.

De acordo com a Lei Forte dos Grandes Numeros,Xn/n, que representa o ganho porjogada apos n lancamentos, converge para o ganho medio com n → ∞. Como o ganhomedio por jogada e dado por E[ganho por jogada] = p− (1− p) = 2p− 1, entao temos quelimn→∞Xn/n = 2p− 1.

Para p 6= 1/2,limn→∞Xn/n 6= 0, implicando que Xn 6= 0 para qualquer n grande, ou seja,estaremos num estado diferente de zero apos um numero grande de lancamentos, com certeza.Isso implica que o numero de retornos a este estado nao sera infinito em infinitos lancamentosda moeda e o estado zero sera transiente. Como a cadeia e irredutıvel e homogenea, todosos estados serao transientes.

Para p > 1/2, o ganho medio por jogada e positivo e a cadeia ira visitar sempre estadosa direita, em longo prazo, nao mais retornando ao estado zero.

Para p < 1/2, acontece o inverso. O ganho medio e negativo e a tendencia e que a cadeiavisite estados cada vez mais a esquerda, tambem nao mais retornando ao estado zero.

Para p = 1/2, podemos observar que limn→∞Xn/n = 0, mostrando que o estado 0 seravisitado no futuro com probabilidade 1, indicando que ele nao pode ser transiente. Logo, oestado zero e todos os outros serao recorrentes. Por simetria, se existisse uma distribuicaoestacionaria terıamos π0 = π1 = π−i, ∀i e, entao, para se ter

∀i = 1, terıamos πi = 0, ∀i,o que prova que nao pode haver uma distribuicao estacionaria com πi 6= 0. Logo os estadossao recorrentes nulos, pois nao poderao ser transientes nem recorrentes positivos.

*

143

Page 144: Apostila - Aguiar

Provando a recorrencia nula pelo calculo de∑∞

n=1 p(2n)00 =∞ e usando aproximacao

de Stirling

Para p = 1/2, podemos obter p(2n)00 , a probabilidade de estar no estado 0 apos 2n

lancamentos e verificar o comportamento de∑∞

n=1 p(2n)00 .

p(2n)00 = P(numero de caras = numero de coroas em n lancamentos)

=

(

2n

n

)

pn(1− p)n =(2n)!(p(1− p))n

n!n!, n >> 1

Convem observar que p(2n+1)00 = 0, n ≥ 0, pois saindo do estado zero nao poderemos estar

nele novamente apos um numero ımpar de lancamentos. Visitas ao estado zero so poderaoocorrer apos um numero par de lancamentos.

Para calcular p(2n)00 , podemos usar a aproximacao de Stirling n! ≈ n

2n+12 e−n

√2π e concluir

que

p(2n)00 ≈

4p(1− p))n√nπ

.

Para p = 1/2, p(2n)00 ≈ 1√

nπe

∞∑

n=1

p(2n)00 ≈

∞∑

n=1

1√nπ

=1√π

∞∑

n=1

1

n1/2=∞

implicando que o estado zero e recorrente.

Para p 6= 1/2, 4p(1− p) = a−1 (a expressao e maxima para p = 1/2), e

∞∑

n=1

p(2n)00 ≈

∞∑

n=1

1

an√nπ

=1√π

∞∑

n=1

1

ann1/2<

∞∑

n=1

(

1

a

)n

=1

a− 1<∞

implicando que o estado 0 e transiente, como ja foi observado.

NOTA: Para concluir que∑∞

n=11

n1/2 = ∞, podemos utilizar as propriedades de seriesharmonicas.

Seja H(r)n = 1 + 1

2r+ 1

3r+ · · · 1

nr .

Pode-se mostrar que H(r)∞ converge para r > 1.

Quando r < 1, H(r)∞ =∞.

H(r)∞ = ξ(r) e a funcao zeta de Riemann. Consulte Knuth, Vol. 1, pagina 74.

Observe que Hn = 1 + 12+ 1

3+ · · · 1

ne uma serie harmonica.

Temos H2m ≥ 1 + m2, portanto, sem limite.

*

144

Page 145: Apostila - Aguiar

Provando a recorrencia nula pelo calculo de∑∞

n=1 p(2n)00 =∞ e usando aproximacao

baseada no Teorema do Limite Central

Para o calculo de p(2n)00 podemos tambem usar uma aproximacao baseada no Teorema do

Limite Central.

Xn pode ser definida como a soma de n variaveis aleatorias independentes Yi, tais queP (Yi = 1) = p e P (Yi = −1) = 1− p, com Xn =

∑ni=1 Yi.

Para p = 1/2, temos

E[Yi] = 0, E[Xn] = 0, E[Y 2i ] = 1, V (Yi) = 1, e V (Xn) = n

A variavel aleatoria Zn = Xn−E[Xn]σXn

= Xn√ntem comportamento N(0, 1) para n≫ 1.

Entao, para n≫ 1,

p(2n)00 = P

(

−12< X2n <

1

2

)

= P

(

−12< Z2n

√2n <

1

2

)

= P

(

− 1

2√2n

< Z2n <1

2√2n

)

= Φ

(

1

2√2n

)

− Φ

(

− 1

2√2n

)

∞∑

n=1

p(2n)00 =

∞∑

n=1

(

Φ

(

1

2√2n

)

− Φ

(

− 1

2√2n

))

= A∞∑

n=1

1√n=∞, n≫ 1

Tambem aqui recaımos em provar que∑∞

n=11√n=∞, como no caso anterior. Na formula

acima A e uma constante que nao e funcao de n.

***

Exemplo 1: Classificacao de estados

Analisemos os estados da Cadeia de Markov abaixo:

A cadeia e claramente redutıvel e homogenea. O conjunto {2,3,4,...} e fechado e nao haestado absorvente. Os estados 0 e 1 sao transientes.

Estando no conjunto fechado, o incremento no estado a cada jogada e 0, pois com 50%de probabilidade incrementamos de 1 e com 50% de probabilidade decrementamos de 1. Namedia, o ganho e zero. Como, num numero muito grande de jogadas, o ganho medio tendepara o ganho real, entao podemos concluir, que retornaremos a qualquer estado do conjuntofechado com probabilidade 1.

145

Page 146: Apostila - Aguiar

Como os estados nao podem ser recorrentes positivos, pois terıamos que obter uma solucaoestacionaria pelo criterio de Foster e nao a obtemos (temos 2π2 = π3 = π4 + · · · , e estasprobabilidades nao podem ser diferentes de 0), entao, os estados do conjunto fechado sopodem ser recorrentes nulos.

Se analisarmos o conjunto {n} para os quais P(n)00 > 0, podemos verificar que teremos

sempre n par e, portanto, o MDC e 2. Os estados do conjunto fechado sao periodicos comperıodo 2.

Os estados do conjunto fechado, tratado com uma CMTD irredutıvel, sao RECORREN-TES NULOS e PERIODICOS, com perıodo 2.

*

Exemplo 2: Classificacao de estados

Neste segundo exemplo, vamos analisar os estados da cadeia abaixo:

Esta cadeia e irredutıvel e homogenea. Nao ha solucao estacionaria para as probabili-dades em equilıbrio e a cadeia nao satisfaz o criterio de Foster (mostre que nao ha solucaoestacionaria para o sistemas das equacoes de estado em equilıbrio). Os estados nao podemser recorrentes positivos.

O estado zero funciona como uma barreira a esquerda e so reforca a permanencia dacadeia em estados a direita.

A cada transicao a cadeia move3

4+ (−1)1

4=

1

2> 0 para a direita na media.

Entao, limn→∞Xn/n = n2n

= 1/2, implicando que Xn 6= 0 para n≫ 1. Logo, o estado0 e transiente e sera visitado um numero finito de vezes.

***

Aplicacao: Cadeia Embutida em Fila M/M/1/n

Uma fila M/M/1/n e uma fila M/M/1 onde a fila de espera e limitada e um maximode n fregueses podem estar no sistema, incluindo o fregues em servico. Iniciando com umafila vazia, queremos calcular o numero medio de chegadas ate que o primeiro fregues sejaperdido por falta de espaco.

Vamos analisar a fila apenas nos instantes em que chegadas ou partidas ocorrem na filae construir a CMTD embutida nestes instantes. A taxa exponencial de chegada sera λ e ataxa exponencial de servico sera µ. O estado sera o numero de pessoas no sistema.

146

Page 147: Apostila - Aguiar

Vamos inicialmente construir a CMTD com n+ 2 estados, como mostrada abaixo:

A probabilidade corresponde ao evento de chegada ocorrendo antes de uma partida, oque forca a cadeia a incrementar o estado. Quando estamos no estado n e o proximo eventoe uma chegada, esta chegada e perdida. Indicamos isso indo para o estado n + 1 e de laretornamos ao estado 0, com probabilidade 1.

Estamos interessados em calcular o numero medio de chegadas ate atingir o estado n+1.Devemos observar que uma chegada provoca uma transicao na cadeia para a direita e, quandoo fregues e servido, ocorre uma transicao para a esquerda. Somente atingimos o estado n+1quando

# de chegadas - # de partidas = n+ 1, e tomando a media, temos

E[# de chegadas] = E[# de partidas]+ n+ 1

Como cada partida de um fregues da fila corresponde a duas transicoes na cadeia, umadevido a sua chegada e outra devido a sua partida em si, podemos afirmar que

E[# de transicoes indo de 0 a n+1] = 2 x E[# de partidas]+ n + 1

Como o estado E0 sempre e alcancado apos atingir o estado En+1,

E[# de transicoes de E0 a En+1] = E[Mn+1] - 1 = 2 x E[# de partidas]+ n + 1,

o que nos permite obter E[# de partidas] = E[Mn+1]−n−22

.

Entao,

E[# de chegadas] = E[# de partidas] + n+ 1 =E[Mn+1] + n

2

Nossa solucao depende apenas de determinar as probabilidades de estado em equilıbrio,pois E[Mn+1] =

1πn+1

.

147

Page 148: Apostila - Aguiar

As equacoes de estado em equilıbrio podem ser obtidas resolvendo o sistema de equacoes:

π0 = (1− p)π1 + πn+1

π1 = (1− p)π2 + π0

π2 = (1− p)π3 + pπ1

π3 = (1− p)π4 + pπ3

...

πn−1 = (1− p)πn + pπn−2

πn = pπn−1

πn+1 = pπn

n+1∑

i=0

πi = 1

Convem observar que precisamos apenas de n + 2 equacoes, pois temos n + 2 incognitas.Dentre as primeiras n + 1 equacoes, uma e linearmente dependente e nao deve ser usada.O sistema fica completo com a equacao de conservacao de probabilidades. Para um casosimples, com n = 2, obtemos π3 =

p2

2(1+p2).

E[# de chegadas] = E[M3]+22

= 1+2π3

2π3= 1+2p2

p2= 1

p2+ 2.

O resultado e coerente, pois quando p tende a 1, a media sera de 3 chegadas, o que e oesperado.

***

O mesmo problema poderia ser resolvido com uma CMTD ligeiramente diferente daanterior, onde procuramos garantir que o numero de transicoes na cadeia entre retornos aoestado zero apos perder uma chegada seja exatamente igual ao dobro do numero de chegadasque estamos interessados em calcular. Veja a CMTD abaixo: Nessa nova cadeia, apos atingir

o estado En+1 pelo fregues que foi perdido, simplesmente passo pelos estados Ei∗, provocandouma transicao na cadeia para cada um dos n fregueses que estavam no sistema. Dessa forma,garanto que retornos ao estado zero ocorram apos um numero de transicoes que sera igualao dobro do numero de chegadas.

148

Page 149: Apostila - Aguiar

O numero medio de transicoes na cadeia sera dado pelo tempo medio de recorrenciado estado E1∗. Nao podemos utilizar E[M0], pois retornos ao estado E0 ocorrerao sempassar pelo estado En+1. Na cadeia acima E[M1∗] = E[M2∗] = · · · = E[Mn+1]. Resolvendoas probabilidades em equilıbrio nessa nova cadeia, podemos obter os tempos medios derecorrencia dos estados. Entao,

E[# de chegadas] =E[M1∗]

2=

E[Mn+1]

2

As equacoes de estado em equilıbrio podem ser obtidas resolvendo o sistema de equacoes:

π0 = (1− p)π1 + πn+1

π1 = (1− p)π2 + π0

π2 = (1− p)π3 + pπ1

π3 = (1− p)π4 + pπ3

...

πn−1 = (1− p)πn + pπn−2

πn = pπn−1

πn+1 = π1∗ = π2∗ = · · · = πn∗ = pπn∑

∀iπi = 1

Para um caso simples, com n = 2, obtemos π3 =p2

2(1+2p2).

E[# de chegadas] = E[M3]2

= 12π3

= 1+2p2

p2= 1

p2+ 2.

que e igual ao obtido anteriormente, como esperado, demonstrando a correcao das duassolucoes.

149

Page 150: Apostila - Aguiar

19 Cadeia de Markov em Tempo Contınuo

Definicao: A sequencia de variaveis aleatorias discretas {X(t)} forma uma Cadeia de Mar-kov em Tempo Contınuo (CMTC), se:

P (X(tn+1) = j|X(t1) = i1, X(t2) = i2, · · · , X(tn) = in) = P (X(tn+1) = j|X(tn) = in)

Na CMTD a distribuicao do tempo no estado (em termos de transicoes) e geometrica. NaCMTC a distribuicao de tempo no estado e exponencial. O fato destas duas distribuicoesserem as unicas com a propriedade da falta de memoria nao e coincidencia. A definicao daCadeia de Markov exige que o passado nao interfira nas transicoes do estado atual.

Probabilidades de Transicao

pij(s, t) = P (X(t) = j|X(s) = i), t ≥ s

Considerando todos os estados possıveis pelos quais a cadeia pode passar em um instanteintermediario u, podemos escrever:

pij(s, t) =∑

k

pik(s, u)pkj(u, t)

Na forma de matriz,

H(s, t) = [pij(s, t)]

H(s, t) = H(s, u)H(u, t), s ≤ u ≤ t

Esta ultima equacao e chamada de equacao de recorrencia para frente de Chapman-Kolmogorov.

Observe que: H(t, t) = I, que e a matriz identidade. Todos os elementos de I sao nulos,excetos os elementos pii(t, t) da diagonal principal que sao iguais a 1.

*

Discretizacao

Para obter o resultado em tempo contınuo, vamos usar o artifıcio de discretizar o tempoem intervalos de tamanho ∆t, para depois fazer ∆t → dt, e obter a solucao em tempocontınuo.

Com o tempo discretizado, vamos chamar H(n, n+ 1) = P(n).

Reescrevendo a relacao de Chapman-Kolmogorov na forma discreta, obtemos:

H(m,n) = H(m,n− 1)P(n− 1), recorrencia para frente

H(m,n)−H(m,n− 1) = H(m,n− 1)P(n− 1)−H(m,n− 1)

= H(m,n− 1) [P(n− 1)− I]

0chap19.tex 25/07/2013

150

Page 151: Apostila - Aguiar

Defina P(t) = [pij(t, t +∆t)].

Com ∆t→ dt, temos

H(m,n) → H(s, t)

P(n) e P(n− 1) → P(t)

Dividindo por ∆t e fazendo ∆t→ dt, obtemos

∂H(s, t)

∂t= H(s, t)Q(t), s ≤ t

Q(t) = lim∆t→0

P(t)− I

∆t

A matriz Q(t) e conhecida como o gerador infinitesimal da matriz de transicao H(s, t).Q(t) = [qij(t)] e definida como a matriz da taxa de transicao.

qii(t) = lim∆t→0

pii(t, t+∆t)− 1

∆t

qij(t) = lim∆t→0

pij(t, t +∆t)

∆t, i 6= j

Observe que para ∆t→ 0, pii(t, t+∆t) = 1+ qii(t)∆t, que e a probabilidade de permanecerno proprio estado, um infinitesimo depois. Por outro lado, 1 − pii(t, t + ∆t) = −qii(t)∆trepresenta a probabilidade de deixar o estado um infinitesimo depois. Interpretacao:

t t+∆t Probabilidade InterpretacaoEi Ei 1 + qii(t)∆t + o(∆t) ficar no proprio estadoEi 6= Ei −qii(t)∆t+ o(∆t) deixar o estadoEi Ej qij(t)∆t + o(∆t) ir de Ei para Ej

−qii(t) = taxa de abandono do estado Ei

qij(t) = taxa de transicao de Ei para Ej

OBS. lim∆t→0o(∆t)∆t

= 0, ou seja o(∆t) decresce a zero mais rapidamente que ∆t.

Observe que:∑

j

pij(s, t) = 1

pii(s, t) +∑

j 6=i

pij(s, t) = 1

Fazendo t = s+∆s,

pii(s, s+∆s) +∑

j 6=i

pij(s, s+∆s) = 1

1 + qii(s)∆s+∑

j 6=i

qij(s)∆s = 1

151

Page 152: Apostila - Aguiar

Entao,∑

j qij(s) = 0, ∀i, ∀s, implicando que qii = −∑

j 6=i qij , ou seja, a taxa de permanenciano estado e igual a menos a taxa de ida para outros estados. Em outras palavras, a matrizQ(t) tem linhas cuja soma dos elementos e zero.

*

19.1 CMTC Homogenea

Para uma CMTC homogenea, as probabilidades de transicao independem do referencial detempo, e dependem apenas do tamanho do intervalo entre transicoes.

Assim temos,

pij(s, s+ t) ⇒ pij(t)

qij(t) ⇒ qij, taxa constante, independente do tempo

H(s, s+ t) ⇒ [pij(t)] = H(t)

Q(t) ⇒ [qij] = Q

Na nova notacao:

H(s+ t) = H(s)H(t), e

dH(t)

dt= H(t)Q

A equacao diferencial pode ser expressa como:

dpij(t)

dt=∑

k

pik(t)qkj = qjjpij(t) +∑

k 6=j

pik(t)qkj

Pode-se mostrar tmbem que H(t) e Q satisfazem:

dH(t)

dt= QH(t)

dpij(t)

dt=

k

qikpkj(t)

= qiipij(t) +∑

k 6=i

qikpkj(t)

As equacoes acima possuem condicao inicial H(0) = I.

Para as probabilidades de estado no tempo,

πj(t) = P (X(t) = j), e

π(t) = [πj(t)] (na forma de matriz)

152

Page 153: Apostila - Aguiar

temos:

dπ(t)

dt= π(t)Q

Mas, limt→∞ πj(t) = πj , se a cadeia de Markov e irredutıvel e homogenea.

Para CMTC homogenea e em equilıbrio,

πQ = 0 e∑

j

πj = 1

Compare com o caso discreto e homogeneo em que se tinha:

π = πP e∑

j

πj = 1

Q e a matriz de taxas (nao de probabilidades) e P e a matriz de transicao de probabilidadede um passo.

***

19.2 Processo Nascimento e Morte (Birth-Death Processes)

O interesse maior e no caso de tempo contınuo, que permite modelar o comportamento defilas M/M/1.

Dada uma populacao X , que nasce e morre a taxas conhecidas, quer se determinar:

Pk(t) = P (X(t) = k)

X(t) = tamanho da populacao no instante t

Um nascimento causa a transicao Ek → Ek+1.

Uma morte causa a transicao Ek → Ek−1.

Seja λk a taxa de nascimento para a populacao de tamanho k. Em termos de taxa detransicao da CMTC homogenea, λk = qk,k+1. Temos:

P (exatamente 1 nascimento em (t, t+∆t) | populacao k) = λk∆t + o(∆t)P (0 nascimento em (t, t +∆t) | populacao k) = 1− λk∆t + o(∆t)

Seja µk a taxa de morte para a populacao de tamanho k. Em termos de taxa de transicaoda CMTC homogenea, µk = qk,k−1. Temos:

P (exatamente 1 morte em (t, t+∆t) | populacao k) = µk∆t + o(∆t)P (0 morte em (t, t+∆t) | populacao k) = 1− µk∆t + o(∆t)

153

Page 154: Apostila - Aguiar

Obviamente, qkj = 0, para |k − j| > 1, ou seja, so existe transicao para um estadovizinho, cujo numero de pessoas so difere de uma unidade do estado atual.

Mortes e nascimentos sao eventos independentes. Nao existem eventos simultaneos (suaprobabilidade e desprezıvel ou se reduz a o(∆t)), como duas mortes, dois nascimentos ouuma morte e um nascimento, etc. Por exemplo, uma morte e um nascimento simultaneosem uma populacao k tem a seguinte probabilidade:

P(1 nascimento e uma morte) = (λk∆t+ o(∆t))(µk∆t+ o(∆t))

= λkµk(∆t)2 + o(∆t)

= o(∆t)

Por outro lado, podemos verificar que:

P(0 nascimento e 0 morte) = (1− λk∆t+ o(∆t))(1 − µk∆t+ o(∆t))

= −(λk + µk)∆t + λkµk(∆t)2 + o(∆t)

= −(λk + µk)∆t + o(∆t)

Lembrar que :

j

qij(t) = 0, ∀i

qkk = −(λk + µk) taxa de imutabilidade da populacao

A matriz geradora infinitesimal Q para o processo sera:

Q =

−λ0 λ0 0 0 0 · · ·µ1 −(λ1 + µ1) λ1 0 0 · · ·0 µ2 −(λ2 + µ2) λ2 0 · · ·0 0 µ3 −(λ3 + µ3) λ3 · · ·...

......

......

...

Exercıcio: desenho a Cadeia de Markov correspondente ao Processo Nascimento eMorte.

Se no instante (t+∆t) o sistema se encontra com k pessoas, entao no instante t imedia-tamente anterior, o sistema so poderia ter tido

• k − 1 pessoas e um nascimento ocorreucom probabilidade λk−1∆t + o(∆t)

• k pessoas e nao ocorreu nascimento e nem mortecom probabilidade − (λk + µk)∆t + o(∆t)

• k + 1 pessoas e uma morte ocorreucom probabilidade µk+1∆t+ o(∆t)

154

Page 155: Apostila - Aguiar

Relacionando as probabilidades de transicao temos;

pk(t+∆t) = pk−1(t) (λk−1∆t + o(∆t)) +

pk(t) (− (λk + µk)∆t+ o(∆t)) +

pk+1(t) (µk+1∆t+ o(∆t)) + o(∆t), k ≥ 1

p0(t+∆t) = p0(t) (1− λ0∆t+ o(∆t)) + p1(t) (µ1∆t+ o(∆t)) + o(∆t), k = 0

Manipulando os termos das equacoes acima obtemos:

pk(t+∆t)− pk(t) = λk−1pk−1(t)∆t + µk+1pk+1(t)∆t− (λk + µk) pk(t)∆t + o(∆t)

p0(t+∆t)− p0(t) = −λ0p0(t)∆t + µ1p1(t)∆t + o(∆t)

Dividindo por ∆t e levando ∆t→ dt, temos:

dpk(t)

dt= − (λk + µk) pk(t) + λk−1pk−1(t) + µk+1pk+1(t), k ≥ 1

dp0(t)

dt= −λ0p0(t) + µ1p1(t)

∞∑

k=0

pk(t) = 1, ∀t

Pode-se escrever as equacoes observando o diagrama de estados da cadeia de Markov.Circunde cada estado com uma superfıcie imaginaria. Analise o fluxo que entra e o fluxoque sai atraves desta superfıcie.

Taxa de variacao da probabilidade de estado = fluxo entrante - fluxo sainte

O fluxo e sempre representado pelo produto da taxa vezes a probabilidade de estado.

*

Para um processo nascimento e morte em equilıbrio limt→∞ pk(t) = πk, a taxa de variacaoda probabilidade de estado e igual a zero, e entao o fluxo entrante e igual ao fluxo sainte.Temos:

0 = − (λk + µk) πk + λk−1πk−1 + µk+1pk+1(t), k ≥ 1

0 = −λ0p0(t) + µ1p1(t)∞∑

k=0

pk(t) = 1, ∀t

***

155

Page 156: Apostila - Aguiar

19.3 Processo de Nascimento Puro com taxa constante

Vamos estudar o processo que tem µk = 0 e λk = λ.

As equacoes que governam o processo sao:

dpk(t)

dt= −λpk(t) + λpk−1(t), k ≥ 1

dp0(t)

dt= −λp0(t)

∞∑

k=0

pk(t) = 1, ∀t

Como iniciamos com populacao zero no instante inicial, p0(0) = 1.

Para o sistema de equacoes acima, mostra-se facilmente que:

po(t) = e−λt e p1(t) = λte−λt

E por inducao: pk(t) =(λt)ke−λt

k!, que e a formula de Poisson. Um processo de nascimento

puro a taxa constante e portanto um processo de Poisson.

Uma forma de chegar a solucao do sistema de equacoes acima e usar o conceito detransformada. Para isso, vamos mostrar uma propriedade da transformada de Laplace.

Imagine que temos F ∗(s) ⇔ f(x), isto e, F ∗(s) =∫∞0

e−sxf(x)dx, transformada deLaplace de uma distribuicao que assume valores nao negativos, como a funcao densidade deuma variavel dependente do tempo. Gostarıamos de obter G∗(s), onde G∗(s)⇔ df(x)

dx.

G∗(s) =

∫ ∞

0

e−sxdf(x)

dxdx

e fazendo a integracao por partes

= e−sxf(x)|∞0 −∫ ∞

0

(−s)e−sxf(x)dx

= −f(0) + sF ∗(s)

onde f(0) e a condicao inicial no instante zero.

Como o numero de pessoas e uma variavel discreta, vamos definir P (z, t) =∑∞

k=0 zkpk(t),

que e uma transformada Z dependente do tempo.

Multiplicando a equacao de dpk(t)dt

por zk, e fazendo o somatorio para k ≥ 1, temos:

∞∑

k=1

zkdpk(t)

dt= −λ

∞∑

k=1

zkpk(t) + λ

∞∑

k=1

zkpk−1(t)

d

dt[P (z, t)− p0(t)] = −λ[P (z, t)− p0(t)] + λzP (z, t)

d

dtP (z, t)− d

dtp0(t) = −λP (z, t) + λp0(t) + λzP (z, t)

156

Page 157: Apostila - Aguiar

Usando a equacao dp0(t)dt

= −λp0(t) e substituindo acima, apos simplificar obtemos:

d

dtP (z, t) = −λ(1− z)P (z, t)

Podemos agora definir F ∗(z, s) =∫∞0

e−stP (z, t)dt.

Aplicando a transformada de Laplace na equacao diferencial obtida, temos:

sF ∗(z, s)− P (z, 0) = −λ(1− z)F ∗(z, s)

Ora, P (z, 0) =∑∞

k=0 zkpk(0) = p0(0) +

∑∞k=1 z

kpk(0) = 1 +∑∞

k=1 zk × 0 = 1, pois

iniciamos com populacao zero.

Entao,

F ∗(z, s) =1

s+ λ(1− z)

Como e−αt ⇔ 1s+α

, concluimos imediatamente que P (z, t) = e−λ(1−z)t = e−λteλzt.

Agora, como eλzt =∑∞

k=0(λt)kzk

k!, decorre imediatamente que

pk(t) =(λt)ke−λt

k!, k ≥ 0

***

19.4 Solucao de CMTC em Equilıbrio

Objetivo: Obter as probabilidades de estado em equilıbrio πk, ∀k.

Estas probabilidades representam a porcentagem de tempo que a cadeia de Markov passaem cada estado em equilıbrio. Elas podem tambem representar a probabilidade de umachegada aleatoria encontrar a cadeia de Markov em determinado estado.

As probabilidades πk tem que satisfazer a equacao de conservacao das probabilidades∑

k πk = 1. As outras equacoes necessarias sao obtidas do diagrama da cadeia de Markov.

Procedimento basico:

1. Desenhe a cadeia de Markov, colocando as taxas de transicao entre estados de acordocom o enunciado do problema

2. Atraves do uso de contornos fechados (vale qualquer contorno fechado, englobandoqualquer numero de estados), iguale os fluxos entrante e sainte, e obtenha as outrasequacoes.

157

Page 158: Apostila - Aguiar

Cuidado para nao obter equacoes linearmente dependentes. Um processo que evita amontagem de equacoes linearmente dependentes, mas que nem sempre leva ao conjuntode equacoes mais simples para ser resolvido, consiste de envolver cada estado com umcontorno fechado, que o isola completamente dos outros estados. Se temos N estados,realizamos este processo para N − 1, obtendo N − 1 equacoes e usando a conservacaodas probabilidades para completar o sistema de N equacoes independentes.

Entretanto, escolher contornos de forma inteligente pode gerar equacoes mais simples,que conduzem a uma solucao mais imediata e sem muitos algebrismos.

***

19.5 Tempo medio entre retornos a um estado

Vamos considerar o tempo medio E[Rj ] entre retornos ao estado Ej de uma CMTC ergodicahomogenea em equilıbrio, medido entre os instantes em que a cadeia entra no estado Ej.

Ao retornar a Ej , a cadeia passa um tempo medio E[Tj ] em Ej , antes de abandonarnovamente o estado.

Se focarmos o comportamento da cadeia em funcao dela estar ou nao no estado Ej ,podemos afirmar que a cadeia passa por ciclos, o tempo do ciclo sendo o tempo Rj entreretornos ao estado Ej .

Tomando um ciclo medio E[Rj ], o tempo medio gasto no estado Ej e dado por E[Tj ].Entao, usando argumentos medios (baseados na Teoria da Renovacao), podemos afirmar que:

πj =E[Tj ]

E[Rj ], ou

E[Rj ] =E[Tj ]

πj

Exemplo:

Seja uma fila M/M/1, com taxa de chegada λ e servico exponencial com taxa µ. Asolucao da cadeia de Markov nos leva a πk = (1− ρ)ρk.

O tempo medio gasto num estado e E[Tk] =1

λ+µ, k ≥ 1 e E[T0] =

1λ.

E[R0] =1

λπ0

=1

λ(1− ρ)

λ(µ− λ), e

E[R1] =µ2

λ(µ2 − λ2)

158

Page 159: Apostila - Aguiar

*

Considerando uma fila M/M/1, suponha que queiramos determinar o tempo medio que trans-corre desde o instante que a cadeia sai do estado E1 e segue para E2, passando eventualmentepor outros estados, e finalmente retornando a E1. Chamaremos este tempo medio de E[Y1].

Como calcula-lo?

Vamos analisar a formacao do tempo R0.

Ao deixar E0, a cadeia vai para E1 necessariamente. De E1, ela volta a E0 com probabi-lidade µ

µ+λ= 1− p ou demora Y1, ate retornar novamente a E1, com probabilidade λ

µ+λ= p.

Apos um tempo T1 no estado E1, o procedimento se repete.

Observe entao que na formacao de R0 podemos ter N contribuicoes de Y1+ T1, a i-esimasendo expressa como Y1i + T1i, com probabilidade

P (N = k) =

(

λ

µ+ λ

)k (µ

µ+ λ

)

= pk(1− p), k ≥ 0

A variavel aleatoria R0 sera entao formada por:

R0 = T0 + T1 +

N∑

i=0

(Y1i + T1i)

E[R0] = E[T0] + E[T1] + E[N ](E[Y1] + E[T1])

Vamos calcular E[N ].

E[N ] =∞∑

k=0

kpk(1− p)

= (1− p)∞∑

k=1

kpk

= (1− p)p

∞∑

k=1

kpk−1

= (1− p)p

∞∑

k=1

d

dppk

= (1− p)pd

dp

∞∑

k=1

pk

= (1− p)pd

dp

(

p

1− p

)

=p

1− p=

λ

µ

Substituindo este valor e o valor de E[R0] na expressao das medias, obtemos:

E[Y1] =1

µ− λ

159

Page 160: Apostila - Aguiar

Obtido o valor de E[Y1], poderıamos obter E[R1] atraves da expressao abaixo:

E[R1] = E[T1] +µ

µ+ λE[T0] +

λ

µ+ λE[Y1], obtendo

=µ2

λ(µ2 − λ2)

Este resultado coincide com o obtido diretamente da formula de E[R1] com o uso de π1.

***

19.6 Tempo medio para ir de um estado a outro

Para calcular o tempo medio para ir de um estado Ei a outro estado Ej, E[Tij ], deve-seresolver as probabilidades de estado em equilıbrio para a seguinte cadeia modificada, cujosestados serao indicados com *:

1. Mantenha todas as taxas de transicoes para Ej∗ da cadeia original

2. Elimine todas as taxas de transicoes para fora de Ej∗ da cadeia original

3. Acrescente a taxa β de Ej∗ para Ei∗ na cadeia modificada

4. Elimine estados que nao forem mais alcancaveis e fique apenas com o conjunto fechadoque engloba os estados Ei∗ e Ej∗, que constituira a cadeia modificada de interesse

5. Resolva para as probabilidades de estado em equilıbrio da cadeia modificada, obtendoπj∗, que sera funcao de β

6. Observando que

E[Rj∗] =1

βπj∗=

1∑

∀k qkjπj∗= E[Tij ] + E[Tj∗] = E[Tij ] + 1/β

basta tomarmos o limite para β →∞ e obter

E[Tij ] = limβ→∞

1

βπj∗= lim

β→∞

1∑

∀k qkjπj∗

Vale o observar que no limite para β →∞, πj∗ → 0 e as probabilidades da cadeia modificadase concentrarao nos outros estados. Todavia, fazendo o equilıbrio de fluxo em torno do estadoEj∗, podemos ver que βπj∗ =

∀k qkjπj∗ para qualquer valor de β, incluindo β →∞.

160