MODELAGEM DE ERROS EM SURTOS EM SISTEMAS ...Os conceitos expressos neste trabalho são de responsabilidade do autor e dos orientadores. F363 Fernandes, Marcus Vinícius dos Santos

INSTITUTO MILITAR DE ENGENHARIA

MAJ MARCUS VINÍCIUS DOS SANTOS FERNANDES

MODELAGEM DE ERROS EM SURTOS EM SISTEMAS DE

COMUNICAÇÕES

Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica do Instituto Militar de Engenharia, como requisito Parcial para obtenção do título de Mestre em Ciências em Engenharia Elétrica. Orientador: Prof. Ernesto Leite Pinto – D.C. Co-orientador: Marco Antônio Grivet M. Maia – Ph.D.

Rio de Janeiro

2002

2

c2002


Praça General Tibúrcio, 80 – Praia Vermelha

Rio de Janeiro – RJ CEP: 22290-270

Este exemplar é de propriedade do Instituto Militar de Engenharia, que poderá incluí-

lo em base de dados, armazenar em computador, microfilmar ou adotar qualquer

forma de arquivamento.

É permitida a menção, reprodução parcial ou integral e a transmissão entre

bibliotecas deste trabalho, sem modificação de seu texto, em qualquer meio que

esteja ou venha a ser fixado, para pesquisa acadêmica, comentários e citações,

desde que sem finalidade comercial e que seja feita a referência bibliográfica

completa.

Os conceitos expressos neste trabalho são de responsabilidade do autor e dos

orientadores.

F363 Fernandes, Marcus Vinícius dos Santos. Modelagem de erros em surtos em sistemas de comunicações / Marcus Vinícius dos Santos Fernandes. – Rio de Janeiro : Instituto Militar de Engenharia, 2002. 88 p. : il., graf., tab. Dissertação (mestrado) – Instituto Militar de Engenharia - Rio de Janeiro, 2002. 1. Modelagem de erros em surtos. I. Instituto Militar de Engenharia. II. Título. CDD 621.3822

3


MAJ MARCUS VINÍCIUS DOS SANTOS FERNANDES

MODELAGEM DE ERROS EM SURTOS EM SISTEMAS DE

COMUNICAÇÕES

Dissertação de Mestrado apresentada ao Curso de Mestrado em Engenharia Elétrica do Instituto Militar de Engenharia, como requisito parcial para a obtenção do título de Mestre em Ciências em Engenharia Elétrica.

Orientador: Prof. Ernesto Leite Pinto – D.C. Co-orientador: Marco Antonio Grivet Mattoso Maia – Ph.D.

Aprovada em 10 de maio de 2002 pela seguinte Banca Examinadora:

_______________________________________________________________ Prof. Ernesto Leite Pinto – D.C. do IME – Presidente

_______________________________________________________________ Prof. Marco Antonio Grivet Mattoso Maia – Ph.D. da PUC-Rio _______________________________________________________________ Prof. Pedro Henrique Gouvêa Coelho – Ph.D. da UERJ _______________________________________________________________ Prof. Francisco Marcos de Assis – D.C. da UFPB _______________________________________________________________ Prof. João Célio Barros Brandão – M.C. da PUC-Rio

Rio de Janeiro

2002

4

Aos meus pais Walter Fernandes e Maria Bernadete, à minha

esposa Maria Inês e à minha filha Marina Letícia.

5

AGRADECIMENTOS

Agradeço a todos que me apoiaram e incentivaram a vencer esta importante

etapa da minha carreira profissional.

À minha esposa e aos meus pais que sempre me encorajaram a superar as

dificuldades encontradas e seguir em busca do objetivo.

Aos professores e funcionários do Departamento de Engenharia Elétrica do IME

que de algum modo contribuíram para minha formação.

Em especial ao meu Professor Orientador Dr. Ernesto Leite Pinto e ao meu

Professor Co-orientador Dr. Marco Antonio Grivet Mattoso Maia, pela dedicação e

atenção que prestaram para a ampliação de meus conhecimentos e para a

realização deste trabalho.

6

SUMÁRIO

LISTA DE ILUSTRAÇÕES ................................................................................... 09

LISTA DE TABELAS ............................................................................................ 12

LISTA DE ABREVIATURAS E SÍMBOLOS ......................................................... 13

LISTA DE SIGLAS ............................................................................................... 15

1 INTRODUÇÃO ................................................................................ 18

1.1 Posicionamento do Trabalho ............................................................ 18

1.2 Finalidade do Trabalho ..................................................................... 19

1.3 Organização do Trabalho ................................................................. 20

2 CONCEITOS BÁSICOS ................................................................... 21

2.1. Erros em Surtos ................................................................................ 21

2.2 Modelos de Markov Escondido (HMM) ............................................. 22

2.2.1 Definição ........................................................................................... 22

2.2.2 Considerações .................................................................................. 23

2.2.2.1 Propriedade de Markov .................................................................... 23

2.2.2.2 Estacionariedade .............................................................................. 23

2.2.2.3 Seqüência de Observações .............................................................. 23

2.2.2.4 Independência da Saída ................................................................... 24

2.2.3 Parâmetros ....................................................................................... 24

2.2.4 Modelo de Gilbert- Elliott .................................................................. 25

2.2.5 Modelo de Fritchman ........................................................................ 27

2.2.6 Os Três Problemas Básicos Relativos a HMM ................................. 28

2.2.6.1 Cálculo da Função Verossimilhança ................................................ 29

2.2.6.1.1 Variável Progressiva ......................................................................... 29

2.2.6.1.2 Variável Regressiva .......................................................................... 30

2.2.6.2 Seqüência de Estados ...................................................................... 31

2.2.6.3 Estimação de Parâmetros ................................................................ 32

2.2.6.3.1 Critério da Máxima Verossimilhança (ML) ........................................ 32

7

2.2.6.3.2 Algoritmo de Baum-Welch ................................................................ 33

2.2.6.3.3 Problemas de Implementação .......................................................... 35

2.2.6.3.4 Ordem de Grandeza ......................................................................... 35

2.2.6.3.5 Seqüência de Observações Insuficiente .......................................... 36

2.2.6.3.6 Estimação Inicial dos Parâmetros .................................................... 37

2.2.6.3.7 Implementação ................................................................................. 37

3 MODELO DE MARKOV PROPOSTO .............................................. 41

3.1 Definições ......................................................................................... 42

3.1.1 Número de Estados .......................................................................... 43

3.1.2 Modelo Básico .................................................................................. 43

3.1.3 Tabela de Transição de Estados do Modelo Derivado ..................... 45

3.1.4 Matriz de Probabilidades de Transição ............................................ 45

3.1.5 Diagrama de Estados ....................................................................... 48

3.2

Cálculo das Distribuições de Probabilidades dos Parâmetros

Comprimento de Surto e Intervalo entre Surtos ...............................

49

3.2.1 Comprimento de surto ..................................................................... 49

3.2.2 Intervalo entre Surtos ....................................................................... 50

3.2.3 Cálculo Recursivo das Probabilidades P[C(k,l)] e P[I(k,l)] ................ 50

3.2.3.1 Probabilidade de Comprimento de Surto .......................................... 53

3.2.3.2 Probabilidade de Comprimento de Intervalo entre Surtos ................ 53

4 RESULTADOS ................................................................................. 55

4.1 Simulação ......................................................................................... 55

4.1.1 Levantamento do Parâmetro Comprimento de Surto ....................... 55

4.1.2 Levantamento do Parâmetro Intervalo entre Surtos ......................... 57

4.1.3 Densidade de Erro por surto ............................................................. 59

4.2 Modelo Derivado ............................................................................... 60

4.2.1 Distribuição Calculada dos Comprimentos de Surtos ...................... 60

4.2.1.1 Variação da Inclinação da Curva de Distribuição com L .................. 63

4.2.2 Comportamento Inicial da Distribuição dos Comprimentos .............. 64

4.2.3 Distribuição Calculada dos Intervalos entre Surtos .......................... 67

4.3 Comparação entre Simulação e Modelo Proposto ........................... 68

8

4.3.1 Comparação entre os Tempos de Processamento .......................... 71

4.4 Modelo Básico HMM de 3 Estados ................................................... 72

4.5 Modelo Básico de Fritchman-SES de 3 Estados .............................. 74

4.6 Modelagem de um Canal Simulado de HF ....................................... 79

4.6.1 Modelagem pelo Modelo de Gilbert-Elliott ........................................ 80

4.6.2 Estimação de Parâmetros pelo Modelo Derivado ............................ 82

5 CONCLUSÃO ................................................................................... 84

6 REFERÊNCIAS BIBLIOGRÁFICAS ................................................ 87

9

LISTA DE ILUSTRAÇÕES

FIG. 2.1 Modelo de Gilbert-Elliott .................................................................. 26

FIG. 2.2 Modelo de Fritchman-SES de N estados ........................................ 28

FIG. 2.3

Estimação dos parâmetros do modelo de Gilbert-Elliott pelo

algoritmo de Baum-Welch ...............................................................

39

FIG. 2.4 Efeito do tamanho da amostra na estimação de parâmetros pelo

método de Baum-Welch ..................................................................

40

FIG. 3.1 Modelo básico geral (HMM de n estados) ....................................... 44

FIG. 3.2 Célula básica de 2 estados – Gilbert Elliott ..................................... 44

FIG. 3.3 Diagrama de estados para um modelo originado de um modelo de

Gilbert-Elliott, para L=3 ....................................................................

48

FIG. 4.1 Comparação entre as distribuições do parâmetro comprimento de

surto, levantada para ‘L’s diferentes, a partir de um mesmo bloco .

56

FIG. 4.2 Comparação entre as distribuições do parâmetro intervalo entre

surtos, levantada para ‘L’s diferentes de um mesmo bloco ............

58

FIG. 4.3 Distribuição do parâmetro densidade de erro por surto média,

para L=3 ..........................................................................................

60

FIG. 4.4 Comparação entre as distribuições calculadas do parâmetro

comprimento de surto, para probabilidades de transição fixas e L

diferentes .........................................................................................

61

FIG. 4.5 Comportamento das distribuições calculadas e estimadas do

parâmetro comprimento de surto....................................................

62

1

FIG. 4.6 Comportamento da curva de distribuição dos comprimentos de

surto gerada pelo modelo de Gilbert-Elliott para PG e PB

próximos da unidade .......................................................................

63

FIG. 4.7 Curva coeficiente angular x L para a distribuição de comprimento

de surto ............................................................................................

64

FIG. 4.8 Comportamento inicial da distribuição do parâmetro comprimento

de surto e comparação entre modelo e simulação .......................

66

FIG. 4.9 Comparação entre as distribuições calculadas do parâmetro

intervalo entre surtos, para probabilidades de transição fixas e L

diferentes .........................................................................................

67

FIG. 4.10 Comparação entre simulação e modelo para L=3 .......................... 69

FIG. 4.11 Comparação entre simulação e modelo para L=4 .......................... 70

FIG. 4.12 Comparação entre simulação e modelo para L=10 ........................ 71

FIG. 4.13 Modelo básico de 3 estados ............................................................ 73

FIG. 4.14 Distribuição dos comprimentos entre surtos para um modelo

básico de 3 estados .........................................................................

73

FIG. 4.15 Distribuição dos intervalos entre surtos para um modelo básico de

3 estados .........................................................................................

74

FIG. 4.16 Modelo básico de Fritchman-SES de 3 estados ............................. 75

FIG. 4.17 Distribuições dos comprimentos de surto simuladas e calculadas,

com base no modelo de Fritchman-SES de 3 estados ...................

76

FIG. 4.18 Distribuições dos comprimentos de surto simuladas e calculadas,

com base no modelo de Fritchman-SES de 3 estados, para ‘L’s

diferentes .........................................................................................

77

1

FIG. 4.19 Distribuições dos intervalos entre surtos simuladas e calculadas,

com base no modelo de Fritchman-SES de 3 estados ...................

78

FIG. 4.20 Distribuições dos comprimentos de surtos levantadas da

simulação do canal de HF e calculadas pelo modelagem baseada

em um modelo básico de Gilbert-Elliott, cujos parâmetros foram

estimados ........................................................................................

81

FIG. 4.21 Distribuições dos intervalos entre surtos levantadas da simulação

do canal de HF e calculadas pela modelagem baseada em um

modelo básico de Gilbert-Elliott, cujos parâmetros foram

estimados ........................................................................................

82

FIG. 4.22 Ajuste da curva de distribuição dos comprimentos de surtos

pela curva obtida pelo modelo derivado ..........................................

83

1

LISTA DE TABELAS

TAB. 3.1 Tabela de transição para o modelo derivado ....................................... 45

TAB. 3.2 Tabela de transição simplificada para modelo básico de 2 estados

(η=2) .....................................................................................................

47

TAB. 4.1 Levantamentos estatísticos do parâmetro comprimento de surto do

experimento da FIG. 4.1 ....................................................................

57

TAB. 4.2 Estatística do parâmetro intervalo entre surtos .................................... 58

TAB. 4.3 Tempos de processamento .................................................................. 72

TAB. 4.4 Estatística para o parâmetro comprimento de surto, baseado no

modelo de Fritchman-SES de 3 estados .............................................

76

TAB. 4.5 Estatística para o parâmetro intervalo entre surtos, baseado no

modelo de Fritchman-SES de 3 estados .............................................

78

TAB. 4.6 Parâmetros da CCIR para simulação de condições do canal de HF ... 79

1

LISTA DE ABREVIATURAS E SÍMBOLOS

ABREVIATURAS

ARQ - Automatic Repeat reQuest

ATM - Asynchronous Transfer Mode

BER - Bit Error Rate

BLOS - Beyond Line of Sight

FEC - Forward Error Correction

HF - High Frequency

HMM - Hidden Markov Model

IID - Independentes e Identicamente Distribuidos

IP - Internet Protocol

LEO - Low Earth Orbit

ML - Maximum Likelihood

PDF - Probability Density Function

SchEMe - Skywave Channel Error Model

SES - Single Error State

UHF - Ultra High Frequency

TCP - Transport Control Protocol

SÍMBOLOS

A - Matriz de probabilidades de transição

B - Matriz das distribuições de probabilidades em cada estado

C(k,L) - Surto de comprimento k, dado L

ei - Estado i de um modelo de Markov

I - Conjunto das entradas do modelo derivado

I(k,L) - Intervalo de comprimento k, dado L

L - Critério de comprimento de surto

m - Número de símbolos do alfabeto de observações

N - Número de estados de um modelo de Markov ou do modelo derivado

1

NP - Número máximo de probabilidades distintas não nulas

ot - Observação no instante t

PB - Probabilidade de ir do estado bom para o estado ruim

pb - Probabilidade de erro do estado ruim

PG - Probabilidade de ir do estado ruim para o estado bom

pg - Probabilidade de erro do estado bom

P(O/λ) - Função Verossimilhança

P - Vetor das probabilidades dos estados do modelo derivado no estado

estacionário

qt - Estado no instante t

S - Conjunto dos estados do modelo derivado

αt(i) - Variável Progressiva

βt(i) - Variável Regressiva

η - Número de estados do modelo básico

λ - Modelo Escondido de Markov (HMM)

π - Vetor das probabilidades iniciais dos estados

1

LISTA DE SIGLAS

CCIR Comité Consultatif International de Radio

CCITT Community Colleges for Innovative Technology Transfer

IEEE Institute of Electrical and Electronic Engineers

ITU International Telecommunication Union

ITU-R ITU - Radio

1

RESUMO

A ocorrência de erros em surtos é um problema verificado principalmente nos canais “sem fio” incluindo as comunicações via satélite e os sistemas que operam na faixa de HF. A qualidade destes canais pode variar aleatoriamente devido a diversos fatores tais como: mobilidade, desvanecimento, sombreamento, interferência e ruído. A freqüência de operação e a velocidade do usuário de um sistema de comunicações influenciam no processo de desvanecimento devido ao efeito “multi-percursos”. Os códigos convolucionais e a decodificação de Viterbi, apesar de serem técnicas de correção de erros amplamente usadas para melhorar a taxa de erro de bit (BER) nos sistemas de comunicações via satélite, são também capazes de gerar erros em surtos. Neste trabalho é proposto um modelo de Markov para representar canais de comunicações sujeitos a erros em surtos, cujos estados e entradas são definidos com base em um modelo escondido de Markov clássico. Quando comparado com massas de dados simuladas, este modelo mostrou-se bastante eficiente com relação ao tratamento matemático e computacional voltados para o levantamento dos parâmetros de interesse.

1

ABSTRACT

The occurrence of burst errors is a problem mainly noted on wireless channels, including satellite communications systems and the systems that operate on HF band. The quality of that channels may fluctuates randomly due to a number of unpredictable effects such as mobility, fading, shadowing, interference, and noise. In wireless communications systems, the radio frequency and user speed affect the fading process due to the multi-path effect. Even though the convolutional codes and Viterbi decoding are error correction techniques widely used to improve the bit error rate (BER) performance over satellite communications systems, they are able to generate errors in bursts. In this work it is proposed a Markov model for modeling communications channels with busty behavior, which has its states and inputs definitions based in a classic Hidden Markov Model. When that model was compared with simulated data blocks, it was very efficient in the mathematic and computational treatments used to get the parameters of interest.

1

1 INTRODUÇÃO

1.1 POSICIONAMENTO DO TRABALHO

O fenômeno dos erros em surtos é uma característica dos canais “sem fio”,

sujeitos a todos aqueles fatores citados no resumo deste trabalho, abrangendo as

comunicações móveis, via satélite e HF, tão amplamente empregadas pelos

sistemas de comunicações atuais e em especial pelas Forças Armadas, devido suas

características de emprego. Isto ressalta a importância do estudo deste problema, e

o desenvolvimento de métodos que o minimizem, tornando mais confiáveis estes

importantes sistemas de comunicações. A seguir são citados alguns exemplos sobre

o impacto causado pelos erros em surtos sobre alguns sistemas de comunicações.

Os erros em surtos introduzidos pelo canal de um sistema de comunicações

podem acarretar impactos sobre os protocolos de comunicações. Como exemplo,

pode-se citar o protocolo TCP o qual associado ao IP é amplamente utilizado em

aplicações Internet, tendo sido inicialmente projetado para redes por cabo, onde a

taxa de erro de canal é muito baixa. Entretanto, quando associado a canais “sem

fio”, o TCP tem seu desempenho severamente afetado, devido à perda de pacotes

ocasionada pelos surtos de erros (CHOCKALINGAM, 1998). Da mesma forma nos

anos mais recentes tem havido um crescente interesse pelo ATM “sem fio”, o qual

inicialmente projetado para ambientes livres de erros, agora operando com canais

“sem fio” requer estudos sobre o impacto que recebe pelos erros em surtos (ZORZI,

Set 1998).

Os sistemas de comunicações táticas do Exército dos E.U.A. são tipicamente

amparados por sistemas de satélites a fim de prover alcance além da linha de visada

(BLOS). Estes sistemas adotam os protocolos ATM ou IP, os quais requerem canais

de alta qualidade com BER menor ou igual de 10-8. Como estes canais de satélites

apenas permitem BER da ordem de 10-5, uma solução encontrada para a melhora

de performance é a aplicação dos Códigos Convolucionais e Decodificação de

Viterbi, que por sua vez introduz erros em surtos no sistema (HEISSLER, 1999).

Em particular, o estudo do impacto causado pelos erros em surtos no

desempenho das técnicas de controle de erros assume grande importância diante

1

do exposto. Em (ZORZI, mai. 1998), é realizada uma comparação entre os

desempenhos dos métodos FEC (Forward Error Correction) e ARQ (Automatic

Repeat reQuest) de controle de erros, onde observa que num sistema de

comunicações “sem fio”, as técnicas de retransmissão para recuperar erros de canal

são soluções que em alguns casos devem ser mais eficientes do que as técnicas

FEC.

1.2 FINALIDADE DO TRABALHO

Os primeiros passos para o estudo do comportamento dos erros em surtos se

constituem na modelagem matemática deste fenômeno e no levantamento e análise

de seus parâmetros. A modelagem de um canal de comunicações tem como

finalidade a obtenção de modelos matemáticos capazes de representar com

adequada precisão o comportamento deste canal, sendo de grande importância para

o levantamento de seus parâmetros estatísticos e para o estudo de técnicas de

controle dos erros inerentes a este canal. Modelos nos quais os erros são

independentes e identicamente distribuídos (IID), são inadequados quando se

espera as condições de um canal sujeito ao fenômeno dos erros em surtos (ZORZI,

1999), pois estes possuem significante grau de correlação, não podendo, portanto

ser desprezado o efeito memória destes canais. Os modelos matemáticos mais

empregados para representar processos com memória, têm sido os modelos de

Markov, em que se supõe que a informação atual depende exclusivamente da

informação do instante de tempo imediatamente anterior sendo desnecessária a

informação de todo o passado restante (ZORZI, 2000 e HEISSLER, 1999). Dentre

eles destacam-se os modelos de Gilbert, Elliott e Fritchman, os quais serão descritos

no capítulo 2. Métodos empíricos e ajuste de curvas também são empregados para

representação de distribuições de parâmetros, como em (FRANCHI, 1993), que

procura ajustar a distribuição dos comprimentos de surtos por uma distribuição

geométrica.

Uma grande contribuição sobre o assunto tem sido dada por Michele Zorzi e

Ramesh R. Rao, por meio de suas publicações sobre erros em surtos, abordando a

sua modelagem, suas estatísticas e impacto em alguns sistemas de comunicações

como o TCP (ZORZI, 2000). Já Rabiner e Juang, apesar de trabalharem

2

direcionados para o processamento de sinais de voz, muito contribuem com

métodos para a estimação de parâmetros de um Modelo Escondido de Markov,

possuindo, além de suas publicações, um livro que aborda este assunto (RABINER,

1993).

1.3 ORGANIZAÇÃO DO TRABALHO

O presente trabalho procura encontrar um método eficiente para se obter

modelos adequados para os canais sujeitos a erros em surtos e para o levantamento

e análise dos parâmetros “comprimento de surto de erro” e “intervalo entre surtos de

erro”. O capítulo 2 aborda a definição de erro em surto do CCITT, a qual será

adotada para as análises realizadas, e a teoria sobre as Cadeias de Markov

Escondidas, base necessária ao desenvolvimento deste trabalho e das ferramentas

de simulação e análise.

O enfoque principal do trabalho, abordado pelo capítulo 3, é a proposta de uma

solução para o problema da modelagem e do levantamento dos parâmetros

“comprimento de surto de erro” e “intervalo entre surtos de erro”. Isto é realizado por

meio de um modelo de Markov gerado por uma nova definição dos estados e das

entradas. O capítulo 4, de uma maneira geral, traz os resultados, baseados no

levantamento dos referidos parâmetros de blocos de dados simulados afetados por

surtos de erro e os baseados no modelo proposto no capítulo 3, sendo realizada

comparação entre os dois métodos. Ao final deste capítulo é sugerido e

exemplificado um método para estimação de parâmetros de um HMM por meio do

modelo proposto. O capítulo 5 apresenta uma conclusão, mostrando a contribuição

do trabalho para o estudo dos erros em surtos e propostas para futuros trabalhos

relacionados à aplicação dos resultados aqui obtidos.

2

2 CONCEITOS BÁSICOS

2.1. ERROS EM SURTOS

Um surto de erro é definido pelo CCITT (CCITT “BLUE BOOK”) como: Um

grupo de bits no qual dois bits errados sucessivos estejam sempre separados por

menos do que um dado número L de bits corretos. O número L, que a partir de

agora chamaremos de critério de comprimento de surto, como é definido em

(FRANCHI, 1993), deve ser adequadamente escolhido conforme a aplicação, antes

de qualquer análise ou levantamento de parâmetros. Esta definição afeta

diretamente as distribuições de probabilidades dos parâmetros ‘comprimento de

surto de erro’ e ‘comprimento de intervalo entre surtos de erro’, os quais por

comodidade, a partir de agora chamaremos simplesmente de ‘comprimento de surto’

e ‘intervalo entre surtos’, respectivamente.

O primeiro parâmetro mencionado é o comprimento de um surto de erros,

conforme a definição do CCITT. Este parâmetro é afetado, pois quanto maior é L,

mais seqüências de bits errados, separadas de no máximo L-1 bits corretos são

unidas formando surtos mais longos. Ocorrem assim, uma diminuição das

probabilidades de ocorrência de surtos menores, ao mesmo tempo em que

aumentam as probabilidades de ocorrência de surtos maiores. O segundo parâmetro

refere-se ao número de bits corretos (maior ou igual a L), que separa dois surtos de

erro consecutivos. Este parâmetro é afetado em primeiro lugar, com relação ao

suporte da sua distribuição, pois de acordo com a definição de surto de erro do

CCITT, o menor intervalo entre dois surtos que pode ocorrer é de comprimento L.

Em segundo lugar, com o aumento de L, tem-se uma diminuição dos números de

intervalos possíveis e um conseqüente aumento das respectivas probabilidades de

ocorrência.

A. Franchi e R. A. Harris (FRANCHI, 1993) realizam experimentos baseados na

definição de surto de erro do CCITT, onde levantam a variação sofrida pelos

parâmetros comprimento de surto, comprimento médio de surto e densidade de erro

em um surto, para diferentes valores de L.

2

Todas as distribuições de probabilidades apresentadas neste trabalho são de

probabilidades condicionais, dado a ocorrência dos surtos de erros.

Os processos de Markov, apesar de serem simples aproximações, permitem-

nos representar o efeito memória dos processos com erros em surtos (ZORZI, 1999)

e ainda, a possibilidade de tratá-los analiticamente. Modelos mais precisos podem

ser encontrados, porém em muitos casos, resultando em um aumento de

complexidade matemática não compensador em termos práticos (ZORZI, 1999).

Assim, na escolha do modelo mais adequado à nossa aplicação, devemos levar em

conta os fatores precisão e complexidade, assim como o tempo de processamento.

O fator precisão significa a capacidade do modelo em representar, em termos

estatísticos o comportamento de um determinado canal de comunicações; o fator

complexidade diz respeito à representação matemática do modelo, implicando

diretamente na complexidade computacional, em termos de memória e do tempo de

processamento, que foi o último fator mencionado relacionando-se à velocidade com

que os resultados computacionais são gerados, seja em simulações ou

levantamentos de parâmetros extraídos de massas de dados.

2.2 MODELOS DE MARKOV ESCONDIDO (HMM)

2.2.1 DEFINIÇÃO

HMM (Hidden Markov Model) é um modelo composto de um conjunto finito de

estados, cada qual por sua vez associado a uma distribuição de probabilidades da

ocorrência de observações. Neste trabalho, em que o tempo é considerado discreto,

as transições entre os estados acontecem a cada unidade de tempo e são definidas

por um conjunto de probabilidades chamadas probabilidades de transição. Assim,

não só o estado, mas também a distribuição de probabilidades associada a este,

influenciará nas observações geradas. O termo “observação” é empregado porque

se refere ao símbolo que aparece para um observador externo, sendo os estados

escondidos a este, daí o nome Modelo de Markov Escondido.

2

2.2.2 CONSIDERAÇÕES

Com o objetivo de diminuir a complexidade do tratamento matemático e

computacional dos HMMs, são feitas as seguintes considerações:

2.2.2.1 PROPRIEDADE DE MARKOV

As probabilidades de transição são definidas como: ai,j = p(qt+1 = j | qt = i ), onde

qt é definido como o estado do sistema no instante t. É considerado que o próximo

estado, depende apenas do estado atual, não importando nenhum estado passado.

Com esta suposição, o modelo resultante é dito HMM de primeira ordem. Entretanto

podemos considerar que o próximo estado dependa dos ‘k’ estados passados e

assim poderemos obter um modelo chamado HMM de k-ésima ordem com as

correspondentes probabilidades de transição a seguir definidas:

Njiiiiqiqiqjqpa kkkttttjiii k≤≤===== +−−+ ,,,,1),,,,|( 2112111,21

LLL (2.1)

HMM de ordens mais altas geram maior complexidade, sendo mais empregados

os HMMs de primeira ordem, como será o nosso caso no estudo dos erros em

surtos.

2.2.2.2 ESTACIONARIEDADE

As probabilidades de transições entre estados são independentes de

deslocamentos no tempo, como está matematicamente representado a seguir:

)|()|(2211 11 iqjqpiqjqp tttt ===== ++ (2.2)

para qualquer t1 e t2.

2.2.2.3 SEQÜÊNCIA DE OBSERVAÇÕES

Considera-se como seqüência de observações, uma seqüência indicadora da

correção dos bits da seqüência de dados em questão, sendo que cada bit ‘0’ da

primeira indica que o correspondente bit da segunda chegou correto, e cada bit ‘1’

da primeira indica que o correspondente bit da segunda chegou errado.

2

2.2.2.4 INDEPENDÊNCIA DA SAÍDA

A observação atual é estatisticamente independente das observações

anteriores. Podemos representar matematicamente esta consideração definindo a

seqüência de observações:

O = o1, o2, ... oT (2.3)

considerando um HMM λ, temos:

∏=

=T

t

ttT qopqqqOp1

21 ),|(),,...,,|( λλ (2.4)

2.2.3 PARÂMETROS

Para que um HMM deste tipo seja completamente caracterizado, é necessário

estarem definidos os seguintes parâmetros:

N – Número de estados;

m – Número de símbolos do alfabeto de observações. Admite-se a partir deste

ponto que a observação assume valores em um conjunto discreto e finito. Ou seja,

que cada observação ot ∈ ν1, ν2, ... , νm , que é o conjunto alfabeto de

observações.

A – Matriz das probabilidades de transição, sendo:

A=ai,j; ai,j = p(qt+1 = j | qt = i ); 1 ≤ i, j ≤ N; (2.5)

‘qt’ representa o estado no tempo ‘t’.

As probabilidades de transição ‘aij’ devem atender as seguintes condições:

0 ≤ ai,j ≤ 1; ;11

, =∑=

N

j

jia 1 ≤ i, j ≤ N; (2.6)

B – Matriz das distribuições de probabilidades em cada estado sendo:

B = bj(k) ; onde: bj(k) = p(ot = vk | qt = j), 0 ≤ j ≤ N; 1 ≤ k ≤ m (2.7)

2

e ‘vk’ representa o K-ésimo símbolo de observação no alfabeto e ‘ot’ a observação

no tempo ‘t’.

As probabilidades ‘bj’ devem obedecer as seguintes condições:

0 ≤ bj(k) ≤ 1; ;1)( 1

=∑=

m

k

j kb 0 ≤ j ≤ N; 1 ≤ k ≤ m (2.8)

π – Vetor das probabilidades iniciais de cada estado sendo:

π = πi ; onde: πi = p(q1 = i) (2.9)

As probabilidades ‘πi’ devem obedecer as seguintes condições:

0 ≤πi ≤ 1; 1 1

=∑=

N

i

iπ ; 1 ≤ i ≤ N; (2.10)

Assim representamos um HMM com distribuição discreta de probabilidades por:

λ=(A,B,π) (2.11)

2.2.4 MODELO DE GILBERT- ELLIOTT

Especificamente para o caso da modelagem dos erros em surtos, algumas

publicações como (ZORZI, 1996, set. 1998 e 1999) informa que o modelo de Gilbert-

Elliott, que é um HMM de primeira ordem de dois estados, modela satisfatoriamente

este fenômeno e que por sua simplicidade, possibilita adequado tratamento

matemático e computacional. O alfabeto de símbolos utilizados é o binário (m=2).

Este modelo é definido da seguinte forma:

a) O estado 1 representa o estado bom (G);

b) O estado 2 representa o estado ruim (B);

c) O vetor B possui como elementos apenas quatro probabilidades: as duas

probabilidades complementares de emitir um bit errado ou um bit correto no estado 1

e as duas probabilidades análogas para estado 2 ( bi(k) );

d) O vetor π se constitui das 2 probabilidades iniciais do sistema: a

probabilidade de estar no estado 1 (P1) e a de estar no estado 2 (P2). Como

a consideração de estacionariedade é adotada, o vetor das probabilidades

de estado iniciais é o vetor das probabilidades do estado estacionário. Assim

2

o vetor π é o autovetor da matriz de transição (A), correspondente ao

autovalor 1, sendo solução do seguinte sistema (PAPOULIS, 1991, p. 639):

πA = π , e πi ≥ 0

e) O diagrama de estados correspondente a este modelo está representado na

FIG. 2.1:

Assim os parâmetros para este modelo ficam resumidos como a seguir:

=

2221

1211

aa

aaA sendo: a12 = 1- a11 e a22 = 1- a21 (2.12)

=

)1()0(

)1()0(

22

11

bb

bbB sendo: b1(0) = 1 - b1(1) e b2(0) = 1 – b2(1) (2.13)

( )21,PP=π sendo: 12 1 PP −= e 2112

211

aa

aP

+= (2.14)

O número de unidades de tempo em que o canal permanece no estado ruim é

uma variável aleatória com distribuição geométrica, portanto com média 1/a21.

Analogamente, o tempo que o canal permanece no estado bom é uma variável

aleatória com média 1/a12 (ZORZI, 1995, 1996 e 1997).

FIG. 2.1: Modelo de Gilbert-Elliott

1 1

=∑=

N

i

iπ

2

O modelo de Gilbert-Elliott é uma generalização do modelo de Gilbert, realizado

por Elliott. Inicialmente Gilbert idealizou um modelo de Markov de dois estados,

semelhante ao apresentado neste item, porém com a diferença de possuir

probabilidade de erro igual a zero no estado bom ( b1(1)=0 ). Mais tarde Elliott

considerou a possibilidade de probabilidades de erro diferentes de zero para o

estado bom (SHEN, 1999). A seguir será apresentado o modelo de Fritchman, uma

generalização do modelo de Gilbert, em relação ao número de estados.

2.2.5 MODELO DE FRITCHMAN

Para os canais cujos erros em surtos não são adequadamente representados

pelo modelo de Gilbert-Elliott, uma outra possibilidade é o modelo N-estados

particionados de Fritchman, que se constitui de uma generalização do modelo de

Gilbert, para N estados. Nele os estados são particionados em k estados de erro

(ruins) e N-k estados livres de erros (bons), em que só são permitidas transições

entre os estados bons e os estados ruins (FRITCHMAN, 1967). O que diferencia os

estados bons entre si são as respectivas probabilidades de transição entre estes e o

estado ruim. Neste modelo, a distribuição de intervalos entre surtos fica descrita pela

soma de k distribuições exponenciais enquanto a distribuição de comprimentos de

surtos pela soma de N-k exponenciais (CHU, 2002).

Uma particularização do modelo de Fritchman é o modelo Fritchman-SES

(SES – Sigle-Error-State), selecionado por (JOHNSON, 1994) para modelar o “HF

SchEMe” (Skywave Channel Error Model). Este modelo consiste no modelo de

Fritchman para k=1, ou seja, um único estado ruim para vários estados bons os

quais podem ser em número de dois, três ou mais. Na FIG. 2.2 está representado

um modelo de Fritchman-SES de N estados, onde o estado ruim está indicado por

(B) e os N-1 estados bons estão indicados por (G1), (G2) ... (GN-1), respectivamente.

Este modelo é definido pela seguinte matriz de transição, onde o estado N foi

considerado o estado ruim, deste modo os elementos nulos representam as

probabilidades de transição entre os estados bons:

2

=

−

−−

NNNNNNN

NN

N

N

N

ppppp

p

pp

pp

pp

A

1,321

1,1

333

222

111

0000

000

000

000

L

L

MMOMMM

L

L

L

Outras formas do modelo de Fritchman podem ser também utilizadas de acordo

com a aplicação. Para ilustrar a seleção de diferentes modelos para diferentes

aplicações, estudos sobre modelagem de canais de satélites de baixa órbita (LEO)

descritos em (CHU, 2002) empregam, além dos modelos de Fritchman-SES de três

e quatro estados, o modelo de Fritchman de 4 estados para k=2, ou seja dois

estados bons e dois estados ruins. O primeiro modelo mencionado acima é utilizado

em (CHU, 2002). para descrever a estatística de surtos de erros do sistema LEO-

UHF para os ângulos de elevação de 23o e 52o; o segundo para os ângulos de

elevação restantes e o terceiro para canais sujeitos a interferências.

2.2.6 OS TRÊS PROBLEMAS BÁSICOS RELATIVOS A HMM

No que diz respeito ao levantamento de parâmetros estatísticos a partir de uma

massa de dados existente, os HMMs dão origem a três problemas. A seguir, tudo de

(RABINER, 1993), serão apresentados uma rápida descrição destes problemas e

2

um posterior detalhamento do desenvolvimento teórico que será aplicado aos erros

em surtos, na implementação de ferramentas para estimação de parâmetros:

- Cálculo da função Verossimilhança: dado um HMM λ=(A,B,π) e uma

seqüência O = o1, o2, ... oT de observações, deseja-se calcular a probabilidade

das observações terem sido geradas pelo modelo λ:

P(O/λ); (2.15)

- Seqüência de Estados: dado um HMM λ=(A,B,π) e uma seqüência

O = o1, o2, ... oT de observações, deseja-se saber qual a mais provável seqüência

de estados de λ, que tenha gerado o conjunto de observações O;

- Estimação ML de Parâmetros: dada uma seqüência O = o1, o2, ... oT de

observações, deseja-se ajustar os parâmetros do modelo HMM λ=(A,B,π), de modo

a maximizar P(O/λ).

2.2.6.1 CÁLCULO DA FUNÇÃO VEROSSIMILHANÇA

Com o modelo λ=(A,B,π) e uma seqüência de observações O = o1, o2, ... oT

e devemos calcular a probabilidade da seqüência ‘O’ dado o modelo λ, P(O/λ). No

entanto, se este cálculo for feito de maneira direta, a sua alta complexidade o torna

computacionalmente inviável, mesmo para seqüências de pequeno comprimento,

pois envolve um número de operações da ordem NT, que cresce exponencialmente

com o tamanho da seqüência (T). Assim devemos buscar um método de cálculo que

reduza esta complexidade de modo a tornar o problema computacionalmente

tratável. Para tanto faremos uso de duas variáveis auxiliares: αt(i) – Variável

Progressiva e βt(i) – Variável Regressiva.

2.2.6.1.1 VARIÁVEL PROGRESSIVA

A Variável Progressiva é definida como a probabilidade de ocorrência da

seqüência parcial de observações O1t = o1, o2, ... ot, quando terminada no estado i,

isto é, ot sendo gerado pelo estado i. Está matematicamente representada a seguir:

3

)|,,...,,(),( 211 λα iqooopiO tt

t

t == (2.16)

A qual a partir daqui nos referiremos simplesmente como αt(i).

Assim podemos deduzir a seguinte relação recursiva:

∑=

++ =N

i

ijttjt aiobj1

11 )()()( αα , 1 ≤ j ≤ N , 1 ≤ t ≤ T-1 (2.17)

onde: α1(j) = πjbj(o1), 1 ≤ j ≤ N (2.18)

Através das relações acima calculamos:

αT(i) , 1 ≤ i ≤ N (2.19)

A função verossimilhança é dada por:

∑=

=N

i

T iOp1

)()|( αλ (2.20)

A complexidade deste cálculo é proporcional a N2T, que cresce linearmente com o

tamanho da seqüência T.

2.2.6.1.2 VARIÁVEL REGRESSIVA

Agora definimos a Variável Regressiva, como a probabilidade da ocorrência da

seqüência parcial de observações O1t = ot+1, ot+2, ... , oT, dado que o estado atual é

i, e está matematicamente representada a seguir:

),|,...,,(),( 211 λβ iqooopiO TTtt

t

t == ++ (2.21)

a qual a partir daqui nos referiremos simplesmente como βt(i).

Como no caso de αt(i) existe uma relação recursiva para o cálculo de βt(i):

)()()( 1

1

1 +=

+∑= t

N

j

jijtt obaji ββ , 1 ≤ i ≤ N , 1 ≤ t ≤ T-1 (2.22)

onde: βT(i)=1, 1 ≤ i ≤ N (2.23)

Das relações acima temos:

αt(i)βt(i) = p(O, qt = i | λ ), 1 ≤ i ≤ N , 1 ≤ t ≤ T (2.24)

Assim obtemos um outro modo para o cálculo de P(O/λ), usando as duas variáveis

acima definidas, como a seguir:

3

∑∑==

===N

i

tt

N

i

t iiiqOpOp11

)()(|),()|( βαλ (2.25)

2.2.6.2 SEQÜÊNCIA DE ESTADOS

Com o modelo λ=(A,B,π) e a seqüência O = o1, o2, ... oT de observações,

deseja-se encontrar a seqüência de estados mais provável do modelo que possa ter

gerado as observações. O critério mais utilizado para este fim é o que encontra uma

única seqüência de estados como solução através da maximização da probabilidade

P(q,O|λ) pelo Algoritmo de Viterbi.

Primeiramente definimos a variável δt(i), que indica a seqüência de estados mais

provável de comprimento t, relativa às t primeiras observações e que termina no

estado i:

|...,,...max)( 21121,...,, 121

λδ tttqqq

t oooiqqqqPit

== −−

(2.26)

por indução:

)(])([max)( 11 ++ = tjijti

t obaij δδ (2.27)

Assim encontramos a seqüência q1q2, ..., qT, que maximiza a EQ. 2.27 para cada t e

j. Para implementar uma rotina que calcule a seqüência de estados mais provável,

podemos seguir os passos:

a) Inicialização

( )11 )( obi iiπδ = (2.28)

0)(1 =iψ 1 ≤ j ≤ N (2.29)

b) Recursividade

)(])([max)( 11

tjijtNi

t obaij −≤≤

= δδ (2.30)

])([maxarg)( 11

ijtNi

t aij −≤≤

= δψ 2 ≤ t ≤ T e 1 ≤ j ≤ N (2.31)

c) Término

3

)]([max1

*iP T

Niδ

≤≤= (2.32)

)]([maxarg1

*iq T

NiT δ

≤≤

= (2.33)

d) Seqüência de estados

)( *

11

*

++= ttt qq ψ t=T-1, T-2, ..., 1 (2.34)

2.2.6.3 ESTIMAÇÃO DE PARÂMETROS

Neste caso o objetivo é ajustar os parâmetros de um HMM (A,B,π) para que este

represente da melhor maneira possível uma dada seqüência de observações

(seqüência de treinamento). Para a nossa aplicação utilizaremos o critério da

Máxima Verossimilhança (ML) implementando o Algoritmo de Baum-Welch.

2.2.6.3.1 CRITÉRIO DA MÁXIMA VEROSSIMILHANÇA (ML)

No Critério ML, nós procuramos maximizar a probabilidade de uma dada

seqüência de observações O = o1, o2, ... oT ter sido gerada por um dado HMM λ, por

meio do ajuste de seus parâmetros (A,B,π). Essa probabilidade é a verossimilhança

total das observações, isto é, a soma das probabilidades da observação ter sido

gerada por todas as seqüências de estados possíveis e é matematicamente

representada por:

Ltot = P(O/λ) (2.35)

Não existe nenhuma maneira conhecida de se resolver este problema

analiticamente, ou seja encontrar os parâmetros do HMM λ que maximize Ltot

(RABINER, 1993, p. 342). No entanto podemos encontrar parâmetros que maximize

localmente Ltot , através do uso do Algoritmo de Baum-Welch, o qual está descrito a

seguir:

3

2.2.6.3.2 ALGORITMO DE BAUM-WELCH

Primeiramente definimos a função auxiliar Q:

∑=q

qOpqOpQ )|,(log)'|,(),'( λλλλ (2.36)

a qual deverá ser maximizada em λ a fim de atualizar λ’ no sentido de aumentar

P(O|λ), por meio de cálculos recursivos (RABINER, 1993, p. 344-346), porque:

)'|()|()','(),'( λλλλλλ OPOPQQ ≥⇒≥ (2.37)

Uma característica muito importante deste algoritmo é a garantia da

convergência (RABINER, 1993, p. 344,348):. Define-se ainda, mais duas variáveis

auxiliares em adição as variáveis progressiva e regressiva definidas anteriormente.

A primeira delas é dada pela probabilidade de se estar no estado i em t e no estado

j em t+1 dado o modelo e a seqüência de observações, ou seja:

),|,(),( 1 λξ Ojqiqpji ttt === + (2.38)

ou ainda,

)|(

)|,,(),( 1

λ

λξ

Op

Ojqiqpji tt

t

=== +

(2.39)

em função das variáveis progressiva e Regressiva,

∑∑= =

++

++=

N

i

N

j

tjtijt

tjtijt

t

objai

objaiji

1 1

11

11

)()()(

)()()(),(

βα

βαξ

(2.40)

A segunda variável auxiliar é dada pela probabilidade de se estar no estado i em t,

dados a seqüência de observações e o modelo λ, ou seja:

),|()( λγ Oiqpi tt == (2.41)

Em função das variáveis progressiva e Regressiva,

∑=

=

N

i

tt

tt

ii

ii

t i

1

)()(

)()()(

βα

βαγ (2.42)

3

A relação entre γ(i) e ξ(i,j) é dada por:

∑=

=N

j

tt ji1

),(ξγ , 1≤i≤N, 1≤t≤M (2.43)

Agora podemos descrever as equações de reestimação dos parâmetros pelo

método de Baum-Welch. Estas equações são recursivas e a cada iteração o

parâmetro calculado é substituído na própria equação e calculado novamente

(reestimado), e assim sucessivamente até que se alcance o valor do parâmetro

procurado, segundo algum critério de parada. Os parâmetros de um HMM são

atualizados a cada iteração, no sentido de maximizar a probabilidade P(O/λ),

supondo um modelo modelo inicial λ1 =(A1 ,B1 ,π1). Inicialmente calculamos os ‘α’s

utilizando as EQ. 2.17 e 2.18, e os ‘β’s utilizando as EQ. 2.22 e 2.23. Em seguida

calculamos ξ’ e γ através das EQ. 2.32 e 2.34, respectivamente. Finalmente

atualizamos os parâmetros do HMM seguindo as equações a seguir, conhecidas

como fórmulas de reestimação:

Niii ≤≤= 1),(1γπ (2.44)

NjNi

i

ji

aT

t

t

T

t

t

ij ≤≤≤≤=

∑

∑−

=

−

= 1,1,

)(

),(

1

1

1

1

γ

ξ

(2.45)

mkNj

j

j

kbT

t

t

T

vOt

t

j

kt ≤≤≤≤=

∑

∑

=

==

1,1,

)(

)(

)(

1

1

γ

γ

(2.46)

Em função das variáveis progressiva e regressiva temos:

∑=

=N

j

T

i

j

ii

1

00

)(

)()(

α

βαπ

(2.47)

3

∑

∑

=−−

=−

=T

t

tt

T

t

ttjijt

ij

ii

jobai

a

1

11

1

1

)()(

)()()(

βα

βα

(2.48)

∑

∑

=

==T

t

tt

T

t

kttt

i

ii

voii

kb

1

1

)()(

),()()(

)(

βα

δβα

(2.49)

sendo:

≠

==

kt

kt

ktvose

vosevo

0

1),(δ

2.2.6.3.3 PROBLEMAS DE IMPLEMENTAÇÃO

Teoricamente, chegamos as fórmulas de reestimação, porém ainda existem

vários detalhes em nível de implementação que devemos observar e corrigir.

Comentaremos em seguida os mais significativos para este trabalho:

2.2.6.3.4 ORDEM DE GRANDEZA

As operações recursivas realizadas durante a estimação dos parâmetros de um

HMM fazem com que estes tendam a zero com o número de iterações. Isto acontece

devido ao fato de que as variáveis α(i) e β(i) são produzidas por um cálculo recursivo

e que cada iteração envolve produtos de probabilidades, como observado nas EQ.

2.17 e 2.22. Assim estes fatores são menores do que 1, fazendo com que α(i) e β(i)

atuais sejam sempre menores do que os anteriores, o que leva o valor destas

variáveis exponencialmente para zero com o incremento de t. Assim, mesmo que a

seqüência não seja muito grande, o limite de precisão de qualquer computador é

rapidamente atingido ao se executar este algoritmo. Para combater este problema

utilizaremos uma técnica de ponderar estas variáveis, ou seja, multiplicá-las por um

fator de escala ‘ct’ dependente do tempo, mas que não dependa de ‘i’ (RABINER,

1993, p. 365), de forma que os valores destas variáveis sejam mantidos dentro dos

3

limites de precisão do computador, quando o t varia de 1 até T. Os cálculos deste

procedimento estão descritos a seguir:

- Para t=1, calcula-se α1(i) como na EQ. 2.17;

- Cálculo do fator c1: ∑=

=N

i

i

c

1

1

1

)(

1

α e )()(ˆ111 ici αα = (2.50)

onde: )(ˆ1 iα representa o )(1 iα ponderado pelo fator c1;

- Cálculo recursivo de )(ˆ1 iα : ∑

=−=

N

j

tijitt obaji1

1 )()(ˆ)(ˆ αα ; (2.51)

Após calculado, )(ˆ itα deve ser aplicado nas EQ. 2.52, para o cálculo dos

novos valores de ct e )(ˆ itα , que deverão ser novamente aplicados na EQ. 2.51, e

assim sucessivamente.

sendo: )(ˆ)(ˆ ici ttt αα = onde: ∑=

=N

i

t

t

i

c

1

)(ˆ

1

α (2.52)

Como βt(i) possui a mesma ordem de grandeza de αt(i), utilizaremos o mesmo

fator de escala ct para ponderar estas variáveis, que também serão mantidas em

limites razoáveis para o cálculo computacional.

assim: )()(ˆ ici ttt ββ = (2.53)

2.2.6.3.5 SEQÜÊNCIA DE OBSERVAÇÕES INSUFICIENTE

Um outro problema ao nível de implementação é o efeito causado por uma

pequena seqüência de observação. No caso de bi(k), que significa a probabilidade

de ocorrer a observação vk no estado i, observa-se que o numerador de sua

equação de reestimação (EQ. 2.49) é uma soma cujos termos em que a observação

ot é diferente do símbolo vk, são nulos. Se esta probabilidade é pequena e a amostra

3

da seqüência utilizada na reestimação for também pequena, pode não ocorrer

nenhuma vez o evento ot igual a vk no estado i, assim o correspondente bi(k)

reestimado e conseqüentemente os seguintes serão nulos, levando os cálculos a

valores irreais.

Possíveis soluções seriam aumentar o comprimento da seqüência observada ou

diminuir o número de estados ou o número de símbolos do modelo utilizado,

parâmetros que geralmente não podemos alterar. Uma solução prática estipular

limiares mínimos para os parâmetros do modelo, obrigando-os durante a execução

do algoritmo a ficarem sempre acima destes limites, exemplo (RABINER, 1993, p.

371):

≥

=..,

;)(),()(

co

kbkbkb

b

bii

i δ

δ (2.54)

sendo: δb é o limiar mínimo fixado

2.2.6.3.6 ESTIMAÇÃO INICIAL DOS PARÂMETROS

As equações de reestimação produzem valores dos parâmetros de um HMM,

correspondentes a convergência para qualquer um dos máximos locais da função

verossimilhança, se houver mais de um. Portanto precisamos escolher parâmetros

iniciais, que nos conduzam ao seu máximo global. Não existe nenhuma maneira

simples e direta para resolver este problema (RABINER, 1993, p. 370), porém a

experiência tem mostrado que estimações iniciais aleatórias ou uniforme de ‘π’ e ‘A’

são adequados para a reestimação desses parâmetros. Foi observado que, para o

modelo de Gilbert-Elliott, as estimações iniciais sendo baseadas nas tendências dos

parâmetros devido a baixa probabilidade de erro do canal e dividindo-as em dois

grupos um de baixas probabilidades ( ≤ 0.25) e outro de altas probabilidades ( ≥

0.75), a convergência dos parâmetros se aproximou satisfatoriamente dos valores

esperados.

2.2.6.3.7 IMPLEMENTAÇÃO

Apesar deste assunto não ser o objeto principal deste trabalho, com o objetivo

de se obter uma ferramenta auxiliar para nossos estudos, foi implementado um

3

programa, que executa o algoritmo de Baum-Welch, recebendo como parâmetros de

entrada o bloco de dados e os valores iniciais para o processo de reestimação. A

FIG. 2.3 apresenta, como ilustração, o resultado obtido da estimação dos

parâmetros definidores de um HMM de dois estados. Observe que para este caso,

houve a convergência de todos os parâmetros com menos de dez iterações.

Observou-se para um bloco fixo de dados, que o número de iterações até a

convergência com determinada precisão, depende de dois fatores; dos parâmetros

iniciais e do tamanho da amostra. Este último influi também na precisão dos valores

finais encontrados, ou seja uma amostra pequena pode convergir em poucas

iterações, porém para valores assintóticos diferentes dos parâmetros reais.

A FIG. 2.4 ilustra a importância da dimensão da amostra utilizada para a

estimação dos parâmetros de um sistema. Observe que, apesar da convergência ter

ocorrido para todas as amostras em poucas iterações, à medida que aumentamos o

tamanho da amostra, a convergência ocorre para assíntotas correspondentes a

valores mais próximos dos parâmetros previamente conhecidos, que deram origem

a seqüência.

3

4

4

3 MODELO DE MARKOV PROPOSTO

Com o objetivo de solucionar eficientemente o problema da modelagem e da

análise de parâmetros dos erros em surtos, será proposto neste capítulo um modelo

de Markov específico para o cálculo das distribuições de probabilidades dos

parâmetros comprimento de surto e intervalo entre surtos, cuja dedução das

equações será detalhadamente apresentada. Basicamente, este modelo constitui-se

de uma Cadeia de Markov clássica originada a partir de uma Cadeia Escondida de

Markov (HMM). A partir deste ponto, a primeira cadeia mencionada acima será

referida como modelo derivado e a segunda como modelo básico. O modelo

derivado, apesar de mais complexo do que o modelo básico, é dedicado ao cálculo

dos parâmetros comprimento de surto e intervalo entre surtos, sendo a eficiência

nestes cálculos sua principal vantagem. Este modelo segue uma nova definição para

seus estados e suas entradas, onde uma entrada é definida como sendo uma

excitação originada no modelo básico necessária à transição de um estado para

outro ou para o mesmo estado do modelo derivado. Sua construção basea-se nos

quatro itens seguintes:

a) Toma-se um HMM como modelo básico e escolhe-se um valor para o critério

de comprimento de surto (L);

b) O estado atual do modelo derivado é definido por dois parâmetros, o estado

atual ei do modelo básico e o número y de bits 0 gerados após o último bit 1

gerado pelo modelo básico, sendo que se o número de bits 0 for maior ou

igual a L, define-se que y = E. Assim os estados de um modelo derivado de

um modelo básico de η estados são representadas por:

(ei, 0), (ei, 1), (ei, 2), ..., (ei, L-1), (ei, E) 1 ≤ i ≤ η;

c) A entrada do modelo derivado é definida por dois parâmetros: o próximo

estado ej do modelo básico e o bit gerado (0 ou 1) pelo estado atual do modelo

básico. Assim as entradas de um modelo derivado de um modelo básico de η

estados são representadas por:

(ej, 0) e (ej, 1) 1 ≤ j ≤ η;

4

d) Esta operação conduz a construção de uma nova matriz de transição e de

um correspondente diagrama de estados, dos quais a complexidade depende do

número de estados do modelo básico e de L.

Este modelo derivado possibilita a dedução das distribuições de probabilidades

dos parâmetros comprimento de surto e intervalo entre surtos, com muito mais

velocidade e precisão do que o levantamento destes parâmetros feitos através de

simulações.

3.1 DEFINIÇÕES

São definidos os seguintes parâmetros:

L – Critério de comprimento de surto;

N – No de estados do modelo derivado;

m – tamanho do alfabeto de símbolos dos vetores das observações:

m=2, O = 0,1 onde: '0' ≡ acerto e

'1' ≡ erro;

A – Matriz das probabilidades de transição do modelo derivado:

A= ai,j , ai,j = p(qt+1= j | qt = i ), 1 ≤ i, j ≤ N, qt = estado no tempo t;

π – Vetor das probabilidades de cada estado do modelo derivado no regime

estacionário:

π = pi , pi = p(q = i), 0 ≤ i ≤ N;

P – Vetor das probabilidades de erro dos estados

η – No de estados do modelo básico;

S = (x,y) – Estados do modelo derivado,

onde: x ∈ ei , i = 1...n (estado atual do modelo básico);

y = número (nz) de zeros após último 1 gerado, se nz < L

e

y = E, se nz ≥ L;

I = (u,v) – Entradas do modelo derivado,

onde: u ∈ ej , j = 1...η (próximo estado do modelo básico);

4

v = 0 ou 1 (bit gerado no estado atual do modelo básico);

3.1.1 NÚMERO DE ESTADOS

Observa-se de uma maneira geral, que cada estado do modelo básico define

um entre η grupos de estados do modelo derivado, onde em cada grupo, o

parâmetro y que representa o número de zeros desde o último ‘1’ gerado. Como o

parâmetro y pode assumir L+1 valores distintos, então o número N de estados do

modelo derivado é dado por:

N = η.(L+1) (3.1)

3.1.2 MODELO BÁSICO

O modelo básico constitui-se da Cadeia Escondida de Markov (HMM), a qual

originará o modelo derivado, cujo número de estados depende do número de

estados do modelo básico η e de L. Nota-se que uma mudança de estado no modelo

básico, por variar o primeiro parâmetro x do estado S do modelo derivado, implica

também em uma mudança de seu estado, o contrário não pode ser afirmado, já que

um mesmo estado do modelo básico pode originar mais de um estado do modelo

derivado, isto devido ao segundo parâmetro y de S, que representa o número de

zeros que o sistema gerou após o último ‘1’ gerado. Ainda deve ser observado que

logo que se gera um ‘1’, então y=0 e quando se gera L ou mais ‘0’ após o último ‘1’

gerado, então y=E.

Na FIG. 3.1 está representado um modelo básico genérico, isto é, um HMM

de ‘η’ estados, os quais estão todos ligados entre si por probabilidades de transição

pij nos dois sentidos e cada um deles possui uma probabilidade pi de erro (gerar ‘1’):

4

Onde:

pij = a probabilidade de transição do estado ‘i’ para o estado ‘j’;

pi = a probabilidade de erro (gerar ‘1’) do estado ‘ei’.

Inicialmente tomaremos como referência de modelo básico o modelo de Gilbert-

Elliott, o qual constitui-se de um HMM de dois estados, um deles dito estado bom

(G) e o outro estado ruim (B), onde o primeiro apresenta baixa probabilidade de erro

(pg) e o segundo alta probabilidade de erro (pb). A FIG. 3.2 apresenta o diagrama de

estados deste modelo.

Onde:

PB = Prob. de transição do estado G para o B

PG = Prob. de transição do estado B para o G

4

pb = Prob. de erro (emitir 1) do estado B

pg = Prob. de erro (emitir 1) do estado G

O item 3.1.5 apresenta o diagrama de estados do modelo derivado, para L = 3,

correspondente ao modelo básico de Gilbert-Elliot apresentado neste item.

3.1.3 TABELA DE TRANSIÇÃO DE ESTADOS DO MODELO DERIVADO

A TAB. 3.1 relaciona todos os possíveis estados atuais com todas as possíveis

entradas, apresentando os correspondentes estados futuros e cada uma das

respectivas expressões para cálculo das probabilidades de transição do modelo

derivado, as quais dependem não só das entradas, mas também dos estados atuais.

A última coluna apresenta as expressões para cálculo dos índices dos elementos da

matriz de transição do modelo derivado (descrita no item seguinte), em função dos

índices dos elementos da matriz de transição do modelo básico, esta coluna será útil

no futuro auxiliando na construção e implementação em computador da matriz de

transição.

Estado Atual Entrada Estado Futuro Prob. de Transição Elemento

(ei,x) (ej,1) (ej,0) pij.pi ai+k.η,j k=0 ... L

(ei,y) (ej,y+1) ai+k.η+s,j+(k+1).η k=0 ... L-1 s=0 para k≤L-1

(ei,L-1) (ej,0) (ej,E) pij.(1-pi)

(ei,E) (ej,E) s= η para k =L-1

(ei,y) (ej,x) (ej,z >y+1) 0 Outros casos.

TAB. 3.1: Tabela de transição para o modelo derivado.

3.1.4 MATRIZ DE PROBABILIDADES DE TRANSIÇÃO

Baseado nos parâmetros do modelo básico e na definição dos estados e das

entradas do modelo derivado representados na TAB. 3.1, podemos construir a

4

estrutura da matriz de probabilidades de transição, a qual a partir deste ponto nos

referiremos simplesmente como matriz de transição. Observa-se que só são

possíveis as transições dos estados (X,y-1) para (X,y), onde 1≤y≤L-1; (X,L-1) ou

(X,E) para (X,E) e de qualquer estado para (X,0), onde X, representa estado do

modelo básico. Os elementos da matriz correspondentes as transições restantes são

portanto, nulos.

A organização dos estados em ordem crescente do segundo parâmetro y, nas

linhas e nas colunas da matriz é uma das maneiras que permite a dedução de

expressões simples para os índices de seus elementos. A seguir é mostrado a

estrutura geral de uma matriz de transição para um critério de comprimento de surto

L, e cuja célula básica possui ‘η’ estados:

e1,0 e2,0 … eη,0 e1,1 e2,1 … eη,1 . . . e1,L-1 e2,L-1 … eη,L-1 e1,E e2,E … eη,E

e1,0 a11 a12 a1η a1,η+1 a1,η+2 a1,η+η 0 0 0 0 0 0 0 e2,0 a21 a22 a2η a2,η+1 a2,η+2 a2,η+η 0 0 0 0 0 0 0 . . . 0 0 0 0 0 0 0 eη,0 aη1 aη2 aηη aη,η+1 aη,η+2 aη,η+η 0 0 0 0 0 0 0 e1,1 a11 a12 a1η 0 0 0 0 . 0 0 0 0 e2,1 a21 a22 a2η 0 0 0 0

. 0 0 0 0

. . . 0 0 0 0 . 0 0 0 0 eη,1 aη1 aη2 aηη 0 0 0 0 . 0 0 0 0

. . . . 0 0 0 0

. . . . . 0 0 0 0

. . . . . 0 0 0 0 e1,L-1 a11 a12 a1η 0 0 0 0 0 0 0 a1,η+1 a1,η+2 a1,η+η

e2,L-1 a21 a22 a2η 0 0 0 0 0 0 0 a2,η+1 a2,η+2 a2,η+η

. . . 0 0 0 0 0 0 0 eη,L-1 aη1 aη2 aηη 0 0 0 0 … 0 0 0 aη,η+1 aη,η+2 aη,η+η

e1,E a11 a12 a1η 0 0 0 0 0 0 0 a1,η+1 a1,η+2 a1,η+η

e2,E a21 a22 a2η 0 0 0 0 0 0 0 a2,η+1 a2,η+2 a2,η+η

. . . 0 0 0 0 0 0 0 eη,E aη1 aη2 aηη 0 0 0 0 0 0 0 aη,η+1 aη,η+2 aη,η+η

Podemos observar na matriz, a repetição dos valores das probabilidades dos ηx2η

elementos correspondentes às η primeiras linhas e às 2η primeiras colunas em

outros elementos e o restante dos elementos nulos. Sendo que o número máximo de

probabilidades não nulas distintas (NP), que se repetem é o produto de η por 2η,

então:

NP = 2. η2 (3.2)

4

Agora particularizaremos a matriz de transição tomando-se como modelo básico,

o modelo de 2 estados (η=2) de Gilbert-Elliott, mantendo-a genérica quanto ao L.

Da EQ. 3.1, o número de estados desta matriz de transição é dado por

N=2(L+1), e da EQ. 3.2, o número de probabilidades distintas que podem ocorrer

para este caso é NP = 8. Assim, para este caso a matriz de transição possui a

seguinte estrutura:

Em seguida podemos deduzir cada uma destas 8 probabilidades de transição e

atribuí-las aos correspondentes elementos da matriz de transição de estados, como

descrito na TAB. 3.2.

Elemento Probabilidade de transição Elemento a (1-PB)pg a2k-1,1 onde:

k = 1, 2,…,L+1

b PB.pg a2k-1,2

c PG.pb a2k,1

d (1-PG).pb a2k,2

e (1-PB)(1-pg) a2k-1+S,3+2(k-1) onde: k = 1, 2,…,L S = 0, se k≤L S = 2, se k=L

f PB.(1-pg) a2k-1+S, 4+2(k-1)

g PG.(1-pb) a2k+S, 3+2(k-1)

h (1-PG).(1-pb) a2k+S, 4+2(k-1)

TAB. 3.2: Tabela de transição simplificada para modelo básico de 2 estados (η=2).

3.1.5 DIAGRAMA DE ESTADOS

G,0 B,0 G,1 B,1 G,2 B,2 G,E B,E

G,0 a b e f 0 0 . . . 0 0

B,0 c d g h 0 0 . . . 0 0

G,1 a b 0 0 e f . . . 0 0

B,1 c d 0 0 g h . . . 0 0

. . .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

. .

.

.

.

.

.

.

.

G,L-1 a b 0 0 0 0 . . . e f

4

Para representar o diagrama de estados do modelo derivado, exemplifica-se

com um modelo básico de Gilbert-Elliott, para L=3. Observa-se na FIG. 3.3, que os

estados (X,0) recebem transições de todos os estados, pois de qualquer estado, o

sistema pode gerar o bit ‘1’, e assim passar a condição de ter uma quantidade nula

de ‘0’s após este ‘1’, que foi o último “1” gerado.

3.2 CÁLCULO DAS DISTRIBUIÇÕES DE PROBABILIDADES DOS PARÂMETROS

COMPRIMENTO DE SURTO E INTERVALO ENTRE SURTOS

FIG. 3.3: Diagrama de estados para um modelo originado de um modelo de Gilbert-Elliott, para L=3.

4

Apresenta-se a seguir a dedução das probabilidades de ocorrer um surto de

tamanho ‘k’ e de ocorrer um intervalo entre surtos de tamanho ‘k’, possibilitando

assim o cálculo das respectivas distribuições, fixado o valor do parâmetro L.

3.2.1 COMPRIMENTO DE SURTO

Seja Ω o conjunto de todos os N estados do modelo derivado.

Sejam os conjuntos A = (X,E) e B = (X,0), subconjuntos do conjunto Ω.

Admitindo que um surto começa no instante n, tem-se:

qn-1 ∈ A e qn ∈ B (3.3)

Este surto terá tamanho k se:

qn+i ∉ A para i = 1 até k+L-2, e (3.4)

qn+k+L-1 ∈ A (3.5)

sendo: qn o estado do modelo básico no tempo n.

Exemplo: Para L=3, seja um surto de tamanho 7 iniciando no tempo n, como

representado a seguir:

...

xn

xn+1

xn+2

.

.

.

.

.

xn+k+L-2

xn+8

xn+k+L-1

xn+9

...

... 0 0 0 1 1 0 1 1 1 1 0 0 0 0 0 0 ...

Fora de surto Surto de tamanho 7 L = 3 Fora de surto

sendo: xn o bit gerado no tempo n.

Portanto, dado que o surto se inicia no instante n, a probabilidade de que este surto

tenha tamanho k, é dada por:

)];(|;[)],([ 1

2

1

1 AxBxAxAxPLkCP nn

Lk

i

inLkn ∈∈∉∈= −

−+

=

+−++ I (3.6)

3.2.2 INTERVALO ENTRE SURTOS

5

Sejam os conjuntos A = (X,E), B = (X,0) e C = (X,L-1), subconjuntos do

conjunto Ω.

Admitindo que um intervalo entre surtos começa no instante n, tem-se:

qn-1 ∈ C e qn ∈ A (3.7)

Se este intervalo entre surtos tem tamanho k (k ≥ L), então:

qn+i ∈ A para i = 1 até k-L e (3.8)

qn+k-L+1 ∈ B (3.9)

Exemplo: Para L=3, seja um intervalo entre surtos de tamanho 7 iniciando no tempo

n, como representado a seguir:

...

xn

xn+1

xn+2

.

.

xn+k-L+1

xn+5

...

... 1 0 0 0 0 0 0 0 1 ...

surto L = 3

Intervalo de tamanho 7

surto

A probabilidade de ocorrer um intervalo entre surtos de tamanho ‘k’ é, portanto dada

por:

)];(|;[)],([ 1

1

1 CxAxAxBxPLkIP nn

Lk

i

inLkn ∈∈∈∈= −

−

=

++−+ I (3.10)

3.2.3 CÁLCULO RECURSIVO DAS PROBABILIDADES P[C(K,L)] E P[I(K,L)]

As probabilidades em questão são casos particulares da seguinte probabilidade

geral, a qual será desenvolvida a seguir, visando a obtenção de um algoritmo

recursivo para o seu cálculo:

)];(|;[)( 1

1

1

WxVxUxUxPM nn

M

i

inMn ∈∈∈∈= −

−

=

++ Iαλ (3.11)

Sendo: Uα , U, V e W subconjuntos fixos de Ω (conjunto de todos os estados).

Expressando λ(M) através de uma probabilidade da interseção, temos:

5

);;;();(

1)( 1

1

11

WxVxUxUxPWxVxP

M nn

M

i

inMn

nn

∈∈∈∈⋅∈∈

= −

−

=

++

−

Iαλ (3.12)

Expandindo as probabilidades do numerador e denominador da expressão acima em

somatórios nos respectivos subconjuntos:

∑ ∑∑ ∑ ∑∑∑∑ ∈ ∈ ∈ ∈ ∈ ∈

−

−

=

++

∈ ∈− −

====⋅==

=αα

αλU Uu Uu Uu Vv Ww

nni

M

i

inMn

Vv Ww

nn M

wxvxuxxPwxvxP

M1 2 1

);;;(....);(

1)( 1

1

11

I

(3.13)

usando as notações: ∑ ∑∑∈ ∈

=VW Vv Ww

e ∑ ∑ ∑∑∑∈ ∈ ∈ ∈

=αα U Uu Vv WwUVW 1

....

e aplicando a regra da cadeia nas probabilidades da EQ. 3.13 obtemos:

)()|(

);|();;|(

);;|()()|(

1)(

11

1111

2

1

11

1

1

111

wxPwxvxP

wxvxuxPwxvxuxuxP

wxvxuxxPwxPwxvxP

M

nnn

nnnnni

M

i

inMMn

UVW

nni

M

i

inMn

VW

nnn

===

⋅===⋅⋅====

⋅====⋅===

=

−−

−+−

−

=

+−−+

−

−

=

++

−−

∑∑

LI

Iαλ

(3.14)

Supondo-se este processo ser Markov de 1a ordem, obtemos a simplificação dos

fatores que compõem cada parcela da soma do numerador da EQ. 3.14:

)()|()|()|(

)|()()|(

1)(

11112211

11

11

wxPwxvxPvxuxPuxuxP

uxxPwxPwxvxP

M

nnnnnMMnMMn

UVW

MMnMn

VW

nnn

===⋅==⋅⋅==

⋅==⋅===

=

−−+−−+−−+

−−++

−−

∑∑

L

αλ

(3.15)

5

Podemos observar a EQ. 3.15 como sendo o produto de um vetor de dimensão N

contendo como elementos os estados iniciais do sistema (último fator da EQ. 3.15),

por M+1 matrizes com mesma dimensão da matriz de transição (NxN), cujos

elementos diferentes de zero são iguais aos correspondentes na matriz de transição.

No entanto, os elementos das linhas e das colunas que não correspondam aos

subconjuntos dos estados de partida (estado atual) e de chegada (próximo estado)

respectivamente, são iguais a zero. Ou seja, as matrizes em questão, equivalem a

matriz de transição afetada por uma máscara de zeros conveniente. Assim sendo,

podemos gerar a seguinte indução matemática:

1

2

1

)()(

1)( PAAAAP

PAPM u

M

uuvuwvw

wvw

⋅⋅

= −αλ (3.16)

1

3

1

)()(

1)1( PAAAAP

PAPM u

M

uuvuwvw

wvw

⋅⋅

=− −αλ (3.17)

definindo: )()(

1)( 2

1

−

⋅= M

uuvuwvw

wvw

AAAPPAP

Mλ (3.18)

chega-se à seguinte equação recursiva:

uuAMM ⋅−= )1()( λλ (3.19)

Os valores das probabilidades em função de M da EQ. 3.16 podem ser dados então

por:

1])([)( PAMM u ⋅⋅= αλλ (3.20)

Sendo:

Pw = Vetor linha de dimensão N de probabilidades dos estados iniciais do

subconjunto W. Seus elementos correspondentes a estados que não

pertençam a W são nulos;

Axy = Matriz de transição dos estados pertencentes ao subconjunto X para os

pertencentes ao subconjunto Y. As suas linhas e colunas

5

correspondentes a outros estados não pertencentes aos estados X e Y,

respectivamente, possuem elementos nulos;

P1 = Vetor coluna de dimensão N, cujos elementos são iguais a 1.

3.2.3.1 PROBABILIDADE DE COMPRIMENTO DE SURTO

Agora particularizaremos as EQ. 3.19 e 3.20 para calcularmos a expressão

recursiva da probabilidade de comprimento de surto.

Comparando as EQ. 3.6 e 3.11 e fazendo a analogia entre os subconjuntos

empregados nestas duas equações, observa-se que:

W = Uα = A = (X,E) ; V = B = (X,0) e U = (X,0),(X,1),…,(X,L-1) ≠ A (3.21)

F azendo: M=k+L-1 (3.22) definimos a equações para o cálculo daquela probabilidade:

uuAMM ⋅−= )1()( λλ (3.23)

e 1])([)( PAMM uw ⋅⋅= λλ , L ≤ M ≤ k+L-1 (3.24)

Como o menor comprimento possível de surto é 1, o menor valor de M será neste caso L. Assim, a recursão da EQ. 3.16 será i niciada por:

2

1)(

1)( −

⋅= L

uuvuwvw

wvw

AAAPPAP

Lλ (3.25)

3.2.3.2 PROBABILIDADE DE COMPRIMENTO DE INTERVALO ENTRE SURTOS

Particularizaremos a seguir as EQ. 3.19 e 3.20 para o calculo recursivo da

probabilidade de intervalo entre surtos.

5

Comparando as EQ. 3.10 e 3.11 e fazendo a analogia entre os subconjuntos

empregados nestas duas equações, observa-se que:

W = C = (X,L-1) , U = V = A = (X,E) e Uα = B = (X,0) (3.26)

F azendo: M=k-L+1 e (3.27)

voltando à EQ. 3.16, temos

1

2

1

)()(

1)( PAAAAP

PAPM u

M

uuvuwvw

wvw

⋅⋅

= −αλ (3.28)

Aplicando os subconjuntos acima observamos que Avu = Auu e Awv = Awu , logo:

1

1

1

)()(

1)( PAAAP

PAPM u

M

uuwuw

wvw

⋅⋅

= −αλ (3.29)

De forma análoga ao caso do comprimento de surto, definimos as equações para o

cálculo da probabilidade de comprimento de intervalo entre surtos:

uuAMM ⋅−= )1()( λλ (3.30)

1])([)( PAMM u ⋅⋅= αλλ , 1 ≤ M ≤ k-L+1 (3.31)

Como o menor comprimento de intervalo entre surtos possível é L, o menor valor de

M na EQ. 3.27 é igual a 1.

Assim, a recursão da EQ. 3.29 é i

niciada por:

wuw

wvw

APPAP 1)(

1)1(

⋅=λ (3.32)

5

4 RESULTADOS

4.1 SIMULAÇÃO

Foram geradas, por computador, seqüências de bits sujeitas a erros em surtos,

baseadas em um HMM de η estados, simulando o comportamento de um canal com

memória. O algoritmo gera uma seqüência de observações conforme a definição do

item 2.2.2.4.

Foram geradas diversas seqüências de observações, de comprimentos variados

e partindo-se de diferentes modelos (HMM), para posterior levantamento dos

parâmetros comprimento de surto, intervalo entre surtos e densidade de erro por

surto. Este último parâmetro é definido como a razão entre o número de bits errados

de um surto de erros e o comprimento deste surto.

4.1.1 LEVANTAMENTO DO PARÂMETRO COMPRIMENTO DE SURTO

Foi levantada a distribuição do parâmetro comprimento de surto de uma

seqüência de observações, por meio de um algoritmo que recebe como parâmetros

de entrada uma seqüência de observações e L, definido no item 1.1, retornando o

número de surtos; uma tabela com as freqüências absolutas e relativas dos

comprimentos de surto; sua média, variância, assimetria, curtose e um gráfico de

sua distribuição de probabilidades estimadas.

Foi gerado um bloco de 500 Kbytes com surtos de erro, pelo modelo de Gilbert-

Elliott definido pelos seguintes parâmetros:

PG = 0,85 pg = 0,05

PB = 0,32 pb = 0,92

para: L= 3, L= 5 e L= 7

apresentando os resultados da Fig. 4.1. Observa-se que para pequenos valores de

L, os eventos podem ser separados em múltiplos surtos pequenos, reduzindo assim

o comprimento médio dos surtos. O contrário acontece para grandes valores de L,

5

onde eventos separados são combinados em uma menor quantidade de surtos de

maior comprimento. Na TAB. 4.1 podemos observar alguns parâmetros estatísticos

dos comprimentos de surtos para os três casos, onde são apresentados o número

total de surtos, média, variância, assimetria e curtose, para cada um dos valores de

L.

Observa-se na FIG. 4.1 que o aumento de L, por acarretar a união de surtos

menores formando surtos maiores, causa uma diminuição da freqüência relativa dos

surtos menores e um aumento da freqüência relativa dos surtos maiores, causando,

portanto, uma redução em módulo da inclinação da direção geral da curva.

FIG. 4.1: Comparação entre as distribuições do parâmetro comprimento de surto, levantada para ‘L’s diferentes, a partir de um mesmo bloco.

L = 3 L = 5 L = 7

No de Surtos 430837 197667 90807

Média 4,405 13,615 35,993

Variância 19,177 199,438 1353,20

Assimetria 2,063 2,033 2,001

Curtose 9,215 9,229 9,069

5

Nota-se que apesar do aspecto mais comum das curvas de distribuição do

parâmetro comprimentos de surto ser como o apresentado nas curvas da FIG. 4.1,

este pode variar bastante com a variação dos parâmetros, como pode ser visto nas

FIG. 4.5 e 4.6.

4.1.2 LEVANTAMENTO DO PARÂMETRO INTERVALO ENTRE SURTOS

Foi levantada a distribuição do parâmetro intervalo entre surtos de uma

seqüência de observações, por meio de um algoritmo que recebe como parâmetros

de entrada uma seqüência de observações e o número L, definido no item 1.1,

retornando o número de intervalos entre surtos; uma tabela com as freqüências

absolutas e relativas dos intervalos entre surtos; sua média, variância, assimetria,

curtose e um gráfico de sua distribuição de probabilidades estimadas.

Foi gerado um bloco de 500 Kbytes com surtos de erro, pelo modelo de Gilbert-

Elliott definido pelos seguintes parâmetros:

PG = 0,85 pg = 0,05

PB = 0,32 pb = 0,92

para: L= 3, L= 5 e L= 7

apresentando os resultados da FIG. 4.2, onde pode-se observar o paralelismo das

curvas. Na TAB. 4.2 podemos observar alguns parâmetros estatísticos dos

intervalos entre surtos, onde é apresentado o número total de intervalos entre surtos,

média, variância, assimetria e curtose, para cada um dos valores de L.

5

Apesar das curvas de distribuição do parâmetro intervalo entre surtos apresentar, o

aspecto mostrado pelas curvas da FIG. 4.2, este pode variar com a variação dos

parâmetros.

4.1.3 DENSIDADE DE ERRO POR SURTO

FIG. 4.2: Comparação entre as distribuições do parâmetro intervalo entre surtos, levantada para ‘L’s diferentes de um mesmo bloco.

L = 3 L = 5 L = 7

No de Intervalos 430836 197666 90806

Média 5,102 7,107 9,114

Variância 6,559 6,586 6,606

Assimetria 2,054 2,055 2,060

Curtose 9,300 9,314 9,357

5

Foi realizado o levantamento do parâmetro densidade de erros por surto,

através de um algoritmo que recebe uma seqüência de observações e o critério de

comprimento de surto L e calcula a densidade de bits errados em cada surto de erro;

tira as médias das densidades para surtos de mesmo comprimento e então plota o

gráfico (Densidade de erro por surto) X (Comprimento de surto).

Com um bloco de 1 Mbyte, com surtos de erro, pelo modelo de Gilbert-Elliott

definido pelos seguintes parâmetros:

PG = 0,75 pg = 0,04

PB = 0,007 pb = 0,93

Foi levantada a distribuição do parâmetro densidade de erro por surto para L = 3,

que é mostrada na FIG. 4.3. A seguir são apresentados alguns parâmetros

estatísticos obtidos destes dados:

Número de surtos de erro = 605342

Comprimento médio de surto = 3.868

Taxa de erro de bits do bloco = 0.243

Densidade média de erro por surto = 0.926

Variância das densidades = 0.020

6

4.2 MODELO DERIVADO

Serão aqui apresentados alguns resultados obtidos da implementação em

computador do modelo derivado, proposto no capítulo 3. Serão apresentadas

também as distribuições de probabilidades calculadas, dos parâmetros

“comprimento de surto” e “intervalo entre surtos”, inicialmente tomando-se como

modelo básico, o modelo de Gilbert-Elliott. Em seguida, são apresentados resultados

baseados em um modelo básico de 3 estados. Por fim serão apresentadas

comparações entre os resultados levantados dos dados simulados e os calculados

pelo modelo derivado.

4.2.1 DISTRIBUIÇÃO CALCULADA DOS COMPRIMENTOS DE SURTOS

Foram geradas e comparadas três curvas de distribuição para 3 valores

diferentes de L. O modelo básico utilizado foi um HMM de Gilbert-Elliott com os

FIG. 4.3: Distribuição do parâmetro densidade de erro por surto média, para L=3.

6

mesmos parâmetros da simulação da FIG. 4.1. Observou-se, que as curvas

calculadas apresentaram o mesmo comportamento do que a simulação, como está

mostrado na FIG. 4.4.

FIG. 4.4: Comparação entre as distribuições calculadas do parâmetro comprimento de surto, para probabilidades de transição fixas e L diferentes.

Como já mencionado no item 4.1.1, a curva de distribuição pode variar bastante com

os parâmetros do HMM. A FIG. 4.5 mostra que as curvas de distribuição do

parâmetro comprimento de surto, calculada e estimada, apresentam um

comportamento semelhante a uma oscilação amortecida. Os parâmetros do HMM

deste experimento são:

PG = 0,95 pg = 0,05

PB = 0,60 pb = 0,98 e L = 2

6

Nota-se que os fatores que influenciam este comportamento oscilatório, são os

valores de ambas as probabilidades de transição para o estado bom e para o estado

ruim serem altas e ainda, a probabilidade de erro do estado bom ser baixa e a

probabilidade de erro do estado ruim ser alta. Este fato é realçado pelas curvas de

distribuição de comprimentos de surtos, calculada e simulada mostrada na FIG. 4.6,

cujo HMM que as modelaram possui parâmetros com valores extremos nas

condições descritas acima, como a seguir:

PG = 0,99 pg = 0

PB = 0,99 pb = 1 para L = 2 e

O tamanho do bloco simulado foi de 1,5 Mbytes

FIG. 4.5: Comportamento das distribuições calculadas e estimadas do parâmetro comprimento de surto.

6

FIG. 4.6: Comportamento da curva de distribuição dos comprimentos de surto gerada pelo modelo de Gilbert-Elliott para PG e PB próximos da unidade.

4.2.1.1 VARIAÇÃO DA INCLINAÇÃO DA CURVA DE DISTRIBUIÇÃO COM L

Observa-se que para valores de L grandes, a curva de distribuição dos

comprimentos de surtos se estabiliza numa exponencial, a qual numa escala

semilogarítmica (ordenadas), é representada por uma reta. Foi levantada em

computador a curva dos coeficientes angulares destas retas, versus L. Observa-se

na FIG. 4.7 que a inclinação dessas retas diminui em valor absoluto com o aumento

de L, tendendo a um valor constante para valores de L grandes. A variação de L

afeta de uma maneira complexa a distribuição deste parâmetro, pois um aumento de

L ocasiona o desaparecimento de surtos menores, que se juntam para formar surtos

maiores, ou seja, a curva de distribuição começa a pesar mais para maiores valores

de L e menos para os menores valores, daí a variação de inclinação. A matriz de

6

transição e o vetor das probabilidades de erro definidores do modelo básico utilizado

no experimento da FIG. 4.7 foram:

=

78.022.0

45.055.0A e [ ]05.092.0=P , respectivamente. (4.1)

FIG. 4.7: Curva coeficiente angular x L para a distribuição de comprimento de surto.

4.2.2 COMPORTAMENTO INICIAL DA DISTRIBUIÇÃO DOS COMPRIMENTOS

Em seguida, podemos observar nas FIG. 4.8 (a e b) para o modelo de Gilbert-

Elliott, que apesar do comportamento geral desta distribuição ser visivelmente uma

exponencial (reta na escala semilogarítmica), de uma maneira geral, os

comprimentos iniciais da distribuição fogem a esta regra. O surto de comprimento

K=1 tem uma alta probabilidade de ocorrência, estando acima da exponencial,

enquanto o de comprimento K=2 está abaixo da exponencial. A partir daí, como num

6

movimento oscilatório amortecido, a curva converge para a exponencial. Este

comportamento está representado nas FIG. 4.8 (a, b) pelas curvas de distribuições

calculadas e estimadas dos comprimentos de surtos para os primeiros valores de K.

Em cada distribuição empregou-se o mesmo HMM que gerou o bloco de

observações, para o cálculo pelo modelo derivado, visando o ajuste das curvas, o

qual foi conseguido satisfatoriamente.

Para o experimento da FIG. 4.8 (a), foi gerado um bloco de 500 Kb por um HMM

com os seguintes parâmetros:

PG = 0,91 pg = 0,01

PB = 0,57 pb = 0,89 e L = 2

Para o experimento da FIG. 4.8 (b), foi gerado um bloco de 500 Kb por um HMM


PG = 0,85 pg = 0,05

PB = 0,32 pb = 0,92 e L = 3

6

4.2.3 DISTRIBUIÇÃO CALCULADA DOS INTERVALOS ENTRE SURTOS

a)

6

Foram geradas e comparadas três curvas de distribuição para 3 valores

diferentes de L. O modelo básico utilizado foi um HMM de Gilbert-Elliott com os

mesmos parâmetros da simulação da FIG. 4.2. Observou-se, que as curvas

calculadas apresentaram o comportamento representado na FIG. 4.9.

Com relação aos coeficientes angulares das curvas de distribuição das

probabilidades do parâmetro intervalo entre surtos, deve-se notar que estes não

variam com L, como mostra a FIG. 4.9. Este comportamento é intuitivamente

previsível, já que neste caso, o aumento de L, apenas suprime mais alguns dos

primeiros valores da distribuição, ficando inalteradas as freqüências absolutas a

partir deste valor e conseqüentemente ficando as correspondentes freqüências

relativas aumentadas por um mesmo fator, devido à diminuição do número de

intervalos possíveis. Deve ser ressaltado que os intervalos suprimidos, eram os que

FIG. 4.9: Comparação entre as distribuições calculadas do parâmetro intervalo entre surtos, para probabilidades de transição fixas e L diferentes.

6

possuíam as mais altas probabilidades, o que reforça mais ainda o deslocamento

paralelo das curvas com o aumento de L.

4.3 COMPARAÇÃO ENTRE SIMULAÇÃO E MODELO PROPOSTO

A fim de comprovar a eficiência do modelo derivado, quanto ao levantamento

das distribuições dos parâmetros comprimento de surto e intervalo entre surtos, são

realizadas comparações entre os resultados obtidos por meio de cálculos com o

modelo e os obtidos por meio de simulações.

A partir de uma seqüência simulada de observações, sujeitas a erros em surtos,

geradas por um HMM conhecido, levanta-se as curvas de distribuições dos

parâmetros comprimento de surto e intervalo entre surtos. Baseado no modelo

derivado, calcula-se as curvas correspondentes, tomando-se para modelo básico um

mesmo HMM que gerou a seqüência de observações. O objetivo deste experimento

é o de avaliar a precisão dos resultados e o tempo de processamento de cálculo do

modelo derivado, quando este é comparado com a simulação.

Pode se observar nas FIG. 4.10, 4.11, 4.12, que as curvas calculadas pelo

modelo se ajustam satisfatoriamente às curvas obtidas do levantamento desses

parâmetros do bloco de dados simulado. Nos três experimentos procurou-se variar

os parâmetros do HMM gerador da seqüência de observações, também usado como

modelo básico do modelo derivado empregado nos cálculos das distribuições.

Para o experimento relativo a FIG. 4.10, o tamanho da seqüência de

observações foi de 500 Kbytes e os parâmetros do HMM empregados nas

distribuições foram:

PG = 0,91 pg = 0,01

PB = 0,57 pb = 0,89 e L = 3

6

FIG. 4.10: Comparação entre simulação e modelo para L=3.

Observa-se, na FIG. 4.11, que mudanças nos valores dos parâmetros do HMM

e de L não alteram o ajuste da simulação pelo modelo em termos de precisão. Para

este experimento, o tamanho da seqüência de observações foi de 500 Kbytes e os

parâmetros do HMM empregados nas distribuições foram:

PG = 0,85 pg = 0,05

PB = 0,32 pb = 0,92 e L = 4

7


Observa-se na FIG. 4.12, que a redução em módulo da inclinação da curva

estimada dos comprimentos de surtos e o deslocamento paralelo da curva estimada

dos intervalos entre surtos devido ao aumento de L (em relação ao experimento

anterior), são perfeitamente acompanhados pelas curvas calculadas da modelagem

proposta. O aumento do L, provoca o surgimento de surtos maiores, aumentando

sua probabilidade, ao mesmo tempo em que diminui a probabilidade dos surtos

menores, justificando, portanto o aumento da inclinação da curva de distribuição dos

comprimentos de surtos. A maior dispersão dos pontos das curvas estimadas neste

experimento, em relação ao experimento anterior, é devida a diminuição da

seqüência de observações.

Para o experimento relativo a FIG. 4.12, o tamanho da seqüência de

observações foi de 100 Kbytes e os parâmetros do HMM empregados nas

distribuições foram:

7

PG = 0,85 pg = 0,05

PB = 0,32 pb = 0,92 e L = 10

4.3.1 COMPARAÇÃO ENTRE OS TEMPOS DE PROCESSAMENTO

Comparando-se o tempo de análise de uma seqüência de observações

simulada, afetada por erros em surtos, de tamanho 350 Kbytes, gerada por um HMM


PG = 0,62 pg = 0,08

PB = 0,47 pb = 0,83 e L = 3,


7

com o tempo de cálculo pela modelagem proposta, observou-se que o segundo

método além de preciso é muitas vezes mais rápido do que o primeiro, como

apresentado na TAB. 4.3:

Tempos (seg.) Parâmetro Obtido

Simulação

(Ts)

Modelagem

(Tm)

Tempo relativo

(Ts/Tm)

Comprimento de surto

308,25

0,06

5138

Intervalo entre Surtos

337,08

0,06

5618

TAB. 4.3: Tempos de processamento.

Deve-se notar que nos tempos de simulação da TAB. 4.3, não foram

computados o tempo de geração da seqüência de observações, o qual dependerá

do tamanho do bloco gerado. Foram computados somente os tempos de

levantamento daqueles parâmetros, os quais aumentariam razoavelmente com a

inclusão do tempo de simulação das observações.

O computador utilizado foi um Pentium II 300 MHz.

4.4 MODELO BÁSICO HMM DE 3 ESTADOS

A representação do HMM que tomaremos como modelo básico, cujos estados

classificaremos como bom (G), médio (M) e ruim (B), está representado na FIG.

4.13, sendo que, a sua matriz de transição e o seu vetor de probabilidades de erro

dos estados são respectivamente os seguintes:

=

50.045.005.0

28.032.040.0

03.037.060.0

A e [ ]70.026.004.0=P (4.2)

7

As distribuições dos parâmetros comprimento de surto e intervalo entre surtos,

calculados pelo modelo derivado e as levantadas de um bloco simulado de 300

kbytes, todas baseadas no HMM definido pelas matrizes em 4.2, estão

representadas para L=4 nas FIG. 4.14 e 4.15, respectivamente.

A FIG. 4.14 mostra que a curva de distribuição dos comprimentos de surtos

calculada pelo modelo derivado ajustou-se precisamente a curva gerada pela

seqüência de observações estimada pelo HMM de 3 estados.

FIG. 4.14: Distribuição dos comprimentos entre surtos para um modelo básico de 3 estados.

7

A FIG. 4.15 mostra que a curva de distribuição dos intervalos de surtos

calculada pelo modelo derivado ajustou-se precisamente a curva gerada pela

seqüência de observações estimada pelo HMM de 3 estados.

4.5 MODELO BÁSICO DE FRITCHMAN-SES DE 3 ESTADOS

Agora geramos, por simulação, uma seqüência de observações de tamanho

500 KBytes, baseado no modelo de Fritchman-SES (definido no item 2.2.5) de 3

estados, comparando as distribuições de comprimento de surto e intervalo entre

surtos levantadas desta seqüência, com as calculadas pela modelagem proposta

com o correspondente modelo de Fritchman como modelo básico. A FIG. 4.16

apresenta o referido modelo básico e as FIG. 4.17 e 4.18 apresentam as curvas de

FIG. 4.15: Distribuição dos intervalos entre surtos para um modelo básico de 3 estados.

7

distribuição de probabilidades obtidas. A matriz de transição e o vetor das

probabilidades de erro dos estados estão representados a seguir:

=

6,025,015,0

10,090,00

15,0085,0

A e [ ]100=P (4.3)

Observe nas matrizes 4.3 que o vetor P das probabilidades de erro dos estados

indica probabilidade de erro zero para os dois estados bons e 1 para o estado ruim,

o que torna este modelo uma cadeia de Markov observável em relação ao estado

ruim.

A FIG. 4.17 apresenta a distribuição do parâmetro comprimento de surto

levantada a partir de um bloco de dados de 500Kb simulado e a calculada pelo

modelo derivado, ambas com base no modelo definido pelas matrizes em 4.3, para

diferentes valores de L.

A TAB. 4.4 apresenta alguns resultados estatísticos complementares deste

experimento. Observa-se que o aumento de L, por formar surtos maiores, o número

de surtos diminui, enquanto a média dos comprimentos de surto e a variância

aumentam.

Origem L No de surtos Média Variância Assimetria Curtose Tempo Comput. (seg.)

Ts Ts/Tm

7

simulação

3

282720 3,635 10,657 2,060 9,074 489,05 1286,9

modelo

______

3,637

10,693

2,080

9.274

Tm

0,38

simulação

7

172509

8,727

83,992

2,062

9,349

Ts Ts/Tm 620,10

2818,6

modelo

______

8,735

84,143

2,005

8,476

Tm

0,22 TAB. 4.4: Estatística para o parâmetro comprimento de surto, baseado no modelo de Fritchman-SES de 3 estados.

FIG. 4.17: Distribuições dos comprimentos de surto simuladas e calculadas, com base no modelo de Fritchman-SES de 3 estados.

Foi observado que para este tipo de modelo, as curvas de distribuição dos

comprimentos de surtos apresentam um ponto de quebra na abscissa

7

correspondente ao comprimento L+1, o que podemos observar com mais detalhes

na FIG. 4.18, onde são mostradas quatro curvas para L diferentes, definidas pelos

parâmetros das matrizes 4.3.

Analogamente ao caso anterior, a FIG. 4.19 apresenta a distribuição do

parâmetro intervalo entre surtos levantada do mesmo bloco e a calculada pelo

modelo derivado, ambas com base no modelo definido pelas matrizes em 4.3, para

diferentes valores de L.

A TAB. 4.5 apresenta alguns resultados estatísticos complementares deste

experimento. Observa-se que o aumento de L, por suprimir intervalos menores, o

número de intervalos diminui, enquanto a média dos comprimentos dos intervalos

entre surtos e a variância aumentam.

FIG. 4.18: Distribuições dos comprimentos de surto simuladas e calculadas, com base no modelo de Fritchman-SES de 3 estados, para ‘L’s diferentes.

7

Origem L No de Intervalos

Média Variância Assimetria Curtose Tempo Comput. (seg.)

simulação

3

282720

10,853

74,525

2,182

10,467

Ts Ts/Tm 508,83

10177 modelo

______

10,836

74,105

2,150

9,919

Tm

0,05

simulação

7

172509

15,017

76,875

2,166

10,374

Ts Ts/Tm 505,59

10112

modelo

______

15,004

76,728

2,149

10,054

Tm

0,05 TAB. 4.5: Estatística para o parâmetro intervalo entre surtos, baseado no modelo de Fritchman-SES de 3 estados.

7

4.6 MODELAGEM DE UM CANAL SIMULADO DE HF

Para tentar avaliar o comportamento da modelagem em dados que em princípio

não foram gerados por HMM, foi gerada uma seqüência de observações de

aproximadamente 1Mb, obtida da simulação de um canal de HF classificado pelo

CCIR conforme a TAB. 4.6 como “canal bom”. Desta seqüência levantou-se as

distribuições dos parâmetros comprimento de surto, intervalo entre surtos e algumas

estatísticas complementares. Para esta simulação, empregou-se o modelo de

Watterson para um sistema de comunicações em HF e portanto se constituindo

como um canal sujeito a erros em surtos. A princípio nenhuma estatística do canal é

conhecida o qual supomos poder ser representado por algum HMM. A partir daí

estimaremos seus parâmetros utilizando o algoritmo de Baum-Welch. Em seguida

tomaremos o HMM estimado como modelo básico do modelo derivado, pelo qual

FIG. 4.19: Distribuições dos intervalos entre surtos simuladas e calculadas, com base no modelo de Fritchman-SES de 3 estados.

8

calcularemos as distribuições dos parâmetros comprimento de surto e intervalo entre

surtos e compararemos com as respectivas distribuições levantadas dos dados, a

fim de observar a precisão com que aquele modelo representa o referido canal de

HF.

O CCIR estabeleceu condições para o emprego do modelo de Watterson, as

quais largamente utilizadas e procuram retratar as condições reais do canal em

questão. Estas condições consistem em dois percursos independentes de igual

amplitude representando reflexões em diferentes camadas da ionosfera, cujos

parâmetros estão detalhados na TAB. 4.6. (MELO, 2000).

Descrição do Canal

Espalhamento de retardo para 2 percursos de igual

potência (seg)

Freqüência de Deslocamento Doppler para cada percurso (Hz)

BOM

0,5 x 10-3

0,1

MODERADO

1,0 x 10-3

0,5

RUIM

2,0 x 10-3

1,0

TAB. 4.6: Parâmetros da CCIR para simulação de condições do canal de HF.

A seguir serão apresentados os resultados de modelagens com alguns HMM

diferentes, com o objetivo de encontrar aquela que melhor representa aquele canal

de HF.

4.6.1 MODELAGEM PELO MODELO DE GILBERT-ELLIOTT

Admitindo inicialmente, que as curvas de distribuição dos comprimentos de

surtos e dos intervalos entre surtos, levantadas da simulação do canal de HF

possam ser ajustados pelo modelo de Gilbert-Elliott, submeteu-se estes dados ao

algoritmo de Baum-Welch para estimação de parâmetros de HMM de dois estados,

encontrando-se a seguinte matriz de transição e vetor de probabilidades de erro dos

estados:

8

=

9675,00325,0

2325,07675,0A e [ ]0005,05208,0=P (4.4)

O que, em relação à definição particular para HMM de 2 estados, equivale à:

PG = 0,2325 pg = 0,0005

PB = 0,0321 pb = 0,5208 (4.5)

Com o modelo básico definido por 4.4, foram geradas as curvas de distribuição

dos parâmetros comprimento de surto e intervalo entre surtos e comparadas com as

simulações do canal de HF, as quais são apresentadas pelas FIG. 4.20 e 4.21,

respectivamente.

8

Observa-se que ao ser empregado para representar o canal de HF, o modelo de

Gilbert-Elliot, apesar de ter ajustado razoavelmente a distribuição de comprimentos

de surtos, deixa a desejar no que diz respeito, ao parâmetro intervalo entre surtos,

que neste caso apresentou um comportamento oscilatório das probabilidades.

FIG. 4.20: Distribuições dos comprimentos de surtos levantadas da Simulação do canal de HF e calculadas pela modelagem baseada em um modelo básico de Gilbert-Elliott, cujos parâmetros foram estimados.

8

4.6.2 ESTIMAÇÃO DE PARÂMETROS PELO MODELO DERIVADO

Aqui o modelo derivado é empregado para se tentar estimar parâmetros de

dados que em princípio não foram gerados por HMM. O método consiste em ajustar

a curva de distribuição de probabilidades calculadas do parâmetro considerado pela

correspondente curva levantada dos dados. Supondo que os dados possam ser

representados por um HMM, é realizada uma otimização dos parâmetros deste

HMM no sentido de se obter o melhor ajuste entre as curvas pelo critério dos

mínimos quadrados.

A FIG. 4.22 mostra o resultado do ajuste para a curva de distribuição de

probabilidades do parâmetro comprimento de surto levantada dos dados resultantes

da simulação do canal de HF comentada no item 4.6. O HMM empregado é o

FIG. 4.21: Distribuições dos intervalos entre surtos levantadas da simulação do canal de HF e calculadas pela modelagem baseada em um modelo básico de Gilbert-Elliott, cujos parâmetros foram estimados.

8

modelo de Gilbert-Elliott, cujos parâmetros ótimos estimados para aqueles dados

são:

PG = 0,624 pg = 0,000

PB = 0,208 pb = 0,984, para L = 2

FIG. 4.22: Ajuste da curva de distribuição dos comprimentos de surtos pela curva obtida pelo modelo derivado.

Neste experimento foi observado que, sendo o ajuste à curva de distribuição de

comprimentos de surtos a única condição imposta para otimização, mais de uma

solução é possível, o que sugere o uso de outras condições como o ajuste

simultâneo à curva de distribuição de intervalos entre surtos e a condição dos

parâmetros pertencerem a determinadas faixas de valores reconhecidamente mais

prováveis, como por exemplo: a probabilidade de erro deve ser alta no estado ruim e

baixa no estado bom, para cada caso pertencendo a uma faixa de valores mais

prováveis.

8

5 CONCLUSÃO

O presente trabalho foi direcionado ao estudo dos erros em surtos no canal

físico, gerados em canais de comunicações com memória, tais como os canais “sem

fio”, ficando transparente para nós as camadas mais altas e os protocolos dos

sistemas de comunicações.

Propôs-se um método inédito e eficiente para se obter a análise dos parâmetros

comprimento de surto de erro e intervalo entre surtos de erro, considerando-se a

definição de erro em surto do CCITT (CCITT “BLUE BOOK”). Este método

constituiu-se em um modelo de Markov gerado por uma nova definição dos estados

e das entradas, correspondente a um dado HMM clássico. Este modelo possibilita a

dedução de equações recursivas para o cálculo das distribuições de probabilidades

dos parâmetros comprimento de surto de erro e comprimento de intervalo entre

surtos de erros, relativos aos parâmetros do HMM clássico.

As principais vantagens do cálculo dos parâmetros acima citados em relação as

suas estimativas a partir de massas de dados simuladas, são a velocidade de

geração das distribuições e a precisão destes cálculos estar condicionada apenas a

precisão do processador que executa os cálculos. Os cálculos com o modelo

proposto possibilitam a implementação de algoritmos de baixa complexidade, os

quais a partir dos parâmetros do HMM que se deseja empregar como modelo

básico, produzem os resultados desejados em tempos da ordem de centésimos de

segundos, e que por serem cálculos determinísticos, possuem precisão limitada a da

máquina. Já as estimativas requerem a simulação de massas de dados a partir dos

parâmetros do HMM que se deseja empregar como modelo, para posterior

levantamento dos parâmetros comprimento de surto e intervalo entre surtos. Como

estas estimativas são baseadas em cálculos estatísticos sobre uma amostra

simulada de dados, tempos de processamento da ordem de centenas de segundos

são necessários. Além disto estes resultados possuem precisão dependente do

tamanho da massa de dados empregada.

Foram realizados diversos experimentos com HMM dos tipos Gilbert-Elliott e

Fritchman, na prática os mais utilizados na modelagem de canais sujeitos a erros em

surtos. O modelo de Gilbert-Elliott tem sido o preferido para esta finalidade, pois

8

apesar de uma simples aproximação, este possibilita a implementação de algoritmos

menos complexos do que modelos de mais estados, cuja complexidade inviabiliza

um eficiente tratamento computacional (ZORZI, 1999). Modelos de Fritchman são

freqüentemente utilizados para modelagem de canais com memória, como os canais

de satélites de baixa órbita (LEO) apresentados em (CHU, 2002) e nos canais dos

sistemas de comunicações por ondas espaciais em HF. A modelagem aqui

proposta, devido à sua eficiência, viabiliza a análise dos parâmetros destes canais e

de outros que requeiram modelos mais complexos para representá-los, pois o maior

número de estados não se torna um fator limitante em termos práticos, frente a

velocidade de seus cálculos.

Foram citados exemplos do impacto causado pelos erros em surtos em alguns

sistemas de comunicações “sem fio”. Este assunto vem sendo exaustivamente

estudado por Michele Zorzi e Ramesh R. Rao, os quais possuem grande quantidade

de artigos publicados, como (ZORZI, set, 1998 e 1999), que aborda o impacto dos

erros em surtos sobre os protocolos de redes “sem fio”, tais como o TCP e o ATM.

Observa-se que nos trabalhos de Zorzi e Rao, o modelo escolhido para se

representar os canais com memória é o de Gilbert-Elliot, o qual é considerado por

eles como um modelo simples porém suficiente para tal finalidade (ZORZI, 1999).

Um grande número de experimentos foi realizado com o modelo proposto, dos

quais apenas alguns foram apresentados neste trabalho. Inicialmente procurou-se

confirmar eficiência do modelo através de comparações dos resultados gerados por

este com os levantados de massas de dados geradas por HMM conhecidos. Estes

experimentos mostraram que o modelo proposto baseado no mesmo HMM de uma

massa de dados a representa precisamente consumindo um tempo computacional

milhares de vezes menor do que o tempo de levantamento dos parâmetros na

massa de dados. Em seguida tentou-se ajustar o modelo proposto a uma massa de

dados gerada na simulação de um canal de HF, das quais os parâmetros

desconhecidos foram estimados para HMM de 2 e 3 estados pelo algoritmo de

Baum-Welch e aplicados como modelo básico do modelo proposto, dos quais o

HMM de 3 estados ajustou-se melhor aos dados. Finalmente foi sugerido um método

para estimação de parâmetros de um HMM através do ajuste das curvas de

distribuição calculada e levantada dos dados, o qual foi exemplificado com a

estimação dos parâmetros HMM por meio do ajuste realizado para a curva de

8

distribuição dos comprimentos de surto levantadas dos dados gerados pela

simulação de um canal de HF.

Com relação a trabalhos futuros, deve ser ressaltada a importância da

modelagem dos erros em surtos, visando descrever o impacto causado nas diversas

camadas e protocolos de um sistema de comunicações, cujo canal possua memória.

Sendo este um vasto campo para novos trabalhos. Em seguida, com base nos

estudos anteriores, poderiam ser realizados estudos de métodos para controle dos

erros nas diversas camadas dos sistemas de comunicações.

O modelo proposto também pode gerar trabalhos futuros, como a pesquisa e

desenvolvimento de algoritmos para estimação de parâmetros de HMM, de uma

maneira mais eficiente do que o clássico algoritmo de Baum-Welch, baseados no

ajuste das curvas de distribuição de probabilidades dos parâmetros comprimento de

surtos e intervalo entre surtos calculados pelo modelo, em relação as

correspondentes curvas estimadas, por meio da otimização dos parâmetros do

HMM, que se deseja estimar.

Uma outra sugestão para o futuro seria o desenvolvimento de simuladores de

massas de dados afetadas por erros em surto ao nível de bits, voltados para

aplicações mais específicas em camadas mais altas de um sistema de

comunicações.

Deve ser ressaltada a importância deste estudo em aproveitamento ao Exército

Brasileiro. Em acompanhamento a evolução tecnológica dos sistemas de

comunicações digitais “sem fio”, principais alvos do problema abordado por este

trabalho, o Exército por suas características estratégicas e táticas de emprego em

que as grandes distâncias envolvidas, a mobilidade e a segurança são requisitos

básicos que devem ser atendidos pelas suas comunicações, possui dentre outros

sistemas “sem fio”, sistemas de comunicações em HF e por satélites, os quais

tendem cada vez mais, a se incorporarem às comunicações militares e guerra

eletrônica, duas áreas que do ponto de vista técnico já percebem os efeitos do

fenômeno dos erros em surtos provenientes dos canais “sem fio” sob as condições

de emprego citadas acima. Assim este trabalho vem em parte a contribuir para o

estudo de técnicas que minimizem este problema em busca de um aumento no

desempenho dos sistemas de comunicações mais empregados em ambiente militar.

8

6 REFERÊNCIAS BIBLIOGRÁFICAS

CCITT “Blue book”. Terms and definitions. Vol. 1, fasc. I.3, rec. M.60 n.34, rec.

Q.9 n.0222.

CHOCKALINGAM A., Zorzi, Michele e Rao, Ramesh R. Performance of TCP on

wireless fading links with memory. ICC’ 98. Atlanta, GA: June 7-11, 1998. CHU, V. Y. Y. e Sweeney, P. Channel modelling and error control strategies for

the LEO satellite channel. Dept. of Electrical Engineering, The University of Surrey. Disponível: http://www.ee.surrey.ac.uk/CCSR/Software/OPNET /chu-sweeney.pdf [capturado em 28 mar. 2002].

FRANCHI, A., Harris, R. A. On the error burst properties of Viterbi decoding.

IEEE International Communications Conference, 1993. pag. 1086 a 1091. FRANCHI, A., Harris, Robert A. On the error burst properties of the “standard”

K=7, rate–1/2 convolutional code with soft–decision viterbi decoding. Telecomunication Systems. May 1995. Vol. 6, no 3, pag 337 a 351.

FRITCHMAN, B. D. A binary channel characterization using partioned Markov

chains. IEEE Transactions in Information Theory, April 1967. Vol. IT-13, pp. 221 – 227.

HEISSLER, Jeffrey R., Barsoum, Yosry A. e Richard Condello. An analysis of the

Viterbi decoder error statistics for ATM and TCP/IP over satellite communication. IEEE, 1999.

JOHNSON, Eric E. HF SchEMe: a skywave channel error model. IEEE Military

Communications Conference MILCOM, 1994. MELO, Alexandre Guedes de. Equalização cega em canais WSS-US. Dissertação

de Mestrado (Mestrado em Engenharia Elétrica) - IME, jul. 2000. PAPOULIS, Athanasios. Probability, random variables, and stochastic

processes. 3. ed. Editora McGraw-Hill International Editions, 1991. PROAKIS, J. G. Digital communications. Mc Graw Hill, New York: 1995. RABINER, L. R. e Juang, B. H. Fundamental of speech recognition. Editora

Prentice Hall, 1993. RAMSEIER, Stefan e Kaltenschnee, Thomas. ATM over satellite: analysis of ATM

QOS parameters. Ascom Tech Ltd. Gewerbepark, CH-5506 Magenwill, Switzerland: 1995. pag. 1562 a 1565.

8

SHEN, Jia-Pei e Gill, John. Analysis on a hidden Markov channel model. Global Telecommunications Conference, Globecom’ 99, 1999.

TURIN, Willian e NOBELEN, Robert van. Hidden Markov modeling of flat fading

channels. IEEE Journal on selected areas in communications. dez. 1998. v. 16, n. 9.

ZORZI, Michele, Rao, Ramesh R. e Milstein, Laurence B. On the accuracy of a

first-order Markov model for data transmission on fading channels. ICUPC’95. Tokyo, Japão: nov. 1995.

ZORZI, Michele, Rao, Ramesh R. e Milstein, Laurence B. A Markov model for

block errors on fading channels. PIMRC’96. Taiwan: out.1996. ZORZI, Michele e Rao, Ramesh R. ARQ error control for delay-constrained

communications on short-range burst-error channels. VTC’ 97. Phoenix, AZ: mai. 1997.

ZORZI, Michele e Rao, Ramesh R. The effect of correlated errors on the

performance of TCP. Accepted for publication in IEEE communications letters, set. 1997.

ZORZI, Michele. Outage and error events in bursty channels. IEEE Transactions

on Communications. mar. 1998. Vol. 46, no 3, pag. 349 a 356. ZORZI, Michele. Performance of FEC and ARQ error control in bursty channels

under delay constraints. VTC’98. Ottawa, Canadá: mai. 1998. ZORZI, Michele e Rao, Ramesh R. Impact of burst errors on framing. PIMRC’ 98.

Boston: set. 1998. ZORZI, Michele e Rao, Ramesh R. Perspectives on the impact of error statistics

on protocols for wireless networks. IEEE Personal Communications Magazine. Oct. 1999.

ZORZI, Michele, Chockalingam, A. e Rao, Ramesh R. Throughput analysis of

TCP on channels with memory. IEEE Journal on Selected Areas in Communications. Jul. 2000. Vol. 18 no 7, pag. 1289 a 1300.

ZORZI, Michele e Rao, Ramesh R. On the statistics of block errors in bursty

channels. accepted for publication in the IEEE Transactions on Communications ICUPC’96. Cambridge, MA: sep.30-oct.2, 1996.

Documents

MODELAGEM DE ERROS EM SURTOS EM SISTEMAS ...Os conceitos expressos neste trabalho são de responsabilidade do autor e dos orientadores. F363 Fernandes, Marcus Vinícius dos Santos