160
UNIVERSIDADE DO RIO GRANDE DO NORTE FEDERAL Universidade Federal do Rio Grande do Norte Centro de Tecnologia – CT Programa de P´os-gradua¸ ao em Engenharia El´ etrica e de Computa¸c˜ ao – PPgEEC A Influˆ encia da Observabilidade e da Visualiza¸ ao Radial no Projeto de Sistemas de Monitoramento de Redes de Computadores Jo˜ ao Paulo de Souza Medeiros Orientador: Prof. Dr. Paulo S´ ergio da Motta Pires Tese de Doutorado apresentada ao Pro- grama de os-gradua¸ c˜ao em Engenharia El´ etrica e de Computa¸c˜ao da UFRN (´area de concentra¸ c˜ao: EngenhariadeComputa¸c˜ao) como parte dos requisitos para obten¸ c˜aodo ıtulo de Doutor em Ciˆ encias. Natal, RN, 13 de fevereiro de 2014

A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

UNIVERSIDADE DO RIO GRANDE DO NORTEFEDERAL

Universidade Federal do Rio Grande do NorteCentro de Tecnologia – CT

Programa de Pos-graduacao em EngenhariaEletrica e de Computacao – PPgEEC

A Influencia da Observabilidade e da Visualizacao

Radial no Projeto de Sistemas de Monitoramento

de Redes de Computadores

Joao Paulo de Souza Medeiros

Orientador: Prof. Dr. Paulo Sergio da Motta Pires

Tese de Doutorado apresentada ao Pro-grama de Pos-graduacao em EngenhariaEletrica e de Computacao da UFRN (area deconcentracao: Engenharia de Computacao)como parte dos requisitos para obtencao dotıtulo de Doutor em Ciencias.

Natal, RN, 13 de fevereiro de 2014

Page 2: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

UFRN / Biblioteca Central Zila Mamede.

Catalogacao da Publicacao na Fonte.

Medeiros, Joao Paulo de Souza.A Influencia da Observabilidade e da Visualizacao Radial no Projeto de Sis-

temas de Monitoramento de Redes de Computadores. / Joao Paulo de SouzaMedeiros. – Natal, RN, 2014.

167 f.: il.

Orientador: Prof. Dr. Paulo Sergio da Motta Pires.

Tese (Doutorado) – Universidade Federal do Rio Grande do Norte. Centrode Tecnologia. Programa de Pos-graduacao em Engenharia Eletrica e de Com-putacao.

1. Monitoramento de redes – Tese. 2. Sistemas complexos – Tese. 3. Obser-vabilidade de sistemas – Tese. 4. Visualizacao de topologias – Tese. 5. Analisede desempenho e complexidade – Tese. I. Pires, Paulo Sergio da Motta. II.Universidade Federal do Rio Grande do Norte. III. Tıtulo.

RN/UF/BCZM CDU 004.7

Page 3: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da
Page 4: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

“There is no end to education.

It is not that you read a book, pass an examination, and finish with education.

The whole of life, from the moment you are born to the moment you die, is a process of learning.”

Jiddu Krishnamurti

Page 5: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Agradecimentos

Ao Prof. Paulo Sergio da Motta Pires, pelo incentivo e apoio. Seu compromisso com aexcelencia ajuda-nos a descobrir do quao somos capazes. Sou grato tambem pelos valiososconselhos e oportunidades, alem do exemplo de profissionalismo.

Ao Prof. Agostinho de Medeiros Brito Junior, pelo incentivo e apoio. Sou grato pois e desua responsabilidade minha insercao em pesquisa e no meio cientıfico.

Ao Prof. Selan Rodrigues dos Santos, pelas conversas esclarecedoras e por ter me ajudadoa refletir sobre os rumos de minha vida profissional.

A minha mae, Maria Nerivan de Souza Medeiros, pela bencao, incentivo e por ter memostrado que mae e definicao de determinacao e lealdade.

Ao meu pai, Josias Martinho de Medeiros, por me influenciar com os dons da paciencia,superacao e discernimento.

Ao meu irmao, Prof. Luiz Paulo de Souza Medeiros, pelas discussoes enriquecedoras e pordemonstrar de maneira propria como se tornar um profissional exemplar.

A minha companheira, Graciele Saionara Linhares de Lima, por sempre me ajudar arecuperar as forcas e refletir sobre meus objetivos. Seu apoio, atencao e compreensividadeforam fundamentais e dignos.

Ao meu filho, Pedro Joaquin de Lima Medeiros, sua anunciacao e presenca me proporcio-naram a base emocional, firme como rocha, que precisamos quando enfrentamos grandesdesafios, alem de propiciar a elevacao espiritual necessaria na finalizacao deste trabalho.

Aos meus amigos, Franscisco da Chagas Araujo de Lima (em memoria) e Maria CasseLinhares de Lima, por terem me acolhido e ajudado de forma generosa e amavel.

Aos meus amigos, Prof. Joao Batista Borges Neto e Prof. Luiz Paulo de Assis Barbosa,pelo apoio, pelas discussoes esclarecedoras e pelos momentos de descontracao.

Ao grupo de desenvolvedores do Umit, especialmente ao Adriano Monteiro Marques e aoLuıs Antonio Bastiao Silva, pelo enriquecedor envolvimento no meu trabalho.

Ao criador do Nmap, Gordon ‘Fyodor’ Lion, pelos comentarios, oportunidades e conheci-mento compartilhados.

Finalmente, sou grato pela oportunidade de desenvolver este trabalho no Laboratorio deSeguranca da Informacao (LabSIN) e no Laboratorio de Elementos do Processamento daInformacao (LabEPI), ambos sediados na Universidade Federal do Rio Grande do Norte.

Page 6: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Resumo

Este trabalho apresenta um levantamento dos problemas associados a influencia daobservabilidade e da visualizacao radial no projeto de sistemas de monitoramento pararedes de grande magnitude e complexidade. Alem disso, se propoe a apresentar solucoespara parte desses problemas.

Atraves da utilizacao da Teoria de Redes Complexas, sao abordadas duas questoes:(i) a localizacao e a quantidade de nos necessarios para garantir uma aquisicao de dadoscapaz de representar o estado da rede de forma efetiva e (ii) a elaboracao de um modelode visualizacao das informacoes da rede capaz de ampliar a capacidade de inferencia e deentendimento de suas propriedades.

Esta tese estabelece limites teoricos para estas questoes e apresenta um estudo sobrea complexidade do monitoramento eficaz, eficiente e escalavel de redes.

Palavras-chave: Monitoramento de redes; Sistemas complexos; Observabilidade desistemas; Visualizacao de topologias; Analise de desempenho e complexidade.

Page 7: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Abstract

This thesis presents a survey of problems associated to the influence of observability andradial visualization in the design of a monitoring system for huge and complex networks.In addition, there were proposed solutions for part of these problems.

Through the use of Complex Networks Theory, this thesis addresses two questions: (i)the localization and the quantity of nodes needed to ensure the gathering of data sufficientto effectively represent the network state, and (ii) the elaboration of an information visu-alization model capable of amplify the capability of inference and understating of networkproperties.

This thesis establishes theoretical limits for these questions and presents a study aboutthe complexity of an effective, efficient and scalable network monitoring system.

Keywords: Network monitoring; Complex systems; System observability; Topologyvisualization; Performance analysis and complexity.

Page 8: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes i

Sumario

Lista de Algoritmos iii

Lista de Definicoes vi

Lista de Figuras viii

Lista de Tabelas ix

Lista de Teoremas xii

Glossario xiii

1 Introducao 1

1.1 Motivacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.3 Trabalhos relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.4 Contribuicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.5 Organizacao do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.6 Publicacoes relacionadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 Projeto de monitoramento 9

2.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2 Fundamentacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2.1 Topologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.2.2 Observadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.2.3 Otimizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.2.4 Predicados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.2.5 Visualizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.3 Objetivos especıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2.4 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3 Observabilidade de redes 25

3.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.1.1 Modelo linear de representacao topologica . . . . . . . . . . . . . . . 26

3.1.2 Modelo estocastico de propagacao da informacao . . . . . . . . . . . 29

3.2 Modelo proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.2.1 Observabilidade estrutural . . . . . . . . . . . . . . . . . . . . . . . . 32

3.2.2 Observabilidade funcional . . . . . . . . . . . . . . . . . . . . . . . . 37

Page 9: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.3 Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.3.1 Observabilidade estrutural . . . . . . . . . . . . . . . . . . . . . . . . 453.3.2 Observabilidade funcional . . . . . . . . . . . . . . . . . . . . . . . . 53

3.4 Consideracoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613.4.1 Quantidade de nos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613.4.2 Localizacao dos nos . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4 Visualizacao de redes 634.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644.2 Modelo proposto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66

4.2.1 Disposicao radial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 674.2.2 Otimizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

4.3 Analise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 734.3.1 Tempo de execucao esperado . . . . . . . . . . . . . . . . . . . . . . 734.3.2 Escalabilidade da visualizacao . . . . . . . . . . . . . . . . . . . . . . 75

4.4 Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 774.4.1 Distribuicao do raio da visualizacao . . . . . . . . . . . . . . . . . . 784.4.2 Relacao entre o diametro e o raio . . . . . . . . . . . . . . . . . . . . 794.4.3 Relacao entre a eficiencia e o raio . . . . . . . . . . . . . . . . . . . . 80

4.5 Consideracoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

5 Conclusoes 815.1 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 825.2 Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

A Caracterizacao de redes complexas 85A.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86A.2 Metricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

A.2.1 Distribuicao dos graus . . . . . . . . . . . . . . . . . . . . . . . . . . 89A.2.2 Distancia media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92A.2.3 Diametro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96A.2.4 Eficiencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97A.2.5 Coeficiente de agrupamento . . . . . . . . . . . . . . . . . . . . . . . 98

B Representacao de redes complexas 101B.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102B.2 Topologias determinısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102B.3 Grafos aleatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106B.4 Mundo pequeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108B.5 Livre de escala . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

C Resultados complementares 113C.1 Caracterizacao de redes determinısticas . . . . . . . . . . . . . . . . . . . . 113C.2 Observabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121C.3 Visualizacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

Referencias Bibliograficas 132

Indice Remissivo 137

Page 10: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes iii

Lista de Algoritmos

3.1 Algoritmo (Busca do conjunto observador estrutural mınimo) . . . . . . . . 363.2 Algoritmo (Rendimento) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383.3 Algoritmo (Construcao da matriz estocastica de transicao) . . . . . . . . . . 393.4 Algoritmo (Busca do conjunto observador funcional mınimo) . . . . . . . . 42

4.1 Algoritmo (Calculo do espaco angular necessario) . . . . . . . . . . . . . . . 724.2 Algoritmo (Calculo do raio mınimo) . . . . . . . . . . . . . . . . . . . . . . 73

A.1 Algoritmo (Calculo dos graus de entrada e saıda de cada no) . . . . . . . . 90A.2 Algoritmo (Construcao da funcao de distribuicao dos graus) . . . . . . . . . 91A.3 Algoritmo (Distancia em relacao a um no) . . . . . . . . . . . . . . . . . . . 93A.4 Algoritmo (Caminho mais curto) . . . . . . . . . . . . . . . . . . . . . . . . 94A.5 Algoritmo (Distancia media) . . . . . . . . . . . . . . . . . . . . . . . . . . 95A.6 Algoritmo (Diametro) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96A.7 Algoritmo (Eficiencia media) . . . . . . . . . . . . . . . . . . . . . . . . . . 98A.8 Algoritmo (Coeficiente de agrupamento) . . . . . . . . . . . . . . . . . . . . 99A.9 Algoritmo (Coeficiente de agrupamento da rede) . . . . . . . . . . . . . . . 100

B.1 Algoritmo (Criacao de uma rede aleatoria) . . . . . . . . . . . . . . . . . . . 106B.2 Algoritmo (Criacao de uma rede de mundo pequeno) . . . . . . . . . . . . . 108B.3 Algoritmo (Criacao de uma rede livre de escala) . . . . . . . . . . . . . . . . 110

Page 11: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes v

Lista de Definicoes

2.1 Definicao (Monitoramento) . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2 Definicao (Nos observadores ou monitores) . . . . . . . . . . . . . . . . . . . 10

2.3 Definicao (Aquisicao passiva) . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.4 Definicao (Aquisicao ativa) . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.5 Definicao (Eficacia) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.6 Definicao (Eficiencia) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.7 Definicao (Escalabilidade) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.8 Definicao (O conceito de topologia) . . . . . . . . . . . . . . . . . . . . . . . 13

2.9 Definicao (O problema da identificacao topologica) . . . . . . . . . . . . . . 14

2.10 Definicao (O problema da escolha dos observadores) . . . . . . . . . . . . . 15

2.11 Definicao (Controlabilidade) . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.12 Definicao (Observabilidade) . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2.13 Definicao (O problema da otimizacao e aproximacao) . . . . . . . . . . . . . 18

2.14 Definicao (O problema da inferencia de predicados) . . . . . . . . . . . . . . 19

2.15 Definicao (Visualizacao da informacao) . . . . . . . . . . . . . . . . . . . . . 22

2.16 Definicao (O problema da apresentacao da informacao) . . . . . . . . . . . . 22

3.1 Definicao (Representacao eficaz) . . . . . . . . . . . . . . . . . . . . . . . . 26

3.1 Premissa (Invariancia topologica) . . . . . . . . . . . . . . . . . . . . . . . . 26

3.2 Premissa (Evolucao discreta de estado) . . . . . . . . . . . . . . . . . . . . . 27

3.2 Definicao (Sistema linear discreto invariante no tempo) . . . . . . . . . . . . 27

3.3 Premissa (Conservacao da informacao) . . . . . . . . . . . . . . . . . . . . . 29

3.4 Premissa (Atingibilidade) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.3 Definicao (Processo marcoviano) . . . . . . . . . . . . . . . . . . . . . . . . 29

3.4 Definicao (Conjunto observador estrutural) . . . . . . . . . . . . . . . . . . 31

3.5 Definicao (Conjunto observador funcional) . . . . . . . . . . . . . . . . . . . 31

3.6 Definicao (Observabilidade estrutural) . . . . . . . . . . . . . . . . . . . . . 32

3.7 Definicao (Observabilidade funcional) . . . . . . . . . . . . . . . . . . . . . 37

3.8 Definicao (Rendimento de um no) . . . . . . . . . . . . . . . . . . . . . . . . 38

3.9 Definicao (Matriz estocastica regular) . . . . . . . . . . . . . . . . . . . . . 40

4.1 Definicao (Disposicao radial) . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4.2 Definicao (Disposicao radial expressiva) . . . . . . . . . . . . . . . . . . . . 68

4.3 Definicao (Disposicao radial expressiva mınima) . . . . . . . . . . . . . . . . 68

4.4 Definicao (Sobreposicao angular) . . . . . . . . . . . . . . . . . . . . . . . . 69

4.5 Definicao (Sobreposicao parental) . . . . . . . . . . . . . . . . . . . . . . . . 69

A.1 Definicao (Grafo direcionado com pesos) . . . . . . . . . . . . . . . . . . . . 86

Page 12: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

A.2 Definicao (Matriz de adjacencia) . . . . . . . . . . . . . . . . . . . . . . . . 86A.3 Definicao (Grau) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87A.4 Definicao (Densidade) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87A.5 Definicao (Distribuicao dos graus da rede) . . . . . . . . . . . . . . . . . . . 89A.6 Definicao (Distancia entre dois nos) . . . . . . . . . . . . . . . . . . . . . . . 92A.7 Definicao (Distancia media) . . . . . . . . . . . . . . . . . . . . . . . . . . . 95A.8 Definicao (Diametro) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96A.9 Definicao (Eficiencia) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97A.10 Definicao (Eficiencia media) . . . . . . . . . . . . . . . . . . . . . . . . . . . 97A.11 Definicao (Vizinhanca) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98A.12 Definicao (Coeficiente de agrupamento) . . . . . . . . . . . . . . . . . . . . 99A.13 Definicao (Coeficiente de agrupamento da rede) . . . . . . . . . . . . . . . . 100

C.1 Definicao (Grafo direcionado em anel) . . . . . . . . . . . . . . . . . . . . . 113C.2 Definicao (Grafo direcionado em estrela) . . . . . . . . . . . . . . . . . . . . 113C.3 Definicao (Grafo direcionado em linha) . . . . . . . . . . . . . . . . . . . . . 113

Page 13: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes vii

Lista de Figuras

2.1 Representacao do processo de monitoramento de redes . . . . . . . . . . . . 10

2.2 Representacao das etapas do projeto de um sistema de monitoramento . . . 13

2.3 Ilustracao de uma arvore multicast . . . . . . . . . . . . . . . . . . . . . . . 15

2.4 Representacao de grafos por matriz de adjacencia . . . . . . . . . . . . . . . 16

2.5 Representacao do processo de identificacao de sistemas . . . . . . . . . . . . 20

2.6 Mapa auto-organizavel de assinaturas de sistemas operacionais . . . . . . . 20

2.7 Descritores do TCP ISN PRNG de diferentes sistemas operacionais . . . . . 21

2.8 Ilustracao do procedimento metodologico . . . . . . . . . . . . . . . . . . . 23

3.1 Representacao em blocos da equacao de espaco de estado . . . . . . . . . . 27

3.2 Exemplo de mapeamento topologico para equacao de espaco de estado . . . 28

3.3 Matrizes de adjacencia das topologias determinısticas . . . . . . . . . . . . . 29

3.4 Matriz de transmissao para topologias determinısticas. . . . . . . . . . . . . 31

3.5 Exemplo de emparelhamento maximo em grafos nao direcionados . . . . . . 34

3.6 Rendimento dos nos em uma rede livre de escala . . . . . . . . . . . . . . . 43

3.7 Relacao entre o rendimento e o grau em redes livre de escala . . . . . . . . 44

3.8 Cardinalidade do conjunto observador estrutural . . . . . . . . . . . . . . . 45

3.9 Distribuicao da quantidade de nos observadores estruturais . . . . . . . . . 46

3.10 Grau esperado relativo dos nos observadores estruturais . . . . . . . . . . . 47

3.11 Relacao entre o diametro e a observabilidade estrutural . . . . . . . . . . . 48

3.12 Relacao entre a eficiencia e a observabilidade estrutural . . . . . . . . . . . 49

3.13 Relacao entre o agrupamento e a observabilidade estrutural . . . . . . . . . 50

3.14 Relacao entre a cardinalidade de Ooe e a quantidade de rotas . . . . . . . . . 51

3.15 Exemplo de localizacao dos nos observadores estruturais . . . . . . . . . . . 52

3.16 Relacao entre o rendimento e a cardinalidade de Ooc . . . . . . . . . . . . . 53

3.17 Relacao entre o rendimento e a quantidade de trafego instantaneo . . . . . . 54

3.18 Cardinalidade do conjunto observador funcional . . . . . . . . . . . . . . . . 55

3.19 Distribuicao da quantidade de nos observadores funcionais . . . . . . . . . . 56

3.20 Grau esperado relativo dos nos observadores funcionais . . . . . . . . . . . . 56

3.21 Relacao entre o diametro e a observabilidade funcional . . . . . . . . . . . . 57

3.22 Relacao entre a eficiencia e a observabilidade funcional . . . . . . . . . . . . 58

3.23 Relacao entre o agrupamento e a observabilidade funcional . . . . . . . . . . 59

3.24 Relacao entre a cardinalidade de Ooc e a quantidade de rotas . . . . . . . . . 59

3.25 Exemplo de localizacao dos nos observadores funcionais . . . . . . . . . . . 60

4.1 Composicao de tracados de rota para universidades brasileiras . . . . . . . . 64

4.2 Ilustracao das regras da visualizacao por disposicao radial . . . . . . . . . . 67

4.3 Restricoes de sobreposicao da disposicao radial expressiva . . . . . . . . . . 69

Page 14: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

4.4 Espaco angular e raio base necessarios para evitar sobreposicao . . . . . . . 704.5 Valor esperado do raio da visualizacao . . . . . . . . . . . . . . . . . . . . . 774.6 Distribuicao do tamanho do raio da visualizacao . . . . . . . . . . . . . . . 784.7 Relacao entre o diametro e o raio da visualizacao . . . . . . . . . . . . . . . 794.8 Relacao entre a eficiencia e o raio da visualizacao . . . . . . . . . . . . . . . 80

A.1 Tipos de representacao de redes complexas . . . . . . . . . . . . . . . . . . 86A.2 Representacao de redes por meio de lista de adjacencia . . . . . . . . . . . . 88A.3 Caracterizacao e transformacao de grafos . . . . . . . . . . . . . . . . . . . 89

B.1 Ilustracao das topologias em anel, em estrela e linear . . . . . . . . . . . . . 102B.2 Distancia media das topologias determinısticas . . . . . . . . . . . . . . . . 104B.3 Eficiencia media das topologias determinısticas . . . . . . . . . . . . . . . . 105B.4 Exemplo de rede de mundo pequeno . . . . . . . . . . . . . . . . . . . . . . 109B.5 Exemplo da evolucao de uma rede livre de escala . . . . . . . . . . . . . . . 111B.6 Distribuicao dos graus em uma rede livre de escala . . . . . . . . . . . . . . 112

Page 15: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes ix

Lista de Tabelas

3.1 Influencia das metricas na observabilidade . . . . . . . . . . . . . . . . . . . 61

4.1 Representacao por meio da utilizacao das propriedades retinais . . . . . . . 654.2 Eficacia da representacao de cada propriedade retinal . . . . . . . . . . . . . 65

5.1 Desempenho das metricas de caracterizacao . . . . . . . . . . . . . . . . . . 815.2 Influencia das metricas na visualizacao . . . . . . . . . . . . . . . . . . . . . 83

B.1 Densidade e distribuicao dos graus em topologias determinısticas . . . . . . 103

Page 16: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes xi

Lista de Teoremas

3.1 Teorema (Condicao para observabilidade estrutural) . . . . . . . . . . . . . 32

3.1 Lema (Correspondencia entre controlabilidade e observabilidade) . . . . . . 33

3.2 Teorema (Conjunto controlador mınimo) . . . . . . . . . . . . . . . . . . . . 35

3.1 Corolario (Conjunto observador estrutural mınimo) . . . . . . . . . . . . . . 35

3.3 Teorema (Comportamento do processo marcoviano regular) . . . . . . . . . 40

3.4 Teorema (Estado estavel do processo marcoviano regular) . . . . . . . . . . 40

3.5 Teorema (Potencias da matriz de adjacencia) . . . . . . . . . . . . . . . . . 41

3.2 Lema (Regularidade da matriz de transicao) . . . . . . . . . . . . . . . . . . 41

3.2 Corolario (Influencia do diametro sobre a matriz regular) . . . . . . . . . . 41

3.3 Corolario (Conjunto observador funcional mınimo) . . . . . . . . . . . . . . 41

4.1 Lema (Equivalencia entre o raio base e o espaco) . . . . . . . . . . . . . . . 68

4.2 Lema (Espaco angular necessario de um no) . . . . . . . . . . . . . . . . . . 69

4.3 Lema (Espaco angular necessario para evitar sobreposicao angular) . . . . . 70

4.4 Lema (Raio base mınimo necessario para evitar sobreposicao angular) . . . 71

4.5 Lema (Raio base mınimo necessario para evitar sobreposicao parental) . . . 71

4.1 Teorema (Raio base mınimo para a disposicao radial expressiva) . . . . . . 72

4.2 Teorema (Tempo de execucao esperado do algoritmo ‘espaco-angular()’) . . 73

4.3 Teorema (Tempo de execucao esperado do algoritmo ‘raio-minimo()’) . . . . 74

4.6 Lema (Quantidade maxima de nos por area) . . . . . . . . . . . . . . . . . . 75

4.7 Lema (Quantidade maxima de nos distribuıdos em aneis concentricos) . . . 75

4.8 Lema (Relacao entre quantidade de nos em aneis concentricos e a area) . . 76

4.9 Lema (Pior caso da escalabilidade em aneis concentricos) . . . . . . . . . . 77

4.4 Teorema (Escalabilidade da disposicao radial expressiva mınima) . . . . . . 77

C.1 Lema (Distancia media na topologia em anel) . . . . . . . . . . . . . . . . . 114

C.1 Corolario (Influencia da paridade de |N | em ESring) . . . . . . . . . . . . 114

C.2 Corolario (Comportamento assintotico de ESring) . . . . . . . . . . . . . . 115

C.2 Lema (Distancia media na topologia em estrela) . . . . . . . . . . . . . . . 115

C.3 Corolario (Comportamento assintotico de ESstar) . . . . . . . . . . . . . . 115

C.3 Lema (Distancia media na topologia em linha) . . . . . . . . . . . . . . . . 116

C.4 Corolario (Comportamento assintotico de ES line) . . . . . . . . . . . . . . 116

C.4 Lema (Eficiencia media na topologia em anel) . . . . . . . . . . . . . . . . . 117

C.5 Corolario (Influencia da paridade de |N | em EF ring) . . . . . . . . . . . . 117

C.6 Corolario (Comportamento assintotico de EF ring) . . . . . . . . . . . . . 118

C.5 Lema (Eficiencia media na topologia em estrela) . . . . . . . . . . . . . . . 119

C.7 Corolario (Comportamento assintotico de EF star) . . . . . . . . . . . . . 119

C.6 Lema (Eficiencia media na topologia em linha) . . . . . . . . . . . . . . . . 119

Page 17: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

C.8 Corolario (Comportamento assintotico de EF line) . . . . . . . . . . . . . . 120C.7 Lema (Conjunto observador estrutural mınimo da topologia em anel) . . . . 121C.8 Lema (Conjunto observador estrutural mınimo da topologia em linha) . . . 121C.9 Lema (Conjunto observador estrutural mınimo da topologia em estrela) . . 121C.10 Lema (Estado estavel da topologia em estrela) . . . . . . . . . . . . . . . . 122C.11 Lema (Comportamento assintotico de f(n,m) = (nm+1 − n)/(n− 1)) . . . . 123C.12 Lema (Quantidade esperada de nos em uma arvore) . . . . . . . . . . . . . 123C.13 Lema (Comportamento assintotico linear de f(n) = 1/ arcsin(1/2n)) . . . . 124

Page 18: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes xiii

Glossario

Acronimos

BFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Breadth-First SearchBGP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Border Gateway ProtocolCAIDA . . . . . . . . . . . . . . . . . . . . . . . . . Cooperative Association for Internet Data AnalysisCDF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Cumulative Distribution FunctionDDoS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Distributed Denial of ServiceDoS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Denial of ServiceFIFO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . First-In First-OutIDS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Intrusion Detection SystemIoT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Internet of ThingsIP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Internet ProtocolIPv4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Internet Protocol version 4IPv6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Internet Protocol version 6IPS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Intrusion Prevention SystemISN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Initial Sequence NumberNAPT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Network Address and Port TranslationNAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Network Address TranslationNAT-PT . . . . . . . . . . . . . . . . . . . . . . . Network Address Translation – Protocol TranslationNP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Nondeterministic Polynomial TimeP2P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Peer to PeerPDF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Probability Distribution FunctionPRNG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Pseudo-Random Number GeneratorSOM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Self-Organizing MapTCP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Transmission Control Protocol

Simbologia

C.Q.D. . . . . . . Demarcador contracao de ‘como se queria demonstrar’.

. . . . . . . . . . . . Demarca fim de Algoritmos, Definicoes, Teoremas, dentre outros.

Representacoes

x . . . . . . . . . . . . Letras minusculas em negrito indicam vetores coluna. E possıvel pa-rametrizar o vetor, por exemplo, x(t) =

[

x1(t) · · · xn(t)]⊺

indicaque o vetor x e variante no tempo.

Page 19: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

xiv Glossario

X . . . . . . . . . . . . Letras maiusculas em negrito indicam matrizes. Assim como epossıvel parametrizar vetores, o mesmo e possıvel com matrizes, porexemplo, uma matriz variante no tempo pode ser representa porX(t).

X . . . . . . . . . . . . Letras maiusculas caligraficas representam variaveis aleatorias.

x(t) . . . . . . . . . . Indica a derivada da funcao x(·) em relacao ao tempo t. Tambem seaplica a funcionais em vetores e matrizes.

n! . . . . . . . . . . . . Operador fatorial, definido recursivamente como n! = n(n−1)! e comcaso base 0! = 1. De forma iterativa tambem pode ser descrito como

n! =n−2∏

i=0

(n− i),

para n ≥ 2.

(

nk

)

. . . . . . . . . . . Coeficiente binomial de n dado k, onde 0 ≤ k ≤ n, definido como

(

n

k

)

=n!

k!(n− k)!,

que pode ser computado de forma eficiente utilizando

(

n

k

)

=k∏

i=1

n− (k − i)

i,

que possui complexidade Θ(k).

δ(t), δij . . . . . . . A funcao delta de Kronecker, definida como

δij ,

1 se i = j0 caso contrario

,

utilizada como contrapartida discreta da funcao delta de Dirac. Porconveniencia, e possıvel usar a seguinte representacao

δ(t) ,

1 se t = 00 caso contrario

.

Dessa forma temos de forma equivalente que o valor δ(i − j) e 1 sei = j e 0 caso contrario.

Page 20: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Glossario xv

Hn . . . . . . . . . . . Indica a soma dos n primeiros termos da serie harmonica, represen-tada por

Hn =n∑

i=1

1

i,

que diverge no limite quando n → ∞. Porem, possui a seguintepropriedade assintotica

limn→∞

Hn− log(n) = γ,

onde γ ≈ 0.57721 representa a constante de Euler-Mascheroni. Por-tanto, e possıvel usar a seguinte igualdade assintotica

Hn ≃ log(n) + γ,

onde o logaritmo natural e o da base natural e.

x : p(x) . . . . Descricao do conjunto representado pelos elementos x que tem apropriedade, ou predicado, p(x). Adicionalmente, o predicado p(x)pode ser descrito utilizando os operadores da logica proposicional.

(∀x)(p(x)) . . . Quantificacao universal em relacao aos elementos x que tem a propri-edade, ou predicado, p(x). A pertinencia dos elementos representa-dos por x tambem pode ser descrita de forma explicita, por exemplo,(∀x ∈ N)(p(x)). Que expressa que todos os elementos do conjuntodos numeros naturais possuem o predicado p. Adicionalmente, opredicado p(x) pode ser descrito utilizando os operadores da logicaproposicional.

(∃x)(p(x)) . . . Quantificacao existencial em relacao aos elementos x que tem a pro-priedade, ou predicado, p(x). A pertinencia dos elementos represen-tados por x tambem pode ser descrita de forma explicita, por exem-plo, (∃x ∈ N)(p(x)). Que expressa que existe pelo menos um numeronatural que possui o predicado p. Adicionalmente, o predicado p(x)pode ser descrito utilizando os operadores da logica proposicional.

Notacao assintotica

O(·) . . . . . . . . . . Quando e expresso que f(n) ∈ O(g(n))[i], dize-se que existe umaconstante k, tal que a funcao f(n), para todo valor de n > n0, esempre limitada superiormente por kg(n).

Ω(·) . . . . . . . . . . Quando e expresso que f(n) ∈ Ω(g(n)), dize-se que existe uma cons-tante k, tal que a funcao f(n), para todo valor de n > n0, e semprelimitada inferiormente por kg(n).

[i]Utiliza-se o sımbolo de pertinencia ∈ pois interpreta-se que o operador O(·) representa o conjunto dasfuncoes que sao limitadas superiormente pelo seu argumento, no caso a funcao g(·). O mesmo princıpiopode ser aplicada aos outros operadores assintoticos apresentados em sequencia.

Page 21: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

xvi Glossario

Θ(·) . . . . . . . . . . Quando e expresso que f(n) ∈ Θ(g(n)), dize-se que existe uma cons-tante k1, tal que a funcao f(n), para todo valor de n > n0, e semprelimitada inferiormente por k1g(n), e tambem existe uma outra cons-tante k2, tal que a funcao f(n), para todo valor de n > n0, e semprelimitada superiormente por k2g(n). De forma equivalente, define-seque f(n) ∈ Θ(g(n)) se e somente se

limn→∞

f(n)

g(n)= c,

para g(n) diferente de zero ou, pelo menos, sempre maior de que zeroa partir de algum ponto e para 0 < c <∞.

Igualdades matematicas

≈ . . . . . . . . . . . . Valor aproximado.

≃ . . . . . . . . . . . . Igualdade assintotica, isto e, se f(n) ≃ g(n) entao

limn→∞

f(n)

g(n)= 1,

para g(·) infinitamente diferente de zero.

∝ . . . . . . . . . . . . Proporcionalidade, isto e, se f(n) ∝ g(n), entao existe uma cons-tante k tal que f(n) = kg(n). De forma generalista, pode considerartambem a igualdade assintotica.

, . . . . . . . . . . . . Igualdade por definicao, por exemplo,

dx(t)

dt,

[

dx1(t)dt · · · dxn(t)

dt

]⊺,

onde x(t) e um vetor coluna.

≡ . . . . . . . . . . . . Equivalencia, por exemplo, x ≡ y significa que x e definido comosendo logicamente igual a y.

Notacao estatıstica

∼ . . . . . . . . . . . . Indicador de distribuicao de probabilidade, por exemplo X ∼ N(µ, σ)indica que a variavel aleatoria X segue uma distribuicao de probabi-lidade normal com media µ e desvio padrao σ.

Xζ . . . . . . . . . . . Resultado ou realizacao ζ da variavel aleatoria X .

P(Xζ) . . . . . . . . Probabilidade da variavel aleatoria X assumir a realizacao ζ.

Page 22: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Glossario xvii

P(Xζ | p) . . . . . Probabilidade da variavel aleatoria X assumir a realizacao ζ dadoque o predicado p e verdadeiro.

EX . . . . . . . . Valor esperado da variavel aleatoria X . No caso discreto e definidocomo

EX =∑

ζ∈

Xζ P(Xζ),

onde e o conjunto de possıveis realizacoes da variavel aleatoria.

EX | p . . . . . Valor esperado da variavel aleatoria X dado que o predicado p everdadeiro. No caso discreto e definido como

EX =∑

ζ∈

Xζ P(Xζ | p),

onde e o conjunto de possıveis realizacoes da variavel aleatoria.

Operadores matematicos

| · | . . . . . . . . . . . Se for aplicado a um escalar, indica o seu valor absoluto. Caso sejaaplicado a um conjunto, indica sua cardinalidade.

⌊·⌋ . . . . . . . . . . . O maior valor inteiro menor ou igual ao escalar.

⌈·⌉ . . . . . . . . . . . O menor valor inteiro maior ou igual ao escalar.

ρ(·) . . . . . . . . . . Posto de uma matriz, por exemplo dada uma matriz identidade In×n,ρ(I) = n.

X⊺ . . . . . . . . . . . Operacao de transposicao da matriz X, isto e, troca dos elementosxij pelos elementos xji. Tambem pode ser aplicada a vetores, no qualtransforma vetores coluna em vetores linha, e vice-versa.

X − Y . . . . . . . Subtracao de elementos de conjuntos. Utilizando a notacao de con-juntos pode ser definido por

X − Y , z : (z ∈ X) ∧ (z /∈ Y ),

que representa o conjunto resultante da retirada dos elementos emX que tambem estao em Y .

X × Y . . . . . . . Produto cartesiano entre dois conjuntos X e Y . Utilizando a notacaode conjuntos pode ser definido por

X × Y , (x, y) : (x ∈ X) ∧ (y ∈ Y ),

que representa todas as possıveis combinacoes de pares ordenadosentres os elementos de X e de Y .

Page 23: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

xviii Glossario

Operadores logicos

¬ . . . . . . . . . . . . Operador unario de negacao.

∨ . . . . . . . . . . . . Operador binario de disjuncao, definido como ‘ou inclusivo’.

∧ . . . . . . . . . . . . Operador binario de conjuncao, definido com valor logico ‘e’.

⇒ . . . . . . . . . . . Operador binario de implicacao, por exemplo, (a ⇒ b), onde a edenominado antecedente e b consequente. Unico operador binarionao comutativo.

⇔ . . . . . . . . . . . Operador binario de bi-implicacao. Onde (a ⇔ b) e logicamenteequivalente a representacao ((a⇒ b) ∧ (b⇒ a)).

Page 24: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes 1

Capıtulo 1

Introducao

“If knowledge can create problems,

it is not through ignorance that we can solve them.”

Isaac Asimov

Desde sua criacao ate sua popularizacao, a Internet tem sido usada para os maisdiversos fins. A influencia que a Internet exerce no inıcio do seculo XXI, faz com queinstituicoes militares, cientıficas, polıticas ou comerciais despertem um grande interesse noconhecimento de sua estrutura [Deibert et al. 2008, Deibert et al. 2010, Lordet 2012]. Esseinteresse deve-se, dentre outras coisas, ao fato da Internet tornar possıvel, enquanto meiode comunicacao, a liberdade de expressao e a pluralidade ideologica em escala global [Arsu2011, Goodman 2011].

Este trabalho apresenta um levantamento dos problemas associados a influencia da ob-servabilidade e da visualizacao radial no projeto de sistemas de monitoramento para redesde grande magnitude, como a Internet, e estabelece limites teoricos para esses problemas.Alem disso, esta tese se propoe a apresentar solucoes para parte desses problemas. Edada enfase na localizacao e na quantidade de nos necessarios para garantir uma aquisicaode dados capaz de representar o estado da rede de forma efetiva e na elaboracao de ummodelo de visualizacao das informacoes da rede com o objetivo de ampliar a capacidadede inferencia e de entendimento de suas propriedades.

Este Capıtulo esta organizado da seguinte forma: na Secao 1.1, sao apresentadas asrazoes responsaveis pela definicao do tema deste trabalho. Os objetivos do trabalho saoapresentados na Secao 1.2. Em seguida, na Secao 1.3 e apresentada uma revisao bibli-ografica. As principais contribuicoes deste trabalho sao resumidas na Secao 1.4. Final-mente, na Secao 1.5, e apresentada a organizacao do conteudo dos outros Capıtulos e dosApendices constituintes desta tese.

Page 25: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

2 Capıtulo 1. Introducao

1.1 Motivacao

Alem de existirem tentativas de desenvolver mecanismos de controle para a Internet,ha tambem esforcos para garantir sua integridade e a descentralizacao estrutural de taismecanismos de controle. Em ambos os casos, para se desenvolver qualquer tipo de sis-tema computacional voltado para algum desses propositos, e necessario um entendimentoefetivo sobre os aspectos que caracterizam redes como a Internet. Esse cenario e aindamais crıtico quando consideramos novas tendencias tecnologicas como e o caso da IoT(do ingles, Internet of Things). Isso porque, nesse novo contexto, inserido no modelo decomputacao ubıqua, e considerada a conexao direta de dispositivos, principalmente os deproposito pessoal, a Internet. Torna-se evidente que o estudo das propriedades estrutu-rais e das funcionalidades dessas redes pode estabelecer limites teoricos relacionados aconfidencialidade e outras questoes de seguranca.

O estudo dos limites teoricos para criacao de um sistema de monitoramento globalda Internet parece caminhar na direcao do controle do fluxo da informacao. Entretanto,esse estudo tambem e capaz de revelar em que condicoes os requisitos, necessarios parapossibilitar esse monitoramento restritivo, podem deixar de serem atendidos. Dessa forma,deixando em segundo plano o proposito final do monitoramento, este trabalho tem comomotivacao o entendimento dos fatores associados a influencia da observabilidade e davisualizacao radial na criacao de um sistema de monitoramento para redes de grandeescala e complexidade.

1.2 Objetivos

A criacao de sistemas de monitoramento para redes de grande magnitude, deve atender,alem da efetividade, a requisitos de eficiencia e escalabilidade. No desenvolvimento destetrabalho, sao apontados diversos problemas crıticos na concepcao desses tipos de sistemas.Dentre eles estao: (i) a necessidade de criacao de algoritmos eficientes para estimar aquantidade mınima e a localizacao dos nos da rede que terao de coletar dados para omonitoramento e (ii) a necessidade de algoritmos eficientes para a criacao de modelosescalaveis de apresentacao das informacoes extraıdas no processo de monitoramento. Dessaforma, em relacao aos desafios teoricos associados ao monitoramento de redes de grandeescala, este trabalho se concentra em avancar teoricamente nessas duas questoes.

1.3 Trabalhos relacionados

Nesta Secao, e feita uma revisao bibliografica dos principais trabalhos relacionados aoatual estado da arte no que se refere a inferencia do estado interno da rede e da visualizacaodos predicados da rede com base em sua representacao topologica. As referencias saoapresentadas em ordem cronologica.

Inferencia do estado interno da rede

Medicoes robustas da dinamica da rede sao importantes para o projeto e operacao deredes de grande escala, como a Internet. Porem, a diversidade administrativa, uma vezque a Internet e composta por sistemas autonomos, torna impraticavel o monitoramentode cada caminho fim-a-fim da rede. Tambem e difıcil determinar as caracterısticas de

Page 26: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

1.3. Trabalhos relacionados 3

desempenho de pontos individuais da rede a partir de medicoes unicast associadas a cadauma de suas possıveis rotas. Caceres et al. (1999) mostram que o uso de medicoes fim-a-fimmulticast possibilita a inferencia de caracterısticas internas da rede. Apesar de se tratarde um metodo de monitoramento ativo, que gera trafego excedente na rede, a utilizacaode mensagens multicast reduz esse impacto. A quantidade de trafego necessaria para seobter estimativas do estado interno da rede nao e apresentada em [Caceres et al. 1999].Essa informacao pode ser obtida a partir do estudo da escalabilidade desse modelo.

Ji & Elwalid (2002), a partir da consideracao de que os nos observadores estao locali-zados principalmente nas bordas da rede, apresentam as condicoes em que a quantidadede medicoes necessarias no modelo de Caceres et al. (1999) e escalavel. Especificamente,eles verificaram que a quantidade de medicoes cresce linearmente em relacao ao tamanhoda rede, ou seja, e da ordem de O(n)[i], quando nao ha perda de pacotes na transmissao e,portanto, e escalavel. Quando considera-se a possibilidade de perda de pacotes, a quanti-dade de medicoes cresce de forma mais rapida comparada ao crescimento da propria rede, oque caracteriza a nao escalabilidade do sistema. Porem, a premissa de que todos os nos daborda da rede sao nos observadores e bastante restritiva quantitativamente. Considerandoo crescimento hierarquico na quantidade de nos, pode-se chegar a uma quantidade de nosobservadores de aproximadamente metade da quantidade total de nos. E conveniente queseja possıvel minimizar essa quantidade.

No contexto de monitoramento de sobrecargas em uma rede, por exemplo, latencia,congestionamento e falhas, Chen et al. (2007) desenvolveram um modelo capaz de mini-mizar a quantidade de nos observadores para redes de grande escala. Ao contrario do quee proposto por Ji & Elwalid (2002), os autores consideram que os enlaces e que serao mo-nitorados no lugar dos nos. Ate entao, sistemas eficazes com esse proposito requeriam quea quantidade de enlaces observados fosse da ordem de O(n2). A partir do procedimentode minimizacao desenvolvido, Chen et al. (2007) demonstraram que essa quantidade podeser reduzida para O(n log n). Apesar de diminuir de forma significativa a quantidade deenlaces monitorados, a quantidade de observadores pode chegar a ser maior que a propriaquantidade de nos da rede.

Gopalan & Ramasubramanian (2012) estabelecem condicoes necessarias e suficientespara que seja possıvel utilizar apenas um observador para estimar de forma eficaz in-formacoes sobre metricas de enlace aditivas como, por exemplo, latencia e distancia. Paracomputar a quantidade mınima e a localizacao dos observadores quando essas condicoesnao se fazem presentes, os autores apresentam um algoritmo de tempo polinomial, espe-cificamente, da ordem de O(n2). Porem, nao ha indicacao da quantidade e da localizacaoesperada dos nos observadores.

Visualizacao de predicados com base na topologia

O entendimento da estrutura de uma rede e um problema permanentemente abordadona visualizacao da informacao. Sua aplicabilidade em redes de comunicacao tem comointeresse, por exemplo, apresentar de forma adequada o grau de conectividade em uma redee a distancia entre seus nos. Esse problema e abordado por Yee et al. (2001) com base emuma aplicacao interativa para exploracao de grafos sendo a visualizacao de sua estruturatopologia disposta de forma radial. Os autores verificaram que a forma interativa como aaplicacao foi desenvolvida, onde e permitida a habilidade de mudar o foco da visualizacao,

[i]Considera-se n como sendo a quantidade de nos da rede e e a quantidade de enlaces.

Page 27: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

4 Capıtulo 1. Introducao

entusiasma os usuarios a fim de descobrir propriedades relacionadas a localizacao dos nosda rede. Apesar de exitoso, esse trabalho deixa como desenvolvimento futuro a questaode escalabilidade quando a rede possui uma grande quantidade de nos. Sugestoes de piorcaso de escalabilidade sao encontrada na literatura [Battista et al. 1998], mas o melhorcaso e o comportamento esperado dessa escalabilidade nao sao conhecidos.

A visualizacao por disposicao radial tem como finalidade inicial a apresentacao deestrutura hierarquicas, ou seja, arvores. Isso pode ser considerado uma desvantagem asso-ciada a sua utilizacao. Porem, como apresentado por Kim et al. (2004), redes complexassao fortemente caracterizadas por seu nucleo de comunicacao (communication kernel, oubackbone para redes de computadores) que tem uma forte correlacao com a topologia ori-ginal. Esse nucleo de comunicacao e criado com base em uma metrica de centralidade[Newman 2003] e no estudo das arvores de cobertura [Kruskal 1956]. De fato, a utilizacaode metricas baseadas em centralidade e uma abordagem ja utilizada no projeto de algorit-mos de roteamento [Oliveira et al. 2010, Ramos et al. 2012]. Portanto, em vez de se tornaruma desvantagem, a caracterıstica centrada na visualizacao de estruturas hierarquicas davisualizacao por disposicao radial a torna ainda mais adequada. Adicionalmente, Kimet al. (2005) verificam tambem que, para redes livre de escala, a distribuicao dos graus daarvore que representa o nucleo de comunicacao tambem e livre de escala.

Em relacao a qualidade da visualizacao, tem-se que a minimizacao de cruzamentos entrearestas e um dos principais criterios para legibilidade. Em seu trabalho, Bachmaier (2007)demonstra que a visualizacao radial e mais flexıvel para rotear arestas quando comparadaa visualizacao tradicional. De fato, Bachmaier (2007) verificou experimentalmente que autilizacao da disposicao radial possibilita em media uma reducao de 30% na quantidadede cruzamentos entre arestas quando comparada a sua contrapartida cartesiana. Isso epossıvel a partir do uso de um algoritmo da ordem de O(en2). Ainda segundo Bachmaier(2007), a representacao de grafos por disposicao radial e bem adaptada a visualizacao depropriedades centrais, o que tambem e verificado por Ham & Wattenberg (2008).

Medeiros & Santos (2008) apresentam o uso da visualizacao proposta por Yee et al.(2001) para representacao de predicados associados a seguranca em redes de computadores.Com o objetivo de apresentar solucoes para as questoes de escalabilidade, os autoresutilizam tecnicas de agrupamento dos nos, priorizacao do foco da visualizacao e ajuste doraio. O controle desses parametros e feito pelo proprio analista, de forma que e necessarioo desenvolvimento de tecnicas de ajuste preliminar desses parametros. Essas tecnicas, noentanto, podem ter como base o estudo da escalabilidade da visualizacao.

Recentemente, foram apresentados estudos comparativos sobre as vantagens e desvan-tagens da utilizacao da disposicao radial para visualizacao de informacao. Especificamente,Diehl et al. (2010) relatam que, embora a visualizacao por disposicao cartesiana apresenteresultados melhores no geral, a disposicao radial tambem apresenta resultados satisfatorios.Adicionalmente, a visualizacao por disposicao radial parece ser mais adequada para o es-tudo de uma dimensao unica dos dados, por exemplo, distancia entre os nos, assim como asbordas da visualizacao parecem ser mais expressivas. Burch et al. (2011) apresentam umaanalise do tempo de resposta de participantes em tarefas associadas a identificacao de pro-priedades topologicas de um grafo. Os experimentos apresentados em [Burch et al. 2011]indicam que a visualizacao por disposicao radial tende a fazer com que o analista verifiquemais de uma vez propriedades em comum entre os nos da topologia e que, quando a in-formacao de interesse esta no centro da visualizacao radial, o tempo de resposta e melhordo que aquele apresentado na contrapartida cartesiana.

Page 28: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

1.4. Contribuicoes 5

Solucoes propostas

Como nao ha um estudo sobre a observabilidade da rede considerando o monitora-mento passivo, em que o processo de monitoramento nao gera trafego excedente, tem-sea definicao da primeira proposta desse trabalho: desenvolver um modelo eficaz e algorit-mos eficientes que permitam o projeto de observabilidade passiva de redes em relacao alocalizacao otima dos nos observadores.

Como tambem nao ha um estudo sobre a escalabilidade da visualizacao por disposicaoradial, propoe-se desenvolver um modelo otimizado para visualizacao de redes de largaescala que permita a utilizacao de algoritmos eficientes e de uma quantidade de recursoscomputacionais escalavel, sem comprometer sua eficacia.

1.4 Contribuicoes

Os desenvolvimentos teoricos, a analise de desempenho das solucoes propostas e asimplicacoes dos resultados observados no projeto de sistemas de monitoramento de redes,para as duas questoes apresentadas na Secao 1.2, compoem a maior parte das contribuicoesdeste trabalho. Alem disso, com base na revisao bibliografica apresentada na Secao 1.3,e possıvel destacar os seguintes fatos: (i) nao ha um estudo sobre a quantidade mınimae a localizacao dos nos observadores em relacao ao monitoramento passivo da rede e (ii)nao ha um estudo sobre a escalabilidade esperada da visualizacao por disposicao radial.Portanto, as contribuicoes sao discriminadas a seguir na ordem em que sao apresentadas.

Com base na descricao de redes atraves da Teoria de Sistemas Complexos e dasequacoes de espaco de estado, foi elaborado um algoritmo capaz de definir a quantidademınima de nos observadores (aqueles que atuarao como sensores na rede) para monitoraruma dada topologia. Esse problema e abordado de duas formas: (i) a localizacao e a quan-tidade mınima de nos observadores necessarios para se estimar o estado de todos os nosda rede de forma passiva e (ii) a localizacao e a quantidade mınima de nos observadoresnecessarios para se capturar uma determinada proporcao do trafego de informacao na redeem um dado instante. Esses dois subconjuntos de nos observadores da rede, denominadosnos observadores estruturais e nos observadores funcionais, estao associados diretamente atopologia da rede, considerando a forma como os estados de nos adjacentes interagem e asentidades que regem o trafego das informacoes, por exemplo, os algoritmos de roteamento.

Utilizando os algoritmos desenvolvidos para o estudo de observabilidade de redes, fo-ram realizados experimentos a fim de relacionar propriedades de redes livre de escala(por exemplo, grau dos nos observadores e quantidade de nos em relacao ao diametro darede) com a quantidade e a localizacao dos nos observadores. Alem disso, sao explora-das tambem as propriedades de observacao de redes com topologias determinısticas (emanel, em estrela e linear), que tambem e uma contribuicao deste trabalho. E importantedestacar que o conjunto de nos observadores estruturais possui caracterısticas distintasdaquelas encontradas no conjunto de nos observadores funcionais. Por exemplo, enquantoos nos observadores funcionais tendem a se concentrar na parte central da rede, os nosobservadores estruturais se concentram nas bordas.

A fim de tornar possıvel a apresentacao das informacoes de monitoramento, foi desen-volvido um algoritmo de tempo linear capaz de utilizar a quantidade mınima de espacopara representar topologias utilizando o modelo de visualizacao de grafos pela disposicaoradial. Isso foi possıvel gracas a um processo de otimizacao baseado em uma definicao for-

Page 29: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

6 Capıtulo 1. Introducao

mal do modelo de visualizacao. Tanto o modelo formal, quanto o processo de otimizacao,tambem sao contribuicoes deste trabalho. E provada a escalabilidade do modelo de visua-lizacao demonstrando formalmente que ela atinge o limite teorico inferior no melhor caso.Da mesma forma e demonstrado o tempo de execucao linear do algoritmo proposto.

1.5 Organizacao do trabalho

Alem desta Introducao, o trabalho esta organizado em mais quatro Capıtulos e tresApendices, cujos conteudos sao individualmente discriminados a seguir.

No Capıtulo 2, trata-se dos fundamentos associados ao projeto de sistemas de mo-nitoramento de redes de computadores. Nele e definido o contexto de aplicacao assimcomo todas as definicoes fundamentais relacionadas a bibliografia e aos desenvolvimentosteoricos deste trabalho. Ainda nesse Capıtulo, sao descritos, de forma mais elaborada,os problemas relacionados a criacao de um sistema de monitoramento de redes de grandeescala. Finalmente, com base em uma definicao estendida dos objetivos especıficos, edescrita a metodologia utilizada no desenvolvimento do trabalho.

As contribuicoes do trabalho no que se refere a quantidade mınima e localizacao dosnos observadores, sao apresentadas no Capıtulo 3. Inicialmente, e apresentado o modelo derepresentacao de redes, que tem como objetivo dar suporte aos algoritmos de identificacaodo subconjunto dos nos observadores. Em seguida, sao apresentados os algoritmos paraidentificacao do conjunto observador estrutural mınimo e do conjunto observador funcionalmınimo. Utilizando os algoritmos desenvolvidos, sao apresentados experimentos a fim derelacionar propriedades de redes livre de escala com a quantidade e localizacao dos nosobservadores. Finalmente, sao realizados experimentos tendo como exemplo dados delevantamentos topologicos da Internet.

A apresentacao dos dados em um sistema de monitoramento e fundamental para oentendimento dos predicados da rede a ser monitorada. Dessa forma, o modelo de visu-alizacao dessas informacoes deve propiciar uma representacao das informacoes que sejaadequada a escala da quantidade dos dados. No Capıtulo 4, e definido um modelo eficazde representacao de topologias utilizando a visualizacao por meio da disposicao radial.Esse modelo e otimizado a fim de minimizar a quantidade de espaco necessario para vi-sualizacao de topologias sem que haja prejuızo das propriedades visuais das entidades derepresentacao da informacao. Um algoritmo de tempo linear e desenvolvido com base nasolucao do problema de otimizacao. Finalmente, tanto o tempo de execucao do algoritmoquanto a escalabilidade do modelo sao demostradas.

Por fim, no Capıtulo 5, sao sumarizados e discutidos os resultados do trabalho e,com base no estudo realizado em cada Capıtulo, sao ainda apresentados possıveis direci-onamentos para novas pesquisas. Resultados indiretos e algumas definicoes utilizadas notrabalho estao organizadas nos Apendices. Especificamente, o modelo de caracterizacaode topologias utilizado neste trabalho para estudar as propriedades do monitoramento deredes, e apresentado no Apendice A. Inicialmente, sao definidas os conceitos basicos e aspropriedades de grafos e de seus elementos fundamentais. Em seguida, sao apresentadasmetricas de caracterizacao de redes complexas.

Os conceitos apresentados no Apendice A sao exemplificados no Apendice B com autilizacao de tres tipos de redes determinısticas: em anel, estrela e linear. Alem dastopologias determinısticas, tambem sao apresentadas propriedades de grafos aleatorios,redes de mundo pequeno e livre de escala. Os modelos e definicoes apresentados nesse

Page 30: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

1.6. Publicacoes relacionadas 7

Apendice sao utilizados na modelagem e analise das solucoes propostas neste trabalho.Finalmente, no Apendice C, sao apresentadas demonstracoes complementares utilizadasem cada um dos Capıtulos. Basicamente, esse Apendice contem uma serie de resultadosutilizados no desenvolvimento teorico apresentado neste trabalho.

1.6 Publicacoes relacionadas

Durante o desenvolvimento desta tese, foram publicados capıtulos de livros, artigos emconferencias e em periodicos. As publicacoes relacionados a esta tese sao listadas a seguir.

Capıtulos de livros

1. Medeiros, J.P.S.; Borges Neto, J.B.; Brito Junior, A.M.; Pires, P.S.M. LearningRemote Computer Fingerprinting, Computational Intelligence in Digital Foren-sics, Springer, Studies in Computational Intelligence, ISSN 1860-949X, 2014 (aceitopara publicacao).

2. Medeiros, J.P.S.; Borges Neto, J.B.; Queiroz, G.S.D.; Pires, P.S.M. IntelligentRemote Operating System Detection, Case Studies in Intelligent Computing:Achievements and Trends, ISBN 978-1-4822-0703-3, CRC Press, Taylor and Francis,2014.

Conferencias

1. Medeiros, J.P.S.; Brito Junior, A.M.; Pires, P.S.M. A New Method for Recog-nizing Operating Systems of Automation Devices, 14th IEEE InternationalConference on Emerging Technologies and Factory Automation (ETFA), 2009. Pro-ceedings of ETFA 2009, ISSN 1946-0759, pages 1-4, ISBN 978-1-4244-2727-7, 2009.

2. Medeiros, J.P.S.; Brito Junior, A.M.; Pires, P.S.M. A Data Mining Based Analy-sis of Nmap Operating System Fingerprint Database, 2nd InternationalWorkshop on Computational Intelligence in Security for Information Systems (CI-SIS), 2009. Computational Intelligence in Security for Information Systems, ISBN978-3-642-04090-0, Springer, Advances in Soft Computing, ISSN 1867-5662, volume63, pages 1-8, 2009.

3. Medeiros, J.P.S.; Brito Junior, A.M.; Pires, P.S.M. An Effective TCP/IP Fin-gerprinting Technique Based on Strange Attractors Classification, 2ndInternational Workshop on Autonomous and Spontaneous Security (SETOP), 2009.Data Privacy Management and Autonomous Spontaneous Security, ISBN 978-3-642-11206-5, Springer, Lecture Notes in Computer Science (LNCS), ISSN 0302-9743,volume 5939, pages 208-221, 2010.

4. Medeiros, J.P.S.; Brito Junior, A.M.; Pires, P.S.M. A Qualitative Survey of Ac-tive TCP/IP Fingerprinting Tools and Techniques for Operating SystemsIdentification, 4th International Workshop on Computational Intelligence in Secu-rity for Information Systems (CISIS), 2011. Computational Intelligence in Securityfor Information Systems, ISBN 978-3-642-21322-9, Springer, Lecture Notes in Com-puter Science (LNCS), ISSN 0302-9743, volume 6694, pages 68-75, 2011.

5. Medeiros, J.P.S.; Pires, P.S.M. Optimal Visualization of Complex NetworksUsing Radial Layout, Perspectives and Challenges in Statistical Physics and Com-

Page 31: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

8 Capıtulo 1. Introducao

plex Systems for the Next Decade: A Conference in Honor of Eugene Stanley andLiacir Lucena, Book of Abstracts, page 37, 2011.

Periodicos

1. Medeiros, J.P.S.; Santos, S.R.; Brito Junior, A.M.; Pires, P.S.M. Advances inNetwork Topology Security Visualisation, International Journal of System ofSystems Engineering (IJSSE), ISSN 1748-0671, Inderscience, volume 1, number 4,pages 387-400, 2009.

2. Medeiros, J.P.S.; Brito Junior, A.M.; Pires, P.S.M. Using Intelligent Techniquesto Extend the Applicability of Operating System Fingerprint Databases,Journal of Information Assurance and Security (JIAS), ISSN 1554-1010, volume 5,issue 4, pages 554-560, 2010.

3. Medeiros, J.P.S.; Pires, P.S.M. On the Scalability Bounds of Radial Layoutfor the Visualization of Scale-free Networks, Applicable Algebra in Engine-ering, Communication and Computing (AAECC), ISSN 0938-1279, Springer, 2013(submetido para revisao).

Page 32: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes 9

Capıtulo 2

Projeto de monitoramento

“We can only see a short distance ahead,

but we can see plenty there that needs to be done.”

Alan Mathison Turing

O entendimento dos fundamentos associados ao projeto de sistemas de monitoramentode redes de computadores e condicao necessaria para o desenvolvimento teorico a quese propoe este trabalho. Este Capıtulo tem por objetivo apresentar o contexto no qualenquadra-se o monitoramento de redes. Alem disso, sao apresentadas algumas definicoesque serao utilizadas ao longo da tese.

Este Capıtulo esta organizado da seguinte forma: na Secao 2.1, e definido o conceito demonitoramento de redes utilizado neste trabalho. Os desafios de cada etapa do desenvol-vimento de uma aplicacao voltada para o monitoramento de redes de computadores, assimcomo a definicao do problema e os trabalhos relacionados, sao apresentados na Secao 2.2.Na Secao 2.3, os objetivos especıficos sao apresentados com base nas definicoes e conceitosapresentados nas Secoes anteriores. Em seguida, na Secao 2.4 e apresentada a metodologiautilizada no projeto, desenvolvimento e validacao de cada parte do trabalho.

Page 33: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

10 Capıtulo 2. Projeto de monitoramento

2.1 Introducao

O monitoramento em redes pode ser definido como o processo de realizar medicoesde suas propriedades a fim de inferir alguma informacao de interesse a partir dessasmedicoes [Dilman & Raz 2002]. Essas informacoes, denominadas predicados, podem serrepassados para outros sistemas que tem como responsabilidade atuar na rede a fim demante-la em um estado desejavel. Dessa forma, nao necessariamente as informacoes sin-tetizadas sao apresentadas ou assistidas por algum indivıduo que desempenhe o papel deanalista da informacao. Apesar de opcional, a visualizacao de dados de monitoramentopode auxiliar no processo de tomada de decisao assistida, como por exemplo, atraves damineracao visual de dados. Por esse motivo, estendemos a definicao de monitoramentoadicionando ao processo mais uma incumbencia, a da apresentacao de informacoes pormeio da visualizacao cientıfica [Card et al. 1999]. O processo de monitoramento, com aapresentacao visual de informacoes, e definido a seguir e apresentado na Figura 2.1.

Definicao 2.1 (Monitoramento). O processo de monitoramento e definido como a com-posicao de 3 etapas distintas: (i) aquisicao de dados extraıdos da rede, (ii) processamentodos dados a fim de inferir predicados da rede e (iii) apresentacao dos predicados com baseem um modelo visual adequado.

aquisição

de dados

1

processamento

2apresentação

da informação

3

extração de

dados da rede

informaçãodados

modelo de apresentação

da informação

rede

modelo

Figura 2.1: Representacao do processo de monitoramento de redes de computadores divido emtres etapas: (1) aquisicao de dados extraıdos da rede, (2) processamento dos dados a fim de extrairinformacoes relevantes ao entendimento do funcionamento de algum aspecto da rede em questao e(3) apresentacao da informacao com base em um modelo.

No processo de monitoramento, nem todos os nos possuem a capacidade de extrair erepassar dados da rede para outros nos. Isso pode acontecer por limitacoes computacionaisdo no ou por questoes de acesso restrito ao no ou ao proprio dado. Dessa forma, a seguintedefinicao tem como objetivo discriminar os nos que sao usados para essa finalidade.

Definicao 2.2 (Nos observadores ou monitores). Dentre o conjunto de nos da rede, osubconjunto de nos que e designado para a etapa de aquisicao de dados e denominadoconjunto de nos observadores.

Apos sua aquisicao, os dados sao agregados para servir de entrada para a etapa deprocessamento. Nessa etapa os dados sao refinados a fim de extrair informacoes relevantesacerca da estrutura e do funcionamento da rede. Finalmente, essas informacoes devemser apresentadas em um modelo visual confiavel, capaz de promover o entendimento doestado da rede. Esse estado pode ser composto por diferentes aspectos, como, por exemplo:topologia, largura de banda, latencia e identificacao de dispositivos e servicos.

Page 34: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

2.2. Fundamentacao 11

Com o objetivo de estabelecer conceitos relevantes para o entendimento deste trabalho,faz-se necessario um esclarecimento mais detalhado sobre a etapa de aquisicao de dados.A forma como esses dados sao capturados diferem quanto a atividade ou passividade dono observador. Nesse sentido, sao duas as formas como o no observador pode capturaresses dados da rede, definidas a seguir.

Definicao 2.3 (Aquisicao passiva). A aquisicao de dados e dita passiva quando o noobservador coleta apenas dados locais ou que trafegam diretamente por ele.

Definicao 2.4 (Aquisicao ativa). A aquisicao de dados e denominada ativa quando ono observador utiliza-se de comunicacao com outros nos da rede a fim de gerar dadosrelevantes para o processo de monitoramento.

A forma natural de captura dos dados e por meio de metodos passivos, em que naoha necessidade de gerar trafego excedente na rede (ou overhead). Outra caracterıstica daaquisicao passiva de dados, e que o processo de aquisicao pouco altera o estado da rede.Dessa forma, a influencia do processo de monitoramento na medicao e minimizada. Poresse motivo, os metodos passivos devem ser utilizados preferencialmente. Exemplos dedados que sao obtidos com a utilizacao de metodos passivos sao: (i) tabelas de rotas e (ii)quantidade de dados trafegados por unidade de tempo.

Infelizmente, nem sempre informacoes relevantes para o entendimento da rede podemser extraıdas dos dados que sao gerados espontaneamente. Um exemplo e quando o no quepossui esse dado nao pode ser um no observador. Nesses casos, a utilizacao de metodosativos se faz necessaria. Exemplos de dados que sao obtidos com a utilizacao de metodosativos sao: (i) rotas (via traceroute), (ii) identificacao de servicos em maquinas remotas(via port scan), e (iii) identificacao de dispositivos, como firewall, proxies, e sistemasoperacionais (via operating system detection).

Na etapa de processamento, independente do metodo de aquisicao, os dados advin-dos da primeira etapa sao utilizados para compor predicados sobre a rede. Temos comoexemplo: (i) a reconstrucao da topologia a partir do tracado de rotas ou de tabelas derotas, (ii) a classificacao do sistema operacional de dispositivos remotos a partir da analisede pacotes e (iii) a descoberta de servicos e de sua versao a partir da analise de pacotes.Uma vez extraıdos, os predicados da rede podem servir de informacao de entrada paraoutros sistemas ou, simplesmente, podem ser apresentados em um modelo visual da rede.Exemplos de sistemas em que esses predicados podem servir de entrada sao os sistemasde deteccao de intrusao (IDS, do ingles, Intrusion Detection System) e os sistemas deprevencao contra intrusao (IPS, do ingles, Intrusion Prevention System).

Dado o contexto de monitoramento de redes apresentado nesta Secao, serao definidosna proxima Secao os problemas associados a criacao de um sistema de monitoramento. Es-pecificamente, serao esclarecidos em quais pontos o desenvolvimento cientıfico e suficientee em quais pontos deve-se avancar para tornar possıvel a criacao de sistemas eficientes.

2.2 Fundamentacao

Um dos grandes desafios do monitoramento de uma rede como a Internet esta rela-cionado a escalabilidade, dada a quantidade de elementos que compoem essa rede. Porexemplo, em uma rede como a Internet, cuja camada de rede e baseada no protocolo IP(Internet Protocol), o numero de nos pode ser da ordem de 232, se considerarmos o campode enderecamento IPv4 (IP versao 4) [Postel 1981a], ou da ordem de 2128, se considerarmos

Page 35: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

12 Capıtulo 2. Projeto de monitoramento

o campo de enderecamento IPv6 (IP versao 6) [Deering & Hinden 1998]. Se considerarmosa utilizacao de redes privadas criadas, por exemplo, com a utilizacao de NAT (NetworkAddress Translation) [Egevang & Francis 1994, Srisuresh & Egevang 2001] ou NAT-PT(Protocol Translation) [Tsirtsis & Srisuresh 2000], esse numero pode ser significativamentemaior. Por esse motivo, o projeto de uma estrutura de monitoramento de uma rede desseporte deve ser embasado em estudos que considerem a otimizacao de cada uma das etapasdo processo descrito na Figura 2.1.

O projeto de um sistema de monitoramento, como o descrito na Definicao 2.1, deveser eficaz, eficiente e escalavel. Com o objetivo de evitar ambiguidades, neste trabalho,definimos os termos ‘eficaz’, ‘eficiente’ e ‘escalavel’ para qualificar um sistema ou modelo.

Definicao 2.5 (Eficacia). Entende-se por sistema (ou modelo) eficaz aquele que produzum resultado consistente em relacao a sua entrada. De tal forma que se a entrada dosistema e consistente, a saıda tambem deve ser consistente.

Em um sistema de monitoramento eficaz os predicados apresentados refletem de formafiel o estado real da rede. Por exemplo, a topologia da rede apresentada pelo sistemaexpressa as conexoes entre os nos de forma consistente, ou seja, a topologia apresentada naodifere substancialmente da topologia real. Isso e possıvel desde que os dados capturadose a inferencia de predicados sejam corretos, adequados e suficientes.

Definicao 2.6 (Eficiencia). Entende-se por sistema (ou modelo) eficiente aquele queminimiza a quantidade de tempo necessario para produzir resultados. Quando esse tempoatinge o limite teorico mınimo, diz-se que a eficiencia e de melhor caso.

O tempo total necessario para realizar o monitoramento, desde a etapa de aquisicaodos dados ate a apresentacao da informacao, e um parametro que caracteriza, em termosgerais, a eficiencia do sistema. Se esse tempo cresce de forma muito mais rapida em relacaoao crescimento da propria rede, entao o sistema nao pode ser dito eficiente. Por exemplo,se o tempo necessario para capturar os dados adequados e suficientes para descrever atopologia de uma rede de n nos e da ordem de 2n, a simples aquisicao desses dadosimpossibilita todo o processo de monitoramento para valores de n maiores que apenasalgumas dezenas. Essa configuracao hipotetica caracteriza uma incompatibilidade entrea eficacia e a eficiencia do sistema. Isso porque, no exemplo citado, para ser eficaz enecessario que haja um tempo de espera da ordem exponencial, o que torna o sistemaineficiente. E, entao, necessario um estudo para que haja um balanceamento entre essasduas qualidades do sistema.

Quando esse tipo de incompatibilidade surge, e comum o modelo recair em um pro-blema de otimizacao combinatoria. Nessa classe de problemas, e natural a constatacao daclassificacao do problema como NP-arduo (Nondeterministic Polynomial Time) [Cormenet al. 2009]. Problemas que pertencem a essa classe nao sao passıveis de resolucao exatamesmo para instancias de tamanho razoavel. Uma solucao para contornar esse impassecomputacional se da por meio da utilizacao de algoritmos aproximativos. A utilizacao dealgoritmos aproximativos objetiva a resolucao do problemas de forma aproximadamenteotima. Metodos de busca estocastica, como e o caso dos algoritmos geneticos [Goldberg1989], sao candidatos para resolucao desses problemas.

Definicao 2.7 (Escalabilidade). Entende-se por sistema (ou modelo) escalavel aqueleque possui a capacidade de se adequar, em relacao a quantidade de recursos necessarios,ao crescimento da instancia do problema que se propoe a resolver.

Page 36: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

2.2. Fundamentacao 13

Alem de capturar e processar os dados de forma eficaz e eficiente, e necessario arma-zenar as informacoes antes de serem processadas. Por exemplo, sabendo que os dadosutilizados para criar a topologia podem ser baseados na coleta de tabelas de rotas de al-gum protocolo de roteamento, se essas tabelas de roteamento crescem de forma linear emrelacao ao numero de nos da rede, a quantidade de espaco de armazenamento necessariopode extrapolar a capacidade do sistema. Isso porque a quantidade de espaco para arma-zenar as rotas sera quadratica em relacao ao numero de nos. Portanto, para ser praticavel,o sistema, alem de eficaz e eficiente, deve ser escalavel. A Figura 2.2 ilustra as relacoesentre as etapas do projeto de um sistema de monitoramento.

identificação

de topologia

1definição de

observadores

2otimização

e aproximação

3construção

de predicados

4elaboração

da visualização

5

analista de

informaçãointeração

exploração

extrapolação

dados

a

b

c

d

e

f

g

h

Figura 2.2: Representacao das etapas do projeto de um sistema de monitoramento. As relacoesentre as etapas do projeto sao identificadas pelos rotulos comentados a seguir: (a) descoberta datopologia da rede, (b) definicao dos nos observadores a partir da topologia, (c) otimizacao de pro-cedimentos influenciados pela topologia, (d) modelo de gerenciamento dos dados adquiridos pelosobservadores, (e) otimizacao de procedimentos influenciados pela localizacao dos nos observado-res, (f) preprocessamento dos dados para inferencia de predicados, (g) analise dos dados a fim deestabelecer estruturas visuais adequadas para visualizacao da informacao e (h) apresentacao dainformacao para o analista cuja interacao ajuda a extrapolar informacoes acerca da topologia eexplorar os dados por meio da interpretacao dos predicados.

Como apresentado pela Figura 2.2, nao ha explicitamente uma etapa inicial no desen-volvimento de um sistema de monitoramento, ja que ha uma interdependencia entre asetapas. Nesse sentido, e importante ressaltar que a metodologia do projeto de um sistemade monitoramento deve considerar um desenvolvimento paralelo de etapas dependentesentre si. A seguir, serao levantadas alguma questoes fundamentais que relacionam osdesafios associados ao projeto desse sistema.

2.2.1 Topologia

A identificacao de topologia e um dos problemas mais desafiadores do projeto de umsistema de monitoramento. Mesmo a definicao do significado real do termo e algo que podecausar desentendimentos. Para evitar esse transtorno, define-se o que se deve entenderpela utilizacao do termo topologia neste trabalho.

Definicao 2.8 (O conceito de topologia). Entende-se por topologia de uma rede, qual-quer descricao da interconexao de seus nos em um dado instante de tempo. No casoda topologia de redes de computadores, consideram-se nos dispositivos com capacidadescomputacionais e de comunicacao e suas conexoes como canais fısicos ou logicos de comu-nicacao ativos entre esses nos.

Page 37: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

14 Capıtulo 2. Projeto de monitoramento

De acordo com essa Definicao, pode-se falar de dois tipos diferentes de topologia daInternet: (i) a da camada de enlace (nıvel 2) e (ii) a da camada de rede (nıvel 3). A identi-ficacao da topologia de uma rede descentralizada como a Internet, baseada em um conjuntode protocolos nao projetados para permitir tal identificacao, exige a utilizacao de tecnicasque nao tem como garantir confiabilidade. Por exemplo, Albert et al. (2000) cometeram oengano de confiar em dados dessa natureza. Os problemas relacionados a identificacao datopologia estao intrinsecamente associados a interpretacao de propriedades baseadas nama utilizacao dos dados [Alderson & Doyle 2010, Roughan et al. 2011]. Os trabalhos queevidenciam as razoes desse problema atribuem a confusao a dois fatos: (i) utilizacao demodelos diferentes que fazem suposicoes tambem diferentes e (ii) diferencas metodologicasque resultam em resultados distintos [Doyle et al. 2005, Willinger et al. 2009]. De formageral, os dados utilizados sao gerados por ferramentas que tracam rotas (traceroute) entrenos e realizam uma composicao dessas rotas, ou sao coletados atraves de informacoes ori-ginadas de protocolos de roteamento, como o BGP (Border Gateway Protocol) [Rekhteret al. 2006]. Porem, nem o tracado de rotas [Zhang et al. 2011] nem o protocolo BGP fo-ram projetados para realizar o levantamento topologico de uma rede [Roughan et al. 2011].Portanto, com a utilizacao desses dados, tem-se o comprometimento da eficacia do sistema.

Para solucionar esse impasse, novas tecnicas de reconhecimento topologico e modelosda Internet sao desenvolvidos. Um novo conjunto de ferramentas de estudo, denominadascomo tomografia da Internet [Coates et al. 2002], sao uma alternativa (ou complemento)aos metodos de tracado de rotas e baseados em tabelas de roteamento. Essas novas tecnicasapresentam, em relacao a descoberta da topologia da Internet, uma forma eficaz de des-cobrir a topologia e prometem tambem ser razoavelmente eficientes e escalaveis [Eriksonet al. 2012]. Contudo, para se validar essas tecnicas e necessaria uma avaliacao dos seusresultados e essa avaliacao deve ter como base um ambiente de testes significativamenteparecido com a Internet. Tecnicas e modelos que nao possuam uma validacao adequadaestao sujeitos aos mesmos problemas identificados no trabalho de Albert et al. (2000).Porem, o requisito de um ambiente de controle dessa magnitude demanda uma grandequantidade de recursos. Dessa forma, pesquisas nessa area necessitam de financiamentoadequado e da colaboracao de diversos sistemas autonomos que compoem a Internet. Fi-nalmente, com base no que foi apresentado nesta Subsecao, tem-se a definicao do primeiroproblema associado ao projeto do sistema de monitoramento.

Definicao 2.9 (O problema da identificacao topologica). Modelar de forma eficaz eidentificar de forma eficiente a topologia da rede, principalmente, quando essa eficienciadepende de conhecimento previo de propriedades da propria topologia.

2.2.2 Observadores

Assumindo que a topologia da rede e conhecida, e possıvel realizar a escolha dosnos observadores, como descrito pela Figura 2.2 e na Definicao 2.2. Se considerarmosos dados obtidos atraves da aquisicao ativa, a localizacao dos nos observadores nao enecessariamente um problema, porque os dados necessarios podem ser adquiridos de formaativa pelo proprio no observador. Porem, na aquisicao passiva, os dados tem que trafegarpelo no observador para que o monitoramento tenha sucesso. Dessa forma, e necessariosaber as localizacoes dos nos observadores e, preferencialmente, a quantidade mınimade nos observadores necessarios. Esse procedimento de otimizacao e essencial porque autilizacao da aquisicao passiva e preferencial por nao introduzir trafego excedente na rede.

Page 38: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

2.2. Fundamentacao 15

No modelo de monitoramento centrado na rede (network centric monitoring) os estadosda rede sao monitorados. Exemplos de informacao que podem compor esses estados sao:(i) a quantidade de pacotes perdidos, (ii) atrasos em cada no da rede e (iii) capacidade detransmissao de canais e de nos [Ji & Elwalid 2002]. Naturalmente, se cada no da rede forum no observador, entao nao ha dificuldade na aquisicao dessas informacoes, logo teremosuma aquisicao passiva eficaz. Porem, considerar que cada no de uma rede como a Internetira enviar de forma espontanea essas informacoes nao seria possıvel, tampouco eficiente.Felizmente, por causa da correlacao espacial de dados como atraso e perda de pacotes, epossıvel estimar, a partir da observacao de um subconjunto de nos da rede, as mesmasinformacoes nos demais nos [Cao et al. 2000]. Ji & Elwalid (2002) desenvolveram ummodelo baseado em uma arvore multicast onde os nos observadores estao localizados nosnos finais e possivelmente em nos internos da arvore, como representado na Figura 2.3.

nós nais

nós internos

Figura 2.3: Ilustracao de uma arvore multicast onde vr representa o no raiz e de v1 ate vkh (sendoh a altura e k o fator de ramificacao da arvore) sao representados os nos finais.

Como resultado, Ji & Elwalid (2002), concluıram que essa localizacao especıfica dos nosobservadores, faz com que a quantidade de medidas necessarias (mensagens que passamdo no raiz vr ate os nos observadores) seja escalavel quando nao ha perdas de pacotessignificativas. Esse resultado, alem de importante do ponto de vista da eficacia e daescalabilidade, mostra que a quantidade de nos observadores e aproximadamente iguala kh, que representa uma fracao da quantidade total de nos[i]. Todavia, a Internet naopode ser representada significativamente por meio de uma arvore, pois a redundancia deconexoes e uma caracterıstica de sua robustez. Alem disso, considerar que todos os nosfolhas sao monitores nao e viavel. Nesse sentido, e razoavel utilizar um modelo de estudomais adequado para escolha dos nos observadores. Portanto, tem-se a definicao do segundoproblema associado ao projeto do sistema de monitoramento.

Definicao 2.10 (O problema da escolha dos observadores). Dado que a topologia da redee conhecida, escolher de forma otima, dentre os nos acessıveis, aqueles que desempenharaoo papel de observadores.

Um possıvel caminho para responder a essa questao tem como base o trabalho de Liuet al. (2011), que utiliza a representacao de espaco de estado (state space representation)para estudar a controlabilidade de redes complexas modeladas como sistemas linearesdinamicos [Kalman 1963]. A seguir, e feita uma descricao introdutoria dessa teoria.

[i]Considerando que o numero de nos n =∑h

i=0 ki, a quantidade de nos finais e de kh, que se trata

apenas do ultimo termo do somatorio. Especificamente, a quantidade de nos finais pode ser descrita comouma funcao f(n, k) = (n(k − 1) + 1)/k. Por exemplo, para k = 2, essa quantidade e de aproximadamentemetade da quantidade total de nos, precisamente, (n+ 1)/2.

Page 39: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

16 Capıtulo 2. Projeto de monitoramento

Equacao de espaco de estado Na teoria de sistemas lineares, a equacao (ou repre-sentacao) de espaco de estado e definida como [Chen 2009]:

x(t) = A(t)x(t) + B(t)u(t) (2.1)

y(t) = C(t)x(t) + D(t)u(t), (2.2)

onde x(t) ∈ Rn×1, e o vetor que representa o estado do sistema; y(t) ∈ R

q×1, e o vetor querepresenta a saıda do sistema; u(t) ∈ R

p×1, e um vetor de entrada do sistema; An×n(t)e a matriz de transicao de estado[ii]; Bn×p(t) e a matriz de entrada do sistema; Cq×n(t)e a matriz de saıda do sistema e Dq×p(t) e a matriz de alimentacao direta da saıda dosistema. Especificamente, no caso das Equacoes 2.1 e 2.2, temos a representacao de umsistema linear contınuo variante no tempo. Se for possıvel controlar o estado do sistema apartir da entrada, o sistema e dito controlavel [Kalman 1960b].

Definicao 2.11 (Controlabilidade). Um sistema, descrito pelas Equacoes 2.1 e 2.2, edito controlavel se existe um sequencia de entradas capaz de transferir o estado inicial dosistema x(t0) ∈ Σ (onde Σ representa o espaco de estados) para qualquer outro estadox(te) ∈ Σ, para (te > t0), em um tempo finito. [iii]

No trabalho de Liu et al. (2011), e considerada a representacao de sistemas linearesinvariantes no tempo para modelagem de redes complexas. Desta forma, as matrizesnas Equacoes 2.1 e 2.2 nao mudam durante a evolucao do sistema. Nesse sentido, x(t)representa o estado de cada um dos nos da rede (o estado da rede) e A as ligacoes entreos nos, como uma matriz de adjacencia. Essa representacao e ilustrada na Figura 2.4.

2

3

4

5

1

2 3 4 51

0

b

0

a

0

e

c

d

0

a

f

0

0

d

0

0

g

f

e

0

g

0

0

c

b

Matriz de adjacênciaGrafo não direcionado

2 3

45

1

b c

d

e

a

f

g

(a)

2

3

4

5

1

2 3 4 51

0

0

0

00

c 000a

0

00d

0

0 g

0

0b

0 0fe

0

Matriz de adjacênciaGrafo direcionado

2 3

4 5

1

b c

d

e

a

f

g

(b)

Figura 2.4: Representacao de grafos por matriz de adjacencia, considerando em (a) grafos naodirecionados, e em (b) grafos direcionados. O tamanho da matriz de adjacencia e de n× n, dadoque n representa a quantidade de nos do grafo. A matriz de adjacencia e preenchida da seguinteforma: se existe uma ligacao do no j para o no i com peso α, entao a posicao aij da matriz Apossui valor α, se a aresta nao possui peso, e comum utilizar o valor 1 para esse proposito. Paragrafos nao direcionados, tem-se que a matriz de adjacencia e simetrica (ou seja, A = A⊺).

A matriz de adjacencia e preenchida de tal forma que, se existe uma ligacao do no jpara o no i com peso α, entao a posicao aij da matriz A devera possui valor α. Porem, se aaresta nao possui peso, e comum utilizar o valor 1 para esse proposito [Cormen et al. 2009].No trabalho de Liu et al. (2011), a matriz B foi escolhida de forma que o sistema fosse

[ii]Na literatura de sistemas lineares, a matriz de transicao de estado e conceitualmente distinta, uma vezque considera a transicao entre qualquer par de estados [Chen 2009]. Neste trabalho, considera-se A(t) amatriz de transicao de estado pois ha interesse na transicao para o estado subsequente.[iii]A definicao de controlabilidade descrita aqui e simplificada com o objetivo de evitar introducao de

conceitos especıficos nao relevantes para o contexto deste trabalho. Para conhecimento da definicao commaior formalismo, consultar as referencias [Kalman 1960b] ou [Chen 2009].

Page 40: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

2.2. Fundamentacao 17

controlavel. Isso e possıvel porque, para controlabilidade de um sistema invariante notempo, e condicao necessaria e suficiente que a matriz

S ,[

B AB A2B · · · An−1B]

(2.3)

possua posto n, ou seja, ρ(S) = n. De posse da matriz B que torna o sistema controlavel,e possıvel inferir quais nos da rede deve-se ter acesso para poder induzir o estado da rede.Isso porque, o resultado do produto entre a matriz de entrada B e o vetor de entrada u(t)e um vetor de tamanho n× 1 que sera somado ao estado subsequente do sistema. Logo, amatriz B atua como um multiplexador que faz com que a entrada influencie diretamenteo estados de alguns nos da rede. Desta forma, a partir de alteracoes especıficas no estadodesses nos e possıvel controlar o estado de todos os nos do sistema.

Assim como e possıvel estimar quais nos influenciam na controlabilidade de um rede,tambem e possıvel estimar quais nos podem garantir sua observabilidade por meio daaquisicao passiva dos dados. Isso se da por meio do estudo da observabilidade de sistemas.Nesse sentido, um sistema linear e observavel, se e possıvel determinar seu estado a partirde observacoes de sua saıda y(·) e do conhecimento de sua entrada u(·). Especificamente,a observabilidade e defina a seguir [Kalman 1960b].

Definicao 2.12 (Observabilidade). Um sistema, descrito pelas Equacoes 2.1 e 2.2, e ditoobservavel se a partir de observacoes da saıda y(·) e do conhecimento da entrada u(·), epossıvel determinar o estado inicial do sistema x(t0) ∈ Σ em um tempo finito. [iv]

A partir dessa Definicao, pode-se verificar que e possıvel responder ao problema daDefinicao 2.10 atraves do estudo da teoria de sistemas lineares, especificamente, de suaobservabilidade. Isso porque o desenvolvimento da aplicacao dessa teoria ao monitora-mento de redes pode ajudar a definir a localizacao dos nos observadores de forma a tornarpossıvel a observacao passiva de rede. Alem de tornar o monitoramento eficaz, uma vezque e possıvel estimar o estado de toda a rede, tambem torna-o escalavel, ja que isso erealizado a partir da observacao de apenas um subconjunto dos nos da rede.

2.2.3 Otimizacao

A frequencia com que os dados de monitoramento sao reportados, assim como o tama-nho desse conjunto de dados, pode influenciar de forma significativa o estado da rede. Eimportante que essa frequencia seja minimizada e controlada a fim de nao gerar um trafegoexcedente que comprometa a precisao do sistema e que seja possıvel prever a influencia domonitoramento na medicao de seu estado. Nesse sentido, considera-se o exemplo em queos dados capturados serao remetidos a uma estacao de monitoramento.

Estacao de monitoramento Primeiramente, a localizacao da estacao de monitora-mento pode ser escolhida de forma que a quantidade de trafego necessario para coletaras informacoes dos nos observadores seja minimizada. Para desenvolver essa otimizacao enecessario conhecer a topologia da rede e a localizacao dos nos observadores. A escolhada localizacao da estacao de monitoramento pode ser feita de forma a escolher o no queesta, em media, mais proximo em numero de hops de cada um dos nos observadores.

[iv]A definicao de observabilidade descrita aqui e simplificada com o objetivo de evitar a introducao deconceitos especıficos nao relevantes para o contexto deste trabalho. Para conhecimento da definicao commaior formalismo, consultar as referencias [Kalman 1960b] ou [Chen 2009].

Page 41: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

18 Capıtulo 2. Projeto de monitoramento

Para uma rede com n = |N | nos, e = |E| arestas e o = |O| observadores, e considerandoa utilizacao do algoritmo de caminho mais curto de Dijkstra (1959), que possui complexi-dade em tempo da ordem de O(e log n), a localizacao otima da estacao de monitoramentopode ser computada em tempo O(noe logn). Supondo que o cresce linearmente com n, istoe, o ≃ αn, sendo 0 < α ≤ 1, e que a quantidade mınima de arestas em um grafo conectadoe igual a emin = (n−1), entao temos que o tempo de execucao desse algoritmo e da ordemde Ω(n3 logn). Ja considerando que a quantidade de arestas e maxima, emax = n(n−1)/2,temos que esse tempo e de O(n4 log n). Apesar de ser de tempo polinomial, a descobertada localizacao otima da estacao de monitoramento e custosa. Nesse sentido, uma vezconhecida a localizacao dos nos observadores, talvez seja necessario aplicar algoritmosaproximativos para solucao desse problema. Nesse sentido, o problema de otimizacao eaproximacao no sistema de monitoramento e especificamente definido a seguir.

Definicao 2.13 (O problema da otimizacao e aproximacao). Dada a localizacao dos nosobservadores e o conhecimento da topologia da rede, utilizar essa informacao para reduzira quantidade de dados que trafegam dos nos observadores ate a base de dados.

Alem da localizacao da estacao de monitoramento, e possıvel otimizar o polıtica deamostragem e envio dos dados. Em relacao a polıtica que arbitra como os dados devemser enviados dos nos observadores ate a estacao de monitoramento, podemos classificar omonitoramento em dois tipos: (i) monitoramento estatıstico e (ii) monitoramento reativo.

No monitoramento estatıstico os dados sao coletados pelos nos observadores e envia-dos a estacao de monitoramento com o objetivo de se estabelecer predicados sobre a rede.Ja no monitoramento reativo, o sistema de monitoramento tem como objetivo identificarcondicoes especıficas do estado da rede em que e necessario coletar esses dados. A mi-nimizacao de trafego no monitoramento reativo nao e problematica pois e possıvel fazercom que os nos observadores transmitam a informacao apenas quando necessario. Nessesentido, Dilman & Raz (2002) apresentam em seu trabalho os algoritmos e estrategias demonitoramento reativo que podem minimizar o trafego de monitoramento.

Infelizmente, as estrategias de minimizacao de trafego utilizadas no monitoramentoreativo nao podem ser utilizadas no monitoramento estatıstico, que e o objeto de estudodeste trabalho. No monitoramento estatıstico os dados obtidos pelos nos observadoresdevem ser enviados regularmente a estacao de monitoramento. Por se tratar de um modeloestatıstico, e fundamental que a quantidade de dados utilizada para inferir predicados sejarepresentativa. Nesse caso, como nao ha processamento dos dados nos nos observadores,nao ha como minimizar a quantidade de dados enviados. Porem, a descoberta recente deuma nova tecnica de amostragem pode fazer com que essa minimizacao possa ser feitaatraves da aquisicao parcial dos dados. Isso e possıvel por meio do estudo da amostragemcompressiva (compressive sampling), tambem conhecida como sensoriamento comprimido(compressed sensing) [Donoho & Tanner 2010].

A amostragem compressiva tem como princıpio a reconstrucao de sinais a partir dedados de amostragem obtidos a uma taxa inferior a definida pelo teorema de amostragem[v]

de Nyquist–Shannon [Nyquist 1928, Shannon 1949]. Isso e possıvel porque a amostragemcompressiva se baseia em dois princıpios [Candes & Wakin 2008, Donoho & Tanner 2010]:(i) esparsidade, que pertence ao sinal de interesse e (ii) incoerencia, que esta relacionadaao modalidade de sensoriamento ou amostragem. Para garantir essa esparsidade, Haupt

[v]O teorema da amostragem tambem e atribuıdo a outros pesquisadores, alem de Nyquist e Shannon,que os desenvolveram independentemente. E o caso de Whittaker (1915) e Kotelnikov (1933).

Page 42: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

2.2. Fundamentacao 19

et al. (2008) assume em seu trabalho que apenas um subconjunto dos sensores da redepossuem informacao relevante a cada intervalo de amostragem. Nessas condicoes, a teoriade amostragem compressiva pode garantir a eficacia do monitoramento. Alem disso, comoo sinal e esparso, a quantidade de informacao a ser transmitida e inferior ao numero denos, ou seja, o monitoramento compressivo tambem e escalavel.

Nesse sentido, o estudo da natureza esparsa dos sinais de monitoramento [Xu et al.2011, Wang et al. 2012], a busca por bases de amostragem e de representacao incoerentes,assim como a elaboracao de algoritmos eficientes de reconstrucao do sinal, sao sugestoesde pesquisa para se responder ao problema da Definicao 2.13.

2.2.4 Predicados

A inferencia de predicados e uma etapa do projeto onde sao definidas as caracterısticasda rede que serao monitoradas. Para cada tipo de predicado a ser considerado e possıvelquestionar aspectos relacionados a: (i) disponibilidade dos dados, (ii) quantidade ne-cessaria de dados, (iii) influencia da aquisicao dos dados ou efeito da ponta de prova, (iv)extracao de caracterısticas, (v) necessidade de procedimento de classificacao, (vi) tamanhoda base de dados de classificacao, (vii) complexidade do algoritmo de classificacao, (viii)consistencia dos predicados, (ix) estabilidade dos predicados e (x) natureza distribuıda dopredicado [Chandy & Lamport 1985]. Outro aspecto importante nao considerado e o decomo as informacoes seriam armazenadas, e se esse armazenamento e escalavel. A seguir,defini-se o problema de inferencia de predicados.

Definicao 2.14 (O problema da inferencia de predicados). Desenvolver tecnicas de in-ferencia eficazes e eficientes em que a quantidade de dados necessarios para a derivacaode predicados seja escalavel.

Com as tecnicas de compressao amostral e de dados, com e sem perdas, existentes,e possıvel responder a essa questao no contexto da Definicao 2.13. Mesmo assim, naonecessariamente para todo tipo de predicado esses aspectos de compressao podem seraplicados, como por exemplo a descoberta de servicos.

Descoberta de servicos A utilizacao de mensagens de sincronizacao e suficiente naidentificacao do estado das portas de comunicacao TCP (Transmission Control Protocol)[Postel 1981b]. Isso porque, nao ha problema quanto a disponibilidade desses dados desdeque a maquina esteja em rede. A inferencia do estado das portas e um procedimentonormalmente feito atraves da aquisicao ativa de dados. Porem, tambem e possıvel que umno observador monitore o trafego a fim de identificar pares de mensagens de sincronizacao.Nesse sentido, tem-se as seguintes consideracoes acerca da [Lyon 2009]: (i) disponibilidadedos dados: os dados estao disponıveis tanto para realizacao de aquisicao passiva quantoativa, (ii) extracao de caracterısticas: a informacao sobre o estado de uma porta e extraıdade forma quase que trivial e da (iii) quantidade necessaria de dados: para se obter o estadode todas as p portas de todos os n nos da rede seriam necessarias np mensagens de resposta(considerando as dimensoes da Internet estima-se uma quantidade de trafego da ordem decentenas de peta bytes). Nesses casos, e necessario considerar a aquisicao passiva sempreque possıvel e a ativa quando necessario. Em relacao a escalabilidade de bases de dadosde classificacao, considera-se o exemplo de identificacao de remota de sistemas.

Page 43: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

20 Capıtulo 2. Projeto de monitoramento

Identificacao remota de sistemas A identificacao remota de sistemas operacionais,ou operating system detection e um processo que tem como finalidade a descoberta dosistema operacional de uma maquina remota. Esta identificacao e realizada a partir dautilizacao de dados originados da maquina remota. A partir daı, o processo de identificacaoe realizado em acordo com a representacao da Figura 2.5.

aquisição dedados

1extração de

características

2algoritmo declassi cação

3resultado daidenti cação

4

base de dados

caracterização classi cação

Figura 2.5: Representacao do processo de identificacao de sistemas. (1) na primeira etapa osdados sao adquiridos de forma passiva ou ativa; (2) posteriormente, e realizado um processo deextracao de caracterısticas que tem como objetivo facilitar o processo de classificacao; (3) a partirde uma base de dados onde caracterısticas sao associadas a cada sistema operacional, e realizadoo procedimento de classificacao e (4) o resultado do processo de classificacao e apresentado.

No contexto da identificacao remota de sistemas, a aquisicao passiva diminui conside-ravelmente a eficacia da inferencia [Medeiros, Brito Jr. & Pires 2009, Medeiros et al. 2011],o que nao acontece na descoberta de servicos. No trabalho de Medeiros et al. (2010b) abase de dados e explorada atraves do uso de tecnicas de mineracao de dados, especifica-mente utilizando um algoritmo denominado SOM (Self-Organizing Map) [Kohonen 2000].Um exemplo desse mapa e apresentado na Figura 2.6.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

O

N

N

N N

N

N N

N

N

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

W

WW

W

W

W

W

W

W

W

W

W

M

M M M

F

F

F

F

F F

F

F

F

F F

F

F

F

F

F

F

F

F

F

F

F

F

F

F

F

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

LLL L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L

L L

L

L

L

L

L

L

L L

L

L

L

L

L

L

L L L

LL

L L

LL

L L

LL

L L

LL

Sy

SySySy

Sy Sy

S S S S S S

S S S

S

Mi

C

C C

C

C

C

C

C

C

C

C

C

C

C

C

C

C

C C

3

3

I

I I

I I I I

I I I I I

I I I I I

I I I

I I I

I

I

I

Ir

Ir

Ir

Ir

B

B

SR

SR SR

NN NN

NN

3Com switch

3Com wireless

BSDI BSD/OS 4.2

Cisco switch

Cisco concentrator

Cisco wireless

H

H H H H H

HH

NN

M

M

Mi

O

O

O

S

S

S

SR

Sy

W

W

W

W

W

N

N

3

3

B

C

C

C

F

F

F

F

Ir

I

I

I

I

L

L

L

H

FreeBSD 2.x

FreeBSD 4.x

FreeBSD 5.x

FreeBSD 6.x

HP-UX B.11.11

IBM OS/400 v4r5

IBM AIX 5.2

IBM z/OS 1.x

IBM i5/OS v5r4

SGI IRIX64 6.5.x

Linux 2.2.x

Linux 2.4.x

Linux 2.6.x

NetBSD 1.6.2

NetBSD 4.99.4

Novell Netware

Mac OS X 10.2.8

Mac OS X Server

Minix 3.1.2a

OpenBSD 2.8

OpenBSD 3.9

OpenBSD 4.0

Solaris 7

Solaris 8

Solaris 9 or 10

Sun RSC

Symbian OS 9.1

Windows 2000

Windows XP

Windows 2003

Windows 98SE

Windows Vista

Figura 2.6: Mapa auto-organizavel de assinaturas de sistemas operacionais. Ao utilizar o mapapara classificacao, ha uma reducao do tamanho da base de dados de 3575 para 268 ocorrencias. Abase de dados resultante e de aproximadamente 7% do tamanho da original.

Page 44: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

2.2. Fundamentacao 21

O mapa apresentado na Figura 2.6 foi construıdo a partir da base de dados do Nmap[Lyon 2009]. Esse mapa pode ser utilizado para reduzir a dimensao da base de dados,assim como para descobrir quais informacoes conseguem diferenciar de forma mais eficazos sistemas. Dessa forma, e possıvel reduzir tambem a quantidade de dados que tem queser adquiridos, diminuindo assim o trafego gerado na rede. Outra forma de reduzir essetrafego e atraves do estudo de representatividade dos dados [Greenwald & Thomas 2007a,Greenwald & Thomas 2007b]. Porem, mesmo o processo de aquisicao ativa realizadopor ferramentas como o Nmap e outros, nao e eficaz. Isso porque, existem ferramentascomo o Honeyd [Provos 2004, Provos & Holz 2008], que mimetizam o comportamento dediferentes sistemas operacionais em rede simulando maquinas que na realidade nao existem.Alem disso, tecnicas como normalizacao de pacotes (packet normalization) [Watson et al.2001, Watson et al. 2004], NAPT (Network Address and Port Translation) [Srisuresh &Holdrege 1999] e intermediacao de sincronizacao (syn proxies) [Eddy 2006, Eddy 2007,Hartmeier 2002] alteram caracterısticas dos pacotes que sao utilizadas no processo deidentificacao.

Para contornar esses casos e possıvel utilizar outra tecnica de identificacao ativa base-ada na classificacao do gerador de numeros aleatorios do TCP. A especificacao do protocoloTCP define que exista na mensagem de reposta a sincronizacao um numero que seja ge-rado de forma aleatoria pela maquina remota, denominado TCP ISN (Initial SequenceNumber). Um fato importante para o processo de identificacao, e o de que muitos siste-mas operacionais implementam esse gerador de numeros pseudo-aleatorios (ou PRNG, doingles Pseudo-Random Number Generator) de forma distinta. Esse fato e explorado porMedeiros et al. (2010a) para gerar descricoes desses geradores. De posse dessas descricoese possıvel classificar o sistema operacional a partir de amostras do gerador, que podem serobtidas remotamente. Exemplos dessas descricoes sao apresentados na Figura 2.7.

(Cisco IOS) (FreeBSD) (Linux) (NetBSD)

(OpenBSD) (Solaris) (Windows Vista) (Windows XP)

Figura 2.7: Descritores do TCP ISN PRNG de diferentes sistemas operacionais. E possıvelverificar que o OpenBSD e o Cisco IOS possuem geradores similares. Um fato interessante e quediferentes versoes do Windows possuem geradores distintos.

O metodo de inferencia desenvolvido com base no gerador de numeros aleatorios dossistemas operacionais e o mais eficaz, e deve ser utilizado em situacoes onde ha o com-prometimento da eficacia. Porem, e necessaria uma reducao na quantidade de mensagensutilizada no processo de classificacao, atualmente da ordem de milhares.

Page 45: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

22 Capıtulo 2. Projeto de monitoramento

2.2.5 Visualizacao

A forma como e projetada a visualizacao dos predicados pode promover significativa-mente o entendimento do estado da rede. Isto porque, quando associados, os predicadospodem revelar padroes e propriedades emergentes nao antecipadas. A visualizacao deinformacao, definida a seguir, reune conceitos da computacao grafica, fisiologia da visaohumana, psicologia e interacao humano-computador para auxiliar na compreensao de da-dos representados por estruturas visuais.

Definicao 2.15 (Visualizacao da informacao). A ciencia da visualizacao da informacaocompreende o estudo do uso de representacoes visuais interativas de dados abstratos, quesao auxiladas por computador e que tem como objetivo amplificar a cognicao.

O projeto de um sistema de visualizacao eficaz pode beneficiar o entendimento dospredicados, e ir ainda alem, relacionando-os e propiciando a extrapolacao de novas in-formacoes. Yee et al. (2001) e Medeiros, Brito Jr., Pires & Santos (2009) utilizam esseconceito para o estudo de propriedades topologicas de redes P2P (Peer to Peer) e daInternet (nıvel 3), respectivamente. Nesse sentido, caracteriza-se um novo problema.

Definicao 2.16 (O problema da apresentacao da informacao). Dado um conjunto depredicados, apresenta-los de forma eficiente, escalavel e eficaz, considerando a utilizacaodo fator visual e da ampliacao da cognicao que ela proporciona.

2.3 Objetivos especıficos

A partir dos desafios e do estado da arte discutidos na Secao anterior e na Secao 1.3,e possıvel discernir que, no que diz respeito a criacao de um sistema global de monitora-mento, ainda ha o que se desenvolver teoricamente em relacao a:

(i) identificacao da topologia [Alderson & Doyle 2010, Roughan et al. 2011];(ii) localizacao e quantidade mınima de observadores [Ji & Elwalid 2002, Liu et al. 2011];

(iii) otimizacao do processo de aquisicao dos dados [Haupt et al. 2008],(iv) aquisicao de dados e construcao de predicados [Coates et al. 2002, Lyon 2009], e(v) visualizacao dos predicados [Yee et al. 2001, Medeiros, Brito Jr., Pires & Santos 2009].

Dessa forma, e necessaria a definicao de escopo de forma a discriminar os objetivos es-pecıficos desse trabalho. Por causa da demanda excessiva de recursos, no caso do problemada Definicao 2.9, e do carater centrado nos predicados, no caso das Definicoes 2.13 e 2.14,esse trabalho se concentra nos desafios relacionados a localizacao dos nos observadores (ii),e na eficiencia e escalabilidade da visualizacao (v), pois esses dois sao de carater teorico,e centrados no projeto estrutural do sistema de monitoramento. Especificamente, essetrabalho se concentra em avancar teoricamente nessas duas questoes da seguinte forma:

1. desenvolver um modelo eficaz e algoritmos eficientes que permitam o projeto deobservabilidade de redes em relacao a localizacao otima dos nos observadores; e

2. desenvolver um modelo otimizado da visualizacao de redes, que permita a utilizacaode algoritmos eficientes e uma quantidade de recursos computacionais escalavel, semcomprometer sua eficacia.

Considerando a magnitude dos problemas em questao, e razoavel que haja uma analiseda complexidade das solucoes propostas. Nesse sentido, e necessaria a adocao de umametodologia que proporcione essa analise, tanto de forma teorica quanto experimental. Oprocedimento metodologico utilizado neste trabalho e apresentado na proxima Secao.

Page 46: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

2.4. Metodologia 23

2.4 Metodologia

O procedimento metodologico utilizado no desenvolvimento deste trabalho possui umaabordagem dividida em 5 estagios. Esses estagios sao ordenados em uma sequencia emque e permitida uma evolucao com ciclos, cuja relacao e descrita na Figura 2.8.

estudo

bibliogr fico

1

a

2 3

dade

4 5

Figura 2.8: Ilustracao do procedimento metodologico adotado no desenvolvimento deste trabalho.O processo foi divido em 5 estagios: (1) estudo bibliografico para fundamentar o desenvolvimentode modelos representativos do problema; (2) modelagem do problema para servir de referenciapara a elaboracao de solucoes que, se identificadas como inadequadas, podem remeter novamenteao estudo bibliografico; (3) elaboracao de solucoes algorıtmicas que serao avaliadas nos proximosestagios; (4) analise de complexidade das solucoes que, quando ineficientes, podem remeter aelaboracao de uma nova solucao e (5) analise experimental dos resultados teoricos.

A seguir, cada um dos estagios do procedimento metodologico apresentado na Fi-gura 2.8 e descrito. Na descricao de cada estagio, sao considerados, alem de seu objetivo,as possibilidades de evolucao de acordo com a ilustracao apresentada.

1. Estudo bibliografico: consiste na busca por bibliografia de referencia e solucoesanteriores para o problema considerado, incluindo solucoes para problemas similaresou logicamente equivalentes. Em relacao a evolucao temos que:

(i) o estudo inicial pode levar a um ciclo de busca por solucoes que, por sua vez,pode remeter ao estudo bibliografico de outros trabalhos e

(ii) dado que a bibliografia levantada e tida como definitiva, o proximo estagio aser considerado e o da criacao de um modelo para o problema que possa serutilizado na elaboracao de solucoes.

2. Modelagem do problema: com base no referencial teorico construıdo no primeiroestagio deve-se criar um modelo matematico que represente o problema de formaeficaz. Em relacao a evolucao desse estagio tem-se tres opcoes:

(i) passar para o estagio de elaboracao de solucoes quando o modelo e eficaz parao problema em questao;

(ii) estender a modelagem ao se verificar uma deficiencia na abordagem encontradana literatura e

(iii) possivelmente, quando a necessidade de extensao ocorre, deve-se recorrer nova-mente ao estudo bibliografico, pois essas extensoes devem ser cuidadosamenteprojetadas e validadas.

3. Elaboracao de solucoes: a partir do modelo criado no estagio anterior, e possıvelelaborar solucoes algorıtmicas e aplicar metodos de otimizacao a fim de solucionaro problema redefinido com base no modelo matematico construıdo; Em relacao aevolucao desse estagio tem-se tres opcoes:

(i) passar para o estagio de analise de complexidade da solucao, seja essa comple-xidade associada a necessidade de recursos de tempo ou de memoria;

(ii) estender a solucao para subproblemas do modelo a fim de verificar propriedadesque caracterizam e subsidiam a formacao de hipoteses e

Page 47: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

24 Capıtulo 2. Projeto de monitoramento

(iii) possivelmente, quando a necessidade de uma nova tecnica ocorre, deve-se re-correr novamente ao estudo bibliografico.

4. Analise de complexidade: cada solucao projetada tem um custo de implementacaoassociado. A princıpio, este custo nao deve inviabilizar a utilizacao da solucao emtermos de tempo e memoria, dentre outros recursos, necessarios para resolver o pro-blema em questao. Em relacao a evolucao temos que:

(i) se as complexidades envolvidas satisfizerem os requisitos, entao evolui-se parao estagio de implementacao das solucoes de forma integrada e

(ii) se a complexidade for proibitiva, e necessario voltar ao estagio de elaboracaopara construcao de uma outra solucao.

5. Analise experimental: se o estagio de analise de complexidade fomenta a uti-lizacao da solucao proposta, deve-se realizar experimentos com dados reais paravalidar a solucao, ou aplica-las a instancias do modelo a fim de extrair conjecturasacerca das propriedades do modelo que indiquem a validade da solucao.

No proximo Capıtulo serao apresentados os conceitos basicos do modelo de redes uti-lizado para modelagem do problema, na elaboracao de solucoes e na analise experimental.Essas analises serao feitas com base na Teoria de Grafos e de Redes Complexas, que saoapresentadas de forma introdutoria nos Apendices A e B.

Page 48: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes 25

Capıtulo 3

Observabilidade de redes

“With system theory there is a new and harmonious relationship of mathematics to reality.

Without having to veil any of her unbelievable but delicate beauty,

mathematics has become the much-loved partner of a new kind of relevance.”

Rudolf Emil Kalman

O problema de localizacao dos nos observadores em uma rede a partir do conhecimentode sua topologia e definido na Subsecao 2.2.2 do Capıtulo 2. Especificamente, nessamesma Subsecao, foi verificado que a teoria de observabilidade de sistemas lineares podepossibilitar uma resposta para esse problema. Neste Capıtulo, o relacionamento entre oproblema de localizacao otima da escolha do conjunto de nos observadores e a teoria daobservabilidade de sistemas lineares e explorada.

Na definicao do modelo, verifica-se dois conceitos de observabilidade de rede: (i) umassociado a sua estrutura e (ii) um associado a sua funcao. No segundo, e necessariaa apresentacao das propriedades de sistemas dinamicos em que a transicao de estadoe caracterizada por probabilidades. Nesse caso, a matriz que descreve o sistema linear eestocastica e descreve a evolucao de um processo estocastico, especificamente, um processode Markov. Dessa forma, dada a representacao do problema por meio dessas duas teorias,sao definidos dois modelos para solucao do problema de localizacao dos nos observadores,um associado a estrutura da rede, e outro associado a sua funcao. Por fim, solucoes combase nesse modelo sao apresentadas e analisadas.

Este Capıtulo esta organizado da seguinte forma: na Secao 3.1 e apresentada a teorianecessaria para o entendimento do modelo apresentado na Secao 3.2. Na Secao 3.2, saodesenvolvidas solucoes algorıtmicas com base no modelo apresentado, cuja eficiencia eescalabilidade sao analisadas. Na Secao 3.3 sao apresentados os resultados de experimentosconsiderando estruturas topologicas geradas a partir de modelos nao determinısticos deredes livres de escala e com dados topologicos reais. Por fim, na Secao 3.4, sao feitasconsideracoes finais.

Page 49: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

26 Capıtulo 3. Observabilidade de redes

3.1 Introducao

Antes de tratar sobre a localizacao dos nos observadores em uma rede, e necessarioestabelecer uma representacao matematica eficaz para esse proposito. Nesse sentido, tem-se por representacao eficaz aquela que for capaz de representar de forma apropriada aspropriedades estruturais e funcionais de uma rede, assim como a sua dinamica. Com basenisso, defini-se a seguir o conceito de representacao eficaz de uma rede.

Definicao 3.1 (Representacao eficaz). Uma representacao matematica de uma rede edita eficaz se e capaz de representar as seguintes propriedades da rede:

1. sua estrutura topologica;2. o processo dinamico que caracteriza a evolucao do estado da rede e3. o processo de propagacao da informacao entre os nos que compoem a topologia.

Entende-se por estado da rede qualquer informacao passıvel de associacao aos elemen-tos que a compoem e que possa ser calculado com base no estado dos elementos adjacentes,ou seja, nos ou arestas. Dessa forma, aproveitando a exposicao inicial do tema como ex-posto na Subsecao 2.2.2, e possıvel utilizar a teoria de sistemas lineares dinamicos paradescrever matematicamente essas tres propriedades de uma rede. A apresentacao da teo-ria, assim como a sua utilizacao, e feita de forma contextualizada, considerando a aplicacaoem questao. Nesse sentido, na Subsecao 3.1.1 e apresentada parte da teoria de sistemaslineares, especificamente, para sistemas discretos invariantes no tempo, a fim de satisfa-zer os dois primeiros requisitos citados, no caso, a topologia e a evolucao do estado darede. Posteriormente, na Subsecao 3.1.2, segue-se uma apresentacao da teoria de cadeiasde Markov, utilizada com o objetivo de estender a representacao de rede complexas emrelacao ao processo de propagacao da informacao entre os nos da rede. O entendimentoda aplicacao dessas duas teorias serve de base para o conceito de observabilidade de redes,a ser definido de forma precisa posteriormente.

3.1.1 Modelo linear de representacao topologica

O processo de adocao de um modelo matematico para descricao de um sistema fısicotem como etapa primaria o estabelecimento de premissas. Neste trabalho, considera-seque ha invariancia topologica da rede, como descrito na Premissa a seguir.

Premissa 3.1 (Invariancia topologica). Considera-se que a topologia da rede nao mudacom o tempo. Essa propriedade e denominada invariancia topologica restrita.

Na invariancia topologica restrita, o estudo da evolucao de uma rede pode ser realizadosem a preocupacao com eventuais mudancas na sua estrutura topologica. Uma alterna-tiva a essa restricao, e que a topologia muda em uma frequencia consideravelmente menorque a da evolucao do proprio sistema, denominada invariancia topologica relativa. Nessecaso, e necessario detectar tais mudancas topologicas a fim de corrigir o modelo de formainstantanea. Ao se considerar que essas mudancas ocorrem com uma frequencia sufici-entemente baixa em relacao a evolucao do estado do sistema, e possıvel assegurar que aevolucao do modelo convirja para o estado real da rede.

A Premissa 3.1, permite descrever o processo dinamico da evolucao do estado de umarede atraves da representacao de sistemas lineares invariantes no tempo. Alem disso,considera-se que o sistema nao e contınuo, mas sim definidos para instantes de tempodiscreto, como apresentado na Premissa a seguir.

Page 50: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.1. Introducao 27

Premissa 3.2 (Evolucao discreta de estado). A transicao de estado do sistema ocorrede forma sıncrona, para cada no da rede, e discreta, em instantes bem definidos.

A mudanca de estado do sistema e definida para instantes discretos, convenientementerepresentados por t. Porem, que fique claro que esse parametro nao representada o tempode forma contınua. Essas duas premissas permitem descrever a rede como um sistemalinear discreto invariante no tempo. Utilizando a notacao definida por Kalman (1963), adefinicao desse tipo de sistema e realizada a seguir.

Definicao 3.2 (Sistema linear discreto invariante no tempo). Um sistema linear discretoinvariante no tempo e um sistema que pode ser descrito pelas seguintes equacoes[i]

x[t + 1] = Ax[t] + Bu[t] (3.1)

y[t] = Cx[t] + Du[t], (3.2)

denominadas equacao de estado e saıda, respectivamente. As matrizes e vetores sao aquelesdescritos nas Equacoes 2.1 e 2.2, porem, as matrizes sao invariantes no tempo.

Comumente, considera-se que a entrada nao influencia de forma direta a saıda dosistema, ou seja, a matriz D nula. A fim ilustrar a dinamica da evolucao de um sistemadescrito pelas Equacoes 3.1 e 3.2, a relacao matematica entre a entrada, a saıda e o estadodo sistema e representada na forma de diagrama de blocos na Figura 3.1.

m ria

Figura 3.1: Representacao em blocos da equacao de espaco de estado em termos de sua entradau[t], sua saıda y[t], seu estado x[t], que caracteriza uma memoria interna do sistema, e as matrizesque descrevem como esses tres parametros se relacionam.

Como apresentado na Figura 3.1, e possıvel caracterizar o vetor de estado x[t] comosendo a memoria do sistema. A possibilidade de se estimar o vetor x[t], que representa oestado interno de um sistema linear discreto, tem grande relacao sobre a questao de suaobservabilidade. Porem, antes de se avancar sobre a teoria de estimacao do vetor x[t], enecessario definir um significado para cada vetor e matriz de um sistema linear em relacaoa topologia de uma dada rede. Especificamente, o conceito de estado do sistema, de umaentrada que possa excitar esse estado e de uma saıda que possa ser utilizada para mediresse estado. Nesse sentindo, considera-se que o estado e alguma composicao de informacoesassociada indiretamente a cada no da rede. Para fins de ilustracao, na Figura 3.2, esseconceito e representado em tres instancias de topologias determinısticas.

[i]Apesar de t ser comumente utilizado para representar o tempo contınuo e n o tempo discreto, nestetrabalho optou-se por continuar a usar t no caso discreto pois e o unico abordado e n ja e utilizado paraoutros fins, especificamente, para representar a quantidade de nos da rede. De forma que a distincao sedara pelo uso de colchetes para indexar o tempo no caso discreto.

Page 51: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

28 Capıtulo 3. Observabilidade de redes

linha

estrelaanel

Figura 3.2: Exemplo de mapeamento topologico para equacao de espaco de estado, onde ha umaindicacao de que e possıvel excitar o estado xj por meio da entrada uj e realizar uma leitura (oumedicao) do estado atraves de yj . A descricao de estado, entrada e saıda de um no, compoem osvetores x[t], u[t] e y[t], respectivamente.

Na Figura 3.2, ha uma representacao que indica que e possıvel excitar o estado xjpor meio da entrada uj , e realizar uma leitura (ou medicao) do estado atraves de yj .Considerando que a entrada nao influencia diretamente na saıda do sistema e que a relacaodos estados e linear em funcao da entrada e saıda, as propriedades topologicas de umarede podem ser descritas pelas equacoes da Definicao 3.2 da seguinte forma:

x1[t + 1]x2[t + 1]

...xn[t + 1]

= A

x1[t]x2[t]

...xn[t]

+ B

u1[t]u2[t]

...un[t]

(3.3)

y1[t]y2[t]

...yn[t]

= C

x1[t]x2[t]

...xn[t]

, (3.4)

onde n representa a quantidade de nos da rede, a matriz A representa a relacao linearentre os estados do sistema e as matrizes B e C representam a relacao linear entre o vetorde excitacao u[t] e o vetor de leitura y[t], respectivamente. Se em uma rede e possıvel, oudesejavel, excitar o estado de todos os nos e realizar a leitura de todos os estados, ambosde forma direta, como ilustrado na Figura 3.2, entao as matrizes B e C sao definidas como objetivo de adicionar apenas a entrada uj [t] em xj [t] e reproduzir o estado xj [t] na saıdayj [t], como um elemento neutro do produto matricial[ii]. Ou seja, as dimensoes dessasmatrizes obedecem p = q = n, para p e q como as dimensoes descritas na Definicao 3.2,resultando na matriz identidade In×n. Portanto, resta definir que conceitos podem serrepresentados pela matriz A.

Dos tres requisitos de eficacia apresentados na Definicao 3.1, apenas o processo dinamicoque caracteriza a evolucao do estado do sistema foi abordado. A seguir, os demais requi-sitos sao refletidos na definicao da matriz A, que representara a estrutura topologica e oprocesso de propagacao da informacao na rede. A topologia da rede pode ser representadaem A utilizando a definicao de representacao de grafos por matriz de adjacencia, comoapresentado pela Definicao A.2 e pela Figura 2.4. Dessa forma, temos as seguintes matrizespara as topologias apresentadas na Figura 3.2, respectivamente ilustradas na Figura 3.3.

[ii]Os demais casos, em que nao ha excitacao ou leitura direta de parte do vetor de estado, sao discutidosposteriormente, quando se fizer necessario.

Page 52: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.1. Introducao 29

topologia em anel

0 1 0 11 0 1 00 1 0 11 0 1 0

(a) Aring

topologia linear

0 1 0 01 0 1 00 1 0 10 0 1 0

(b) Aline

topologia em estrela

0 1 1 11 0 0 01 0 0 01 0 0 0

(c) Astar

Figura 3.3: Matrizes de adjacencia das tres topologias determinısticas apresentadas na Figura 3.2.Cada uma das matrizes de adjacencia sao simetricas e estao associadas as topologias em anel (a),linear (b) e estrela (c).

A matriz de transicao de estado A descreve quais estados no instante t influenciamindividualmente cada elemento do vetor de estado no instante posterior (t + 1). Porem,apesar de representar a estrutura topologica, a matriz de transicao de estado recem de-finida necessita ainda representar o processo de propagacao da informacao, ou seja, ainfluencia de um estado xj [t] no valor de um estado xi[t+1], para 1 ≤ i, j ≤ n. Especifica-mente, considerando um exemplo de transmissao de pacotes na rede, onde o estado indicaa quantidade de informacao a ser enviada, as transicoes podem representar as porcenta-gens de informacao que espera-se repassar para cada um dos vizinhos. Nesse sentido, enecessario a definicao da funcao de pesos ω(·) da matriz de adjacencia A. A definicao dafuncao de pesos ω(·) e feita com base no modelo de processos estocasticos, cujos princıpiossao apresentados a seguir.

3.1.2 Modelo estocastico de propagacao da informacao

Para modelar o processo de propagacao (ou transmissao) da informacao considera-se aprobabilidade de transmissao entre os nos da rede. Nesse sentido, defini-se, inicialmente,um ambiente de comunicacao em que nao ha perda de informacao. Esse propriedade,denominada conservacao da informacao, e definida na Premissa a seguir.

Premissa 3.3 (Conservacao da informacao). A probabilidade de haver perda de in-formacao na rede durante o processo de propagacao e nula.

Esta Premissa tem como consequencia que a soma das probabilidades de propagacao deum no para os seus vizinhos ou para permanencia no mesmo no, e unitaria. Dessa forma, apossibilidade da informacao se perder inexiste. Alem disso, e conveniente estabelecer quee possıvel se transmitir informacao entre qualquer par de nos da rede. Essa propriedade,denominada atingibilidade, expressa que uma mensagem, originada em qualquer no darede, e capaz de atingir qualquer outro no.

Premissa 3.4 (Atingibilidade). A probabilidade de que uma informacao partindo deum no qualquer da rede atinja qualquer outro no da rede e sempre positiva.

A Premissa 3.4 tem como consequencia o fato de que o grafo que representa a redee conexo e que, para todo no, existe pelo menos uma ligacao em que a probabilidadede transmissao e positiva. Em conjunto, essas duas Premissas tornam possıvel e salutara modelagem do processo de propagacao da informacao por meio da teoria de processomarcoviano [Markov 1913, Papoulis & Pillai 2002].

Page 53: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

30 Capıtulo 3. Observabilidade de redes

Definicao 3.3 (Processo marcoviano). Um processo de Markov e uma descricao de umsistema cujo estado x[t] evolui da seguinte forma:

x[t + 1] = Ax[t], (3.5)

onde A e uma matriz estocastica de transicao de estado definida como

A =

a11 · · · a1n...

. . ....

an1 · · · ann

, (3.6)

onde aij descreve a probabilidade de ocorrencia no estado xi[t + 1] dada uma ocorrenciaprecedente em xj [t].

Como a matriz A e estocastica, o somatorio dos elementos de cada uma de suas colunase sempre unitaria, ou seja,

n∑

i=1

aij = 1 j = 1, 2, . . . , n. (3.7)

De forma que a funcao de pesos de um grafo pode ser definida como

ω(e) = aij |e=(vi,vj) , (3.8)

que representa a probabilidade de que a quantidade de informacao em vj , representadapor xj , seja transmitida para o no vi. Portanto, conhecendo as probabilidades de trans-missao de informacao entre os nos da rede e possıvel modelar a matriz de transicao deestado da Equacao 3.1 como a matriz estocastica de transicao de estado de um processomarcoviano. Completa-se assim os requisitos de eficacia de representacao estabelecidospela Definicao 3.1.

Para cada um dos tres exemplos de topologia apresentados na Figura 3.2 e possıvelestabelecer a matriz estocastica de transicao de estado A. Primeiramente, e necessarioestabelecer a polıtica de transmissao entre os vizinhos de um no e a probabilidade deretencao de informacao. Considerando que o destino de uma informacao qualquer e igual-mente provavel para qualquer no da rede, tem-se a probabilidade de retencao

pr =1

n, (3.9)

de onde infere-se que a probabilidade de transmissao da informacao pt = (1− pr) e

pt =n− 1

n. (3.10)

De forma que cada elemento da matriz de transicao de estado pode ser definido como

pij =

pr se i = jpt/gout(vj) se vi ∈ h(vj)

0 caso contrario, (3.11)

onde gout(·) representa o grau de saıda do no e h(·) o conjunto de nos vizinhos. Por-tanto, a matriz de transicao de estado para cada topologia determinıstica da Figura 3.2 eapresentada na Figura 3.4.

Page 54: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.2. Modelo proposto 31

topologia em anel

1/4 3/8 0 3/83/8 1/4 3/8 00 3/8 1/4 3/8

3/8 0 3/8 1/4

(a) Aring

topologia linear

1/4 3/8 0 03/4 1/4 3/8 00 3/8 1/4 3/40 0 3/8 1/4

(b) Aline

topologia em estrela

1/4 3/4 3/4 3/41/4 1/4 0 01/4 0 1/4 01/4 0 0 1/4

(c) Astar

Figura 3.4: Matriz de transmissao para topologias determinısticas. Em (a), as probabilidades detransmissao pt sao iguais para todas as arestas. Em (b), sao iguais as da anterior, exceto pelos nosterminais. Em (c), as de transmissao e retencao sao as mesmas para cada no.

A partir do exposto na Figura 3.4, e possıvel verificar propriedades relevantes sobreo comportamento da transmissao da informacao em uma rede. Especificamente, a de-finicao da matriz realizada na Equacao 3.11, revela uma interpretacao bem definida doque representa matematicamente a matriz de adjacencia de uma rede. De fato, as teoriasde representacao por sistemas lineares e processo marcoviano possuem teoremas que per-mitem explorar significativamente propriedades de uma rede. Dentre essas propriedades,existem aquelas que possibilitam o estabelecimento de afirmacoes acerca da observabili-dade. Na proxima Secao, esses conceitos e um modelo de caracterizacao de propriedadesrelacionadas a observabilidade de uma rede sao apresentados.

3.2 Modelo proposto

A representacao de uma rede como descrita na Secao anterior, permite a definicao dedois conceitos de observabilidade ou de no observador. O primeiro, que sera denominadoobservador estrutural, tem como propriedade permitir a inferencia do estado de outrosnos a partir de leituras de seu estado. Esse denominacao se justifica pelo fato de que omonitoramento realiza uma caracterizacao da estrutura da rede.

Definicao 3.4 (Conjunto observador estrutural). Conjunto de nos, representado por Oe,para os quais a leitura dos estados permitem a inferencia do estado de todos os outros nosda rede.

O segundo conceito de no observador esta associado a quantidade de informacao quetrafega no no, uma vez que o estado de cada no nao e a unica caracterıstica que podeinteressar em um sistema de monitoramento de rede. Isso porque pode ser necessaria aanalise da informacao que trafega atraves desse no. Nesse caso, e importante que o con-junto de nos observadores seja capazes de monitorar a maxima quantidade de informacaoque trafega na rede. Como esse tipo de conceito de observador esta relacionado a funcaoda rede, em vez de sua estrutura, esse no e denominado observador funcional.

Definicao 3.5 (Conjunto observador funcional). Conjunto de nos, representado por Oc,cuja quantidade de informacao que trafega por eles consiste, quantitativamente, em umfator predefinido da totalidade do trafego que se propaga na rede.

Enquanto que na Definicao 3.4 busca-se monitorar todo o estado da rede, na De-finicao 3.5 essa totalidade nao e aplicada a quantidade do trafego monitorado. Isto por-que, de fato, para que a observacao funcional seja completa, seria necessario monitorar

Page 55: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

32 Capıtulo 3. Observabilidade de redes

todos os nos, ou seja, o conjunto de observadores funcionais teria que ser sempre o proprioconjunto de nos em uma rede conexa. Nesse sentido, de posse dessas definicoes e com basenas teorias de sistemas lineares e processo marcoviano, nas proximas Subsecoes sao apre-sentadas as condicoes necessarias e suficientes para a definicao da localizacao topologicados nos observadores em uma rede.

3.2.1 Observabilidade estrutural

Para determinar se um grupo de nos compoem um conjunto observador estrutural,e necessario o entendimento do conceito de observabilidade de sistemas lineares, que seapoia em propriedades das matrizes A e C. Dessa forma, o conceito de observabilidadeestrutural de uma rede esta associado ao de observabilidade de um sistema linear. Combase na Definicao 2.12, e definido a seguir o conceito de observabilidade estrutural da rede.

Definicao 3.6 (Observabilidade estrutural). Uma rede e passıvel de observabilidadeestrutural se, a partir de observacoes da saıda y[·] e, opcionalmente, com o conhecimentoda entrada u[·], e possıvel estimar com precisao o estado inicial do sistema x[t0].

De fato, e importante esclarecer que, conhecendo o estado inicial x[t0], as matrizes A,B, C e D, as entradas e as saıdas do sistema em todos instantes, e possıvel calcular oestado do sistema em qualquer instante utilizando as Equacoes 3.1 e 3.2. Dessa forma,encontrar a quantidade mınima de nos observadores estruturais pode fazer com que um sis-tema de monitoramento seja capaz de estimar todo o estado da rede monitorando apenasum subconjunto de seus nos. Para isso, basta que a matriz C associada a esse subcon-junto de nos torne a rede observavel. A Definicao 3.6 assemelha-se com a Definicao 2.12(diferindo quanto ao conhecimento da entrada, fato posteriormente justificado na Nota 1da pagina 37). Isso sera explorado a fim verificar a observabilidade da rede a partir de umteorema estabelecido por Kalman (1963). Esse Teorema estabelece uma relacao de neces-sidade e suficiencia em relacao a observabilidade e produtos da matriz C com potenciasda matriz A.

Teorema 3.1 (Condicao para observabilidade estrutural). [Kalman 1963] Um sistemalinear e observavel se e somente se, a matriz de observabilidade Oqn×n, definida como

O ,

CCACA2

...CAn−1

(3.12)

possui posto n, ou seja, ρ(O) = n.

A partir da matriz de observabilidade definida no Teorema 3.1, e possıvel projetar umconjunto observador estrutural de nos. Por exemplo, considerando que a matriz C e umamatriz identidade In×n tem-se, pelas primeiras n linhas da matriz de observabilidade, queρ(O) = n. Porem, essa configuracao da matriz C implica que e necessario monitorar oestado de todos os nos[iii]. Dessa forma, tem-se que, independentemente da matriz A,qualquer rede pode ser observavel, o que e natural ao se considerar a possibilidade de semonitorar todos os nos. Porem, considerando a questao de escalabilidade, e necessaria a

[iii]Considera-se C = In×n a solucao trivial para o conjunto observador estrutural.

Page 56: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.2. Modelo proposto 33

minimizacao da quantidade de nos observadores. Nesse sentido, e conveniente consideraro conjunto observador estrutural de menor cardinalidade.

Conjunto observador estrutural mınimo

A quantidade de possıveis subconjuntos de nos em uma rede com n nos e exatamente 2n.O conjunto observador estrutural de menor cardinalidade, representado por Oo

e , deve serescolhido dentre essas possibilidades. Porem, dada a quantidade de possıveis subconjuntos,a busca pelo conjunto observador estrutural mınimo nao pode ser realizada analisando todoo espaco de solucoes. Para atender ao quesito de eficiencia, e necessario desenvolver umalgoritmo de tempo polinomial para o seguinte problema de otimizacao:

Ooe = arg min

Oe

|Oe| (3.13)

s.a.: ρ(O) = n. (3.14)

Recentemente, Liu et al. (2011) mostrou que o problema de encontrar o conjunto mınimo denos para controlar uma rede e equivalentemente ao problema de emparelhamento maximo(do ingles, maximum matching). Dessa forma, como ha uma correspondencia entre contro-labilidade e observabilidade, e possıvel utilizar solucoes para o emparelhamento maximoa fim de encontrar o conjunto observador estrutural mınimo. A relacao entre os nos quetornam o sistema controlavel e os que o tornam observavel e definida no Lema a seguir.

Lema 3.1 (Correspondencia entre controlabilidade e observabilidade). Se um sistemalinear representa uma rede por meio de sua matriz de adjacencia e essa matriz de adjacenciae simetrica, entao as seguintes afirmacoes sao verdadeiras:

1. a quantidade de nos que compoem a solucao mınima para a controlabilidade tambeme a quantidade mınima de nos que compoem a solucao para a observabilidade e

2. os nos que compoem a solucao mınima para a controlabilidade sao os mesmos quecompoem a solucao mınima para a observabilidade.

Demonstracao. Se um sistema linear e controlavel, entao sua matriz de controlabilidade

S ,[

B AB A2B · · · An−1B]

, (3.15)

possui posto n, ou seja, ρ(S) = n, onde A e a matriz de adjacencia. Sabe-se que o operadorρ(·) e invariante em relacao a operacao de transposicao, ou seja, ρ(A) = ρ(A⊺). Portanto,se uma matriz tem posto n, entao sua transposta tambem o tera. Assim, tem-se que aseguinte matriz transposta tambem tem posto n:

S⊺ =

B⊺

(AB)⊺

(A2B)⊺

...(An−1B)⊺

, (3.16)

que, a partir da distribuicao da operacao de transposicao, pode ser reescrita como

S⊺ =

B⊺

B⊺A⊺

B⊺(A⊺)2

...B⊺(A⊺)n−1

, (3.17)

Page 57: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

34 Capıtulo 3. Observabilidade de redes

que, a partir da premissa A = A⊺, pode ser reescrita como

S⊺ =

B⊺

B⊺AB⊺A2

...B⊺An−1

. (3.18)

Utilizando-se de O = S⊺, tem-se que C = B⊺. Considerando a invariancia do posto quantoa operacao de transposicao, uma vez que O = S⊺, se B e a solucao mınima para que Stenha posto n, entao C e a solucao mınima para O tenha posto n. Como as matrizes B e Csao compostas por linhas linearmente independentes, em que cada linha possui apenas umelemento diferente de zero, entao a matriz C le o estado da mesma quantidade de nos quea matriz B altera com a entrada, concluindo-se assim a primeira parte da demonstracao.

Para demonstrar que os nos que possibilitam o controle sao os mesmos que possibilitama observacao, considera-se novamente a natureza das matrizes B e C. O elemento diferentede zero em cada coluna da matriz B indica qual o no que tera seu estado excitado, enquantoo elemento diferente de zero nas linhas da matriz C diz qual o no que tera seu estadomonitorado. Como C = B⊺, entao os elementos que eram diferentes de zero nas colunasde B serao os elementos diferentes de zero nas linhas de C, de forma que os mesmos nosque eram excitados para se manter o controle da rede, sao os nos que serao monitoradosa fim de observa-la. C.Q.D.

Utilizando os resultados do Lema 3.1 e possıvel verificar a escalabilidade da rede quantoa sua observabilidade, uma vez que e possıvel descobrir a quantidade mınima de nosobservadores. A seguir, e apresentado o problema de emparelhamento maximo em grafos.

Emparelhamento maximo em grafos

O emparelhamento em grafos e definido como um subconjunto das arestas em quecada aresta liga dois nos que nao se repetem em nenhuma outra aresta do subconjunto. Oconceito de emparelhamento esta associado a criacao de pares entre os nos. Quando essesubconjunto de emparelhamento tem cardinalidade maxima em um dado grafo, diz-se quetal subconjunto e solucao para o problema de emparelhamento maximo do grafo. As redesrepresentadas na Figura 3.2 sao apresentadas na Figura 3.5 como grafos nao direcionados.

linha

estrelaanel

Figura 3.5: Exemplo de emparelhamento maximo em grafos nao direcionados relacionados asredes apresentadas na Figura 3.2. O conjunto composto pelas arestas mais largas representamuma solucao do emparelhamento maximo de cada grafo.

Page 58: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.2. Modelo proposto 35

Para cada uma das topologias apresentadas[iv], o conjunto composto pelas arestasmais largas representam uma solucao do emparelhamento maximo. Na topologia em anelha duas solucoes de emparelhamento maximo. Para a topologia em linha, apenas umemparelhamento e maximo, pois, ao se escolher a aresta (v2, v3), haverao dois nos naoemparelhados. Por ultimo, para a topologia em estrela existem tantas solucoes quanto onumero de arestas. Tanto na topologia em anel quanto na topologia linear, todos os nosforam emparelhados. Quando isso acontece, o emparelhamento maximo e denominadoperfeito. Dado o conceito de emparelhamento maximo e de emparelhamento perfeito, aseguir e apresentado o Teorema que relaciona o problema de emparelhamento com o decontrolabilidade da rede.

Teorema 3.2 (Conjunto controlador mınimo). [Liu et al. 2011] A quantidade mınimade nos que se deve excitar para se ter controle de uma rede e unitaria se existe um empa-relhamento perfeito na rede. Nesse caso, qualquer no da rede pode ser o no controlador.Caso contrario, ela e igual a quantidade de nos nao emparelhados em qualquer um dosemparelhamentos maximos. Nesse caso, o conjunto de nos necessarios para controlar osistema e composto pelos nos nao emparelhados.

Esse Teorema permite estabelecer uma assertiva em relacao a observabilidade estru-tural. Porem, antes, e conveniente esclarecer porque o Teorema 3.2 nao faz qualquerassertiva sobre a matriz de adjacencia A. Em seu trabalho, Liu et al. (2011) esclarecemque o Teorema em questao e valido para a maioria das configuracoes dos valores nao nu-los da matriz de adjacencia. Para demonstrar essa proposicao, foi utilizado o conceitode sistema estruturalmente controlavel [Chiang et al. 2007], que e conveniente esclarecer,nao tem relacao com o termo ‘estrutural’ usado para qualificar o conjunto de nos obser-vadores neste trabalho. De forma geral, um sistema estruturalmente controlavel so naoe controlavel para configuracoes especıficas da matriz de adjacencia A, condicoes essas,normalmente, improvaveis ou impraticaveis [Liu et al. 2011].

Considerando que a matriz A sera uma matriz estocastica utilizada para representacaode probabilidades de transicao, e de se esperar que casos de nao observabilidade sejam im-provaveis dado o espaco de solucao em que o sistema e observavel. Mesmo assim, se aexcecao for o caso, e possıvel ajustar o sistema com a adicao de valores infinitesimais.Dessa forma, e introduzido um ruıdo no modelo que garante sua observabilidade, mas quepode ser compensado com a utilizacao de estimadores adaptativos [Chiang et al. 2007, Liuet al. 2011]. Portanto, a fim de evitar problemas quanto a utilizacao do termo ‘estrutural’,considera-se, a partir do Teorema 3.2, que ao se referir tanto a controlabilidade quandoa observabilidade, refere-se especificamente as suas contrapartidas ‘estruturalmente’ de-finidas. No seguinte Corolario, define-se uma estrategia para solucionar o problema debusca do conjunto observador estrutural mınimo, em relacao a quantidade mınima e loca-lizacao dos nos observadores, a partir de uma solucao para o problema de emparelhamentomaximo do grafo associado a matriz de adjacencia do sistema.

[iv]Os conceitos apresentados neste trabalho foram ilustrados, quase sempre, com grafos direcionadossimetricos. Isso porque, quando analisadas do ponto de vista de conectividade, redes de computadorespodem ser representadas e analisadas, como um grafo nao direcionado e por uma matriz de adjacencia sempesos. Porem, para se analisar o processo de troca de informacao, nao necessariamente a probabilidade detransmissao de um no vi para um no vizinho vj e a mesma probabilidade de transmissao de vj para vi.Portanto, a representacao de redes por digrafos simetricos e a mais adequada para aplicacao em questao.Sendo assim, no decorrer deste trabalho, apesar dos conceitos serem estabelecidos para grafos direcionados,nao necessariamente simetricos, a propriedade de simetria e utilizada quando adequada.

Page 59: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

36 Capıtulo 3. Observabilidade de redes

Corolario 3.1 (Conjunto observador estrutural mınimo). Em uma rede, cuja repre-sentacao por matriz de adjacencia e simetrica, a quantidade mınima de nos que deve-semonitorar para se ter uma leitura de todos os estados da rede e unitaria se existe umemparelhamento perfeito na rede. Nesse caso, qualquer no da rede pode ser o no obser-vador. Caso contrario, a cardinalidade e igual a quantidade de nos nao emparelhados,para qualquer um dos emparelhamentos maximos. E, nesse caso, o conjunto observadorestrutural e composto pelos nos nao emparelhados.

Demonstracao. Segue-se de forma direta a partir da utilizacao do exposto pelo Teo-rema 3.2, que trata do conjunto mınimo de nos controladores e da relacao de corres-pondencia estabelecida no Lema 3.1, que demostra a equivalencia entre o conjunto obser-vador e o controlador, quando a matriz A e simetrica. C.Q.D.

A partir do Corolario 3.1 e possıvel verificar que para a rede em anel e a rede em linhaapresentadas na Figura 3.5, a quantidade de nos observadores necessaria e unitaria e oconjunto observador estrutural pode ser composto por qualquer um dos nos da rede. Talfato e confirmado pelos Lemas C.7 e C.8 para a topologia em anel e para a topologia emlinha, respectivamente. Ja para o caso da topologia em estrela, para o emparelhamentoapresentado na Figura 3.5, e necessario observar 2 dos 4 nos, uma vez que os nos v2 e v4nao foram emparelhados. E conveniente notar que, qualquer que fosse a aresta escolhidapara o emparelhamento, o no central v1 nao faria parte do conjunto observador. Essascaracterısticas da topologia em estrela sao formalmente apresentadas pelo Lema C.9. Pode-se, ainda, considerar o fato de que a matriz de adjacencia de uma topologia em estrela,como a apresentada na Figura 3.3, sempre ira possuir posto 2, ou seja, ρ(Astar) = 2. Omesmo acontece para qualquer potencia da matriz Astar. Dessa forma, para que a matrizde observabilidade de uma topologia em estrela possua posto n, e necessario construir umamatriz Cstar de posto (n−2), cujas linhas sejam linearmente independentes de Astar. Paraisso, um dos requisitos e que a matriz Cstar nao deve incluir a linha que implica na leiturado no central, pois essa linha seria linearmente dependente com uma das linhas de Astar.

Apesar de uteis para o entendimento dos conceitos, topologias determinısticas nemsempre sao encontradas em cenarios reais. Portanto, o estudo desses cenarios e de modelosapresentados no Apendice A serao apresentados na Secao 3.3. Usando o Corolario 3.1, epossıvel elaborar um algoritmo de busca do conjunto observador estrutural mınimo Oo

e .

Algoritmo 3.1 (Busca do conjunto observador estrutural mınimo). E possıvel compu-tar o conjunto observador mınimo de uma rede com base na representacao por lista deadjacencia e na solucao do problema de emparelhamento maximo.

algoritmo observador-estrutural(L)1: Lista de adjacencia L de um grafo direcionado G = 〈N,E〉.2: 〈e, o〉 ← emparelhamento-maximo(L) Tupla de nos emparelhados e e do restante o.3: retorne o Conjunto observador estrutural mınimo.

As complexidades sao da ordem de O(√

|N ||E|) em tempo e de Θ(|N |) em memoria.

As complexidades do Algoritmo 3.1 dependem unicamente das complexidades associ-adas ao procedimento ‘emparelhamento-maximo()’. O primeiro algoritmo de tempo poli-nomial para o problema de emparelhamento maximo em grafos foi proposto por Edmonds(1965). Os algoritmos mais eficientes para esse problema sao da ordem de O(

|N ||E|)[Hopcroft & Karp 1973, Micali & Vazirani 1980]. Dado que a escolha dos nos observadorese eficiente, e conveniente uma discussao sobre o projeto de um sistema de monitoramento.

Page 60: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.2. Modelo proposto 37

Nota 1 (Sobre o projeto de um sistema observador estrutural). A realizacao de umsistema de monitoramento nao faz parte do escopo deste trabalho. Entretanto, conside-rando a teoria necessaria para se encontrar a quantidade mınima de nos observadores emrelacao ao conjunto observador estrutural, e conveniente citar como e possıvel projeta-lo.No projeto do sistema de monitoramento em que e possıvel conhecer a entrada do sistema,pode-se utilizar filtros como o de Luenberger (1971). Porem, se nao ha conhecimento dasentradas do sistema, e possıvel utilizar filtros adaptativos para estimar seu estado. Filtroscomo o de Kalman (1960a), sao capazes de estimar o estado de um sistema observavelutilizando apenas observacoes de sua saıda. Em adicao, Haykin (2008) apresenta variastecnicas de estimacao de estado de sistemas dinamicos baseadas em filtros estatısticos.

Ainda em relacao ao sistema de monitoramento, mesmo sendo conhecida a topolo-gia, persiste o problema de identificacao das probabilidades de transicao. Essa questao,juntamente com o modelo de observabilidade funcional, e desenvolvida a seguir.

3.2.2 Observabilidade funcional

A definicao de conjunto observador funcional esta associada a capacidade do sistema demonitoramento em interceptar uma quantidade predefinida de trafego. Nesta Subsecao,a quantidade de informacao interceptada e estabelecida como parametro do sistema demonitoramento. Especificamente, sera considerada a capacidade dos nos observadores emtornar possıvel examinar uma porcentagem esperada do total do trafego da rede.

Definicao 3.7 (Observabilidade funcional). Uma rede e passıvel de observabilidade fun-cional se, a partir da matriz estocastica de transicao A e de uma distribuicao de probabi-lidade do estado inicial x[t0], e possıvel examinar, pelo menos, uma porcentagem esperadaα do total de informacao que trafega na rede.

A Definicao 3.7 permite abordar o problema de duas formas. Na primeira, pode-se es-tabelecer um parametro α desejado e entao buscar por um conjunto observador funcionalmınimo. Na segunda, pode-se estabelecer a quantidade maxima de nos e, a partir da maxi-mizacao de α, encontrar o conjunto observador funcional. Para que as duas possibilidadessejam consideradas, estuda-se o comportamento do fator α em relacao a minimizacao daquantidade de nos. Para tanto, e fundamental o projeto de uma matriz A que tornepossıvel caracterizar a quantidade de informacao que passa por cada no. Para que essaproporcao de trafego transpareca de forma imparcial no vetor de estado x[t], define-se quetodos os nos da rede possuem igual probabilidade de retencao da informacao, ou seja,

pr(vi) = pr i = 1, . . . , n. (3.19)

Portanto, quanto mais informacao passa por um no vi, maior sera o valor de xi[t]. Conse-quentemente, a probabilidade de transmissao e definida por

pt(vi) = 1− pr i = 1, . . . , n. (3.20)

Dada a Premissa 3.3, que trata da conservacao da informacao, se a soma dos estadosindividuais no estado inicial x[t0] for unitaria, o estado

x[t0 + k] = Akx[t0], (3.21)

para qual o sistema ira convergir tambem tera essa propriedade.

Page 61: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

38 Capıtulo 3. Observabilidade de redes

Dado o estado inicial do processo marcoviano, para completar o modelo e necessariodefinir a matriz de transicao A. A partir da Equacao 3.19, e possıvel definir o elementosda diagonal da matriz. Porem, as entradas referentes a matriz de adjacencia necessitam daanalise da polıtica de transmissao entre cada no e seus vizinhos. Em uma rede onde naoha polıtica de transmissao[v], e possıvel definir que a transmissao para qualquer vizinho eequiprovavel. Nesse caso, e possıvel definir as entradas relacionadas a matriz de adjacenciacomo descrita pela Equacao 3.11. Porem, em redes projetadas, ou onde ha um princıpiode otimizacao na polıtica de transmissao de informacao, no momento de repasse ha umapredilecao pelos vizinhos que minimizem a distancia de trafego. De forma que, se um no vitransmite alguma informacao destinada a vj , a quantidade de repasses deve se aproximarda distancia entre os nos, isto e, sij como estabelecida pela Definicao A.6. Nesse caso, apolıtica de transmissao equiprovavel nao e conveniente e deve ser substituıda por outra queconsidere essa otimizacao. Para tanto, e estabelecida uma nova metrica que caracterizaa performance de um no em relacao a sua capacidade de minimizar a quantidade derepasses da informacao. Nesse sentido, baseado na ideia de centralidade [Newman 2003],e apresentado a seguir o conceito de rendimento de um no.

Definicao 3.8 (Rendimento de um no). O rendimento de um no vi, representado porγ(vi), e definido pela razao entre a quantidade de outros nos na rede e a soma das distanciaspara cada um desses nos, ou seja,

γ(vi) =|N | − 1

vj∈N sij(3.22)

onde sij representa a distancia entre os nos vi e vj .

De acordo com a Definicao 3.8, se a distancia de um nos para todos os outros da rede forunitaria, entao o rendimento de tal no e maximo e quanto maior forem as distancias, menorsera o rendimento. O Algoritmo apresentado a seguir realiza o calculo do rendimento decada no da rede.

Algoritmo 3.2 (Rendimento). E possıvel computar o rendimento de cada no de umgrafo conexo com base na representacao por lista de adjacencia.

algoritmo rendimento(L)1: Lista de adjacencia L de um grafo direcionado G = 〈N,E〉.2: r ← novo-vetor(|N |, 0) Vetor de |N | posicoes preenchidas com zero.3: para cada vi ∈ N faca4: 〈s, p〉 ← distancia(L, vi) Calcula as distancias de vi para os demais nos.5: t← 06: para cada j de 1 ate |N | faca7: t← t + s[j]8: fim para9: r[i]← (|N | − 1)/t

10: fim para11: retorne r Vetor com os rendimentos de cada no da rede.A complexidade do algoritmo e da ordem de O(n2 EGout) em tempo e de Θ(n) emmemoria, onde n = |N |.

[v]Em redes de computadores, pode-se considerar a polıtica de roteamento.

Page 62: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.2. Modelo proposto 39

As complexidades do Algoritmo 3.2 dependem do procedimento ‘distancia()’, associadoao Algoritmo A.3. Considerando a complexidade desse procedimento, a complexidade doAlgoritmo 3.2 e da ordem de O(n2 EGout) em tempo e de Θ(n) em memoria. Combase nesse Algoritmo e na definicao do conceito de rendimento, e possıvel computar asprobabilidades de transmissao. Especificamente, com base na Definicao 3.8, e possıvelponderar a probabilidade de transmissao entre os vizinhos de um no vj , de forma quequanto maior for o rendimento do vizinho vi, maior e a probabilidade de transmissao dainformacao de vj para vi. Essa ponderacao pode ser descrita pela seguinte relacao:

µ(vj , vi) =γ(vi)

vw∈h(vj)γ(vw)

vi ∈ h(vj), (3.23)

onde h(vj) representa os vizinhos do no vj . Com bases nas probabilidades de retencao e napolitica de transmissao, e possıvel definir os elementos da matriz estocastica de transicaocomo sendo:

pij =

pr(vi) se i = j(1− pr(vi))µ(vj , vi) se vi ∈ h(vj)

0 caso contrario, (3.24)

que, considerando EGout ≪ |N |, define uma matriz esparsa. Embora essa otimizacao doprocesso de transmissao da informacao seja adequada para representacao de alguns siste-mas reais, como e o caso das redes de computadores, e possıvel que a escolha equiprovaveldo encaminhamento seja mais adequada em outros cenarios. Dado o objeto de estudo destetrabalho, a construcao da matriz estocastica esta relacionada a Equacao 3.24. Todavia,em alguns casos pode ser de interesse uma comparacao dos resultados de ambas, o quesera feito explicitamente. Nesse sentido, elabora-se o seguinte algoritmo de construcao damatriz A.

Algoritmo 3.3 (Construcao da matriz estocastica de transicao). E possıvel construir amatriz estocastica de transicao otimizada de uma rede, em relacao as probabilidades detransmissao, com base na lista de adjacencia e nas probabilidades de retencao.

algoritmo matriz-estocastica(L, pr)1: Lista de adjacencia L de um digrafo G = 〈N,E〉 e probabilidades de retencao pr.2: a← nova-matriz(|N |, |N |, 0) Matriz nula |N | × |N |, possivelmente esparsa.3: r ← rendimento(L) Vetor de rendimentos.4: para cada vj ∈ N faca5: a[j][j]← pr[j]6: s← 07: para cada vi ∈ L[j] faca8: s← s + r[i] Soma dos rendimentos na vizinhanca de vj .9: fim para

10: pt ← 1− pr[j] Probabilidade de transmissao em vj .11: para cada vi ∈ L[j] faca12: a[i][j]← pt(r[i]/s) Probabilidade de transmissao de vj para vi.13: fim para14: fim para15: retorne a Matriz estocastica da rede.A complexidade do algoritmo e da ordem de O(n2 EGout) em tempo e de Θ(nEGout)em memoria, onde n = |N |.

Page 63: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

40 Capıtulo 3. Observabilidade de redes

A complexidade em tempo do Algoritmo 3.3, considerando o laco de repeticao dalinha 4, seria da ordem de Θ(nEGout), porem, a complexidade em tempo do procedi-mento ‘rendimento()’ e superior e, portanto, a complexidade em tempo do algoritmo eda ordem de O(n2 EGout). Em relacao a complexidade em memoria, o Algoritmo 3.3tem como ponto crıtico o tamanho da matriz estocastica. Essa complexidade e da ordemde Θ(nEGout), pois apenas essa quantidade esperada de elementos nao serao nulos, deforma que a matriz A ocupa tanta memoria quanto a representacao por lista de adjacencia.

Dado que e possıvel caracterizar a matriz de transicao A, deve-se agora dar continui-dade ao processo de busca pelo conjunto observador funcional mınimo. Nesse sentido, epreciso verificar, atraves da evolucao do processo descrito pela Equacao 3.21, se o processomarcoviano converge para algum estado. Especificamente, e preciso considerar se o sistemapode convergir para estados diferentes a partir de estados iniciais distintos. Felizmente,para a matriz A proposta nesta Subsecao, o processo marcoviano sempre converge paraalgum estado e esse estado e unico. Porem, para demonstrar essa propriedade, e necessarioapresentar a seguir uma serie de Definicoes e Teoremas, que tem como finalidade servir deteoria de suporte para a demonstracao dos requisitos de convergencia.

Definicao 3.9 (Matriz estocastica regular). Uma matriz estocastica A e regular se Ak,para algum valor de k > 0, possui todos os elementos positivos. Um processo marcoviano,onde a matriz de transicao e regular, e dito processo marcoviano regular.

Com base na definicao de processo marcoviano regular, e possıvel se utilizar de algunsTeoremas a fim de mostrar que: (i) o sistema sempre converge e (ii) converge para o mesmoestado independentemente do estado inicial. Nesse sentido, e conveniente apresentar oseguinte Teorema sobre o comportamento assintotico de um processo marcoviano regular.

Teorema 3.3 (Comportamento do processo marcoviano regular). [Anton & Busby 2003]Se A e uma matriz de transicao regular, entao

Ak →

c1 c1 · · · c1c2 c2 · · · c2...

.... . .

...cn cn · · · cn

, (3.25)

para valores assintoticos de k, onde ci sao todos numeros positivos, e∑n

i=1 ci = 1.

Teorema 3.4 (Estado estavel do processo marcoviano regular). [Anton & Busby 2003]Se A e uma matriz de transicao regular e x[t0] e um vetor de probabilidades, entao

Akx[t0]→

c1c2...cn

= c, (3.26)

para valores assintoticos de k, onde c e o estado estavel unico, independente de x[t0], ecom todos os elementos positivos e

∑ni=1 ci = 1.

Esses dois Teoremas podem ser utilizados para garantir a convergencia e a unicidade dasolucao desde que seja demonstrado que a matriz estocastica definida pela Equacao 3.24e regular. O Teorema a seguir, associado a interpretacao da potencia de uma matriz deadjacencia, torna essa demonstracao possıvel.

Page 64: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.2. Modelo proposto 41

Teorema 3.5 (Potencias da matriz de adjacencia). [Cvetkovic et al. 2009] Dado que Ae a matriz de adjacencia de um grafo direcionado G, composto pelos nos v1, v2, . . . , vn, oelemento aij da matriz Ak representa a quantidade de caminhos distintos de tamanho kpartindo do vertice vj ate o vertice vi.

As potencias da representacao por matriz de adjacencia possibilitam uma interpretacaorazoavel sobre a evolucao do processo marcoviano, tornando possıvel estabelecer condicoessuficientes para que a matriz estocastica de transicao seja regular, como apresentado noseguinte Lema.

Lema 3.2 (Regularidade da matriz de transicao). Sao condicoes suficientes para que amatriz de transicao A, definida pela Equacao 3.24, seja regular:

1. a matriz de adjacencia representar um grafo conexo; e2. as probabilidades de retencao pr(vi) serem todas positivas.

Demonstracao. A partir do Teorema 3.5, tem-se que, se existe pelo menos um caminhode tamanho k do no vj ate o no vi, entao o elemento aij da matriz Ak sera positivo.Portanto, assumindo que o grafo e conexo, pode-se afirmar que cada entrada aij da matrizsera positiva para algum valor de k. Tal fato nao garante que elas serao todas positivaspara algum instante k. Ao adicionar as probabilidades de retencao, tem-se como inter-pretacao a adicao de um laco em cada no da rede. Considerando que existe um caminhode tamanho k entre dois nos, a existencia de lacos garante que tambem existirao quaisquercaminhos maiores que k. Assim, tao logo um elemento qualquer da matriz seja positivo, elepermanecera positivo. Como todos os elementos da matriz se tornarao positivos em alguminstante e permanecerao positivos, entao a matriz estocastica definida pela Equacao 3.24e sempre positiva para algum valor de k e, portanto, regular. C.Q.D.

Corolario 3.2 (Influencia do diametro sobre a matriz regular). Uma matriz estocasticaregular A, que representa uma grafo conexo G, tera todas as suas entradas positivas noinstante k = d(G), onde d(G) representa o diametro do grafo G.

Demonstracao. Tomando como base a demostracao do Lema 3.2, tem-se que o ultimoelemento da matriz a ser positivo sera aquele referente a maior distancia do grafo, que erepresentado pelo diametro. Portanto, quando k for igual ao diametro, todos as entra-das cujos nos eram separados por distancias menores que k, ja eram positivos e assimpermanecem e as entradas que eram nulas passam a ser positivas. C.Q.D.

A partir do Lema 3.2 sao estabelecidas condicoes suficientes para que a matriz es-tocastica seja regular. De fato, das duas condicoes, apenas a primeira e necessaria. Toda-via, como a definicao proposta para a matriz se encaixa nos requisitos de suficiencia, naoe necessario ir alem do exposto pelo Lema. Em relacao ao Corolario 3.2, apesar de nao sernecessario para a busca do conjunto observador mınimo, e util para se estimar o tempo deconvergencia do processo marcoviano que, como pode-se deduzir, esta diretamente relaci-onado ao diametro da rede. Por fim, garantida a convergencia do processo e a unicidadeda solucao, e possıvel desenvolver um algoritmo capaz de encontrar o conjunto observadorfuncional mınimo, com base no seguinte Corolario.

Corolario 3.3 (Conjunto observador funcional mınimo). O conjunto observador funcio-nal mınimo e composto pela menor quantidade de nos cuja soma dos estados, considerandoo estado estavel c, resulta em um valor s ≥ α.

Page 65: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

42 Capıtulo 3. Observabilidade de redes

Demonstracao. Considerando que o estado estavel c representa a quantidade esperadarelativa de trafego em cada no da rede, a escolha gulosa dos nos pelo respectivo estado novetor c representa a quantidade mınima de nos para se monitorar a quantidade de trafegoestabelecida pela soma de seus estados. Portanto, a menor quantidade de nos cuja somados estados excede ou se iguala a α e o conjunto observador funcional mınimo. C.Q.D.

O Algoritmo apresentado a seguir utiliza esse Corolario para encontrar o conjuntoobservador funcional mınimo de um grafo dado o parametro de observacao α.

Algoritmo 3.4 (Busca do conjunto observador funcional mınimo). E possıvel computaro conjunto observador mınimo de uma rede, considerando o parametro α, com base narepresentacao por lista de adjacencia e no vetor de probabilidades de retencao.

algoritmo observador-funcional(L, pr, α)1: Lista de adjacencia L, probabilidades de retencao pr e fator de analise α.2: a←matriz-estocastica(L, pr) Construcao da matriz estocastica regular.3: c←estado-estavel(a) Solucao do estado estavel da matriz.4: o← nova-lista() Cria uma nova lista vazia.5: s← 06: enquanto s ≤ α faca7: vm ← arg maxvi c[i]8: s← s + c[m]9: inserir(o, vm) Insere o no vm no inicio da lista o.

10: remove(c, vm) Remove no vm da lista c.11: fim enquanto12: retorne o Conjunto observador funcional mınimo.A complexidade do algoritmo e da ordem de O(n2 EGout) em tempo e de O(nEGout)em memoria, onde n = |N |.

As complexidades do Algoritmo 3.4 dependem, principalmente, da forma como saoimplementados os procedimentos ‘matriz-estocastica()’ e ‘estado-estavel()’, uma vez quea complexidade na linha 6 e, no pior caso, da ordem de O(n). As complexidades doprocedimento ‘matriz-estocastica()’ sao apresentadas no Algoritmo 3.3 e sao da ordem deO(n2 EGout) em tempo e de Θ(nEGout) em memoria. Ja em relacao ao procedimento‘estado-estavel()’, pode ser implementado como a solucao do sistema linear:

(I−A)c = 0, (3.27)

com complexidade em tempo da ordem de O(n3), utilizando-se de algum processo de esca-lonamento de matriz. Como a matriz e esparsa, e possıvel implementar o escalonamentoem O(n2 EGout). Ja a complexidade em memoria de ‘estado-estavel()’ pode chegar aO(n2) em alguns casos. Em redes reais tal caso nao e provavel e, portanto, pode-se con-siderar que a complexidade esperada em memoria e da ordem de O(nEGout). Dessaforma, considera-se que a complexidade do Algoritmo 3.4 e da ordem de O(n2 EGout)em tempo e de O(nEGout) em memoria.

O procedimento de descoberta do conjunto observador funcional apresentado tem comocaracterısticas a eficiencia e a escalabilidade em relacao aos algoritmos apresentados. NaSecao de Experimentos sera abordada a questao de escalabilidade da quantidade de nosobservadores. Por enquanto, e conveniente verificar a questao da observabilidade funcionalnas topologias determinısticas utilizadas como referencia. Nesse sentido, e possıvel concluir

Page 66: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.3. Experimentos 43

que, se as probabilidades de retencao forem iguais, na topologia em anel todos os nosdevem convergir para o mesmo estado, ou seja, ci = 1/n. Isso nao acontece na topologiaem linha ja que, para pr = 1/n e considerando a matriz estocastica como definida pelaEquacao 3.24, o vetor c, para a rede apresentada na Figura 3.2, e

cline ≈

0.1430.3570.3570.143

. (3.28)

Por esse resultado, e possıvel concluir que espera-se analisar mais de 70% do trafegoinstantaneo da rede apenas monitorando os dois nos centrais. Em relacao a topologiaem estrela, tem-se que, se a propriedade de retencao for igual para todos os nos, 50%do trafego estara no no central, independentemente da quantidade de nos, e do valor daprobabilidade de retencao. Esse resultado e apresentado formalmente pelo Lema C.10.

Nota 2 (Sobre o projeto da matriz de transicao). A matriz de transicao de estado de-finida nesta Secao, tem como objetivo o estudo da quantidade de informacao que trafegapela rede. Para considerar o projeto da matriz A a ser utilizada no sistema de monito-ramento, nao e pratico considerar, por exemplo, que as probabilidades de retencao saoiguais para todos os nos da rede[vi].

3.3 Experimentos

Esta Secao tem como objetivo o estudo experimental de caracterısticas da rede queinfluenciam o conjunto dos nos observadores, por exemplo: (i) como cresce a quantidade denos observadores em relacao ao tamanho e a densidade da rede e (ii) como as propriedadesda rede influenciam nas propriedades qualitativas e quantitativas dos nos observadores.E possıvel estabelecer evidencias experimentais de duas formas: (i) pela analise direta dealguma metrica, ou (ii) pela utilizacao de tecnicas de visualizacao das propriedades darede. A fim de ilustrar a segunda, e apresentada a Figura 3.6.

Figura 3.6: Rendimento dos nos em uma rede livre de escala. Todas as redes sao compostas porn = 21 nos e diferenciam-se pelo parametro m, discriminado abaixo da rede.

Na Figura 3.6, o rendimento e proporcional a cor do no, de forma que de maior ren-dimento e mais escuro, culminando com a cor branca para o no com menor rendimento.Alem disso, o no com maior rendimento e colocado no centro da visualizacao e as arestasque nao compoem a arvore de cobertura mınima em relacao ao no central sao mais claras.

[vi]Pode-se perceber que, em redes de computadores, tem-se nos em que a retencao e baixa, como pode sero caso de roteadores, enquanto a retencao de outros e alta, como e o caso de servidores de armazenamento.

Page 67: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

44 Capıtulo 3. Observabilidade de redes

A partir das redes apresentadas, e possıvel verificar que existe uma relacao entre o rendi-mento de um no e o seu grau, uma vez que os nos com maior rendimento possuem umaquantidade consideravel de vizinhos. A fim de ilustrar como essas caracterısticas podemser verificadas de forma experimental, sera considerada relacao esperada entre o grau deum no e o seu rendimento. A partir da criacao e analise de 104 redes livre de escala de ta-manhos n = 50, 100, 150, para valores de m = 1, 2, 3, foi verificado o comportamentodo grau de um no em relacao ao seu rendimento esperado. Esses resultados, agrupadosem 3 graficos em relacao ao valor de m, sao apresentados na Figura 3.7.

00.10.20.30.40.50.60.70.80.9

1

0 10 20 30 40 50 60 70

grau

ren

dim

o

(a)

00.10.20.30.40.50.60.70.80.9

1

0 10 20 30 40 50 60 70 80

ren

dim

o

(b)

00.10.20.30.40.50.60.70.80.9

1

0 10 20 30 40 50 60 70

ren

dim

o

(c)

Figura 3.7: Relacao entre o rendimento e o grau em redes livre de escala. Em (a), onde m = 1,tem-se que a inclinacao relativa e a mais acentuada; em (b), onde m = 2, ha um aumento no valoresperado dos rendimentos para graus menores; o que e ainda mais notavel em (c), onde m = 3.

Com base na aparente relacao linear entre o grau de um no e seu rendimento esperado,como apresentado na Figura 3.7 para valores distintos do parametro m e para redes detamanho tambem distintos, e possıvel estabelecer a Observacao a seguir.

Observacao 3.1 (Relacao entre grau e o rendimento esperado). Em uma rede livre deescala, o rendimento esperado de um no, representado por EY, esta proporcionalmenteassociado ao seu grau EG, ou seja, EY ∝ EG.

Page 68: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.3. Experimentos 45

Os graficos apresentados na Figura 3.7 possuem comportamentos ligeiramente diferen-tes para valores distintos do parametro m. Especificamente, para valores maiores de m, ainclinacao da reta de valor esperado do rendimento e menor. Isso porque para m = 1 ovalor esperado do rendimento para graus menores e aproximadamente 1/5, ja para m = 2tem-se que esse valor e de, aproximadamente, 1/3, e para m = 3 e de, aproximadamente,2/5. Esses resultados dao suporte a Observacao a seguir.

Observacao 3.2 (Relacao entre m e o rendimento esperado). Em uma rede livre deescala, o rendimento esperado de um no, representado por EY, esta proporcionalmenteassociado ao valor do parametro livre da rede m.

E natural que haja um aumento no rendimento proporcional a m pois, quanto maioresse parametro maior sera a quantidade de arestas. Uma quantidade maior de arestasaumenta a densidade da rede, fazendo com que a distancia media tenda a ser menor, o queaumenta o rendimento. De forma geral, os resultados, expressos na forma de observacoes,compoem um exemplo de como a analise experimental pode dar suporte ao entendimentode caracterısticas gerais de redes. A seguir, sao exploradas as caracterısticas associadasao conjunto observador estrutural mınimo e do conjunto observador funcional mınimo.

3.3.1 Observabilidade estrutural

Na Secao anterior, foi constatada que a escolha do subconjunto mınimo de nos quetorna a rede estruturalmente observavel e eficiente. Alem da eficiencia, e preciso verificara escalabilidade do conjunto observador estrutural. A verificacao da escalabilidade conduzos experimentos desta Subsecao.

Quantidade de nos observadores

A quantidade mınima esperada de nos necessarios para garantir a observabilidade deuma rede e uma questao de escalabilidade a ser explorada. Para 103 instancias de redeslivre de escala de tamanho entre 10 e 500, os resultados sao apresentados na Figura 3.8.

0

20

40

60

80

100

120

140

160

180

200

220

0 50 100 150 200 250 300 350 400 450 500

Figura 3.8: Cardinalidade esperada do conjunto observador estrutural mınimo, considerandoredes livre de escala de tamanho entre 10 e 500 nos.

Page 69: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

46 Capıtulo 3. Observabilidade de redes

Com base na Figura 3.8, e possıvel identificar que a quantidade mınima de nos obser-vadores e de uma fracao linear da quantidade total de nos. Especificamente, para m = 1,a quantidade esperada de nos observadores e da ordem de 40% do total. Ja para m = 2,espera-se que a quantidade de observadores seja de 15%, enquanto que para m = 3 essevalor esperado decai rapidamente para aproximadamente 1%. Dessa forma, tem-se que aobservabilidade de redes livre de escala possui uma relacao linear com a cardinalidade doconjunto de nos observadores. Estes resultados dao suporte a Observacao a seguir.

Observacao 3.3 (Cardinalidade do conjunto observador estrutural mınimo). Ha umarelacao linear entre a quantidade de nos em uma rede e a cardinalidade esperada doconjunto observador estrutural mınimo, isto e, EOe ≃ βn, para 0 < β < 1, onde Oe e avariavel aleatoria que representa a cardinalidade de Oo

e .

Em relacao ao crescimento do parametro m, a quantidade de nos observadores ne-cessarios decresce de forma consideravel. Isso deve-se ao fato de que, para valores maioresde m, a densidade do grafo aumenta, o que proporciona uma quantidade maior de possi-bilidades de emparelhamento, aumentando assim a probabilidade de existir um empare-lhamento perfeito, isto e, de um conjunto observador mınimo unitario.

Observacao 3.4 (Relacao entre densidade e observabilidade estrutural). Quanto maiora densidade de uma grafo, maior a probabilidade de reducao da cardinalidade do conjuntoobservador estrutural mınimo.

Para redes do tipo livre de escala, quanto maior o valor do parametro m maior seraa densidade do grafo e, portanto, maior e a probabilidade de existir um emparelhamentoperfeito. Outra caracterıstica importante sobre a cardinalidade do conjunto observadormınimo e o quao provavel e seu valor esperado em relacao a enumeracao de todas aspossibilidades. Essa distribuicao e apresentada na Figura 3.9.

0

500

1000

1500

2000

2500

0 10 20 30 40 50 60 70 80 90

(a)

0

500

1000

1500

2000

2500

0 5 10 15 20 25 30 35 40 45

(b)

Figura 3.9: Distribuicao da quantidade de nos observadores estruturais considerando 104

instancias de tamanhos n = 50, 100, 150, para m = 1 em (a) e m = 2 em (b).

Page 70: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.3. Experimentos 47

Com base na Figura 3.9 e possıvel verificar que, para valores de m igual a 1 ou 2[vii],a distribuicao de probabilidade da cardinalidade do conjunto observador mınimo de umarede livre de escala se comporta como uma distribuicao de Poisson (1837) [Papoulis &Pillai 2002]. A partir dessa evidencia, e possıvel inferir que ha maior probabilidade de quea cardinalidade do conjunto observador estrutural mınimo esteja em torno da media, o quenao aconteceria se a distribuicao fosse uniforme. A cardinalidade esperada apresentada naFigura 3.8 expressa de forma adequada o comportamento da quantidade de nos observa-dores em relacao a quantidade total de nos. Outra questao expressiva esta relacionada ainfluencia que o grau de um no possui em relacao a sua pertinencia ao conjunto observadormınimo. Essa relacao e apresentada na Figura 3.10.

1

1.5

2

2.5

3

3.5

4

0 50 100 150 200 250 300 350 400 450 500

Figura 3.10: Grau esperado relativo dos nos observadores estruturais, onde EGe e o valoresperado da variavel aleatoria Ge, que indica o grau de um no observador estrutural qualquer doconjunto observador estrutural mınimo.

A Figura 3.10 expressa uma propriedade interessante do conjunto observador estruturalmınimo, que e o fato de que o valor esperado do grau dos nos observadores e relativamentemenor. A partir disso, pode-se inferir que os nos com menor grau em uma rede livre deescala possuem maior probabilidade de compor o conjunto observador estrutural mınimo.Essa propriedade e invariante ja para valores de n da ordem de algumas dezenas. Combase nesses resultados, e estabelecida a Observacao a seguir.

Observacao 3.5 (Grau esperado no conjunto observador estrutural mınimo). O grauesperado dos nos em um conjunto observador estrutural mınimo e cerca de pouco mais dametade do grau esperado da rede, para valores de m igual a 1 e 2. Assintoticamente, essapropriedade e invariante em relacao a quantidade de nos da rede.

Apesar de nao ser explicitado, verificou-se experimentalmente que a Observacao 3.5tambem se aplica a valores de m ate 7, o que talvez possibilite a eliminacao da restricaoacerca da magnitude de m. Porem, tal possibilidade, a princıpio, nada tem a acrescentar.Contudo, o estudo do comportamento do conjunto observador mınimo em relacao a outrasmetricas e natural. A seguir, e analisado o comportamento dos nos que compoem oconjunto observador mınimo em relacao a algumas das metricas apresentadas na Secao A.2.E conveniente afirmar que, devido a distribuicao das cardinalidades do conjunto observadorestrutural mınimo, a analise experimental dessas metricas perdem representatividade nasextremidades, uma vez que ha maior frequencia de realizacoes em torno de sua media.

[vii]Devido ao fato de que, em redes de computadores, uma porcao consideravel dos nos possuem grau 1ou 2, que somente pode ser reproduzido em redes livre de escala para m = 1 ou m = 2, considera-se nosexperimentos apenas esses valores de m pois, se for possıvel estender as caracterısticas de redes livre deescala para redes de computadores sera para esses valores de m.

Page 71: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

48 Capıtulo 3. Observabilidade de redes

Portanto, para os graficos apresentados a seguir, onde considerar-se como um dos eixos acardinalidade de Oo

e , e razoavel se concentrar nos resultados para os valores nao extremosde |Oo

e |.

Relacao com as metricas

O estudo experimental de caracterısticas de uma rede livre de escala que influenciam naquantidade de nos observadores estruturais pode estabelecer conceitos que condicionemtanto a escalabilidade quanto o proprio projeto do sistema de monitoramento da rede.Especificamente, sera explorado como o diametro, a eficiencia, e o agrupamento de umarede interferem na quantidade de nos observadores da rede. A influencia do diametro naquantidade de nos observadores e apresentada na Figura 3.11.

7

8

9

10

11

12

13

0 10 20 30 40 50 60 70 80 90

(a)

4.24.44.64.8

55.25.45.65.8

66.2

0 5 10 15 20 25 30 35 40 45

(b)

Figura 3.11: Relacao entre o diametro e a observabilidade estrutural. Em (a) e consideradom = 1, enquanto em (b) considera-se m = 2. Para ambos os casos e apresentado o comportamentoda quantidade de nos observadores em relacao ao diametro da rede.

Na Figura 3.11, e possıvel verificar que ha uma relacao inversamente proporcional entrea quantidade de nos observadores estruturais e o diametro esperado da rede. Para redescomo diametro relativamente elevado, tem-se uma minimizacao da quantidade necessariade nos observadores. E possıvel afirmar que para redes com diametro relativamente menorha um aumento no grau esperado dos nos e, portanto, uma maior quantidade de nos naoemparelhados, o que permite concluir o aumento na cardinalidade de Oo

e . Tal constatacaopermite a elaboracao do seguinte Observacao.

Observacao 3.6 (Relacao entre o diametro e a cardinalidade de Ooe). Em uma rede

livre de escala, representada por uma grafo G, cujo o diametro d(G) e relativamenteelevado, espera-se que a cardinalidade do conjunto observador estrutural mınimo Oo

e sejarelativamente reduzida. E estabelecida uma relacao inversamente proporcional entre osvalores esperados de |Oo

e | e d(G).

Page 72: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.3. Experimentos 49

Ao considerar as topologias determinısticas apresentadas na Secao B.1, e possıvel ve-rificar a Observacao 3.6. Uma rede livre de escala com parametro m = 1 possui diametromaximo quando for uma topologia em linha. Assim, com base no Lema C.8, o conjunto ob-servador estrutural mınimo e unitario e, portanto, mınimo. Ja para o caso de minimizacaodo diametro, tem-se uma topologia em estrela, onde, com base no Lema C.9, o conjuntoobservador estrutural mınimo possui cardinalidade igual a (n− 2), ou seja, maxima, umavez que a adicao de qualquer aresta diminuiria a quantidade de nos observadores em umpar. Verifica-se entao uma relacao inversa entre |Oo

e | e o diametro da rede d(G). Dandoprosseguimento ao estudo da influencia das demais metricas, na Figura 3.12, e apresentadoo comportamento da quantidade de nos observadores em relacao a eficiencia da rede.

0.20.220.240.260.28

0.30.320.340.360.38

0.4

0 10 20 30 40 50 60 70 80 90

(a)

0.32

0.34

0.36

0.38

0.4

0.42

0.44

0.46

0.48

0 5 10 15 20 25 30 35 40 45

(b)

Figura 3.12: Relacao entre a eficiencia e a observabilidade estrutural. Em (a) e consideradom = 1, enquanto em (b) considera-se m = 2. Para ambos os casos, e apresentado o comportamentoda quantidade de nos observadores em relacao a eficiencia da rede.

Ao contrario do que acontece com o diametro, existe uma relacao direta entre a car-dinalidade do conjunto observador estrutural mınimo e a eficiencia da rede. Tal fato eesperado ja que quanto maior for o diametro de uma rede, menor sera a sua eficiencia. Apartir da analise das topologias em linha e estrela, e possıvel constatar que, na topologiaem linha, onde a eficiencia e minimizada, tem-se que a cardinalidade de Oo

e tambem o sera.Ja no caso da topologia em estrela, onde a eficiencia e maximizada, tem-se tambem a ma-ximizacao da cardinalidade de Oo

e . Estas observacoes permitem estabelecer a Observacaoa seguir.

Observacao 3.7 (Relacao entre a eficiencia e a cardinalidade de Ooe). Em uma rede

livre de escala, representada por uma grafo G, cuja eficiencia EF e relativamente baixa,espera-se que a cardinalidade do conjunto observador estrutural mınimo Oo

e tambem sejarelativamente baixa. Portanto, existe uma relacao diretamente proporcional entre o valoresperado de |Oo

e | e EF.

Page 73: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

50 Capıtulo 3. Observabilidade de redes

A Observacao 3.7 permite uma segunda reflexao acerca da influencia da densidade naquantidade de nos observadores. Isso porque espera-se que redes com maior densidadepossuam maior eficiencia, uma vez que a distancia entre os nos diminui. A Observacao 3.4estabelece que quanto maior a densidade, menor sera a cardinalidade de Oo

e , o que apa-rentemente contradiz a Observacao 3.7. Porem, e de se considerar que essa ultima, trataa eficiencia relativa da rede, ou seja, da eficiencia de uma rede, comparada a outras commesma quantidade de nos e arestas e, portanto, todas de mesma densidade. Portanto, amedida de ‘densidade’ que exerce influencia nesse caso, e o coeficiente de agrupamento darede. Isso porque, redes onde os nos sao mais agrupados possuem uma eficiencia maior.Pelo exposto nos paragrafos precedentes, e possıvel concluir que, assim como a eficiencia,o agrupamento de uma rede e diretamente proporcional a quantidade de nos. Este fato econfirmado pelo grafico apresentado na Figura 3.13 e pela Observacao 3.8.

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0 5 10 15 20 25 30 35 40 45

Figura 3.13: Relacao entre o agrupamento e a observabilidade estrutural. E apresentado ocomportamento apenas para m = 2, uma vez que para m = 1 o agrupamento e sempre nulo.

Observacao 3.8 (Relacao entre o agrupamento e a cardinalidade de Ooe). Em uma rede

livre de escala, representada por uma grafo G, cujo agrupamento EC e relativamentebaixo, espera-se que a cardinalidade do conjunto observador estrutural mınimo Oo

e tambemseja relativamente baixa. Ha uma relacao diretamente proporcional entre o valor esperadode |Oo

e | e EC.

Quando uma rede possui um ındice de agrupamento elevado, ao se adicionar qualqueraresta, diminui-se a probabilidade de um no ser emparelhado pois, se seus vizinhos estaoemparelhados, esse no nao tem contrapartida para formar par. Expondo de outra forma,quando ha alto agrupamento, existe uma maior adjacencia entre as arestas. Como em umemparelhamento nao existe arestas adjacentes, havera entao uma menor quantidade dearestas no emparelhamento e, portanto, uma menor quantidade de nos emparelhados.

A partir da definicao do comportamento do diametro, da eficiencia, e do agrupamentoem relacao ao conjunto observador estrutural mınimo, e possıvel quantificar de formaestatıstica a escalabilidade de uma rede, a partir do conhecimento do valor esperado de suasmetricas. Para redes livre de escala, verifica-se que o valor esperado de nos observadores,e sempre menor que a metade da quantidade de nos. Especificamente, tem-se que aquantidade de nos observadores diminui de forma rapida em relacao ao aumento de m.Para valores pequenos de m, tem-se que o quantidade esperada de nos observadores oscilaentre 15% e 40% do total de nos da rede. Para caracterizar de forma pratica essas medidas,a seguir, considera-se o estudo da quantidade de nos observadores em dados obtidos a partirde redes reais. Contudo, isso e feito a tıtulo de ilustracao. Os resultados apresentadosnesta Secao sao os definitivos, uma vez que tracados de rotas nao sao confiaveis.

Page 74: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.3. Experimentos 51

Analise com base em dados reais

O estudo das propriedades do conjunto observador estrutural mınimo com base emredes livre de escala permite o entendimento da influencia de propriedades da rede comodensidade, diametro, eficiencia e agrupamento.

A partir desses resultados pode-se considerar a descoberta do conjunto observadorestrutural mınimo de forma eficiente e que sua quantidade e escalavel. Considerando oobjeto de estudo deste trabalho, isto e, redes de computadores, e conveniente analisar alocalizacao e a escalabilidade para alguma aproximacao de uma topologia real. E conve-niente destacar que tais dados nao passam de aproximacoes cujos resultados nao podemser generalizados de forma descuidada, como discutido na Secao 2.2.1.

E utilizado um conjunto de dados de roteamento obtido de forma ativa via tracadode rotas, disponıvel na base de dados sobre a Internet IPv6 da CAIDA (CooperativeAssociation for Internet Data Analysis)[viii]. Nessa base de dados, existem varios conjuntosde rotas, divididos por mes, associados a cada no monitor de um grupo de maquinasque tracam rotas para enderecos IPv6 definidos de forma aleatoria. Para simular umcrescimento na quantidade de nos, a fim de estudar o comportamento da cardinalidade deOo

e , foi utilizado um desses conjuntos de rotas. As rotas foram compostas para formar umgrafo da topologia identificada pelo no monitor. O comportamento das cardinalidades dosconjuntos de nos, arestas e nos observadores e apresentado na Figura 3.14.

0

1000

2000

3000

4000

5000

6000

7000

0 500 1000 1500 2000 2500 3000 3500 4000

Figura 3.14: Relacao entre a cardinalidade de Ooe e a quantidade de rotas, para um conjunto

de 3972 rotas. No total foram considerados 5904 nos e 6548 arestas, resultando em 1190 nosobservadores, que compoem aproximadamente 20% da quantidade de nos.

A Figura 3.14, composta por um conjunto de 3972 rotas, permite verificar o compor-tamento linear em relacao a quantidade de nos observadores. No total foram considerados5904 nos, resultando em 1190 nos observadores, o que compoe aproximadamente 20% daquantidade total de nos. A porcao de nos observadores esta entre aquela encontrada entreredes livre de escala para m = 1 e m = 2. Como a rede composta por todas as rotas possuidensidade maior que a livre de escala equivalente para m = 1, e natural que a quantidadede nos observadores seja relativamente menor. Este fato e justificado porque a quantidademaior de arestas faz com que o diametro seja reduzido e a eficiencia aumentada. Conside-rando que a Internet deve possuir uma densidade maior que uma rede livre de escala comm = 1, porem menor do que para m = 2, pode-se estimar que a porcao esperada de nosobservadores na Internet deve estar entre 15% e 40%. Apesar do tracado de rotas nao serconfiavel, essa afirmacao e razoavel pois baseia-se principalmente nos resultados obtidos apartir do estudo com redes livre de escala.

[viii]Disponıvel como ‘The CAIDA UCSD IPv6 Topology Dataset’, em http://www.caida.org/ (2013).

Page 75: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

52 Capıtulo 3. Observabilidade de redes

Alem da quantidade de nos observadores, sua localizacao tambem e informacao rele-vante para o estudo da viabilidade do projeto de uma sistema de monitoramento. NaFigura 3.15 essa localizacao e apresentada para uma topologia composta por 39 dessasrotas.

Figura 3.15: Exemplo de localizacao dos nos observadores estruturais considerando dados deuma rede real composta por 39 tracados de rota. O no de maior rendimento e colocado no centroda visualizacao. Nos observadores sao destacados como mais escuros.

Na Figura 3.15 e apresentada a localizacao dos nos observadores considerando dadosde uma rede real composta por 39 tracados de rota totalizando 205 nos e 211 arestas.O no de maior rendimento e colocado no centro da visualizacao. Os demais nos saodispostos em uma arvore composta pelas distancias dos nos em relacao ao no central. Os9 nos observadores sao destacados como mais escuros e as arestas redundantes, que naocompoem a arvore de distancias, sao relativamente claras. E possıvel verificar que, assimcomo acontece em redes livre de escala, espera-se que os nos com baixo grau facam partedo conjunto observador mınimo. Este e um fato importante porque, para a maioria dosnos de baixo grau nao emparelhados, e possıvel realizar um novo emparelhamento fazendocom que os nos nao emparelhados alcancem as extremidades da rede, isto e, nos folha do

Page 76: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.3. Experimentos 53

grafo. Alem disso, e possıvel inferir que a maior parte dos nos observadores podem serlocalizados em nos da extremidade da rede. Posteriormente, na Secao 3.4, o impacto dessascaracterısticas e considerado na analise de um projeto de sistema de monitoramento. Aseguir, e considerada a questao de observabilidade funcional.

3.3.2 Observabilidade funcional

Na Secao 3.2, foi constatada que a escolha do subconjunto mınimo de nos que torna arede funcionalmente observavel e eficiente. Apesar de necessaria, a condicao de eficienciaem si nao e suficiente para garantir a factibilidade de criacao de um sistema de monito-ramento. Para isso e preciso verificar a escalabilidade do conjunto observador funcional.A verificacao da escalabilidade conduz os experimentos desta Subsecao. Primeiramente,antes de considerar a questao de escalabilidade do conjunto observador funcional mınimo,e analisada na Figura 3.16, o ganho associado a utilizacao do rendimento na definicao dasprobabilidades de transmissao.

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 5 10 15 20 25 30 35 40 45 50

(a)

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 10 20 30 40 50 60 70 80 90 100

(b)

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

0 20 40 60 80 100 120 140 160

(c)

Figura 3.16: Relacao entre o rendimento e a cardinalidade de Ooc . Para uma probabilidade

de transmissao uniforme entre os vizinhos de um no, considera-se a Equacao 3.11, enquanto autilizacao do rendimento implica na utilizacao da Equacao 3.24. Em (a) tem-se o valores esperadospara m = 1 em uma rede livre de escala com n = 50 nos, n = 100 em (b) e n = 150 em (c).

Page 77: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

54 Capıtulo 3. Observabilidade de redes

A partir de uma analise da Figura 3.16, e possıvel verificar que a utilizacao do ren-dimento na construcao da matriz de transicao faz com que haja uma reducao na quanti-dade de nos observadores. Especificamente, para uma rede livre de escala com parametrom = 1, tem-se que a quantidade de nos esperada para se examinar 50% do trafego darede de forma instantanea e de 7 para n = 50, 13 para n = 100, e 19 para n = 150, seconsiderada a Equacao 3.24. No caso da Equacao 3.11, esses valores seriam de 10, 18 e27, respectivamente. Pode-se observar que enquanto a utilizacao do rendimento fez comque fosse possıvel utilizar aproximadamente 13% do total de nos, a utilizacao da trans-missao uniforme requer aproximadamente 19%. Esse fato pode ser justificado a partir deuma analise relacionando o rendimento esperado em faixas de trafego determinadas. AFigura 3.17 apresenta os resultados desse experimento.

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0-10 10-20 20-30 30-40 40-50

(a)

0.3

0.35

0.4

0.45

0.5

0.55

0.6

0.65

0.7

0-10 10-20 20-30

(b)

Figura 3.17: Relacao entre o rendimento e a quantidade de trafego instantaneo. Em (a) saoconsideradas redes livre de escala com parametro m = 1 e em (b) com parametro m = 2.

Na Figura 3.17, e possıvel verificar que nos com maior probabilidade de trafego pas-sante possuem um valor esperado de rendimento maior. Outra caracterıstica e que, paravalores maiores de m, ha uma tendencia de concentracao nas faixas mais baixas, uma vezque ha uma maior uniformizacao dos rendimentos individuais, pois as distancias dimi-nuem. Espera-se que nos com maior rendimento possuam maior probabilidade de comporo conjunto observador funcional mınimo, embasando assim a Observacao a seguir.

Observacao 3.9 (Relacao entre o rendimento e observabilidade funcional). A probabili-dade de um no compor o conjunto observador funcional mınimo e diretamente proporcionalao seu rendimento.

Esse resultado mostra que a utilizacao do rendimento esta associado a redes onde atransmissao da informacao e otimizada, que e o caso do objeto de estudo deste trabalho.Dadas essas vantagens, a metrica de rendimento sera utilizada para definicao da matrizde transicao (Equacao 3.24) nos experimentos a seguir.

Page 78: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.3. Experimentos 55

Quantidade de nos observadores

A quantidade mınima esperada de nos necessarios para garantir a observabilidade deuma rede e uma questao de escalabilidade a ser explorada. Nesse sentido, utilizando omodelo de redes complexas livre de escala e o algoritmo de busca pelo conjunto observadorfuncional mınimo, e possıvel verificar experimentalmente a relacao entre a quantidade totalde nos e a cardinalidade do conjunto observador. Para 103 instancias de redes livre deescala para cada de tamanho entre 10 e 500 os resultados, considerando α = 1/2, saoapresentados na Figura 3.18[ix].

0

10

20

30

40

50

60

70

80

90

0 50 100 150 200 250 300 350 400 450 500

Figura 3.18: Cardinalidade esperada do conjunto observador funcional mınimo para α = 1/2,considerando redes livre de escala de tamanho entre 10 e 500 nos.

Com base na Figura 3.18, e possıvel identificar que a quantidade mınima de nos ob-servadores e de uma fracao linear da quantidade total de nos. Dessa forma, tem-se quea observabilidade funcional de redes livre de escala possui um comportamento linear emrelacao a cardinalidade do conjunto de nos observadores. Especificamente, para m = 1espera-se uma quantidade aproximada de 12%, enquanto que para m = 2 esse valor espe-rado e de 16%. Essa relacao serve de suporte para a Observacao a seguir.

Observacao 3.10 (Cardinalidade do conjunto observador funcional mınimo). Ha umarelacao linear entre a quantidade de nos em uma rede e a cardinalidade esperada doconjunto observador estrutural mınimo, isto e, EOc ≃ βn, para 0 < β < 1, onde Oc e avariavel aleatoria que representa a cardinalidade de Oo

c .

A Figura 3.18 evidencia que, em redes livre de escala, a quantidade de nos observadoresaumenta em relacao ao parametro m. Esse fato pode ser explicado com base nos resultadosapresentados na Figura 3.17, onde verifica-se que os nos pelo qual passam maior parte dotrafego deixam de existir. Este fato suporta a Observacao a seguir.

Observacao 3.11 (Relacao entre densidade e observabilidade funcional). Quanto maiora densidade de um grafo, menor a probabilidade de reducao da cardinalidade do conjuntoobservador funcional mınimo.

[ix]Para estabelecer uma referencia, sera considerado o monitoramento de 50% do trafego instantaneo.

Page 79: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

56 Capıtulo 3. Observabilidade de redes

Isso se deve ao fato de que, em redes com maior densidade, ha menor diferenca entreos rendimentos dos nos, logo, sao necessarios mais nos para se obter o mesmo valor de α.Outra caracterıstica importante sobre a cardinalidade do conjunto observador mınimo eo quao provavel e seu valor esperado em relacao a enumeracao de todas as possibilidades.Essa distribuicao e apresentada na Figura 3.19.

0500

100015002000250030003500400045005000

5 10 15 20 25 30

(a)

0

500

1000

1500

2000

2500

3000

3500

4000

4500

5 10 15 20 25 30 35

(b)

Figura 3.19: Distribuicao da quantidade de nos observadores funcionais considerando 104

instancias de tamanhos n = 50, 100, 150, para m = 1 em (a) e m = 2 em (b).

Com base na Figura 3.19, e possıvel verificar que, para valores de m igual a 1 ou 2, adistribuicao de probabilidade da cardinalidade do conjunto observador mınimo de uma redelivre de escala remete ao comportamento de uma distribuicao de Poisson. A cardinalidadeesperada apresentada na Figura 3.18 expressa de forma adequada o comportamento daquantidade de nos observadores em relacao a quantidade total de nos. Alem do rendimento,o grau de um no possui relevancia em relacao a sua pertinencia ao conjunto funcionalmınimo. Essa relacao e apresentada na Figura 3.20.

0

2

4

6

8

10

12

14

0 50 100 150 200 250 300 350 400 450 500

Figura 3.20: Grau esperado relativo dos nos observadores funcionais, onde EGc e o valoresperado da variavel aleatoria Gc, que indica o grau de um no observador funcional qualquer doconjunto observador funcional mınimo.

Page 80: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.3. Experimentos 57

A partir do exposto na Figura 3.20, e possıvel verificar que o grau esperado do conjuntoobservador funcional mınimo e muito superior ao grau esperado da rede. Tal fato pode serjustificado pela seguinte sequencia de inferencias: (i) nos com maior rendimento tem maiorprobabilidade de pertencer a uma faixa alta de trafego esperado, como apresentado pelaFigura 3.17 e (ii) ha uma relacao proporcional entre o rendimento de um no a probabilidadede ter grau elevado, como apresentado pela Figura 3.7. Portanto, existe uma relacaodireta entre a faixa de trafego que passa por um no e o seu grau. Tomando como base asObservacoes 3.1 e 3.9, e possıvel estabelecer a Observacao a seguir.

Observacao 3.12 (Grau esperado no conjunto observador funcional mınimo). O grauesperado dos nos em um conjunto observador funcional mınimo e maior que o triplo dograu esperado da rede, para valores pequenos de m. Assintoticamente, essa propriedade einvariante em relacao a quantidade de nos da rede.

Neste ponto, tem-se a primeira diferenca significativa entre os conjuntos Ooe e Oo

c .Contudo, o estudo do comportamento do conjunto observador mınimo em relacao a outrasmetricas e natural. De forma que, a seguir, assim como realizado com a observabilidadeestrutural, e analisado o comportamento dos nos que compoem o conjunto observadorfuncional mınimo em relacao as metricas apresentadas na Secao A.2.

Relacao com as metricas

A seguir, e estudado o comportamento da cardinalidade do conjunto observador fun-cional mınimo em relacao ao diametro, a eficiencia e ao agrupamento de uma rede com oobjetivo de estabelecer observacoes sobre como essas caracterısticas interferem na quanti-dade de nos observadores da rede. Em relacao a influencia do diametro na quantidade denos observadores, pode-se considerar o exposto pela Figura 3.21 e a Observacao 3.13.

6

7

8

9

10

11

12

13

14

15

5 10 15 20 25 30

(a)

4.4

4.6

4.8

5

5.2

5.4

5.6

5.8

6

6.2

5 10 15 20 25 30 35

(b)

Figura 3.21: Relacao entre o diametro e a cardinalidade do conjunto observador funcional Ooc

para redes livre de escala considerado m = 1 (a) e m = 2 (b).

Page 81: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

58 Capıtulo 3. Observabilidade de redes

Observacao 3.13 (Relacao entre o diametro e a cardinalidade de Ooc). Em uma rede li-

vre de escala, representada por uma grafo G, cujo o diametro d(G) e relativamente elevado,espera-se que a cardinalidade do conjunto observador funcional mınimo Oo

c seja relativa-mente elevada. O que estabelece uma relacao proporcional entre os valores esperados de|Oo

c | e d(G).

Pode-se inferir que, se uma rede possui um diametro relativo acentuado, entao ha umadiminuicao no grau dos nos da rede. Com graus menores, ha tambem rendimentos menorese, portanto, a probabilidade de existirem nos com faixa de trafego esperado instantaneoelevado e menor. Como consequencia, sao necessarios mais nos para se obter um mesmovalor de α. E de se esperar, entao, que haja uma proporcionalidade entre o diametro deuma rede e a cardinalidade do conjunto observador funcional. Ja em relacao a eficiencia,e de se esperar um comportamento antagonico, como pode ser verificado na Figura 3.22,cujos resultados fundamentam a Observacao 3.14.

0.180.2

0.220.240.260.28

0.30.320.340.360.38

0.4

5 10 15 20 25 30

(a)

0.32

0.34

0.36

0.38

0.4

0.42

0.44

0.46

5 10 15 20 25 30 35

(b)

Figura 3.22: Relacao entre a eficiencia e a observabilidade funcional. Em (a) e consideradom = 1, enquanto em (b) considera-se m = 2. Para ambos os casos e apresentado o comportamentoda quantidade de nos observadores em relacao a eficiencia da rede.

Observacao 3.14 (Relacao entre a eficiencia e a cardinalidade de Ooc). Em uma rede

livre de escala, representada por uma grafo G, cuja eficiencia EF e relativamente alta,espera-se que a cardinalidade do conjunto observador funcional mınimo Oo

c seja relativa-mente baixa. Este fato estabelece uma relacao inversamente proporcional entre o valoresperado de |Oo

c | e EF.

Em uma rede com eficiencia relativa elevada, tem-se que o rendimento dos nos tambeme relativamente elevado. Esse aumento no rendimento dos nos faz com que haja maiorprobabilidade de existirem nos em faixas de trafego maiores. Nesse contexto, e necessariauma quantidade menor de nos para se obter a mesma soma de porcentagem de trafego α.Considerando redes com mesma densidade, quanto maior for a eficiencia, maior serao os

Page 82: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.3. Experimentos 59

graus dos nos, uma vez que as distancias entre eles sao reduzidas. Essa reducao faz comque haja maior probabilidade de agrupamento. Naturalmente, assim como a eficiencia, oagrupamento deve ser inversamente proporcional a quantidade de nos observadores funcio-nais. Por fim, em relacao ao agrupamento da rede, a cardinalidade do conjunto observadorfuncional mınimo tem o comportamento apresentado na Figura 3.23, cujos resultados fun-damentam a afirmacao da Observacao 3.15.

0.05

0.1

0.15

0.2

0.25

0.3

0.35

5 10 15 20 25 30 35

Figura 3.23: Relacao entre o agrupamento e a observabilidade funcional para n = 50, 100, 150.E apresentado o comportamento apenas para m = 2, uma vez que em redes livre de escala comparametro m = 1 o agrupamento e sempre nulo.

Observacao 3.15 (Relacao entre o agrupamento e a cardinalidade de Ooc). Em uma rede

livre de escala, representada por uma grafo G, cujo agrupamento EC e relativamentebaixo, espera-se que a cardinalidade do conjunto observador funcional mınimo Oo

c sejarelativamente alta. O que estabelece uma relacao inversamente proporcional entre o valoresperado de |Oo

c | e EC.

Analise com base em dados reais

De forma similar ao estudo realizado para Ooe , a seguir, utiliza-se a mesma base de dados

de rotas da Internet IPv6 da CAIDA. Para simular um crescimento na quantidade de nos,a fim de estudar o comportamento da cardinalidade de Oo

c , as rotas foram compostasgradativamente. O comportamento das cardinalidades dos conjuntos de nos, arestas e nosobservadores e apresentado na Figura 3.24.

0

1000

2000

3000

4000

5000

6000

7000

0 500 1000 1500 2000 2500 3000 3500 4000

Figura 3.24: Relacao entre a cardinalidade de Ooc e a quantidade de rotas, para um conjunto

de 3972 rotas. No total foram considerados 5904 nos e 6548 arestas, resultando em 1022 nosobservadores, que compoem aproximadamente 17% da quantidade de nos.

A Figura 3.24, composta por um conjunto de 3972 rotas, permite verificar o compor-tamento linear em relacao a quantidade de nos observadores. No total foram considerados

Page 83: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

60 Capıtulo 3. Observabilidade de redes

5904 nos, resultando em 1022 nos observadores, o que compoe aproximadamente 17% daquantidade total de nos. De forma que, a porcao de nos observadores esta proxima daquelaencontrada em redes livre de escala para m = 2. Alem da quantidade de nos observadores,sua localizacao tambem e informacao relevante para o estudo da viabilidade do projeto deuma sistema de monitoramento. Essa localizacao e apresentada na Figura 3.25 para umatopologia composta por 39 rotas.

Figura 3.25: Exemplo de localizacao dos nos observadores funcionais considerando α = 1/2 emdados de uma rede real composta por 39 tracados de rota. O no de maior rendimento e colocadono centro da visualizacao. Nos observadores sao destacados como mais escuros.

Na Figura 3.25 e apresentada a localizacao dos nos observadores considerando dadosde uma rede real composta por 39 tracados de rota, a mesma utilizada para ilustrar aobservabilidade estrutural na Figura 3.15. O no de maior rendimento e colocado no centroda visualizacao, enquanto que os demais nos sao dispostos em uma arvore composta pelasdistancias dos nos em relacao ao no central. Foram identificados 43 nos observadoresnecessarios para α = 1/2, que sao destacados como mais escuros. E possıvel verificar que,assim como acontece em redes livre de escala, espera-se que os nos com alto grau facamparte do conjunto observador mınimo.

Page 84: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

3.4. Consideracoes 61

Demais comentarios acerca dos resultados sao apresentados na Secao 3.4, incluindo oimpacto dessas caracterısticas e a sua relacao no projeto de sistemas de monitoramento.

3.4 Consideracoes

Os resultados apresentados neste Capıtulo compoem um nova visao sobre a localizacaode nos que realizam monitoramento em uma rede. Nessa nova visao, estabelece-se duasdefinicoes acerca da finalidade a qual os nos observadores se propoem. A primeira, de-nominada observabilidade estrutural, tem como finalidade a estimacao do estado da redea partir da observacao do estado de um subconjunto de nos. Nesse caso, como a in-formacao a ser monitorada e uma caracterıstica da propria rede e nao de seu proposito,utiliza-se o termo ‘estrutural’ para denotar um monitoramento centrado na rede. Emcontrapartida, a segunda definicao de monitoramento, denominada observabilidade funci-onal, tem como princıpio minimizar a quantidade de nos necessarios para tornar possıvela analise instantanea de uma porcentagem da informacao que trafega na rede. Nesse caso,justifica-se a denominacao com base no fato de que a finalidade do monitoramento estaassociada a funcao da rede. As duas abordagens de monitoramento apresentam carac-terısticas antagonicas em relacao as metricas que caracterizam a topologia da rede. ATabela 3.1 apresenta uma resumo do comportamento dos conjuntos observadores mınimosem relacao a essas metricas.

metrica observabilidade estrutural |Ooe | observabilidade funcional |Oo

c |densidade inversa (Observacao 3.4) direta (Observacao 3.11)grau medio inferior (Observacao 3.5) superior (Observacao 3.12)diametro inversa (Observacao 3.6) direta (Observacao 3.13)eficiencia direta (Observacao 3.7) inversa (Observacao 3.14)agrupamento direta (Observacao 3.8) inversa (Observacao 3.15)

Tabela 3.1: Influencia das metricas na observabilidade. As metricas de caracterizacao da topolo-gia apresentam comportamentos antagonicos em relacao aos dois conceitos de observabilidade. Ostermos ‘direta’ e ‘inversa’ estao associados a relacao de proporcionalidade.

Alem dos resultados apresentados de forma sucinta na Tabela 3.1, que podem seraplicados a qualquer rede cujo comportamento possa ser representado por um modelolivre de escala, e possıvel afirmar, de forma geral, as seguintes propriedades em relacaoaos conjuntos de nos observadores em redes de computadores.

3.4.1 Quantidade de nos

Apesar de uma quantidade massiva de rotas utilizadas nos experimentos com dadosreais, deve-se ter cautela quanto a significancia dos resultados, uma vez que, como ja dis-cutido na Subsecao 2.2.1, existe uma problematica acerca de dados topologicos obtidospor meio do tracado de rotas na Internet. Considerando as quantidades de nos observa-dores apresentadas nas Figuras 3.14 e 3.24 pode-se estabelecer uma quantidade relativamedia de nos observadores: (i) a quantidade esperada de nos observadores estruturais naInternet deve ser proxima de 15% da quantidade total de nos e (ii) a quantidade esperadade nos observadores funcionais na Internet, para que a analise de trafego instantanea sejade α = 1/2, deve ser proxima de 18% da quantidade total de nos.

Page 85: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

62 Capıtulo 3. Observabilidade de redes

3.4.2 Localizacao dos nos

Outra questao fundamental em relacao a factibilidade de criacao de um sistema demonitoramento para uma rede como a Internet, e a localizacao dos nos observadores.Considerando os resultados apresentados pelas metricas, ver Tabela 3.1 e o exposto nasFiguras 3.15 e 3.25, e possıvel estabelecer as Observacoes a seguir.

Observacao 3.16 (Localizacao do conjunto observador estrutural mınimo). O conjuntoobservador estrutural mınimo tem como tendencia a localizacao dos nos onde ha menorconectividade, com grande parte composta pelos nos localizados proximo as extremidadeda rede.

Observacao 3.17 (Localizacao do conjunto observador funcional mınimo). O conjuntoobservador funcional mınimo tem como tendencia a localizacao dos nos onde ha maiorconectividade, com grande parte composta pelos nos localizados proximo ao centro darede.

Os nos observadores estruturais tem como caracterıstica um grau esperado inferior aoda rede. Em redes onde ha maioria de nos observadores de baixo grau, e possıvel realizarum novo emparelhamento fazendo com que os nos nao emparelhados alcancem a extremi-dade da rede. Por exemplo, na Figura 3.15, e possıvel realizar um novo emparelhamentode forma que todos os nos observadores fiquem localizados em nos da extremidade da rede.Para o caso da Internet, isso tem como impacto direto a possibilidade de estabelecer amaioria dos nos observadores em maquinas de proposito geral, o que promove a possibi-lidade de monitoramento colaborativo a partir da participacao de usuarios finais, sem anecessidade de alteracao de dispositivos de roteamento.

Page 86: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes 63

Capıtulo 4

Visualizacao de redes

“Mathematical elegance is not a dispensable luxury

but a factor that decides between success and failure.”

Edsger Wybe Dijkstra

A etapa de elaboracao da visualizacao de um sistema de monitoramento, apresen-tada no contexto da Figura 2.2, e fundamental para o entendimento dos predicados quecompoem o estado da rede. Uma vez que a visualizacao serve de elo entre os dados e oanalista, e necessario que a apresentacao dos predicados seja realizada de forma a favorecera interpretacao. Portanto, a visualizacao deve ser projetada com base em conceitos daTeoria de Visualizacao de Informacao [Ware 2004].

Devido ao seu tamanho e diversidade, redes complexas continuam sendo desafiadorasquanto recuperacao e entendimento de informacoes associadas a sua estrutura e funcao. Avisualizacao da topologia e das caracterısticas da rede pode ajudar a superar esse desafio,no sentido de que a percepcao visual para analise de redes complexas pode prover umaaplicacao efetiva da visualizacao das relacoes existentes entre os elementos da rede e suaspropriedades.

Este Capıtulo esta organizado da seguinte forma: na Secao 4.1 e feita uma introducaoao metodo de visualizacao de redes utilizado neste trabalho. Na Secao 4.2, e apresentado omodelo de visualizacao proposto e definicoes associadas a sua eficacia. Ainda nessa Secao,e realizada a otimizacao do modelo tendo em vista seu desempenho em relacao a escala-bilidade. O desempenho do algoritmo de criacao da representacao visual e analisado noinıcio da Secao 4.3, seguido de uma analise de sua escalabilidade. Com a finalidade de es-tabelecer relacoes entre as metricas de redes complexas e a escalabilidade da representacaovisual proposta, sao realizados experimentos na Secao 4.4. Finalmente, na Secao 4.5, saofeitas algumas consideracoes.

Page 87: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

64 Capıtulo 4. Visualizacao de redes

4.1 Introducao

Sao consideradas neste Capıtulo, questoes de eficacia, eficiencia e escalabilidade dacriacao de um modelo de visualizacao de redes complexas. Para ilustrar a eficacia do mo-delo proposto, ou seja, como a visualizacao pode auxilar no entendimento dos predicados,considera-se a visualizacao da topologia formada pela composicao das rotas para maquinasdo domınio de 51 universidades brasileiras, apresentada na Figura 4.1.

máquina local

Figura 4.1: Composicao de tracados de rota (via traceroute) de uma maquina local para o domıniode 51 universidades brasileiras. Dos 239 nos identificados, apenas naqueles que hospedam o sıtioda universidade foi realizado o escaneamento de portas. A cor e o tamanho desses nos indicam aquantidade de portas abertas. Figura adaptada de [Medeiros, Brito Jr., Pires & Santos 2009].

A maquina que desempenhou o procedimento de identificacao na rede e discriminada naFigura 4.1 como ‘maquina local’. A apresentacao das informacoes realizada na Figura 4.1e baseada no trabalho de Medeiros & Santos (2008). Trata-se de um modelo interativode visualizacao de grafos no qual os nos sao dispostos de forma hierarquica em aneisconcentricos. Esse modelo foi inicialmente proposto por Yee et al. (2001).

Page 88: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

4.1. Introducao 65

Considerando a etapa de elaboracao da visualizacao na Figura 2.2, ve-se que o analistada informacao tem a possibilidade de interagir com a representacao visual a fim de explorarpredicados e extrapolar padroes e propriedades relacionadas a topologia da rede. Pode-seidentificar as seguintes propriedades do modelo apresentado na Figura 4.1 [Ware 2004]:(i) prove a habilidade de compreensao de uma grande quantidade de dados, (ii) permite apercepcao de propriedades emergentes nao antecipadas, (iii) revela problemas com os dadosou com a forma com que foram adquiridos, (iv) facilita o entendimento de caracterısticasde pequena e larga-escala de forma simultanea e (v) facilita a formacao e elaboracao dehipoteses. Para projetar uma visualizacao adequada e necessario conhecer a naturezados dados para fins de mapeamento em estruturas visuais adequadas. De acordo coma natureza do predicado pode-se mapea-lo para uma das propriedades apresentadas naTabela 4.1 [Bertin 1983, Card et al. 1999].

(posição)

tamanhotons de cinza

cor

textura

forma

orientação

propriedade espacial propriedade do objeto

diferença

extensão

Tabela 4.1: Representacao por meio da utilizacao das propriedades retinais. As propriedades saoagrupadas horizontalmente de acordo com sua natureza espacial ou relacionada a propriedades doobjeto, e verticalmente de acordo o proposito de representacao.

Um predicado pode ser classificado quanto a sua natureza de quatro formas diferentes:(i) nominal: para predicados em que ha distincoes entre seus possıveis valores, sem quehaja uma ordem natural entre eles, (ii) ordinal: para predicados em que ha uma ordemnatural no espaco de possibilidades, (iii) intervalar: quando o predicado e definido emtermos de intervalos entre seus valores, (iv) relacional: quando e possıvel utilizar de formaexpressiva numeros reais e existe um valor zero de referencia. Para cada propriedadedescrita na Tabela 4.1 existe um grau de eficacia relacionado a natureza do predicado quese deseja representar. A eficacia relativa de cada propriedade em relacao a natureza dopredicado e apresentada na Tabela 4.2 [Bertin 1999].

(posição)

tamanhotons de cinza

cor

textura

forma

orientação

propriedadeespacial

propriedadedo objeto

diferença

extensão

NOQ NOQ

eficaz

eficácia marginal

ineficaz

Tabela 4.2: Eficacia da representacao de cada propriedade retinal. Onde (Q) indica dados denatureza quantitativa, (O) indica dados de natureza ordinal, e (N) dados de natureza nominal.

Page 89: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

66 Capıtulo 4. Visualizacao de redes

Com base na Tabela 4.2, onde predicados de natureza intervalar e relacional sao consi-derados quantitativos, e possıvel projetar um sistema de visualizacao eficaz. Por exemplo,ve-se que nao se deve utilizar forma para representar predicados de natureza quantita-tiva ou ordinal, assim como nao se deve utilizar tons de cinza para representar dados denatureza nominal. Porem, e tambem necessario verificar a eficiencia e a escalabilidade e,sobre esses quesitos, e necessario avancar no desenvolvimento teorico da tecnica de visua-lizacao apresentada na Figura 4.1, denominada visualizacao dinamica de grafos por meiode disposicao radial [Yee et al. 2001].

4.2 Modelo proposto

O exemplo apresentado na Figura 4.1, demonstra a eficacia da visualizacao de in-formacao na elaboracao de aplicacoes que podem promover o entendimento de uma quan-tidade massiva de dados, como e o caso da estrutura e da funcao de rede complexas.Uma caracterıstica proeminente de qualquer rede, e sua estrutura topologica. As propri-edades topologicas estruturais de redes complexas sao capazes de revelar boa parcela dosprincıpios de organizacao encontrados em redes reais. Devido a quantidade de nos, saonecessarios questionamentos acerca da escalabilidade e eficiencia da tecnica de visualizacaoque se pretende usar.

Nesta Secao, a escalabilidade e a eficiencia da visualizacao de redes complexas e utili-zada como parametro para se definir criterios da aplicabilidade da visualizacao da topo-logia de redes reais. A fim de resolver possıveis problemas de escalabilidade, e comum aindagacao sobre a utilizacao de modelos tridimensionais para a visualizacao. Portanto, econveniente esclarecer que, a utilizacao de representacao bidimensional e mais adequada,uma vez que os dispositivos de visualizacao sao naturalmente bidimensionais. Alem disso,a utilizacao de dimensoes extras causam oclusao de informacao, podendo prejudicar assimo entendimento de seu contexto. Em adicao, a interacao com ambientes bidimensionais emais intuitiva e possui menos requisitos de desempenho [Card et al. 1999].

A visualizacao da estrutura topologica de uma rede pode ser baseada na visualizacaode grafos por meio da disposicao de seus nos de forma radial. Embora a visualizacaodos dados em coordenadas cartesianas seja, geralmente, mais natural [Diehl et al. 2010],a visualizacao por disposicao radial oferece elementos de codificacao da informacao queauxiliam no entendimento de propriedades topologicas da rede [Medeiros, Brito Jr., Pires& Santos 2009]. Apesar da visualizacao de arvores ser mais comum por meio da disposicaotradicional ou ortogonal [Burch et al. 2011], a representacao por disposicao radial e maisadequada para visualizacao de grafos com ciclos. Isso porque o conjunto de grafos planaresem nıvel e um subconjunto proprio do conjunto de grafos planares radiais [Bachmaier 2007].Essa propriedade da disposicao radial, faz com que seu uso torne possıvel minimizar aquantidade de cruzamento entre arestas [Bachmaier et al. 2005]. Tais fatos, fazem comque a disposicao radial produza uma estetica mais adequada na visualizacao das redesque sao objeto de estudo deste trabalho [Bennett et al. 2007]. Na proxima Secao, saodefinidos os conceitos associados a uma visualizacao eficaz por meio da disposicao radial,para posteriormente, verificar-se sua eficiencia e escalabilidade.

Page 90: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

4.2. Modelo proposto 67

4.2.1 Disposicao radial

Para que seja possıvel dissertar sobre a escalabilidade da disposicao radial, e necessariasua definicao em termos matematicos. Nesta Subsecao, sao apresentados os conceitos e asregras de distribuicao dos nos na visualizacao. Posteriormente, e explorada a questao decomo minimizar a quantidade de espaco necessario para apresentar o grafo, sem que aspropriedades que tornam a visualizacao eficaz sejam comprometidas. Na Figura 4.2, saoapresentadas as regras gerais de distribuicao dos nos na visualizacao por disposicao radial.

(a) (b) (c)

Figura 4.2: Ilustracao das regras da visualizacao por disposicao radial. Em (a) cada anel hl eespacado de forma igual por um fator r, denominado raio base, onde o raio de hl e dado por lr.Em (b) cada no vi possui seu proprio espaco angular θi onde apenas vi e seus filhos na arvore decobertura do grafo podem ser dispostos. Para o grafo apresentado em (c), tem-se como exemplodo espaco angular θ0 = [0, 2π], θ1 = [0, π] e θ5 = [π, 3π/2].

Pelo exposto na Figura 4.2, a disposicao radial e projetada para representar arvorescom raiz. Para o caso de redes, e possıvel considerar a utilizacao de uma das arvores decobertura mınima do grafo, enquanto a raiz pode ser alterada para qualquer no interativa-mente. A raiz de uma arvore, aqui denominada vroot, e localizada no centro da visualizacaoradial, ou seja, no anel h0, denominado anel nulo. No caso do grafo apresentado a direitada Figura 4.2, vroot = v0. Os nos filhos do no raiz sao dispostos no anel seguinte, no caso,h1, e o processo de localizacao dos demais nos segue de forma similar e recursiva. Cadaanel hl possui perımetro 2πlr. A seguir e apresentada a definicao dessa visualizacao.

Definicao 4.1 (Disposicao radial). A visualizacao por disposicao radial e definida comoa visualizacao de uma arvore T com raiz vroot em um plano, onde cada um dos nos vi,representado por circunferencias, e localizado no perımetro de um dos aneis concentricoshl. Cada no possui duas propriedades relacionadas a sua apresentacao, espaco e posicao:

1. O espaco angular de um no vi e definido como o intervalo angular θi onde o no devedesenhar seus filhos. O no raiz vroot possui espaco angular θroot = [0, 2π] no sentidoanti-horario. Assim, o espaco angular de um no e dividido entre seus filhos, e assimsucessivamente;

2. A posicao de um no vi e definida em coordenadas polares pi = (di, ai), onde di e aisao o raio e o angulo que definem a posicao do no, respectivamente. Se a distanciaentre o no vi e o no raiz e de li arestas, entao di = lir, e o no sera localizado noperımetro de hli . O angulo ai e definido na metade do intervalo θi.

E conveniente notar que nao ha restricao em relacao ao valor do raio base r. Dessaforma, tem-se o raio base como parametro livre da visualizacao. Essa liberdade e exploradaa fim de minimizar a quantidade de espaco necessario para representacao da rede.

Page 91: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

68 Capıtulo 4. Visualizacao de redes

4.2.2 Otimizacao

O problema de otimizacao da visualizacao por disposicao radial sera definido em termosda minimizacao do raio base r para o desenho de uma arvore T sem que haja sobreposicaodos nos. Essa abordagem remete a uma otimizacao quantitativa do espaco utilizado paravisualizacao sem comprometer as virtudes qualitativas da expressividade da visualizacaopor disposicao radial. Isso porque, com a restricao de nao-sobreposicao, as capacidadesde representacao das propriedades visuais sao preservadas[i].

Caso a analise apresente casos em que ha problemas de escalabilidade, e possıvel utili-zar outras estrategias de minimizacao como, por exemplo, considerar o uso de tecnicas dedistorcao em detrimento da qualidade. Mesmo assim, tais condicoes de nao-escalabilidadesao desconhecidas e a analise de como elas podem ser caracterizadas tambem e um resul-tado valido. Esta parte do trabalho tem como objetivo: (i) a priorizacao da expressividadeda visualizacao e (ii) a caracterizacao dos casos onde ha problemas de escalabilidade. ADefinicao 4.1 e estendida a fim de especificar o conceito de expressividade e minimalidade.

Definicao 4.2 (Disposicao radial expressiva). A visualizacao de uma arvore T por meioda disposicao radial e dita expressiva se esta de acordo com a Definicao 4.1 e respeita arestricao adicional de nao haver sobreposicao entre os nos.

Definicao 4.3 (Disposicao radial expressiva mınima). A visualizacao de uma arvore Tpor meio da disposicao radial expressiva e mınima se esta em acordo com a Definicao 4.2e atende a restricao adicional de que o espaco utilizado e mınimo.

A Definicao 4.2 aborda a questao da expressividade da visualizacao por disposicao ra-dial, enquanto a Definicao 4.3 disserta sobre sua escalabilidade sem que haja detrimentoda propriedades qualitativas da visualizacao. Como o unico parametro livre da visua-lizacao e o raio base r, e necessario que a otimizacao do espaco utilizado pela visualizacaoconsista na minimizacao de r considerando as restricoes de expressividade. O seguinteLema estabelece o espaco mınimo na disposicao radial expressiva.

Lema 4.1 (Equivalencia entre o raio base e o espaco). Encontrar o espaco mınimo paravisualizacao por disposicao radial expressiva, nos termos Definicao 4.3, e equivalente aencontrar o raio base mınimo, denominado ro, que nao viola as restricoes de localizacaodos nos e de sobreposicao.

Demonstracao. A partir da equacao que define a area de uma cırculo, e possıvel representara area que define o espaco necessario para se estabelecer uma visualizacao por disposicaoradial. A area necessaria para a visualizacao pode ser aproximada pela area do cırculodelimitado pelo anel mais externo, representada por

S(r) ≃ π(lr)2, (4.1)

onde l e ındice do anel mais externo. Como a unica variavel livre da Equacao 4.1 e r,entao, para minimizar S(·) e necessario minimizar r. Ao se encontrar o valor mınimo de rque nao viola as restricoes da Definicao 4.2, se encontra o valor mınimo de S(·). C.Q.D.

[i]Embora algumas tecnicas de visualizacao por disposicao radial proponham estrategias de controle dedistorcao e sobreposicao em trechos mais distantes do centro da visualizacao, e conveniente evita-las, umavez que podem causam oclusao de informacao.

Page 92: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

4.2. Modelo proposto 69

A partir do Lema 4.1, e possıvel estabelecer parte da equacao a ser minimizada. Pararepresentar tal equacao por completo, a seguir, sao apresentados e discutidos os possıveistipos de sobreposicao e sua caracterizacao.

Sobreposicao dos nos

Dadas as Definicoes 4.1, 4.2 e 4.3 e o Lema 4.1, e possıvel criar um modelo que re-presente o problema de otimizacao como uma funcao de aspectos da visualizacao. Paratornar factıvel a solucao desse problema, na Figura 4.3 sao apresentados os dois possıveistipos de sobreposicao e sao estabelecidas as seguintes definicoes.

(a) (b)

Figura 4.3: Restricoes de sobreposicao da disposicao radial expressiva. Em (a), ha sobreposicaoentre nos do mesmo anel, denominada sobreposicao angular. Em (b), ha sobreposicao entre nos deaneis adjacentes, denominada sobreposicao parental, uma vez que sempre envolve nos conectados.

Definicao 4.4 (Sobreposicao angular). Se nos se sobrepoem no mesmo anel, diz-se quea visualizacao possui sobreposicao angular.

Definicao 4.5 (Sobreposicao parental). Se ha sobreposicao entre nos em aneis diferentes,diz-se que a visualizacao possui sobreposicao parental.

Em ambos os tipos de sobreposicao, o valor do raio base r deve ser aumentado. Esseaumento depende, dentre outros, de parametros como o raio do no e a quantidade de nosno mesmo anel. Faz-se necessaria a formalizacao de conceitos que expressem o espaconecessario para se desenhar um no. Assim, e possıvel determinar como se deve dar oaumento de r quando houver sobreposicao. A seguir, tal formalizacao e apresentada paraambos os tipo de sobreposicao.

Sobreposicao angular

Para evitar a sobreposicao angular, e necessario atribuir ao espaco angular de cada novi um intervalo angular suficientemente largo. Para isso, e necessario calcular o espacoangular mınimo que cada cada no do grafo precisa. O que e apresentado pelo seguinteLema.

Lema 4.2 (Espaco angular necessario de um no). O espaco angular necessario pararepresentar de forma expressiva um no vi 6= vroot em funcao do raio base r, e dado por

j(vi, r) = 2 arcsin

(

rilir

)

, (4.2)

onde li representam o anel onde vi esta localizado e ri o raio de sua circunferencia.

Page 93: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

70 Capıtulo 4. Visualizacao de redes

Demonstracao. Supondo o cenario descrito na Figura 4.4a, onde o no vi esta distante lir docentro da visualizacao h0, e que ri e o raio do no, tem-se que o angulo mınimo φ necessariopara desenhar vi obedece a seguinte relacao sin(φ/2) = ri/lir. Na Definicao 4.1, tem-se queo no vi esta localizado no anel hli , e que r e o raio base. Dessa forma, e possıvel reescrevera relacao como φ = 2 arcsin(ri/lir). Finalmente, para tornar explicita a dependencia devi e r utiliza-se a denominacao j(vi, r) para φ. C.Q.D.

(a) (b) (c)

Figura 4.4: Espaco angular e raio base necessarios para evitar sobreposicao. Em (a), e descritoo espaco angular necessario para desenhar o no vi centrado em pi e distante lir do centro h0. Em(b), sao apresentados dois casos relevantes sobre a distribuicao hierarquica do espaco angular, adireita, o espaco angular do no nao e suficiente para evitar sobreposicao entre os filhos. Em (c),para evitar sobreposicao parental o valor do raio base deve ser pelo menos igual a maior soma dosraios de nos adjacentes, no exemplo, r deve ser maior ou igual a (r1 + r2).

O valor do espaco angular, como expresso pela Equacao 4.2, nao e suficiente paragarantir a nao sobreposicao angular entre o filhos de um no. Devido ao carater recursivoda distribuicao do espaco angular dentre os filhos de um no, o valor de θi deve ser grandeo suficiente para nao forcar sobreposicao dentre seus filhos, ver exemplo da Figura 4.4b,que e base para o seguinte Lema.

Lema 4.3 (Espaco angular necessario para evitar sobreposicao angular). O espaco an-gular necessario para se evitar sobreposicao angular para cada no vi, nos termos da De-finicao 4.4, em uma arvore T , e dado por

s(vi, r) = max

j(vi, r),∑

vj∈k(vi)

s(vj , r)

, (4.3)

onde k(vi) denota os filhos do no vi na arvore T .

Demonstracao. Para calcular o espaco angular necessario para se evitar sobreposicao angu-lar, e necessario navegar na arvore a partir dos nos folha. Dessa forma, o espaco angular deum no sera o valor maximo entre aquele necessario para desenhar a si proprio, e aquele ne-cessario para desenhar seus filhos. No primeiro caso, e possıvel utilizar a Equacao 4.2. Nosegundo, a soma dos angulos dos nos filhos pode ser obtida por

vj∈k(vi)j(vj , r). Dessa

forma, tal demostracao apresenta uma definicao recursiva do espaco angular necessario,que pode ser representada por s(vi, r) = maxj(vi, r),

vj∈k(vi)s(vj , r). C.Q.D.

Page 94: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

4.2. Modelo proposto 71

A Equacao 4.3 sugere um procedimento recursivo para calcular o espaco angular paracada no, a partir da definicao previa do raio base r, a fim de evitar a sobreposicao angular.A partir do resultado apresentado pelo Lema 4.3, e possıvel calcular o raio base mınimo afim de evitar a sobreposicao angular, como apresentado pelo seguinte Lema.

Lema 4.4 (Raio base mınimo necessario para evitar sobreposicao angular). O raio basemınimo necessario para se evitar sobreposicao angular, em uma visualizacao por disposicaoradial expressiva, para uma arvore T com raiz vroot, denominado roa, e dado por

roa =1

vj∈k(vroot)

s(vj , 1), (4.4)

onde k(vroot) denota o conjunto formado pelos filhos do no raiz vroot.

Demonstracao. Supondo que o espaco disponıvel para se desenhar os filhos do no raiz vroote dado por θroot. Entao, o valor de roa mınimo necessario para se desenhar tais nos resultano segmento de arco roaθroot. Dessa forma, ha de se descobrir uma funcao que compute oraio base mınimo a partir da quantidade de espaco angular disponıvel. Tal funcao teriao papel inverso daquele representado pela Equacao 4.3. Dessa forma, tem-se a proporcio-nalidade roaθroot = rs(vroot, r), para qualquer valor de r. Como a funcao j(vi, r) nao estadefinida para o no raiz, a relacao pode ser reescrita como roaθroot = r

vj∈k(vroot)s(vj , r).

Finalmente, fazendo r = 1, por questao de simplicidade, e assumindo que o no raiz possuitodo o espaco angular, ou seja, θroot = 2π, tem-se que, para se evitar sobreposicao angular,o raio base mınimo e dado pela relacao roa = (1/2π)

vj∈k(vroot)s(vj , 1). C.Q.D.

Sobreposicao parental

O problema de sobreposicao parental pode ser evitado de forma direta, ja que esse tipode sobreposicao se da apenas quando existe a possibilidade de que dois nos adjacentes naarvore possuam soma de raios maior que o raio base. E necessario estabelecer um raiobase mınimo que nao seja suscetıvel a tal possibilidade, como o definido no seguinte Lema.

Lema 4.5 (Raio base mınimo necessario para evitar sobreposicao parental). O raiobase mınimo necessario para se evitar sobreposicao parental, em uma visualizacao pordisposicao radial expressiva, para uma arvore T , denominado roc , e dado por

roc = max(vi,vj)∈ET

(ri + rj), (4.5)

onde ET representa o conjunto de arestas da arvore T .

Demonstracao. Para garantir que nao ha sobreposicao entre nos em aneis adjacentes hle h(l+1), e necessario garantir que a diferenca entre os raios dos aneis, respectivamentelr e (l + 1)r, isto e, ((l + 1)r − lr) deve ser maior ou igual que a soma dos raios detodos os pares nas arestas da arvore T , como exemplificado na Figura 4.4c. Assim, umraio base suficiente para se evitar sobreposicao parental seria qualquer um para o qual aseguinte sentenca (∀(vi, vj) ∈ ET )(r ≥ (ri + rj)) e verdadeira. Portanto, para minimizartal raio base basta considerar o menor valor de r para que essa sentenca seja satisfeita.Naturalmente, a solucao desse problema e dual ao problema de achar o maximo valor de(ri + rj), ou seja, roc = max(vi,vj)∈ET (ri + rj). C.Q.D.

Page 95: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

72 Capıtulo 4. Visualizacao de redes

A partir dos resultados estabelecidos pelos Lemas 4.4 e 4.5, e possıvel criar um proce-dimento que calcula o raio base mınimo necessario para a visualizacao de uma arvore pormeio da disposicao radial expressiva. Esse resultado e apresentado pelo Teorema a seguir.

Teorema 4.1 (Raio base mınimo para a disposicao radial expressiva). O raio basemınimo necessario para a visualizacao de uma arvore por meio da disposicao radial ex-pressiva, denominado ro, pode ser calculado pela expressao

ro = maxroa, roc, (4.6)

onde roa e roc sao aqueles apresentados pelos Lemas 4.4 e 4.5, respectivamente.

Demonstracao. O raio base mınimo que nao viola as propriedades de expressividade dadisposicao radial e aquele que esta em acordo tanto com a nao-sobreposicao angular quantocom a nao-sobreposicao parental. Dessa forma, o raio base mınimo ro necessario paragarantir a expressividade e o maior dentre roa e roc , como apresentados pelas Equacoes 4.4e 4.5, respectivamente. C.Q.D.

A Equacao 4.6 representa um papel fundamental para o estudo da escalabilidade davisualizacao por disposicao radial. Especificamente, o Teorema 4.1 pode ser utilizado paraestabelecer limites inferiores e superiores em relacao a escalabilidade, alem do comporta-mento medio da visualizacao de redes complexas. Porem, antes de abordar tal questao, aseguir e apresentado o algoritmo de calculo do raio base mınimo.

Solucao para o raio base mınimo

Para solucionar o problema de calculo do raio base mınimo para a visualizacao pordisposicao radial expressiva, sao propostos dois procedimentos. No primeiro, tem-se comoobjetivo o calculo do espaco angular necessario para desenhar um dado no a partir daEquacao 4.3. Esse procedimento tem caracterıstica recursiva, similar a definicao de s(vi, r),e e apresentado no Algoritmo a seguir.

Algoritmo 4.1 (Calculo do espaco angular necessario). Calculo do espaco angular ne-cessario para desenhar a subarvore com raiz no no vi localizado no anel li, considerandoraio base r.

algoritmo espaco-angular(vi, li, r)1: No vi localizado no anel li, e raio base r.2: j ← 2 arcsin(ri/(lir))3: s← 04: para cada vj ∈ k(vi) faca5: s← s + espaco-angular(vj , li + 1, r)6: fim para7: retorne maxj, s Espaco angular necessario para desenhar vi.

Onde as variaveis j e s remetem as Equacoes 4.2 e 4.3, respectivamente.

O Algoritmo 4.1 pode ser utilizado para computar o raio base mınimo para evitarsobreposicao angular na visualizacao por disposicao radial expressiva. E possıvel definiro proximo algoritmo que, a partir das Equacoes 4.5 e 4.6, e capaz de calcular o raio basemınimo para a visualizacao por disposicao radial expressiva. O procedimento iterativo debusca de roc , e o calculo de roa e realizado por meio do Algoritmo 4.1.

Page 96: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

4.3. Analise 73

Algoritmo 4.2 (Calculo do raio mınimo). Calculo do raio mınimo necessario para de-senhar uma arvore T com raiz no no vroot.

algoritmo raio-minimo(T, vroot)1: Uma arvore T = 〈N,ET 〉, com raiz vroot.2: rc ← 03: para cada (vi, vj) ∈ ET faca4: se rc < ri + rj entao5: rc ← ri + rj6: fim se7: fim para8: θ ← 09: para cada vi ∈ k(vroot) faca

10: θ ← θ + espaco-angular(vi, 1, 1)11: fim para12: ra ← θ/(2π)13: retorne maxra, rc Raio base mınimo como definido pelo Teorema 4.1.Onde as variaveis ra e rc remetem as Equacoes 4.4 e 4.5, respectivamente.

Na primeira parte do Algoritmo 4.2, da linha 2 a 7, e realizado calculo descrito pelaEquacao 4.5. A segunda parte, da linha 8 a 12, soluciona-se a Equacao 4.4. Por fim, oretorno do algoritmo utiliza como base a Equacao 4.6 para computar o raio base mınimo.Dada a existencia de um algoritmo para minimizacao do espaco necessario para visua-lizacao de uma rede de forma eficaz, deve-se considerar entao as questoes de eficiencia eescalabilidade.

4.3 Analise

Os algoritmos apresentados na Secao anterior devem ser submetidos a uma analise dedesempenho, uma vez que pretende-se utiliza-los para visualizacao de redes com grandequantidade de nos. Por causa do tamanho de entrada de magnitude consideravel, e ne-cessario que tais algoritmos possuam complexidade de tempo polinomial, preferencial-mente de ordem linear, uma vez que esse e o limite inferior para esse tipo de algoritmo.Alem disso, e necessario verificar a escalabilidade da visualizacao produzida pelos algorit-mos. Nesta Secao, a complexidade em tempo e a escalabilidade da visualizacao em relacaoaos Algoritmo 4.1 e 4.2 e analisada.

4.3.1 Tempo de execucao esperado

Na analise do tempo de execucao dos Algoritmos 4.1 e 4.2 considera-se a representacaopor lista de adjacencia de uma arvore de cobertura T = 〈N,ET 〉 da rede representada pelografo G = 〈N,E〉, onde ET ⊆ E e as arestas em ET nao formam ciclos. Considerandoa aplicacao desses algoritmos ao estudo de redes complexas, onde as quantidades saoexpressas, geralmente, na forma de valor esperado, serao utilizadas as variaveis aleatoriasK e H para representar a quantidade de filhos e a altura de um no qualquer da arvore,respectivamente. Como a complexidade do Algoritmo 4.2 depende da complexidade doAlgoritmo 4.1, a analise comeca pelo Algoritmo 4.1.

Page 97: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

74 Capıtulo 4. Visualizacao de redes

Teorema 4.2 (Tempo de execucao esperado do algoritmo ‘espaco-angular()’). O tempode execucao esperado para calcular o espaco angular necessario para cada no da arvoreutilizando o Algoritmo 4.1 e da ordem de Θ(n), ou seja, linear e proporcional a quantidadede nos.

Demonstracao. Utilizando tecnicas da analise de algoritmos [Cormen et al. 2009], tem-seque o tempo de execucao esperado do Algoritmo 4.1 para uma arvore de altura esperadaEH, representado por T4.1(l), pode ser calculado a partir da solucao da seguinte equacaode recorrencia

T4.1(l) = α + β EK+ T4.1(l + 1) EK, (4.7)

com caso base definido na altura esperada EH, na forma

T4.1(EH) = α, (4.8)

onde α = c2 + c3 + c4 + c7, β = c4 + c5, e ci representam o custo em tempo de execucaoda linha i do algoritmo. Ao se aplicar substituicoes sucessivas [Brassard & Bratley 1996]usando o fato de que somente havera recursao nos primeiros EH− 1 nıveis da arvore, epossıvel reescrever a equacao de recorrencia como

T4.1(l) = α

EH−l−2∑

j=0

EjK+ β

EH−l−1∑

j=1

EjK+ αEEH−l−1K, (4.9)

onde EjK representa a j-esima potencia de EK. Para aplicacao do algoritmo a partirdo no raiz, isto e, l = 0, o resultado do primeiro somatorio e dado por

EH−2∑

j=0

EjK =EEH−1K − 1

EK − 1, (4.10)

e o do segundo somatorio por

EH−1∑

j=1

EjK =EEHK − EK

EK − 1. (4.11)

Utilizando o resultado apresentado pelo Lema C.11, e possıvel verificar que a Equacao 4.11(que e de maior ordem que a Equacao 4.10) e da ordem de Θ(EEH−1K). Utilizandoainda o resultado do Lema C.12, e possıvel expressar a complexidade do algoritmo emfuncao da quantidade esperada de nos. De forma que tem-se T4.1(l) ∈ Θ(EN), onde N ea variavel aleatoria que representa a quantidade de nos da rede. Finalmente, considerandoque a quantidade de nos da rede e conhecida e nao necessita ser representada por seu valoresperado, entao o tempo esperado de execucao do Algoritmo 4.1 e da ordem de Θ(n), ouseja, linear e proporcional a quantidade de nos. C.Q.D.

Teorema 4.3 (Tempo de execucao esperado do algoritmo ‘raio-minimo()’). O tempoesperado de execucao necessario para se calcular o raio base mınimo para visualizacao pordisposicao radial expressiva utilizando o Algoritmo 4.2 e da ordem de Θ(n), ou seja, lineare proporcional a quantidade de nos.

Page 98: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

4.3. Analise 75

Demonstracao. O tempo de execucao esperado do Algoritmo 4.2, representado por T4.2(e),onde e representa a quantidade de arestas da arvore, pode ser expresso por

T4.2(e) = α + βe + (γ + T4.1(1)) EK (4.12)

onde α = c2 + c3 + c8 + c9 + c12 + c13, β = c3 + c4 + c5, γ = c9 + c10. Como em uma arvoree = n − 1 e T4.1(1) ∈ Θ(EEH−2K), entao a complexidade do algoritmo sera definidapela funcao majorante entre Θ(n) e Θ(EEH−1K), considerando o segundo e o terceirotermo da Equacao 4.12, respectivamente. Utilizando ainda o resultado do Lema C.12 nosegundo termo, e possıvel expressar a complexidade do algoritmo em funcao da quantidadeesperada de nos. Tem-se, entao, T4.2(e) ∈ Θ(EN). Finalmente, considerando que aquantidade de nos da rede e conhecida e nao necessita ser representada por seu valoresperado, entao o tempo esperado de execucao do Algoritmo 4.2 e da ordem de Θ(n), ouseja, linear e proporcional a quantidade de nos. C.Q.D.

A partir do resultado obtido pelo Teorema 4.3 e possıvel afirmar que a visualizacao pordisposicao radial expressiva mınima, a partir da utilizacao do Algoritmo 4.2, e eficiente.Portanto, para que o metodo de visualizacao proposto seja praticavel para redes comquantidade massiva de nos, resta verificar a questao da escalabilidade.

4.3.2 Escalabilidade da visualizacao

Para que se possa discutir sobre a escalabilidade da visualizacao por disposicao radialexpressiva mınima e necessario se estabelecer parametros de referencia. Por exemplo,considerando limites teoricos para a escalabilidade, tem-se: (i) a quantidade maxima denos em relacao a area de uma visualizacao bidimensional e (ii) a quantidade maxima denos dispostos em aneis concentricos. Esta Subsecao tem como finalidade estabelecer taislimites para posteriormente avaliar a escalabilidade esperada da visualizacao por disposicaoradial mınima. Para estabelecer uma relacao entre a quantidade maxima de nos em umavisualizacao bidimensional, e apresentado o seguinte Lema.

Lema 4.6 (Quantidade maxima de nos por area). A quantidade maxima de entidadesbidimensionais n por area A de uma visualizacao bidimensional e da ordem de O(A), senao ha sobreposicao entre as entidades, ou seja, n ∈ O(A).

Demonstracao. Mesmo que as entidades ocupem espaco mınimo e nao haja desperdıciode espaco da area da visualizacao, se nao ha sobreposicao entre as entidades, entao aquantidade de entidades ainda e limitada linearmente pela area A. C.Q.D.

A partir do Lema 4.6 e possıvel afirmar que O(A) e limite superior para a quantidadede nos em qualquer visualizacao bidimensional expressiva, isto e, em que nao a sobre-posicao. Dessa forma, e estabelecido o primeiro parametro de escalabilidade para tecnicasde visualizacao expressivas. E conveniente estabelecer analise semelhante para tecnicasde visualizacao expressivas em que ha disposicao das entidades bidimensionais em aneisconcentricos, onde a visualizacao por disposicao radial expressiva e caso especıfico.

Lema 4.7 (Quantidade maxima de nos distribuıdos em aneis concentricos). A quanti-dade maxima de nos n que podem ser distribuıdos sem sobreposicao em l aneis concentricosigualmente espacados e da ordem de n ∈ Θ(l2).

Page 99: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

76 Capıtulo 4. Visualizacao de redes

Demonstracao. Por questao de simplicidade, mas sem perda de generalidade, e possıvelconsiderar que todos os nos possuem mesmo raio r0. Para garantir que nao ha sobreposicaoparental, tem-se que o raio base e dado por 2r0. Tem-se, pela Equacao 4.2, que o espacoangular e uma funcao de l para todos os nos, qual seja

θ(l) = 2 arcsin

(

1

2l

)

. (4.13)

Como em todos os aneis a quantidade de espaco angular e de 2π, entao a quantidademaxima possıvel de nos que podem ser dispostos no anel hl sem sobreposicao e dadapor ⌊2π/θ(h)⌋. Onde a operacao de ⌊·⌋ e necessaria para garantir que a quantidade sejainteira. Sabendo que para l = 0 pode-se dispor apenas 1 no, e que para o restante dos laneis pode-se utilizar a razao de 2π pela Equacao 4.13, a quantidade maxima de nos em laneis concentricos e dada por

n = 1 +l

k=1

π

arcsin(

12k

)

. (4.14)

A partir do resultado apresentado pelo Lema C.13, tem-se que a funcao do somatorio eda ordem de Θ(l), o que faz com que o resultado do somatorio seja da ordem de Θ(l2).Portanto, tem-se que n ∈ Θ(l2). C.Q.D.

A partir do resultado apresentada pelo Lema 4.7 e possıvel estimar a escalabilidadeda quantidade de nos em uma visualizacao baseada na disposicao dos nos em aneisconcentricos. Essa relacao e apresentada pelo seguinte Lema.

Lema 4.8 (Relacao entre quantidade de nos em aneis concentricos e a area). A quanti-dade maxima de nos n em uma visualizacao expressiva baseada na disposicao dos nos emaneis concentricos e da ordem de n ∈ Θ(A), onde A e a area do anel de maior raio.

Demonstracao. A area de uma visualizacao bidimensional baseada na disposicao dos nosem aneis concentricos e dada por

A ≃ π(2lr0)2, (4.15)

onde l e a quantidade de aneis e r0 e o raio dos nos, o que implica, em acordo com oexposto na demostracao do Lema 4.7, que o raio base e dado por 2r0. Dada a relacaon ∈ Θ(l2) apresentada no Lema 4.7, e possıvel determinar que l ∈ Θ(

√n), pela simetria

do operador assintotico. Tem-se que l ≃ α√n, para alguma constante positiva α. A partir

da substituicao de l na Equacao 4.15 e possıvel estabelecer que

A ≃ πn(2αr0)2, (4.16)

de onde e possıvel verificar que A ∈ Θ(n), uma vez que π(2αr0)2 e uma constante. Por-

tanto, dada a simetria do operador assintotico, tem-se que n ∈ Θ(A). C.Q.D.

Com os resultados apresentados pelos Lemas 4.6 e 4.8 e possıvel afirmar que o limiteteorico de quantidade de nos por area em uma visualizacao baseada na disposicao dosnos em aneis concentricos atinge o limite teorico da visualizacao bidimensional. Tal com-portamento pode ser considerado o melhor caso de escalabilidade da visualizacao. Dessaforma, pode-se considerar a possibilidade de que a disposicao radial expressiva mınimaseja escalavel. Mesmo assim, ha casos em que a quantidade de nos nao e linear em relacaoa area da visualizacao. Esse fato e considerado pelo seguinte Lema.

Page 100: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

4.4. Experimentos 77

Lema 4.9 (Pior caso da escalabilidade em aneis concentricos). No pior caso, a escalabi-lidade da visualizacao baseada em aneis concentricos tera uma relacao entre a quantidadede nos n e a area A da ordem de n ∈ Θ(

√A).

Demonstracao. Uma vez que, para tipos de rede especıficos, como a topologia linear, epossıvel que a quantidade de nos seja da mesma ordem que a quantidade de aneis, ou seja,l = n. Nesse caso, considerado o exposto pela Equacao 4.16, a relacao entre a quantidadede nos n e a area A da visualizacao pode chegar a n ∈ Θ(

√A). C.Q.D.

A relacao assintotica que resulta do Lema 4.9 caracteriza o pior caso de escalabili-dade da visualizacao por disposicao radial. Dessa forma, e possıvel unificar os resultadosdos Lemas 4.8 e 4.9 em um unico teorema que trate das condicoes de escalabilidade davisualizacao por disposicao radial expressiva mınima, como se segue.

Teorema 4.4 (Escalabilidade da disposicao radial expressiva mınima). A quantidade denos n em uma visualizacao por disposicao radial expressiva mınima com area A e dada pelarelacao assintotica n ∈ Θ(Aα), onde 1/2 ≤ α ≤ 1. Sendo que, para α = 1/2, caracteriza-seo pior caso de escalabilidade, e para α = 1, o melhor caso.

Demonstracao. Segue-se de forma direta com base nos Lemas 4.8 e 4.9. C.Q.D.

4.4 Experimentos

Na Secao anterior, foram estabelecidos limites analıticos para a escalabilidade da vi-sualizacao por disposicao radial. Especificamente, foram apresentadas condicoes que ca-racterizam o melhor e pior caso de escalabilidade. Porem, o comportamento esperadotambem e importante para o entendimento da escalabilidade da visualizacao proposta.Na Figura 4.5, e apresentado o comportamento esperado do raio total da visualizacao,isto e, hro, onde h e a quantidade de aneis e ro o raio base otimo.

0

500

1000

1500

2000

2500

0 50 100 150 200 250 300 350 400 450 500

limite superior (pior caso)

limite inferior (melhor caso)

raio

esp

era

do d

a v

isu

aliz

ação

(a)

Figura 4.5: Valor esperado do raio da visualizacao, considerando redes livre de escala de tamanhoentre 10 e 500 nos.

Page 101: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

78 Capıtulo 4. Visualizacao de redes

Na Figura 4.5, sao usados os limites teoricos definidos na Secao anterior a fim deestimar a proximidade do caso esperado. Para valores de m = 1 da rede livre de escala,tem-se o comportamento tao proximo do pior caso quanto do melhor caso. Ja para valoresde m = 2 e m = 3 o comportamento do raio da visualizacao se aproxima do melhor caso.E conveniente notar que quase nao ha diferenca entre os valores esperado para m = 2 em = 3. Isso acontece porque, embora com m = 3 haja uma menor quantidade de aneis,uma vez que o diametro da rede tende a ser menor, ha tambem uma maior concentracao denos em cada anel. Logo, o raio base tem que aumentar para evitar sobreposicao angular.

4.4.1 Distribuicao do raio da visualizacao

Na Figura 4.5 e apresentado o comportamento medio do raio da visualizacao. Parase ter uma ideia da dispersao do valor do raio em torno dessa media, na Figura 4.6, saoapresentadas as distribuicoes do valor do raio da visualizacao para redes livre de escalacom m = 1 e m = 2.

0

100200300400500600700800900

1000

0 100 200 300 400 500 600 700 800

valor esperado do raio da visualização

freq

uên

(a)

0

200

400

600

800

1000

1200

1400

1600

1800

50 100 150 200 250 300 350 400 450

frequência

(b)

Figura 4.6: Distribuicao do tamanho do raio da visualizacao considerando 104 instancias detamanhos n = 50, 100, 150, para m = 1 em (a) e m = 2 em (b).

A partir do resultado apresentado na Figura 4.6, tambem e possıvel verificar o mesmocomportamento em relacao ao valor esperado do raio[ii]. Alem disso, essas Figuras, apre-sentam o comportamento aproximadamente gaussiano da distribuicao de probabilidadedo raio da visualizacao, sendo a media e o desvio padrao proporcional a quantidade denos. A verificacao analıtica desse resultado pode apresentar resultados importantes para

[ii]Nessas Figuras, e nas demais ate o final deste Capıtulo, os valores do raio para cada amostra foiarrendondado para o valor multiplo de 5 imediatamente inferior. Assim, quando no eixo horizontal tem-seo valor x, de fato, trata-se do intervalo [x, x+ 5).

Page 102: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

4.4. Experimentos 79

a questao de escalabilidade[iii]. Alem do valor medio do raio na visualizacao, e de sua dis-persao em torno dessa media, e conveniente analisar o comportamento da escalabilidadeda visualizacao em relacao a algumas das metricas apresentadas na Secao A.2. Especi-ficamente, esse estudo sera apresentado para as metricas relacionadas ao diametro e aeficiencia da rede.

4.4.2 Relacao entre o diametro e o raio

O diametro de uma rede e diretamente proporcional a quantidade de aneis na visua-lizacao por disposicao radial. Este fato e importante pois no experimento a seguir tem-se oraio como o unico parametro livre da visualizacao. Na Figura 4.7, e apresentada a relacaoentre o diametro da rede e o valor esperado do raio.

6

8

10

12

14

16

18

0 100 200 300 400 500 600 700 800

valor esperado do raio da visualização

diâ

metro

esp

era

do

(a)

4

4.5

5

5.5

6

6.5

7

50 100 150 200 250 300 350 400 450

diâ

metro

esp

er

do

(b)

Figura 4.7: Relacao entre o diametro e o raio da visualizacao considerando 104 instancias detamanhos n = 50, 100, 150, para m = 1 em (a) e m = 2 em (b).

Como e possıvel verificar na Figura 4.7a, o diametro de uma rede livre de escala param = 1 e proporcional ao raio da visualizacao. Isso e natural pois a quantidade de aneis navisualizacao tem que ser proporcional ao diametro da rede. Porem, o mesmo nao acontecepara m = 2 na Figura 4.7b, onde, aparentemente, o raio da visualizacao nao sofre qualquerinfluencia do diametro da rede. Este fato e ainda mais notorio para os valores maioresde n. Novamente, isso se devo ao fato de que, com um menor diametro ha tambem umamaior concentracao de nos em cada anel, fazendo com que o raio base aumente a fim deevitar sobreposicao angular. E possıvel afirma isso porque, quando o diametro aumenta,o mesmo acontece com a quantidade de aneis e, portanto, o raio da visualizacao somentepode ser manter fixo se houver uma diminuicao no raio base.

[iii]O que pode ser explorado em trabalhos futuros, assim como a relacao entre a media da distribuicao eo parametro m. Por enquanto, tal estudo nao se faz conveniente.

Page 103: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

80 Capıtulo 4. Visualizacao de redes

4.4.3 Relacao entre a eficiencia e o raio

Das topologias determinısticas abordadas na Secao B.2 a topologia linear e a quepossui pior eficiencia e o maior diametro. Em contrapartida, a topologia estrela e maiseficiente e a que possui menor diametro. Especificamente, o comportamento assintotico daeficiencia da topologia e de 1/2 (Corolario C.7) e na topologia linear e dado por 2 log n/n(Corolario C.8), onde n indica a quantidade de nos da rede. Esses fatos levam a acreditarque o raio da visualizacao e inversamente proporcional a eficiencia. Na Figura 4.8, explora-se propriedades do raio da visualizacao em funcao da eficiencia da rede.

0.2

0.22

0.24

0.26

0.28

0.3

0.32

0.34

0.36

0 100 200 300 400 500 600 700 800

valor esperado do raio da visualização

efi

ciê

ncia

esp

era

da

(a)

0.32

0.34

0.36

0.38

0.4

0.42

0.44

0.46

50 100 150 200 250 300 350 400 450

efi

ciê

ncia

esp

era

da

(b)

Figura 4.8: Relacao entre a eficiencia e o raio da visualizacao considerando 104 instancias detamanhos n = 50, 100, 150, para m = 1 em (a) e m = 2 em (b).

Como mostra a Figura 4.8, o raio da visualizacao e proporcional a eficiencia da rede.Isso acontece pelo fato de que em redes mais eficientes, a distancia esperada entre os nose menor. Isso colabora para que haja uma concentracao maior de nos em um mesmoanel, uma vez que o diametro da rede tende a ser menor. Portanto, em contrapartida adiminuicao de h em hro, ha um aumento de ro a fim de evitar sobreposicao angular.

4.5 Consideracoes

De forma conclusiva, o Teorema 4.4 estabelece condicoes de melhor e pior caso paraa escalabilidade da visualizacao por disposicao radial expressiva mınima. Portanto, avisualizacao por disposicao radial apresentada neste Capıtulo e apropriada pois: (i) eeficaz, com base na Definicao 4.2, uma vez que nao possui problemas de expressividade;(ii) e eficiente, com base no Teorema 4.3, pois sua otimizacao pode ser realizada em tempolinear e (iii) e escalavel, dadas as condicoes apresentadas pelo Teorema 4.4 e na Figura 4.5.

Page 104: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes 81

Capıtulo 5

Conclusoes

“If we can really understand the problem,

the answer will come out of it,

because the answer is not separate from the problem.”

Jiddu Krishnamurti

Neste trabalho, foram analisadas, de forma teorica, duas questoes relacionadas ao mo-nitoramento de redes de computadores: (i) a quantidade mınima e a localizacao dos nosobservadores e (ii) a criacao de um modelo de visualizacao que seja adequado a apre-sentacao de seus predicados. Inicialmente, utilizando-se da metodologia apresentada naSecao 2.4, foram estabelecidas, nos Apendices A e B, as bases teoricas para caracterizacaode nos e de redes de larga escala. A Tabela 5.1 apresenta os resultados encontrados.

metrica (no) definicao algoritmo tempo memoria

grau A.3 A.1 Θ(nEGout) Θ(n)distancia A.6 A.3 Θ(nEGout) Θ(n)agrupamento A.12 A.8 Θ(E2Gout) Θ(EGout)

(a)

metrica (rede) definicao algoritmo tempo memoria

distribuicao dos graus A.5 A.2 Θ(nEGout) Θ(n)distancia media A.7 A.5 Θ(n2 EGout) Θ(n)diametro A.8 A.6 Θ(n2 EGout) Θ(n)eficiencia media A.10 A.7 Θ(n2 EGout) Θ(n)agrupamento A.13 A.9 Θ(nE2Gout) Θ(EGout)

(b)

Tabela 5.1: Desempenho das metricas para caracterizacao de nos (a) e de redes (b).

Page 105: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

82 Capıtulo 5. Conclusoes

Os resultados apresentados na Tabela 5.1 mostram que e viavel utilizar qualquer umadas metricas apresentadas na analise de redes com uma grande quantidade de nos. Ao seconsiderar que o grau de saıda esperado da rede e limitado e possıvel eliminar o termoEGout das complexidades em tempo e em memoria. Dessa forma, todas as complexidadessao O(n2) em tempo e O(n) em memoria.

5.1 Resultados

Os resultados relacionados a observabilidade de redes foram apresentados no Capıtulo 3,onde sao estabelecidas duas definicoes acerca da finalidade dos nos observadores. A pri-meira, denominada observabilidade estrutural, tem como finalidade a estimacao do estadoda rede a partir da observacao do estado de um subconjunto de nos. A segunda, de-nominada observabilidade funcional, tem como princıpio minimizar a quantidade de nosnecessarios para tornar possıvel a analise instantanea de uma porcentagem da informacaoque trafega na rede. Foram desenvolvidos para ambos os problemas, algoritmos de tempopolinomial. Em relacao a quantidade de nos observadores, as abordagens apresentam re-sultado escalavel, uma vez que a cardinalidade do conjunto observador mınimo e de umapequena parcela do total de nos. Especificamente, para a observabilidade estrutural, aquantidade mınima de nos observadores pode ser encontrada com base no Corolario 3.1 eseu comportamento e estabelecido pela Observacao 3.3. Ja em relacao a observabilidadefuncional, essa quantidade pode ser encontrada com base no Corolario 3.3 e estabelecidapela Observacao 3.10. Essas caracterısticas, apresentadas na Secao 3.3, sao resumidas naTabela 3.1, reproduzida abaixo.

metrica observabilidade estrutural |Ooe | observabilidade funcional |Oo

c |densidade inversa (Observacao 3.4) direta (Observacao 3.11)grau medio inferior (Observacao 3.5) superior (Observacao 3.12)diametro inversa (Observacao 3.6) direta (Observacao 3.13)eficiencia direta (Observacao 3.7) inversa (Observacao 3.14)agrupamento direta (Observacao 3.8) inversa (Observacao 3.15)

A partir desses resultados, e possıvel verificar que existe a tendencia de que o conjuntoobservador estrutural mınimo seja composto pelos nos de menor grau da rede, uma vezque o grau esperado dos nos em Oo

e e menor do que o da rede (ver Observacao 3.16). Deforma contraria, o conjunto observador funcional mınimo Oo

c tende a ser composto pelosnos de maior grau (ver Observacao 3.17). Verificou-se que, em relacao a localizacao, nocaso da observabilidade funcional, os nos monitores tendem a se localizar no centro da redeenquanto que, para a observabilidade estrutural, e possıvel localizar grande parte dos nosnas bordas. Esse ultimo fato e relevante porque torna viavel o monitoramento de redes decomputadores de forma colaborativa, uma vez que trata-se da localizacao dos dispositivosde usuarios finais.

A otimizacao da visualizacao da topologia de redes por disposicao radial, apresentadano Capıtulo 4, tem como objetivo ampliar a cognicao do analista de informacao, ator dosistema de monitoramento apresentado na Figura 2.2. Considerando a possibilidade davisualizacao de redes com uma grande quantidade de nos, foi necessaria a minimizacao daarea necessaria para representacao eficaz da topologia da rede. Um algoritmo de tempo

Page 106: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

5.2. Trabalhos futuros 83

linear foi desenvolvido para solucionar o problema de otimizacao, resultando em um modelode visualizacao eficaz (Definicao 4.3), eficiente (Teorema 4.3) e possivelmente escalavel,dadas as condicoes apresentadas pelo Teorema 4.4 e o comportamento esperado para redeslivre de escala na Figura 4.5. A relacao entre a escala da visualizacao e as metricas dediametro e eficiencia sao apresentadas na Tabela 5.2.

metrica raio total para m = 1 raio total para m = 2

diametro direta invarianteeficiencia direta direta

Tabela 5.2: Influencia das metricas na visualizacao de redes livre de escala.

Com base na relacao apresentada para a metrica de diametro em relacao a redes livrede escala com parametro m = 2, tem-se que o raio total da visualizacao e invarianteao diametro, o que nao acontece para m = 1. Esse fato sugere que a densidade do grafointerfere diretamente na escalabilidade da visualizacao e que ha pelo menos dois regimes deescala. Um quando a densidade e baixa e, consequentemente o raio total e proporcional aodiametro, e outro quando a densidade ultrapassa algum limiar, que tem como consequenciaa invariancia do raio total em relacao ao diametro.

Os resultados obtidos neste trabalho estabelecem, portanto, limites teoricos para duasquestoes relacionadas a criacao de um sistema de monitoramento para redes de grandemagnitude e complexidade.

5.2 Trabalhos futuros

Os resultados ensejam a extensao deste trabalho visando levar em consideracao outrosfatores relacionados aos aspectos de visualizacao e observabilidade de redes de larga escala.

Visualizacao

Dado o comportamento esperado da escalabilidade da visualizacao por disposicao ra-dial, e convenientemente avaliar se e possıvel minimizar ainda mais a area necessaria pararepresentacao. Para isso, e necessaria a utilizacao de tecnicas de distorcao ou oclusao deinformacoes. Essas tecnicas devem ser controladas a fim de nao prejudicar a amplificacaoda cognicao. Uma alternativa e a utilizacao dessas tecnicas apenas em locais da visua-lizacao que sao de pouco interesse. De forma a garantir que em regioes de interesse darede nao haja distorcao, e em locais afastados do foco, a distorcao pode ser proporcionala distancia. Minimiza-se, dessa forma, os efeitos negativos da distorcao sem que hajaperda significativa da expressividade da representacao. A introducao desses conceitos nomodelo de visualizacao apresentado pode torna-lo ainda mais escalavel, fazendo com queo escalabilidade esperada se aproxime ainda mais do limite teorico de melhor caso. Adi-cionalmente, pode-se ainda explorar outros algoritmos de representacao e de desenho degrafos (graph drawing) [Battista et al. 1998].

Observabilidade

Em relacao a observabilidade, este trabalho pode ser estendido na direcao de estima-tivas da matriz de transicao de estado de redes complexas e na analise de invariancia da

Page 107: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

84 Capıtulo 5. Conclusoes

quantidade e localizacao dos nos observadores em relacao a alteracoes na topologia darede, de forma que o sistema nao seria mais invariante no tempo. Alem disso, e possıvelverificar em que condicoes podem existir partes da rede (ou subgrafos) que possam ser ob-servadas sem que haja diferenca significativa no seu conjunto observador. De forma a criaro conceito de conjunto observador invariante de um subgrafo da rede. Especificamente,essa possibilidade pode ser util para criacao de servicos de monitoramento gerenciados porum sistema autonomo na Internet.

Um dos problemas encontrados em redes de computadores esta relacionado ao esgota-mento de recursos de um no. Tal problema, resultado de um possıvel ataque de negacaode servico, denominado na literatura de seguranca em redes como DoS (Denial of Service)ou DDoS (Distributed Denial of Service), pode ser modelado como estados indesejaveisdo sistema linear que representa a rede. Dada a definicao de controlabilidade, pode-seinvestigar se o projeto de topologias que maximizam a quantidade de nos observadorespode ajudar a criar redes menos suscetıveis a tais ataques.

Page 108: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes 85

Apendice A

Caracterizacao de redes complexas

“Anyone who doesn’t take truth seriously in small matters

cannot be trusted in large ones either.”

Albert Einstein

O estudo de redes atraves de sua descricao por meio da Teoria de Grafos e uma abor-dagem classica comumente encontrada na literatura. Sao muitos os casos de algoritmospara solucao de problemas em grafos que foram e sao utilizados no projeto de redes decomputadores, por exemplo, os algoritmos de Bellman (1958) e Ford & Fulkerson (1962)e de Dijkstra (1959), ambos utilizados no projeto e estudo de protocolos de roteamento.Neste Apendice, estuda-se como e possıvel representar computacional e matematicamenteredes complexas. Especificamente, tem-se como objetivo possibilitar o desenvolvimento derespostas para as seguintes questoes: (i) qual tipo de estrutura de dados pode ser utilizadaa fim de reduzir a quantidade de dados e diminuir a complexidade de algumas operacoessobre grafos e (ii) quais metricas podem ser utilizadas para representar propriedades dografo. A partir das definicoes das metricas encontrada na literatura sao desenvolvidosalgoritmos para que seja possıvel analisar a complexidade em tempo e memoria esperadana utilizacao de cada metrica.

Este Apendice esta organizado da seguinte forma: na Secao A.1, e feita uma introducaoacerca dos requisitos necessarios para modelar redes e sao descritos os tipos de grafos, suaspropriedades e formas de representacao. Finalmente, as metricas que podem ser utilizadaspara caracterizar grafos sao apresentadas na Secao A.2.

Page 109: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

86 Apendice A. Caracterizacao de redes complexas

A.1 Introducao

Antes de tratar de propriedades e dos modelos de redes complexas, e conveniente definira descricao matematica e computacional desses sistemas [Costa et al. 2007].

Definicao A.1 (Grafo direcionado com pesos). Um grafo direcionado com pesos G ecomposto por uma tripla ordenada G = 〈N,E, ω〉, onde N representa o conjunto devertices (ou nos) do grafo e E o conjunto de arestas ao qual se atribui as seguintes pro-priedades: (i) cada aresta e composta por um par ordenado de nos (v1, v2), que indicaque existe uma ligacao saindo do no v1 em direcao ao no v2 e (ii) para cada aresta e ∈ Eexiste um peso que e associado por uma funcao ω(·), que realiza o mapeamento dos pesosde cada aresta para um numero real, ou seja, ω : E 7→ R.

Na Definicao A.1 trata-se do tipo mais generalista de grafo, denominado Tipo 1, ondeas arestas sao direcionas e possuem um peso associado. Alem desse, pode-se definir maisoutros tres tipos de grafos, fazendo com que se alterne as propriedades de direcao e pesodas arestas, como apresentado na Figura A.1[i].

digrafocom pesos

1

digrafosem pesos

3

grafocom pesos

2

grafosem pesos

4

simetria

limiar simetria

limiar

Figura A.1: Tipos de representacao de redes complexas: (1) representacao mais generalista deum grafo, onde as arestas sao direcionadas e com pesos associados; (2) tipo de grafo onde as arestassao simetricas, ou seja, dada uma aresta (v1, v2) ∈ E tem-se que e possıvel sair de v1 em direcao av2 e vice-versa; (3) onde nao ha distincao de pesos entre as arestas, portanto, nao ha necessidadede se definir a funcao ω(·) e (4) tipo de grafo simplista, onde as arestas nao sao direcionadas nempossuem pesos associados. Figura adaptada de [Costa et al. 2007].

Alem do grafo direcionado com pesos (Tipo 1 na Figura A.1), existem outros modelosde grafos que podem ser utilizados para representacao de redes complexas. Porem, antesde descrever os outros tipos de grafos, e conveniente definir como e construıda a matrizde adjacencia de cada tipo.

Definicao A.2 (Matriz de adjacencia). Um grafo G = 〈N,E, ω〉 pode ser representadopor uma matriz adjacencia A, que e construıda da seguinte forma

A =

a11 · · · a1n...

. . ....

an1 · · · ann

, onde aij ,

ω(e) se (vj , vi) ∈ E (Tipo 1 e 2)1 se (vj , vi) ∈ E (Tipo 3 e 4)0 caso contrario

, (A.1)

onde e = (vj , vi) e para grafos nao direcionados dos Tipos 2 e 4 tem-se que e e tratadocomo um par nao ordenado, isto e, (vj , vi) ≡ (vi, vj).

Em acordo com o descrito na Definicao A.2, para grafos do Tipo 2, a funcao ω(·) edefinida de forma a ser simetrica, ou seja, se eij = (vi, vj) pertence ao conjunto de arestas

[i]Neste trabalho, considera-se a inexistencia de lacos, isto e, arestas cuja origem e destino sao o mesmono, e de arestas multiplas, onde tem-se mais de uma aresta com mesma origem e destino.

Page 110: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

A.1. Introducao 87

E e eji = (vj , vi) nao pertence a E, entao ω(eji) e definido como sendo igual a ω(eij). Deforma semelhante, para grafos do Tipo 4, se e somente se, (vi, vj) ou (vj , vi) pertencem aE, entao aij = 1, caso contrario aij = 0. Isso porque, em grafos do Tipo 2, denominadosgrafos nao direcionados com pesos, as arestas sao simetricas, ou seja, dada uma aresta(v1, v2) ∈ E tem-se que e possıvel sair de v1 em direcao a v2 e vice-versa.

Apesar de bastante util no desenvolvimento de modelos e na analise de propriedades deredes complexas, a representacao por matriz de adjacencia nem sempre e a mais adequadapara representacao computacional da rede. Isso porque a representacao em matriz deadjacencia de uma rede com n nos sempre ocupa memoria em uma ordem de Θ(n2), ouseja, quadratica. O que nao e escalavel em termos de armazenamento da representacao dosistema. E conveniente a busca por outro tipo de representacao, principalmente quando amatriz e esparsa. Dado que o desempenho da representacao das conexoes de um grafo estarelacionada a sua quantidade de arestas, denotada por |E|, e que a quantidade maximade arestas em um grafo direcionado e de exatamente |E|max = n(n− 1), e possıvel pensarem uma estrutura de representacao mais escalavel. Para tanto, e conveniente definir osconceitos de grau de um vertice e de densidade do grafo.

Definicao A.3 (Grau). Em um grafo direcionado com pesos, Tipo 1, o grau de umno vi, denotado por g(vi), representa a quantidade de arestas associadas ao no vi. Emgrafos direcionados, essa associacao pode considerar a quantidade de nos que incidem emvi ou a quantidade de nos que vi incide. O primeiro caso, denominado grau de entrada, equantificado por

gin(vi) = |vj ∈ N : (vj , vi) ∈ E|, (A.2)

e o segundo caso, denominado grau de saıda, por

gout(vi) = |vj ∈ N : (vi, vj) ∈ E|, (A.3)

onde considera-se, em ambos os casos, a aresta como um par ordenado.

Para o caso de grafos nao direcionados, Tipos 2 e 4, o grau de entrada e de saıda saoiguais ja que o par que representa uma aresta e nao ordenado. O grau do no de um grafonao direcionado e quantificado por

g(vi) = |vj ∈ N : ((vj , vi) ∈ E) ∨ ((vi, vj) ∈ E)|, (A.4)

onde a disjuncao e considerada a fim de tratar cada aresta como um par nao ordenado.

Definicao A.4 (Densidade). A densidade de um grafo G, do Tipo 1, denotada porm(G), representa a quantidade relativa do numero de arestas do grafo, denotado por |E|,em relacao ao seu valor maximo. Portanto, tem-se que

m(G) =|E||E|max

, (A.5)

onde, para grafos direcionados, |E|max = n(n− 1), sendo que n = |N |.

De forma semelhante, e possıvel definir a densidade de grafos nao direcionados, umavez que sua quantidade maxima de arestas e metade da quantidade maxima em grafosdirecionados. A densidade em grafos nao direcionados e igual a 2m(G).

Page 111: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

88 Apendice A. Caracterizacao de redes complexas

Se consideramos que um dado grafo G e conexo[ii], isto e, sempre existe pelo menosuma trajetoria entre qualquer par de nos do grafo, entao a quantidade mınima de arestassera de, pelo menos, (n − 1). Portanto, considerando grafos conexos do Tipo 1, tem-seque 1/n ≤ m(G) ≤ 1. E possıvel reduzir a quantidade de memoria para representacaodas n(n − 1) possıveis arestas em um fator de 1/n. A lista de adjacencia, ilustrada naFigura A.2, e uma estrutura que possibilita essa otimizacao [Cormen et al. 2009].

Lista de adjacência

2 3

4 5

1

Grafo direcionado

b c

d

e

a

f

g

2

3

4

5

1

3 5

2 4

5

2

4

b

c

d e

a

f

g

Figura A.2: Representacao de redes por meio de lista de adjacencia composta por n listasencadeadas. Cada lista e associada a um no da rede e armazenam os nos ligados ao no associadoe o respectivo peso da aresta. A quantidade de memoria necessaria e da ordem de Θ(nEGout).

A representacao de redes por meio de lista de adjacencia e composta por n listasencadeadas, em que cada lista e associada a um no da rede. A lista encadeada de uma nov armazena os nos em que v incide e, no caso de grafo com pesos, o peso da respectivaaresta. Obviamente, a quantidade de memoria necessaria para armazenar essa estruturadepende do tamanho medio das listas. O tamanho de cada uma dessas listas e igual aograu de saıda do respectivo no, o que implica na seguinte Observacao.

Observacao A.1 (Complexidade em memoria da lista de adjacencia). Utilizando Gout,como sendo a variavel aleatoria que representa o grau de saıda dos nos da rede, tem-se queo tamanho esperado da lista encadeada e dado por EGout. A quantidade de memoriaesperada na representacao por lista de adjacencia e dada por

EMlist ∈ Θ(nEGout), (A.6)

ondeMlist e a variavel aleatoria que representa a quantidade de memoria necessaria paraarmazenar uma lista de adjacencia. Considerando o caso de densidade mınima, o valoresperado do grau de saıda e unitario e, nesse caso, a quantidade de memoria necessariae de ordem linear. A quantidade esperada de memoria necessaria EMlist depende dadensidade do grafo. Considerando a densidade mınima e maxima de grafos conexos doTipo 1, a quantidade de memoria e da ordem de Ω(n) e O(n2).

Para dissertar com mais propriedade sobre a escalabilidade da representacao por listade adjacencia, e necessario considerar a natureza de algumas propriedades da rede. Porexemplo, a do valor esperado do grau de saıda de cada no. Mesmo assim, considerando oexposto na Observacao A.1, de forma geral, pode-se afirmar que a representacao por listade adjacencia e mais escalavel que a representacao por matriz de adjacencia. Mesmo quepara alguns algoritmos a representacao por matriz de adjacencia seja mais eficiente, nestetrabalho, considerando a questao da escalabilidade, em todas as analises de eficiencia econsiderada a representacao por lista de adjacencia.

[ii]Considera-se a propriedade do grafo ser conexo porque, a princıpio, nao faz sentido, no estudo de redes,que existam nos desligados da topologia.

Page 112: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

A.2. Metricas 89

A.2 Metricas

A caracterizacao de redes complexas pode ser feita por meio da utilizacao de diferen-tes metricas. Cada metrica, isoladamente, permite caracterizar a rede em um aspectobem definido. O estudo conjunto dessas caracterısticas possibilita um entendimento maisabrangente sobre as propriedades da rede. Por exemplo, ao se criar um conjunto de carac-terizacoes da rede, antes e apos a aplicacao de uma transformacao T(·), denominados c(1)

e c(2), respectivamente, e possıvel quantificar sua robustez em relacao a transformacao emquestao. Esse processo e ilustrado pela Figura A.3.

caracterização

caracterização

Figura A.3: Caracterizacao, transformacao e quantificacao da robustez de grafos. Quanto menorfor ‖∆c‖, mais robusto e o grafo G a transformacao T(·). No caso, a transformacao T(·) retira dografo os nos com grau igual a 1. Figura adaptada de [Costa et al. 2007].

Se a norma da diferenca entre c(1) e c(2), denominada ‖∆c‖, for significativa, entaoa rede em questao nao e robusta a transformacao T(·). No caso da Figura A.3, a trans-formacao T(·) retira do grafo os nos com grau igual a 1. Se a topologia em questao setratar de uma rede de computadores e alguma metrica que representasse a capacidadede roteamento nao sofresse alteracoes significativas apos a transformacao T(·), poderia-seafirmar, por exemplo, que a existencia de nos finais nao influencia significativamente acapacidade de roteamento da rede. Portanto, e conveniente a definicao de metricas quepodem ser utilizadas no estudo de redes complexas. A seguir, sao descritas algumas dessasmetricas, que estao relacionadas com os objetivos deste trabalho[iii].

A.2.1 Distribuicao dos graus

A distribuicao dos graus de uma rede e representada por uma funcao de distribuicaode probabilidade [Papoulis & Pillai 2002] (ou PDF, do ingles Probability DistributionFunction), denominada f(·) e indexada por k, que caracteriza a probabilidade de um noescolhido de forma aleatoria possuir exatamente grau k. Para dados experimentais, afuncao f(·) e discreta, definida para valores de k ∈ N, e igual a razao entre o numerode eventos em que o grau do no e igual a k e o numero total de nos n. Para grafosdirecionados, existem duas funcoes de distribuicao, uma relacionada aos graus de entradae outra aos de saıda. A distribuicao dos graus de uma rede e definida a seguir.

[iii]As definicoes das metricas apresentadas tem como base [Newman 2003] e [Costa et al. 2007].

Page 113: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

90 Apendice A. Caracterizacao de redes complexas

Definicao A.5 (Distribuicao dos graus da rede). Para dados experimentais, a distri-buicao dos graus da rede e expressa pela funcao de densidade de probabilidade que re-presenta a frequencia relativa dos graus. Assim, como existem dois tipos de grau, o deentrada e o de saıda, sao duas as distribuicoes desses graus. Para cada um deles, tem-se aseguinte forma geral da funcao de distribuicao de probabilidade para grafos direcionados

f(k) =|vi ∈ N : g(vi) = k|

|E| , (A.7)

onde g(vi) e o grau do no vi e |E| representa a quantidade de arestas do grafo. Para seobter fin(k), PDF do grau de entrada, utiliza-se na Equacao A.7 a funcao gin(vi) no lugarde g(vi). Ja no caso de fout(k), PDF do grau de saıda, utiliza-se a funcao gout(vi).

No calculo da funcao de distribuicao de probabilidade, a divisao por |E| justifica-sepelo fato de que o resultado somatorio de f(·), considerando todos os possıveis valores dek, deve ser unitario. A probabilidade de um no, escolhido de forma aleatoria ter grau k,e definida por

P(Gk) = f(k), (A.8)

onde G e a variavel aleatoria que representa o grau de um no qualquer. De forma geral,tanto a Equacao A.7 quanto a A.8 tambem podem ser utilizadas para se obter estatısticasde grafos nao direcionados dos Tipos 2 e 4. Para isso, e necessario considerar que a funcaog(·) utilizada e aquela definida pela Equacao A.4. Para considerar a utilizacao da funcaode distribuicao de graus para fins de estudo da rede, resta saber se a funcao f(·) podeser computada de forma eficiente e escalavel. A seguir, e apresentado um algoritmo paracalculo dos graus de entrada e saıda de cada no da rede.

Algoritmo A.1 (Calculo dos graus de entrada e saıda de cada no). E possıvel calcular osgraus de entrada e saıda de cada no da rede de forma iterativa com base na representacaopor lista de adjacencia.

algoritmo graus(L)1: Lista de adjacencia L de um grafo direcionado G = 〈N,E〉.2: gin ← novo-vetor(|N |, 0) Vetor de |N | posicoes preenchidas com zero.3: gout ← novo-vetor(|N |, 0)4: para i de 1 ate |N | faca5: para cada (vj , p) ∈ L[i] faca6: No adjacente vj e peso p da aresta.7: gout[i]← gout[i] + 18: gin[j]← gin[j] + 19: fim para

10: fim para11: retorne 〈gin, gout〉 Vetores com os graus de entrada e saıda de cada no da rede.Considera-se que os vetores gin e gout sao indexados a partir de 1. A complexidade doalgoritmo e da ordem de Θ(nEGout) em tempo e Θ(n) em memoria.

No Algoritmo A.1, considerando os lacos de repeticao das linhas 4 e 5, tem-se que acomplexidade em tempo do algoritmo e proporcional ao produto entre a quantidade de nosn e o tamanho esperado das listas na representacao por lista de adjacencia. Como descritona Observacao A.1, o tamanho esperado dessas listas e equivalente ao valor esperado dograu de saıda dos nos EGout. O tempo esperado de execucao do Algoritmo A.1 e da

Page 114: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

A.2. Metricas 91

ordem de Θ(nEGout). Considerando que, no pior caso, o valor maximo de EGout e de(n−1), o tempo esperado de execucao e de ordem Θ(n2), ou seja, quadratica. Ja no melhorcaso, EGout nao depende de n e representa um valor constante[iv]. Esta configuracaotorna o tempo esperado de execucao do algoritmo de ordem Θ(n), ou seja, linear. Emrelacao a escalabilidade, o Algoritmo A.1 necessita de uma quantidade de memoria deordem linear em relacao a quantidade de nos. Especificamente, dois vetores de tamanhon, para o caso de grafos direcionados, ou apenas um vetor do mesmo tamanho, parao caso de grafos nao direcionadas. Com base no Algoritmo A.1, e possıvel construir afuncao de distribuicao de probabilidade dos graus. E apresentado no Algoritmo a seguiros procedimento para computacao da funcao f(·), tanto para o grau de entrada quanto ode saıda.

Algoritmo A.2 (Construcao da funcao de distribuicao dos graus). E possıvel construira funcao de distribuicao de propriedade dos graus da rede de forma iterativa com base narepresentacao por lista de adjacencia.

algoritmo distribuicao-graus(L)1: Lista de adjacencia L de um grafo direcionado G = 〈N,E〉.2: 〈gin, gout〉 ← graus(L) Computacao dos graus de entrada e saıda de cada no.3: fin ← novo-vetor(|N |, 0)4: fout ← novo-vetor(|N |, 0)5: para i de 1 ate |N | faca6: g ← gin[i] Utilizando grau como ındice no vetor de distribuicao.7: fin[g]← fin[g] + 18: g ← gout[i]9: fout[g]← fout[g] + 1

10: fim para11: para i de 1 ate |N | faca12: fin[i]← fin[i]/|E| Normalizacao dos vetores de distribuicao.13: fout[i]← fout[i]/|E|14: fim para15: retorne 〈fin, fout〉 Vetores com a distribuicao dos graus de entrada e saıda.A normalizacao e deixada por ultimo, da linha 11 a 14, a fim de minimizar a propagacaode erros numericos relacionados a representacao de ponto flutuante. A complexidade doalgoritmo e da ordem de Θ(nEGout) em tempo e Θ(n) em memoria.

Para manter a simplicidade na representacao e a consistencia em relacao as equacoes,considera-se que os vetores fin e fout sao indexados a partir de 0. A computacao realizadaespecificamente no Algoritmo A.2 e menos custosa do que a realizada no Algoritmo A.1.Por esse motivo, juntamente com o fato de que o Algoritmo A.2 faz uso do A.1, suascomplexidades em tempo sao a mesma. O mesmo acontece em relacao a escalabilidade.Como o tempo de execucao dos Algoritmos A.1 e A.2 depende do valor esperado do graude saıda, pode ser util analisar o comportamento desse valor como uma propriedade darede. Define-se a seguir como computar esse valor esperado utilizando a funcao f(·).

[iv]Nesse caso diz-se que EGout possui a propriedade de ser livre de escala. O que e factıvel no caso deredes como a Internet, em que a quantidade de conexoes entre os nos nao tem relacao com a quantidadede nos de toda a rede. Isso porque a quantidade de conexoes depende apenas da quantidade de portas decomunicacao dos dispositivos de interconexao, por exemplo, roteadores, comutadores e repetidores.

Page 115: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

92 Apendice A. Caracterizacao de redes complexas

Valor esperado do grau O valor esperado do grau pode ser computado com base nafuncao de distribuicao de probabilidade f(·). Como a probabilidade de realizacao k davariavel aleatoria G e dada por P(Gk) = f(k), com base na Equacao A.8, pode-se calcularo valor esperado do grau de um no pela equacao

EG =n−1∑

ζ=0

Gζ P(Gζ) =n−1∑

k=0

kf(k), (A.9)

onde a funcao f(·) deve ser utilizada em acordo com a variavel aleatoria utilizada, isto e,a funcao fin(·) para a de grau de entrada Gin, ou fout(·) para a de grau de saıda Gout.

Funcao de distribuicao cumulativa A partir da aplicacao do Algoritmo A.2, e possıvelverificar de forma eficiente e escalavel qual e a funcao de distribuicao de probabilidademelhor descreve a forma de f(·), como, por exemplo, a geometrica, a uniforme ou a dePoisson. Isso pode ser de grande utilidade na elaboracao de modelos para representacaodessas redes. Porem, em alguns casos e mais adequada a utilizacao da funcao de distri-buicao cumulativa F (·), ou CDF (Cumulative Distribution Function), pois essa e menossujeita a problemas de resolucao encontrados na visualizacao da funcao de distribuicao deprobabilidade. A funcao F (·), denominada CDF complementar, e definida por

F (k) =n−1∑

i=k

f(i), (A.10)

onde n representa a quantidade de nos da rede. Considerando os possıvel valores de graudos nos, tem-se a relacao 0 ≤ k ≤ i ≤ (n−1). Frequentemente, a distribuicao dos graus deuma rede e analisada a partir da visualizacao da funcao F (·) em escala logarıtmica, poisverifica-se experimentalmente que esse tipo de visualizacao e mais efetiva que a visualizacaodo histograma da funcao f(·) [Newman 2003].

A.2.2 Distancia media

A distancia entre dois nos da rede e definida como o menor caminho entre os dois nos.Sao duas as formas de se quantificar o caminho entre dois nos. Na primeira, no caso degrafos com pesos, essa distancia pode ser quantificada como o caminho entre os dois noscuja soma dos pesos seja mınima. No segundo caso, para grafos sem pesos, ou grafos compesos em que o peso nao indica distancia, o menor caminho e quantificado em termos daquantidade mınima de arestas. Neste trabalho e considerado o segundo caso. A distanciaentre dois nos e definida a seguir.

Definicao A.6 (Distancia entre dois nos). Em um grafo sem pesos G = 〈N,E〉, ou compesos, mas em que os pesos nao discriminam uma relacao de proximidade, a distancia deum no vi ∈ N ate um no vj ∈ N e definida como a quantidade de arestas que compoem ocaminho mais curto de vi ate vj , denominada sij .

Dado o fato de que a distancia entre dois nos e definida em termos da quantidadede arestas do caminho mais curto, e direta a associacao da construcao de sua solucaoalgorıtmica com base em algum algoritmo de caminho mais curto em grafos. Como foiconsiderado na Definicao A.6 que o peso das arestas nao caracterizam relacao de proximi-dade, o problema de caminho mais curto pode ser resolvido com a estrategia de busca emlargura, ou BFS (Breadth-First Search), como apresentado no algoritmo a seguir.

Page 116: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

A.2. Metricas 93

Algoritmo A.3 (Distancia em relacao a um no). E possıvel calcular a distancia de umno vi para todos os outros nos do grafo G de forma iterativa com base na representacaopor lista de adjacencia L, percorrendo as listas e armazenando nos nao visitados em umafila q, implementada segundo uma polıtica de acesso do tipo FIFO (First-In First-Out).

algoritmo distancia(L, vi)1: Lista de adjacencia L de um grafo G = 〈N,E〉, e no vi raiz da arvore de busca.2: s← novo-vetor(|N |,∞) Vetor de |N | posicoes preenchidas com infinito.3: p← novo-vetor(|N |, nulo) Vetor de |N | posicoes preenchidas com referencias nulas.4: q ← nova-fila() Cria uma nova fila vazia.5: s[i]← 06: c← 07: marcar(vi)8: enfileirar(q, vi) Enfileira o no vi na fila vazia q.9: enquanto q nao estiver vazia faca

10: c← c + 111: qlocal ← nova-fila() Cria uma nova fila vazia.12: enquanto q nao estiver vazia faca13: vk ← desenfileirar(q)14: para cada (vj , w) ∈ L[k] faca15: se vj nao esta marcado entao16: s[j]← c Distancia c de vi ate vj .17: p[j]← k No vk e pai de vj na arvore de busca.18: marcar(vj)19: enfileirar(qlocal, vj)20: fim se21: fim para22: fim enquanto23: mover(qlocal, q) Esvazia fila qlocal em q.24: fim enquanto25: retorne 〈s, p〉 Vetor s com as distancias a partir de vi e p com a arvore de busca.Como a estrategia BFS acha o menor caminho em numero de arestas, o contador c e adistancia de vi para cada no vj . A complexidade e de O(nEGout) em tempo e de Θ(n)em memoria, onde n = |N |.

O Algoritmo A.3 percorre a arvore de busca de forma a expandir um nıvel da arvorepor iteracao do laco de repeticao da linha 9. Por esse motivo, a cada entrada no lacoo contador c e incrementado, pois, dessa forma, esse contador representa a profundidadede busca na arvore. Obviamente, a profundidade de uma arvore de busca corresponde amenor distancia entre o no raiz e os nos naquela profundidade. Alem disso, na linha 17,a cada no e atribuıdo uma referencia ao pai na arvore, o que torna possıvel reconstruir omenor caminho posteriormente.

Em relacao a complexidade do Algoritmo A.3 tem-se que a linha 10 do algoritmo iraiterar sobre cada no da rede, no caso em que o grafo seja conexo e, para cada no, a linha12 ira iterar sobre cada elemento da lista de adjacencia do no. Utilizando n = |N | pararepresentar a quantidade de nos do grafo e EGout para o valor esperado do tamanho dalista de adjacencia, tem-se que a complexidade em tempo do Algoritmo A.3 e da ordemde O(nEGout). Considera-se que as operacoes de enfileirar, desenfileirar e marcar sao

Page 117: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

94 Apendice A. Caracterizacao de redes complexas

de tempo constante. Alem disso, tem-se que e a operacao de mover os elementos da filaqlocal para a fila q depende apenas do tamanho da fila qlocal. Somando todos os tamanhosde qlocal obtem-se a quantidade de nos |N |, portanto, a linha 23 executa a mesma ordemde quantidade de operacoes que o laco de repeticao da linha 12. Esses fatores contribuempara que a complexidade em tempo do algoritmo seja de O(nEGout). Utilizou-se anotacao O(·), pois caso o grafo nao seja conexo, o tempo de execucao esperado nao elimitado inferiormente pela funcao. Caso o grafo seja conexo, a complexidade em tempoe da ordem de Θ(nEGout). Em relacao a quantidade de memoria necessaria, deve-seconsiderar o tamanho do vetor s, da ordem de Θ(n), e o da fila q, da ordem de O(n).Portanto, a complexidade em memoria do algoritmo e da ordem de Θ(n).

Alem de computar as distancias, o Algoritmo A.3 tambem cria um vetor p que e capazde representar a arvore de busca em que o no vi e raiz. Logo, a partir desse vetor, epossıvel reconstruir o menor caminho entre vi e qualquer no vj da rede em tempo linear.Para isso, basta iterar sobre as referencias do vetor p, partindo de p[j] ate se chegar emvi, se o grafo for conexo, ou ate se encontrar uma referencia nula, o que indica que naoha caminho partindo de vi ate vj . A seguir, e apresentado um algoritmo que efetua esseprocedimento.

Algoritmo A.4 (Caminho mais curto). A partir da descricao da arvore de busca compu-tada pelo Algoritmo A.3 e possıvel reconstruir o menor caminho entre um no vi e qualqueroutro no vj da rede.

algoritmo menor-caminho(L, vi, vj)1: Lista de adjacencia L de um grafo G = 〈N,E〉, e no vi raiz da arvore de busca.2: l← nova-lista() Cria uma nova lista vazia.3: 〈s, p〉 ← distancia(L, vi)4: r ← j5: inserir(l, vj) Insere o no vj no inıcio da lista l.6: enquanto p[r] 6= nulo faca7: r ← p[r]8: inserir(l, vr) Insere pai nao nulo no inıcio da lista.9: fim enquanto

10: c← nulo11: se inicio(l) = vi entao12: c← l Se o inıcio de l e vi, entao o menor caminho existe e e descrito por l.13: fim se14: retorne c Caminho mais curto de vi em direcao a vj .Considerando as complexidades do procedimento ‘distancia()’, tem-se que a complexidadee de O(nEGout) em tempo e de Θ(n) em memoria, onde n = |N |.

Em relacao as complexidades, a construcao do caminho no laco da linha 6 e de O(n),porem predominam as complexidades do procedimento ‘distancia()’. Portanto, a comple-xidade e de O(nEGout) em tempo e de Θ(n) em memoria, onde n = |N |. A partir daDefinicao A.6 e do Algoritmo A.3, e possıvel definir e computar a distancia media entretodos os pares de nos da rede. A soma dessas distancias e, entao, dividida pelo totalde distancias, que, em uma rede com n nos, e de exatamente n2. Quando o grafo nao econexo, ha que se analisar qual valor deve ser considerado quando nao ha um caminhoentre dois nos. Para evitar esse problema, neste trabalho considera-se apenas a distanciamedia para o caso grafos conexos, matematicamente definida a seguir.

Page 118: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

A.2. Metricas 95

Definicao A.7 (Distancia media). A distancia media em um grafo conexo G = 〈N,E〉 edefinida como sendo o valor esperado da distancia entre cada par ordenado de nos (vi, vj)pertencentes ao produto cartesiano N ×N , que pode ser escrito como

ES =1

n2

(vi,vj)∈N×N

sij , (A.11)

onde S e a variavel aleatoria que indica a distancia entre dois nos quaisquer da rede. Aquantidade de elementos em N ×N e de |N |2. Assim, o valor esperado representa a mediaaritmetica das distancias.

A partir da analise de valor mınimo e maximo da Equacao A.11, para o caso de grafosconexos, e possıvel verificar a relacao de desigualdade

1− 1

n≤ ES ≤ n− 1

2, (A.12)

onde o termo a esquerda corresponde a distancia media do grafo completo, isto e, o grafopossui todas as arestas possıveis. Ja o termo a direita corresponde a distancia mediano grafo linear. Se o grafo, alem de conexo, possui a propriedade em que a sentenca(∀eij ∈ E)((∃eji ∈ E)((eij = (vi, vj)) ∧ (eji = (vj , vi)))) e sempre satisfeita, entao, epossıvel reduzir a quantidade de calculos de distancia quase que pela metade. Isso porque,nessas condicoes, tem-se que sij = sji, mesmo que a sentenca (∃eij ∈ E)(ω(eij) 6= ω(eji))seja verdadeira. Portanto, nessas condicoes, e possıvel redefinir a distancia media como

ES =2

n(n + 1)

(vi,vj)∈N×N : i≥j

sij , (A.13)

que pode reduzir o tempo de calculo de ES praticamente pela metade. Porem, porse tratar de uma reducao em um fator constante, essa otimizacao nao impacta de formasignificativa a complexidade teorica do calculo da distancia media. Na Equacao A.13, arestricao do somatorio exclui os pares simetricos mas mantem os casos em que i = j a fimde estabelecer equivalencia com a equacao original. A partir da Equacao A.11, que e maisgeral e possui a mesma complexidade assintotica da Equacao A.13, e possıvel elaborar umalgoritmo para calcular a distancia media em um grafo conexo.

Algoritmo A.5 (Distancia media). E possıvel calcular a distancia media em um grafoa partir de sua representacao em lista de adjacencia com base no Algoritmo A.3 e naEquacao A.11, como descrito pelo procedimento a seguir.

algoritmo distancia-media(L)1: Lista de adjacencia L de um grafo direcionado G = 〈N,E〉.2: m← 03: para cada v ∈ N faca4: 〈s, p〉 ← distancia(L, v) Calcula as distancias de v para os outros nos do grafo.5: para i de 1 ate |N | faca6: m← s[i]7: fim para8: fim para9: retorne m/|N |2 Soma das distancias sobre o quadrado da quantidade de nos.

Considerando que o grafo e conexo e que n = |N |, a complexidade em tempo do algoritmoe da ordem de Θ(n2 EGout) e sua complexidade em memoria e da ordem de Θ(n).

Page 119: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

96 Apendice A. Caracterizacao de redes complexas

A complexidade em tempo do Algoritmo A.5 seria de ordem quadratica se a quan-tidade de execucoes da linha 5 fosse o ponto crıtico. Porem, como a complexidade doAlgoritmo A.3 (a funcao ‘distancia()’ na linha 4) e da ordem de Θ(nEGout), para grafosconexos, e este algoritmo e utilizado n = |N | vezes, entao a complexidade em tempo do Al-goritmo A.5 e de Θ(n2 EGout). Ja a complexidade em memoria necessita de consideracoesacerca da polıtica de alocacao e liberacao de memoria do vetor s. Na implementacao doAlgoritmo A.5, se o bloco de memoria associado ao vetor sempre e desalocado antes deuma nova associacao, tem-se que sua complexidade em memoria e da ordem de Θ(n),caso contrario, sera da ordem de Θ(n2). Porem, a falta da implementacao de uma es-trategia de desalocacao da memoria associada ao vetor s esta mais para um problema deimplementacao de que para algo relacionado a natureza do algoritmo. Por esse motivo,estabelece-se que sua complexidade em memoria e da ordem de Θ(n).

A.2.3 Diametro

A distancia maxima entre dois nos de uma rede representa o pior caso de eficiencia napropagacao de informacao atraves dela. No projeto de redes complexas, pode ser desejavelque essa distancia maxima nao ultrapasse um determinado limiar. O conceito de diametroda rede representada por grafos e apresentado a seguir.

Definicao A.8 (Diametro). O diametro de um grafo G = 〈N,E〉 e definido como amaior distancia entre dois nos quaisquer do grafo. Para grafo direcionados, esse conceitopode ser quantificado da seguinte forma

d(G) = max(vi,vj)∈N×N

sij , (A.14)

onde sij representa a distancia partindo do no vi em direcao ao no vj .

Com base na Definicao A.8, e possıvel identificar que, assim como nao ha sentido emquantificar a distancia media em grafos nao conexos, a funcao de diametro d(G) nao temutilidade em quantificar o diametro de grafos nao conexos. Por esse motivo, o seguintealgoritmo e definido apenas para grafos conexos.

Algoritmo A.6 (Diametro). E possıvel calcular o diametro de um grafo a partir de suarepresentacao em lista de adjacencia com base no Algoritmo A.3 e na Equacao A.14, comodescrito pelo procedimento a seguir.

algoritmo diametro(L)1: Lista de adjacencia L de um grafo direcionado G = 〈N,E〉.2: d← 03: para cada v ∈ N faca4: 〈s, p〉 ← distancia(L, v) Calcula as distancias de v para os outros nos do grafo.5: para i de 1 ate |N | faca6: se d < s[i] entao7: d← s[i]8: fim se9: fim para

10: fim para11: retorne d Maior distancia entre os nos do grafo.Considerando que o grafo e conexo e que n = |N |, a complexidade em tempo do algoritmoe da ordem de Θ(n2 EGout) e sua complexidade em memoria e da ordem de Θ(n).

Page 120: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

A.2. Metricas 97

Devido a similaridade entre os Algoritmos A.3 e A.5, suas complexidades, tanto emtempo quanto em espaco, sao iguais, pelas mesmas justificavas. Assim, a complexidadeem tempo do algoritmo e da ordem de Θ(n2 EGout) e sua complexidade em memoria eda ordem de Θ(n).

A.2.4 Eficiencia

Com a Equacoes A.11 e A.13, alem do Algoritmo A.5, e possıvel quantificar a velocidadede propagacao da informacao na rede. Quando ES e pequeno em relacao a quantidadede nos |N |, sao necessarias poucas transmissoes para que uma mensagem seja propagadaem toda a rede. A velocidade de transmissao na rede e inversamente proporcional a suadistancia media. Essa relacao e explorada no trabalho de Latora & Marchiori (2001)e e denominada eficiencia media da rede. A eficiencia media depende da eficiencia dapropagacao da informacao entre os nos da rede. A eficiencia entre dois nos e definida aseguir.

Definicao A.9 (Eficiencia). Em um grafo G = 〈N,E〉, a medida de eficiencia associadaao trajeto partindo de um no vi para um no vj , denotada por fij , e dada em funcao doinverso da distancia entre os dois nos, ou seja

fij =1

sij, (A.15)

onde sij e a distancia do no vi em direcao ao no vj e i 6= j, pois sii = 0.

Apesar de nao ser definida para i = j, a medida fij e definida quando nao ha umcaminho entre os dois nos vi e vj , nesse caso, admitindo sij = ∞, tem-se que fij = 0.A eficiencia media nao exige que o grafo G seja conexo, diferente do que acontece com adistancia media. Com base nessas afirmacoes, a eficiencia media de um grafo e definida aseguir.

Definicao A.10 (Eficiencia media). A eficiencia media de um grafo G = 〈N,E〉, de-notada por EF, consiste na media aritmetica da eficiencia entre todos os pares de nosdistintos da rede, ou seja, todo par do conjunto (vi, vj) ∈ N × N : i 6= j. Portanto, aeficiencia media pode ser calculada como

EF =1

n(n− 1)

(vi,vj)∈N×N : i 6=j

fij , (A.16)

onde n = |N | representa a quantidade de nos e o denominador se deve ao fato de que aquantidade de medidas de eficiencia fij , nesse caso, e de n(n− 1).

A partir da analise da Equacao A.16 e possıvel verificar a seguinte relacao de desigual-dade 0 ≤ EF ≤ 1. Porem, considerando o grafo conexo menos eficiente (topologia emanel direcionada em apenas um sentido), essa desigualdade pode ser reescrita como

Hn−1

n− 1≤ EF ≤ 1, (A.17)

onde Hn representa o n-esimo termo da serie harmonica (definida na Secao de Simbologiado Glossario). Mesmo assim, como Hn e da ordem de Θ(log n), mesmo considerando queo grafo e conexo, a eficiencia ainda pode ser muito baixa. Isso porque o limite inferior

Page 121: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

98 Apendice A. Caracterizacao de redes complexas

tende a 0 quando n tende para infinito. A seguir, e descrito o algoritmo utilizado para secomputar a eficiencia de um grafo.

Algoritmo A.7 (Eficiencia media). E possıvel calcular a eficiencia media em um grafoG a partir de sua representacao em lista de adjacencia com base no Algoritmo A.3 e naEquacao A.16, como descrito pelo procedimento a seguir.

algoritmo eficiencia-media(L)1: Lista de adjacencia L de um grafo direcionado G = 〈N,E〉.2: f ← 03: para cada vi ∈ N faca4: 〈s, p〉 ← distancia(L, vi) Distancias de vi para os outros nos do grafo.5: para j de 1 ate |N | faca6: se i 6= j entao7: f ← 1/s[j] Quando s[j] for diferente de zero.8: fim se9: fim para

10: fim para11: retorne f/(|N |2 − |N |) Eficiencia media do grafo G.Considerando que o grafo e conexo e que n = |N |, a complexidade em tempo do algoritmoe da ordem de Θ(n2 EGout) e sua complexidade em memoria e da ordem de Θ(n).

Devido a similaridade entre os Algoritmos A.7 e A.5, suas complexidades, tanto emtempo quanto em espaco, sao iguais, pelas mesmas justificavas. Assim, a complexidadeem tempo do algoritmo e da ordem de Θ(n2 EGout) e sua complexidade em memoria eda ordem de Θ(n).

A.2.5 Coeficiente de agrupamento

E de se esperar que, se os vizinhos do nos vi possuem uma quantidade suficiente dearestas entre eles, a remocao de vi pouco deve influenciar na eficiencia que o no representapara a rede. Nessas condicoes, a remocao de vi nao influenciaria de forma significativa adistancia media entre os nos da rede. Para quantificar essa influencia, a seguir define-se oconceito de vizinhanca.

Definicao A.11 (Vizinhanca). A vizinhanca de um no vi, denominada h(vi), consisteem um subconjunto de nos de N formado pelos nos em que vi incide, ou seja

h(vi) = vj ∈ N : (vi, vj) ∈ E, (A.18)

onde |h(vi)| = gout(vi) e o valor esperado de vizinhos e equivalente a EGout.

A quantidade de vizinhos do no vi, representada por |h(vi)|, e igual a definicao dograu de saıda do no vi, como apresentado na Equacao A.3 da Definicao A.3. Utilizando aDefinicao A.11, e possıvel analisar o quao denso e o subgrafo dos vizinhos de vi. Quantomais denso e esse subgrafo, maior e a suficiencia do numero de arestas e menor seraa influencia da remocao de vi. E possıvel quantificar a suficiencia do numero de arestasentre os vizinhos como a razao entre a quantidade de arestas existentes sobre a quantidadetotal de possıveis arestas. A quantidade de arestas entre os vizinhos de vi pode ser escritacomo

ti = |(vj , vk) ∈ E : (vj ∈ h(vi)) ∧ (vk ∈ h(vi))|, (A.19)

Page 122: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

A.2. Metricas 99

onde 0 ≤ ti ≤ gout(vi)(gout(vi)−1), cujo valor mınimo representa os casos onde h(vi) = ∅,ou quando nao ha arestas entre os vizinhos, e o valor maximo quando existem todas asgout(vi)(gout(vi) − 1) arestas entre os vizinhos. E possıvel quantificar a densidade dessesubgrafo, ou seja, o quao agrupados sao os vizinhos de um no, por meio da seguintedefinicao e do algoritmo subsequente.

Definicao A.12 (Coeficiente de agrupamento). O coeficiente de agrupamento de um novi e definido como a razao entre a quantidade de arestas entre os vizinhos, denotada ti, ea total de arestas possıvel, da seguinte forma

ci =ti

gout(vi)(gout(vi)− 1), (A.20)

onde e possıvel identificar que 0 ≤ ci ≤ 1.

A partir da Equacao A.20 e possıvel verificar que so e possıvel computar o coeficiente deagrupamento de nos em que gout(vi) > 1, caso contrario teria-se uma divisao por 0. Desseforma, no caso em que gout(vi) ≤ 1 pode-se assumir que o coeficiente de agrupamento enulo, isto e, ((gout(vi) ≤ 1)⇒ (ci = 0)).

Algoritmo A.8 (Coeficiente de agrupamento). E possıvel calcular o coeficiente de agru-pamento de um no da rede representada por um grafo G a partir da representacao em listade adjacencia, com base na Definicao A.12, como descrito pelo procedimento a seguir.

algoritmo agrupamento(L, vi)1: Lista de adjacencia L de um grafo G = 〈N,E〉, e no vi ∈ N .2: ti ← 03: gout ← 04: para cada (vj , pij) ∈ L[vi] faca5: marcar(vj)6: gout ← gout + 17: fim para8: para cada (vj , pij) ∈ L[vi] faca9: para cada (vw, pjw) ∈ L[vj ] faca

10: se vw esta marcado entao11: ti ← ti + 112: fim se13: fim para14: fim para15: retorne ti/(gout(gout − 1)) Coeficiente de agrupamento do no vi.Considerando que n = |N | representa a quantidade de nos do grafo G, a complexidadeem tempo do algoritmo e da ordem de Θ(E2Gout) e sua complexidade em memoria e daordem de Θ(EGout).

Inicialmente, o Algoritmo A.8 marca os nos que sao vizinhos de vi e realiza a contagemda quantidade de vizinhos. Essa marcacao acarreta em uma complexidade em tempo daordem de Θ(EGout). E possıvel eliminar a necessidade de memoria, porem isso acarretano aumento da complexidade em tempo. Opcionalmente, em vez de marcar os nos vizinhos,e possıvel verificar se vw esta dentre os vizinhos de vi no Algoritmo A.8. Essa tarefaadicional e de complexidade Θ(EGout) e acarretaria no aumento da complexidade emtempo do algoritmo, de forma que o algoritmo resultante seria da ordem de Θ(E3Gout).

Page 123: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

100 Apendice A. Caracterizacao de redes complexas

A fim de nao aumentar mais a complexidade em tempo do algoritmo, que ja e maior que acomplexidade em memoria, neste trabalho adota-se a estrategia expressa no Algoritmo A.8.Posteriormente, e realizada a contagem de arestas entre os vizinhos de vi. Assim, espera-se percorrer EGout listas, cujo tamanho esperado e EGout. A complexidade esperadaem tempo do algoritmo e da ordem de Θ(E2Gout). A seguir, o conceito de coeficientede agrupamento de um no, juntamente com o Algoritmo A.8, e utilizado para calcular ocoeficiente de agrupamento da rede, definido a seguir.

Definicao A.13 (Coeficiente de agrupamento da rede). O coeficiente de agrupamentoda rede e definido como a media aritmetica dos coeficientes de agrupamento individuaisde cada no da rede

EC =1

n

vi∈N

ci, (A.21)

onde n = |N | representa a quantidade de nos da rede.

Com base na Definicao A.13 tem-se que EC representa o coeficiente de agrupamentoda rede ou valor esperado do coeficiente de agrupamento dos nos da rede, ja que C e avariavel aleatoria que expressa o coeficiente de agrupamento de um no qualquer da rede.A seguir e apresentado o algoritmo para calcular o coeficiente de agrupamento da rede.

Algoritmo A.9 (Coeficiente de agrupamento da rede). E possıvel calcular o coefici-ente de agrupamento da rede representada por um grafo G a partir com base na mediados coeficientes de agrupamento de cada no da rede, Definicao A.13, como descrito peloprocedimento a seguir.

algoritmo agrupamento-medio(L)1: Lista de adjacencia L de um grafo G = 〈N,E〉.2: c← 03: para cada vi ∈ N faca4: c← c + agrupamento(L, vi)5: fim para6: retorne c/|N | Coeficiente de agrupamento da rede.

Considerando que n = |N | representa a quantidade de nos do grafo G, a complexidade emtempo do algoritmo e da ordem de Θ(nE2Gout) e sua complexidade em memoria e daordem de Θ(EGout).

As complexidades do Algoritmo A.9 dependem de forma direta das complexidades doAlgoritmo A.8. Por utilizar o algoritmo de calculo do coeficiente de agrupamento paracada no, a complexidade em tempo do Algoritmo A.9 e da ordem de Θ(nE2Gout). Ja acomplexidade em memoria, depende da do Algoritmo A.8, portanto, a complexidade emmemoria do Algoritmo A.9 e da ordem de Θ(EGout). Se o valor esperado do grau desaıda dos nos depender da quantidade de nos, tem-se que EGout ∈ O(n). Nesse caso,pode-se considerar que a complexidade em tempo e memoria, no pior caso, e da ordem deO(n3) e O(n), respectivamente. Porem, em redes reais, espera-se que o valor de EGoutseja constante, ou, pelo menos, nao dependa de n linearmente.

Page 124: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes 101

Apendice B

Representacao de redes complexas

“It is not enough to be in the right place at the right time.

You should also have an open mind at the right time.”

Paul Erdos

A Teoria de Redes Complexas apresenta-se como um modelo efetivo para representacaode Sistemas Complexos. Estes Sistemas podem ser representados por elementos (nos ouvertices) e suas relacoes (ligacoes ou arestas). A adocao dessas teorias serve de basepara a criacao de modelos eficazes para o entendimento de redes de grande magnitude ecomplexidade.

Neste Apendice, sao apresentadas representacoes matematicas e computacionais deredes complexas. Especificamente, tem-se como objetivo possibilitar o desenvolvimentode experimentos com base em algoritmos que podem ser utilizados para gerar modelos degrafos. Como contribuicao desta tese, tem-se a demostracao de propriedades topologicasde topologias em anel, em estrela e linear.

Este Apendice esta organizado da seguinte forma: na Secao B.1 e feita uma introducaoacerca de modelos topologicos de redes complexas. Nas Secoes B.2, B.3, B.4 e B.5, saoapresentados modelos e propriedades de grafos determinısticos, aleatorios, de mundo pe-queno e livre de escala, respectivamente.

Page 125: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

102 Apendice B. Representacao de redes complexas

B.1 Introducao

Nesta Secao, sao explorados modelos de topologias que servem como referencia no es-tudo de redes complexas. Inicialmente, serao apresentadas tres topologias determinısticas.O estudo dessas tres estruturas topologicas tem como objetivo introduzir um metodo deutilizacao das metricas de caracterizacao para o estudo das propriedades da estrutura to-pologica de uma rede. Posteriormente, sao apresentados modelos de estruturas topologicasnao determinısticos fundamentais na teoria de redes complexas. Esses modelos fundamen-tais servem como referencia no estudo das propriedades topologicas dessas redes.

B.2 Topologias determinısticas

Nesta Secao, com o objetivo de ilustrar a capacidade de caracterizacao das metricasapresentadas no Apendice A, e feita uma analise de tres tipos de topologias determinısticas[i]

definidas como grafos direcionados conexos e simetricos. Sao elas: (i) topologia em anel,onde os nos sao conectados a fim de formar um unico ciclo que pode ser percorrido em am-bos os sentidos, horario e anti-horario; (ii) topologia em estrela, onde ha um no central quese liga diretamente aos outros, e todos os outros nos ligam-se apenas a ele e (iii) topologiaem linha, ou linear, onde os nos sao dispostos como uma lista permitindo comunicacao emambos os sentidos.

A definicao formal de cada topologia e apresentada na Secao C.1. Em todos os casos,considera-se que se existe uma aresta partindo de vi em direcao ao no vj , entao tambemexiste uma aresta partindo de vj em direcao a vi, ou seja, (((vi, vj) ∈ E)⇔ ((vj , vi) ∈ E)).As topologias sao ilustradas na Figura B.1.

2 41 3 5

2

4

1 3

5

estrela

2

4

1

3

5

anel

linha

Figura B.1: Ilustracao das topologias em anel, em estrela e linear com n nos. A quantidade dearestas e igual para as topologias em linha e estrela, enquanto a em anel e maior em duas unidades.

A seguir as metricas de caracterizacao apresentadas no Apendice A sao aplicadas acada uma das tres topologias determinısticas apresentadas na Figura B.1. Apenas o coe-ficiente de agrupamento nao e aplicado pois ele e nulo para as tres topologias em questao.

[i]Essas tres topologias foram escolhidas porque fazem parte das topologias basicas desenvolvidas noestudo de infraestrutura de comunicacao de redes de computadores.

Page 126: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

B.2. Topologias determinısticas 103

Alem dessa propriedade em comum, outro fato relevante e que essas tres topologias temaproximadamente a mesma relacao entre a quantidade de arestas, ou seja, aproximada-mente a mesma densidade m(G), como definida pela Equacao A.5. Essa propriedade emcomum e importante porque, para uma mesma quantidade de nos, sao utilizadas prati-camente a mesma quantidade de canais de comunicacao, isto e, a mesma quantidade dearestas. De fato, apenas a topologia em anel possui uma quantidade de arestas maior emduas unidades. Porem, assintoticamente essa quantidade torna-se irrelevante. E possıvelafirmar que a implementacao de uma rede com n nos, em qualquer uma das tres topolo-gias, necessita da mesma quantidade de recursos. Isso permite qualificar de forma relativacada uma das topologias.

Distribuicao dos graus Nas tres topologias determinısticas apresentadas, o grau deentrada de cada no e igual ao grau de saıda. Por esse motivo, a seguir, o termo graue utilizado de forma generica. A distribuicao dos nos na topologia em anel possui acaracterıstica peculiar de que apenas existem nos com grau 2. Esse fato implica que afuncao de distribuicao dos graus f(·) consiste em um pico unitario em k = 2, ou seja,

fring(k) = δ(k − 2), (B.1)

onde δ(·) e a funcao delta de Kronecker. Ja na topologia em linha, os dois nos dasextremidade possuem grau unitario enquanto os outros (n − 2) nos tem grau 2. O queresulta em uma funcao de distribuicao com dois picos: o primeiro em k = 1 com amplitude2/n e outro em k = 2 com amplitude (n− 2)/n, ou seja,

fline(k) =2

nδ(k − 1) +

(n− 2)

nδ(k − 2), (B.2)

onde n = |N | representa a quantidade de nos da rede. Na topologia em estrela, o nocentral possui grau (n − 1) e os demais nos grau unitario. A funcao de distribuicao dosgraus de uma topologia em estrela possui dois picos, um em k = 1 de amplitude (n− 1)/ne outro em k = (n− 1) de amplitude 1/n, ou seja,

fstar(k) =(n− 1)

nδ(k − 1) +

1

nδ(k − (n− 1)). (B.3)

Na Tabela B.1, sao apresentadas cada uma das funcoes de distribuicao.

estrelaanel linha

Tabela B.1: Densidade, distribuicao e valor esperado dos graus das topologias determinısticas.

Page 127: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

104 Apendice B. Representacao de redes complexas

Dada a funcao de distribuicao dos graus de cada topologia e possıvel computar o valoresperado do grau a partir da Equacao A.9. Para o caso da topologia em anel tem-se queEG = 2 e para as topologias em estrela e linear o valor esperado tende a 2 quandoa quantidade de nos tende ao infinito. Esse fato indica uma reducao nas complexidadesapresentadas na Tabela 5.1, uma vez que EGout pode ser considerado constante.

Distancia media A distancia media para cada uma das topologias determinısticas apre-sentadas possui um comportamento assintotico distinto. Para que fosse possıvel analisartal comportamento, foi necessario elaborar para cada topologia, um equacao que descre-vesse a distancia media em relacao a quantidade de nos de cada topologia. Essa analisee apresentada na Secao C.1. Alem dos resultados analıticos descritos nessa Secao, foramtambem realizados experimentos computacionais. A distancia media verificada experi-mentalmente para cada tipo de topologia e apresentada na Figura B.2.

0

2

4

6

8

10

12

14

16

18

5 10 15 20 25 30 35 40 45 50

Figura B.2: Distancia media das topologias determinısticas. A variaveis aleatorias S line, Sring eSstar indicam a distancia media nas topologias em linha, em anel e em estrela, respectivamente.

Na Figura B.2, e possıvel verificar que a distancia media na topologia linear e propor-cional a razao da quantidade de nos da rede por 3, por exemplo, para n = 30 tem-se queES line ≈ 10. O que confirma o Corolario C.4, que trata do comportamento assintoticoda distancia media na topologia linear, que afirma que ES line ≃ n/3. Em relacao a to-pologia em anel tem-se que a distancia media e proporcional a razao da quantidade de nosda rede por 4, por exemplo, para n = 40 tem-se que ESring ≈ 10. O que esta em acordocom o Corolario C.2 que define ESring ≃ n/4. Finalmente, em relacao a topologia emestrela, ve-se na Figura B.2 que quanto maior a quantidade de nos o valor esperado deSstar se aproxima de 2, por exemplo, para n = 50 tem-se que ESstar ≈ 1.92. O quetambem e confirmado pelo Corolario C.3, onde ESstar ≃ 2.

Diametro A distancia maxima em uma topologia representa seu diametro, como mos-trado na Equacao A.14. O diametro em uma rede linear e diretamente proporcional a suaquantidade de nos, pois a maior distancia e aquela entre os nos extremos da rede, ou seja,

d(Gline) = n− 1. (B.4)

Page 128: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

B.2. Topologias determinısticas 105

No caso da topologia em anel, o diametro depende da quantidade de nos da rede assim comode sua paridade. Quando a quantidade de nos e ımpar, tem-se que a distancia maxima edefinida como (n+ 1)/2, ja para uma quantidade par, tem-se n/2. Com a composicao dosdois casos, pode-se representar o diametro na topologia em anel da seguinte forma

d(Gring) =

(n + 1)/2 se n e ımparn/2 se n e par

. (B.5)

No caso da topologia em estrela, a maior distancia e aquela entre qualquer par de nos quenao inclua o no central, isto e,

d(Gstar) = 2. (B.6)

Portanto, assim como acontece com a metrica da distancia media, o diametro das topo-logias em linha e anel sao de ordem linear em relacao a quantidade de nos, enquanto atopologia em estrela converge para a constante 2.

Eficiencia media A eficiencia media verificada experimentalmente para cada tipo detopologia e apresentada na Figura B.3.

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

5 10 15 20 25 30 35 40 45 50

Figura B.3: Eficiencia media das topologias basicas determinısticas. A variaveis aleatorias F line,F ring e F star indicam a eficiencia media nas topologias em linha, em anel e em estrela, respectiva-mente.

Em relacao as topologias em anel e linear, ha uma relacao assintotica definida pelaseguinte relacao

EF ring ≃ EF line ≃ 2 log n

n. (B.7)

Esses resultados podem ser verificados nos Corolarios C.6 e C.8, respectivamente. Aeficiencia dessas duas topologias convergem para 0 quando n tende para o infinito, o quenao ocorre no caso da topologia em estrela, cujo comportamento assintotico e definidocomo

EF star ≃ 1

2, (B.8)

Page 129: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

106 Apendice B. Representacao de redes complexas

ou seja, converge para um grau de eficiencia de 50%, como apresentado pelo Corolario C.7.Considerando o exposto sobre a distancia media dessas topologias, esse resultado e espe-rado, pois enquanto a distancia media diverge, a eficiencia media converge para zero. Nessesentido, das tres topologias determinısticas, a topologia em estrela, devido ao fato de suadistancia media nao divergir, assim como seu diametro, e a mais eficiente.

Consideracoes Nesta Secao, foram caracterizadas tres topologias determinısticas quantoa sua distribuicao dos graus, distancia media, diametro e eficiencia media. Foram apre-sentadas relacoes entre cada uma das metricas. Essas relacoes, associadas ao estudo demodelos representativos, podem auxiliar no projeto e o no entendimento da estrutura deredes. Isso pode ser realizado por meio da verificacao de caracterısticas gerais desses mo-delos. A seguir, sao apresentados tres modelos de redes complexas que sao utilizados paracriacao de topologias nao-determinısticas.

B.3 Grafos aleatorios

O modelo tradicional utilizado no estudo de redes complexas foi introduzido por Erdos& Renyi (1959) e compreende o estudo de grafos aleatorios. O procedimento proposto paracriacao desses grafos tem como parametros a quantidade de nos n = |N | e a probabilidadede dois nos quaisquer estarem ligados por uma aresta, denominada p.

Algoritmo B.1 (Criacao de uma rede aleatoria). Criacao da lista de nos e de arestasde um grafo aleatorio a partir da quantidade de nos n e da probabilidade de ligacao p.

algoritmo grafo-aleatorio(n, p)1: Quantidade de nos n e probabilidade de conexao p.2: N ← lista-de-nos(n) Cria uma lista com n nos.3: E ← lista-de-arestas() Cria uma nova lista vazia.4: para cada possıvel aresta e faca5: se distribuicao-uniforme(0, 1) < p entao6: inserir(E, e) Insercao condicionada por sorteio em distribuicao uniforme.7: fim se8: fim para9: retorne G = 〈N,E〉 Grafo aleatorio resultante.

Considerando o laco de repeticao da linha 4, a complexidade do algoritmo em tempo e deΘ(|E|max) e a complexidade esperada em memoria de Θ(n + p|E|max).

O Algoritmo B.1 constroi o grafo aleatorio G com n = |N | nos com grau inicial nulo. Acada iteracao, cada possıvel aresta e adicionada com probabilidade p. Como e necessarioverificar todas as possibilidades de conexao, sua complexidade em tempo e da ordem deΘ(|E|max), onde |E|max representa a quantidade maxima de arestas no grafo. De formageral, tem-se que a quantidade esperada de arestas em um grafo aleatorio e dada por

EErand = p|E|max, (B.9)

onde o termo Erand representa a variavel aleatoria que indica a quantidade de arestas em umgrafo aleatorio qualquer. Como o novo grafo aleatorio possui n nos e a quantidade esperadade arestas e p|E|max, a quantidade necessaria de memoria e da ordem de Θ(n + p|E|max).O valor de |E|max depende do tipo de grafo a ser considerado. Esse valor e n(n− 1) se ografo for direcionado e n(n− 1)/2 se for nao direcionado.

Page 130: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

B.3. Grafos aleatorios 107

Distribuicao dos graus Bollobas (1981) demonstra que a distribuicao dos graus emum grafo aleatorio segue a seguinte distribuicao binomial

P(Grandk ) =

(

n− 1

k

)

pk(1− p)n−1−k, (B.10)

onde n = |N | representa a quantidade de nos da rede e k o grau de um no. Considerandoo valor esperado de um distribuicao binomial tem-se que o valor esperado do grau em umgrafo aleatorio e dado por [Papoulis & Pillai 2002]

EGrand = p(n− 1), (B.11)

ou seja, se p = 1, entao o valor esperado do grau e igual a (n − 1). Um fato que podeser utilizado tanto em demostracoes quanto na simulacao de grafos aleatorios, e que paravalores grandes de n, a Equacao B.10 pode ser aproximada pela seguinte distribuicao dePoisson [Albert & Barabasi 2002]

P(Grandk ) ≃ zk

k!e−z, (B.12)

onde z = EGrand. Por esse motivo, e comum na literatura de redes complexas que grafosaleatorios desse tipo sejam denominados grafos aleatorios de Poisson.

Diametro e distancia media O distancia maxima em um grafo aleatorio e uma pro-priedade importante para o entendimento de sua eficiencia. Um resultado verificado porvarios autores (ver [ Luczak 1998, Bollobas 2001, Chung & Lu 2001]) e que a distanciamedia em um grafo aleatorio, para valores de p nao muito pequenos, possui a seguinterelacao de proporcionalidade

Ed(Grand) ∝ log n

log EGrand , (B.13)

que possibilita a seguinte conjectura sobre valor esperado da distancia em um grafoaleatorio [Albert & Barabasi 2002]

ESrand ∝ log n

log EGrand . (B.14)

Este fato possibilita concluir que grafos aleatorios possuem uma distancia media pequenaem relacao a quantidade de nos. Especificamente, o distancia media e logarıtmica emfuncao da quantidade de nos, o que indica que grafos aleatorios tambem sao eficientes.

Coeficiente de agrupamento da rede Em um grafo aleatorio, o coeficiente de agrupa-mento esperado pode ser obtido com base na valor esperado de vizinhos e na probabilidadede conexao p. O valor esperado de ligacoes entre os vizinhos de qualquer no do grafo podeser definido como

EDrand = pEGrand(EGrand − 1), (B.15)

onde Drand representa a variavel aleatoria que indica a quantidade arestas entre os vizi-nhos de um no qualquer em um grafo aleatorio e o fator multiplicado por p representaa quantidade maxima de arestas entre os vizinhos de um no qualquer. Para encontrar o

Page 131: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

108 Apendice B. Representacao de redes complexas

coeficiente de agrupamento, e suficiente dividir EDrand pela quantidade total possıvelde arestas entre os vizinhos, ou seja, EGrand(EGrand − 1), que resulta em

ECrand = p. (B.16)

Dessa forma, e possıvel verificar que o agrupamento da rede depende diretamente, e uni-camente, da probabilidade de conexao p.

Consideracoes A teoria de grafos aleatorios consistiu no estado da arte do estudo deredes complexas por decadas ate a descoberta de alguns princıpios de organizacao emredes reais, que naturalmente contrastam com sua natureza puramente aleatoria. Porem,a teoria de grafos aleatorios ainda e significativa, uma vez que algumas propriedades dessesnovos modelos tambem sao presentes em grafos aleatorios.

B.4 Mundo pequeno

Watts & Strogatz (1998) propuseram um modelo, denominado modelo de mundo pe-queno (ou small-world)[ii], em que e possıvel, por meio do controle de um parametro p,interpolar entre a construcao de uma estrutura regular e a estrutura de um grafo aleatorio.Nesse modelo, e construıdo um grafo regular inicial com n nos, onde existe uma arestaentre cada no e seus h vizinhos. Considerando os extremos, para p = 0 nao ha alteracaona estrutura regular inicial e para p = 1 a estrutura se comporta de forma similar a umgrafo aleatorio. Porem, mesmo para p = 1 algumas propriedades do grafo de mundo pe-queno difere da contrapartida aleatoria discutida na Secao B.3. O algoritmo que descrevea construcao desse tipo de grafo e apresentado a seguir.

Algoritmo B.2 (Criacao de uma rede de mundo pequeno). Criacao da lista de nos e dearestas de um grafo de mundo pequeno a partir da quantidade de nos n, da quantidadede vizinhos h e da probabilidade de religacao p.

algoritmo grafo-mundo-pequeno(n, h, p)1: Quantidade de nos n, grau inicial h e probabilidade de reconexao p.2: G← grafo-regular(n, h) Cria grafo regular G = 〈N,E〉.3: para cada aresta e ∈ E faca4: se distribuicao-uniforme(0, 1) < p entao5: e← redefinir(e) Redefinir conexao evitando lacos e arestas multiplas.6: fim se7: fim para8: retorne G = 〈N,E〉 Grafo de mundo pequeno resultante.

Considerando o laco de repeticao da linha 3 e a quantidade de arestas do grafo, tanto acomplexidade em tempo como a em memoria do algoritmo e da ordem de Θ(nh).

O Algoritmo B.2 possui complexidade assintotica em tempo dependente da quantidadede iteracoes do procedimento ‘grafo-regular()’, que tem como princıpio criar os n nos e asn(h/2) arestas (considerado h par). A complexidade em tempo desse procedimento e daordem de Θ(nh). O mesmo acontece com o laco de repeticao da linha 3, que deve iterarsobre todo o conjunto de arestas, cujo tamanho e da ordem de n(h/2), considerando que

[ii]Esse modelo possui esse nome porque e baseado no trabalho de Milgram (1967), que apresenta umatendencia natural da separacao de indivıduos por uma pequeno quantidade de conhecidos em comum.

Page 132: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

B.4. Mundo pequeno 109

o procedimento ‘redefinir()’ e de ordem constante. Portanto o algoritmo possui complexi-dade em tempo da ordem de Θ(nh). A complexidade em memoria do algoritmo dependeda quantidade de arestas, uma vez que se valor mınimo e de (n − 1). Dessa forma, acomplexidade em memoria e tambem da ordem de Θ(nh). Na Figura B.4, e apresentadauma ilustracao da construcao de uma rede desse tipo.

Figura B.4: Exemplo de rede de mundo pequeno com n = 18 nos. Em que o numero de vizinhosh = 4 e a probabilidade de reconexao p = 0.14.

No modelo representado pela Figura B.4 e construıdo um grafo regular inicial comn = 18 e h = 4. O grafo regular e apresentado a esquerda da Figura. Posteriormente, comprobabilidade p = 0.14, cada uma das arestas tem seu destino alterado.

Propriedades Inicialmente, antes da religacao das arestas do grafo, todos os nos pos-suem o mesmo grau h. Dessa forma, a distribuicao dos graus pode ser representada porum impulso unitario em h, ou seja,

P(Gsmallk | p = 0) = δ(k − h). (B.17)

Porem, quando p se aproxima da unidade a distribuicao dos graus se aproxima da mesmadistribuicao de graus encontrada em grafos aleatorios [Albert & Barabasi 2002]. Ja adistancia media quando p = 0 em um grafo de mundo pequeno pode ser definido assinto-ticamente como [Newman 2003]

ESsmall | p = 0 ≃ n

4h, (B.18)

que esta em desacordo com o conceito matematico de mundo pequeno, onde espera-se queES ∝ log n. Porem, Barrat & Weigt (2000) descobriram a existencia da seguinte relacaode transicao de regime de distancia media em funcao do produto (pnh)

ESsmall ∝

n se pnh≪ 1log n se pnh≫ 1

, (B.19)

que resulta no fato de que, para valores nao muito pequenos de p, a distancia media em umgrafo de mundo pequeno e logarıtmica em relacao a quantidade de nos[iii]. Finalmente, emrelacao ao coeficiente de agrupamento, tem-se que o grafo de mundo pequeno apresentadaa seguinte relacao [Barrat & Weigt 2000]

ECsmall ≃ 3(h− 1)

2(2h− 1)(1− p)3, (B.20)

[iii]A partir desse conceito tem-se que grafos aleatorios tambem sao de mundo pequeno, considerandovalores nao muito pequenos da probabilidade de conexao em grafos aleatorios.

Page 133: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

110 Apendice B. Representacao de redes complexas

que mostra que, para p = 0, o agrupamento tende a 3/4 para valores grandes de h. Ja paravalores de p proximo de 1, o coeficiente de agrupamento se aproxima de 0. Assim, paravalores nao muito pequenos de p, um grafo de mundo pequeno possui uma distribuicaodos graus similar ao de grafos aleatorios, uma distancia media de ordem logarıtmica e umcoeficiente de agrupamento relativamente alto.

B.5 Livre de escala

Barabasi & Albert (1999) verificaram que grande parte das redes reais possuem umadistribuicao dos graus que parecia seguir uma lei de potencia, ou seja, a probabilidade deum no possuir grau k e proporcional a potencia k−α, para alguma constante α. Isso naoacontece com os modelos de mundo pequeno e de grafo aleatorio, onde essa distribuicaose aproxima de uma exponencial, por exemplo, a da Equacao B.12. Umas das principaisconsequencias desse comportamento e que a probabilidade de existirem nos com grauelevado e significativamente maior que nos outros dois modelos. Para se criar um modeloque reproduzisse esse resultado, criou-se um procedimento incremental de insercao de nosna rede, em que ha uma ligacao preferencial (preferential attachment) dos novos nos emrelacao aos nos existentes com maior grau.

A cada iteracao do processo de criacao do grafo, deve-se considerar a quantidade dearestas que serao criadas para o novo no, representada por m. Para m = 1, tem-se acriacao de estruturas do tipo arvore, como a apresentada na Figura B.5. O processo decriacao de um grafo livre de escala e representado pelo algoritmo a seguir.

Algoritmo B.3 (Criacao de uma rede livre de escala). Criacao da lista de nos e dearestas de um grafo livre de escala a partir da quantidade de nos n, da quantidade dearestas por insercao m.

algoritmo grafo-livre-de-escala(n,m)1: Quantidade de nos n e quantidade de arestas por insercao m.2: N ← lista-de-nos(m) Cria uma lista com m nos com grau nulo.3: E ← lista-de-arestas() Cria uma nova lista vazia.4: enquanto |N | < n faca5: h← sortear-vizinhos(N,m) Escolha preferencial de vizinhos com maior grau.6: i← |N |+ 17: inserir(N, vi)8: para cada vj ∈ h faca9: inserir(E, (vi, vj))

10: fim para11: fim enquanto12: retorne G = 〈N,E〉 Grafo livre de escala resultante.Considerando o procedimento de sorteio da linha 5, a complexidade em tempo e da ordemde Θ(mn2). Ja a complexidade em memoria depende da quantidade de arestas, que e daordem de Θ(mn).

A complexidade em tempo do Algoritmo B.3 depende diretamente da escolha dasarestas considerando a ligacao preferencial, ou seja, do procedimento ‘sortear-vizinhos()’.Esse procedimento devera sortear m vizinhos, considerando a escolha de um dentre os(n − 1) possıveis. Desconsiderando a possibilidade de sorteios com resultados iguais, acomplexidade do procedimento ‘sortear-vizinhos()’ deve ser da ordem de Θ(mn). Essa

Page 134: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

B.5. Livre de escala 111

complexidade e associada a do laco de repeticao da linha 4, que executa (n−m+1) vezes,e faz com que a complexidade em tempo do algoritmo seja da ordem de Θ(mn2). Ja acomplexidade em memoria depende exclusivamente da quantidade de arestas do grafo.Considerando grafos nao direcionados livre de escala, criados com base no Algoritmo B.3,essa quantidade e de exatamente

|Efree| = m(n−m) (B.21)

arestas. Como m≪ n, a complexidade em memoria e da ordem de Θ(mn).

Para ilustrar a evolucao da criacao de uma rede livre de escala a partir do Algo-ritmo B.3, um exemplo da criacao de um grafo e apresentado na Figura B.5.

Figura B.5: Exemplo da evolucao de uma rede livre de escala. Representacao da rede para valoresde n = 10, 20, 30, 40, 50, considerando m = 1.

Na Figura B.5, a rede livre de escala possui parametro m = 1. E possıvel verificarcom a evolucao da rede como os nos de maior grau possuem uma ligacao preferencial. Asdemais propriedades desse modelo em relacao as metricas sao apresentadas a seguir.

Distribuicao de lei de potencia A caracterıstica que denomina uma rede livre deescala e a sua distribuicao dos graus dos nos. Essa distribuicao segue uma lei de potencia,ou seja, Gfreek ∼ k−α, onde a probabilidade de no qualquer de uma rede livre de escalapossuir grau k e definida por

P(Gfreek ) ≃ ck−α, (B.22)

onde α e uma constante que deve, necessariamente, ser maior que a unidade[iv], a fim degarantir a convergencia da distribuicao e c e uma constante de normalizacao, necessaria,uma vez que, por se tratar de uma distribuicao discreta de probabilidade, deve-se verificar∑∞

k=1 ck−α = 1. O valor mınimo e maximo de k e m e (n − 1), respectivamente, o que

simplifica a restricao da distribuicao para

c

n−m∑

k=m

k−α = 1, (B.23)

que permite inferir que c deve ser o inverso multiplicativo do somatorio. Com o objetivo deapresentar um forma comumente utilizada para se verificar se uma rede e livre de escala,sao apresentadas as frequencias dos graus de tres redes livre de escala na Figura B.6.

[iv]Para redes reais, geralmente e verificada a relacao 2 < α < 3 [Albert & Barabasi 2002].

Page 135: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

112 Apendice B. Representacao de redes complexas

0

1

2

3

4

0 1 2 3

grau

freq

uên

cia

do g

rau

Figura B.6: Distribuicao dos graus dos nos em uma rede livre de escala considerando valores dem = 1, 4, 7 em uma rede com 104 nos. As marcacoes indicam o expostente na base 10.

Por causa da dependencia do valor inicial de k em funcao de m, na Figura B.6, assequencias de frequencia para cada valor de m iniciam e terminam em valores distintosde k. Alem disso, e possıvel verificar que, utilizando a escala logarıtmica, distribuicoesque obedecem uma lei de potencia possuem um comportamento linear. E verificando essecomportamento que, comumente, se classifica uma rede real como livre de escala[v]. Emrelacao a distancia media, tem-se que, pelo trabalho de Bollobas & Riordan (2004), emum grafo livre de escala a seguinte relacao de proporcionalidade e verificada

ES free ∝ log n

log log n, (B.24)

o que demostra que grafos livre de escala tambem sao coerentes com o conceito de mundopequeno. Porem, o coeficiente de agrupamento da rede difere tanto do modelo de mundopequeno como do de grafo aleatorio. Isso porque seu valor e estabelecido pela seguinterelacao

ECfree ∝ log n

n, (B.25)

que depende da quantidade de nos, como pode ser verificado no trabalho de Eggemann &Noble (2011), e converge para 0 para valores assintoticos de n.

[v]Um estudo sobre verificacao de distribuicao de leis de potencia e apresentado em [Clauset et al. 2009].

Page 136: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes 113

Apendice C

Resultados complementares

Neste Apendice, sao apresentadas Definicoes, Teoremas, Lemas e Corolarios desenvol-vidos durante o trabalho e utilizados na tese. Nas Secoes C.1 e C.2 sao apresentadosresultados da caracterizacao e da observabilidade das redes determinısticas, respectiva-mente. Finalmente, na Secao C.3, sao apresentados resultados associados ao tempo deexecucao do algoritmo e a escalabilidade da visualizacao.

C.1 Caracterizacao de redes determinısticas

As Definicoes a seguir servem de base para a demostracao dos resultados subsequentes.

Definicao C.1 (Grafo direcionado em anel). Um grafo direcionado G = 〈N,E〉 e ditoem anel se e possıvel rotular seus nos de forma a satisfazer as sentencas:

1. (((v1, vn) ∈ E) ∧ ((vn, v1) ∈ E)),2. (∀vi ∈ N)((gin(vi) = 2) ∧ (gout(vi) = 2)),3. (∀vi ∈ N)((1 ≤ i < n)⇔ ((vi, vi+1) ∈ E)) e4. (∀vi ∈ N)((1 < i ≤ n)⇔ ((vi, vi−1) ∈ E));

onde n = |N | representa a cardinalidade do conjunto de nos N = v1, v2, . . . , vn e gin(vi)e gout(vi) representam o grau de entrada e saıda de vi, respectivamente.

Definicao C.2 (Grafo direcionado em estrela). Um grafo direcionado G = 〈N,E〉 e ditoem estrela se e possıvel rotular seus nos de forma a satisfazer as sentencas:

1. (∀vi ∈ N)((1 < i ≤ n)⇔ (((v1, vi) ∈ E) ∧ ((vi, v1) ∈ E))) e2. (∀vi ∈ N)((1 < i ≤ n)⇔ ((gin(vi) = 2) ∧ (gout(vi) = 2)));

onde n = |N | representa a cardinalidade do conjunto de nos N = v1, v2, . . . , vn e gin(vi)e gout(vi) representam o grau de entrada e saıda de vi, respectivamente.

Definicao C.3 (Grafo direcionado em linha). Um grafo direcionado G = 〈N,E〉 e ditoem linha se e possıvel rotular seus nos de forma a satisfazer as sentencas:

1. (((v1, vn) /∈ E) ∧ ((vn, v1) /∈ E)),2. (∀vi ∈ N)((1 ≤ i < n)⇔ ((vi, vi+1) ∈ E)),3. (∀vj ∈ N)((1 < j ≤ n)⇔ ((vj , vj−1) ∈ E)) e4. (∀vi ∈ N)((1 < i < n)⇔ ((gin(vi) = 2) ∧ (gout(vi) = 2)));

onde n = |N | representa a cardinalidade do conjunto de nos N = v1, v2, . . . , vn e gin(vi)e gout(vi) representam o grau de entrada e saıda de vi, respectivamente.

Page 137: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

114 Apendice C. Resultados complementares

Distancia media na topologia em anel

Lema C.1 (Distancia media na topologia em anel). A distancia media de uma topo-logia descrita por um grafo direcionado G = 〈N,E〉 em anel, em conformidade com aDefinicao C.1, e dado por

ESring =1

2n

[

⌊n

2

⌋(⌊n

2

+ 1)

+

(n− 1)

2

⌋(⌊

(n− 1)

2

+ 1

)]

, (C.1)

onde n = |N | representa a quantidade de nos do grafo.

Demonstracao. Devido ao caracter circular da topologia em anel, qualquer no do grafotera a mesma soma total de distancias para os demais nos da rede. Considerando umarede com n = |N | nos, a sequencia de distancias de cada no pode ser representada por(1+2+ · · ·+(n−1)/2+(n−1)/2+ · · ·+2+1) se n for ımpar e (1+2+ · · ·+n/2+ · · ·+2+1)se n for par. Essas sequencias podem ser representadas pelo seguinte par de somatorios

⌊n/2⌋∑

i=1

i +

⌊(n−1)/2⌋∑

i=1

i

,

uma vez que ⌊n/2⌋ = ⌊(n − 1)/2⌋ se n e impar e ⌊n/2⌋ = ⌊(n − 1)/2⌋ + 1 se n e par.Considerando a Definicao A.7 e que a rede possui n nos, a distancia media na topologiaem anel e representa por

ESring =1

n2

n

⌊n/2⌋∑

i=1

i +

⌊(n−1)/2⌋∑

i=1

i

.

Como os somatorios caracterizam uma progressao aritmetica de ordem 1, e possıvel rees-crever cada somatorio utilizando a relacao

∑xi=1 i = x(x + 1)/2, de forma que

ESring =1

2n

[

⌊n

2

⌋(⌊n

2

+ 1)

+

(n− 1)

2

⌋(⌊

(n− 1)

2

+ 1

)]

,

onde o termo n/2 de cada somatorio foi colocado em evidencia. C.Q.D.

Corolario C.1 (Influencia da paridade de |N | em ESring). Considerando a possibili-dade de valores pares e ımpares para a quantidade de nos, tem-se que a distancia mediaem uma topologia em anel definida no Lema C.1 pode ser expressa por

ESring | n e par =n

4(C.2)

ESring | n e ımpar =n

4− 1

4n, (C.3)

onde n = |N | representa a quantidade de nos do grafo.

Demonstracao. Pode ser demostrado a partir das seguintes substituicoes na Equacao C.1:(i) ⌊n/2⌋ por n/2 e ⌊(n− 1)/2⌋ por (n− 2)/2 quando n e par; e (ii) ⌊n/2⌋ por (n− 1)/2e ⌊(n− 1)/2⌋ por (n− 1)/2 quando n e ımpar. C.Q.D.

Page 138: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

C.1. Caracterizacao de redes determinısticas 115

Corolario C.2 (Comportamento assintotico de ESring). Em uma topologia em anel,a distancia media possui um comportamento assintotico linear dado pela expressao

ESring ≃ n

4(C.4)

onde n = |N | representa a quantidade de nos do grafo.

Demonstracao. Quando n e par tem-se a igualdade de fato e, portanto, a igualdade as-sintotica tambem e valida. Ja para o caso em que n e ımpar deve-se mostrar que ovalor esperado ESring | n e ımpar e assintoticamente igual a n/4. Isso e verdade selimn→∞ 4 ESring | n e ımpar/n = 1. Utilizando a Equacao C.3 tem-se que

limn→∞

4

n

(

n

4− 1

4n

)

deve ser unitario. Distribuindo o fator em evidencia e o limite, e possıvel reescrever aexpressao como

limn→∞

4

n

(

n

4− 1

4n

)

= 1− limn→∞

1

n2,

onde o limite a direita converge para zero, fazendo com que ESring ≃ n/4. C.Q.D.

Distancia media na topologia em estrela

Lema C.2 (Distancia media na topologia em estrela). A distancia media de uma to-pologia descrita por um grafo direcionado G = 〈N,E〉 em estrela, como apresenta aDefinicao C.2, e dado por

ESstar =2

n

(

n− 2 +1

n

)

, (C.5)

onde n = |N | representa a quantidade de nos do grafo.

Demonstracao. As distancias entre os nos de uma topologia em estrela podem ser dividasem relacao ao no central e entre os demais nos. Nesse sentido, tem-se 2(n− 1) distanciasde tamanho 1 em direcao e a partir do no central e (n− 1)(n− 2) distancias de tamanho2. Utilizando a definicao de distancia media e possıvel descreve-la no caso da topologiaem estrela da seguinte forma

ESstar =1

n2[2(n− 1) + 2(n− 1)(n− 2)] ,

onde, ao se evidenciar a constante, desenvolver o produto na parte interna dos colchetes edistribuir o denominador em evidencia na parte interna, e possıvel reescrever a expressaocomo

ESstar = 2

(

1− 2

n+

1

n2

)

, (C.6)

de onde pode-se obter a Equacao C.5 ao se colocar o termo 1/n em evidencia. C.Q.D.

Corolario C.3 (Comportamento assintotico de ESstar). Em uma topologia em estrelaa distancia media possui um comportamento assintotico linear dado pela expressao

ESstar ≃ 2, (C.7)

onde n = |N | representa a quantidade de nos do grafo.

Page 139: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

116 Apendice C. Resultados complementares

Demonstracao. Pode ser demostrado a partir da aplicacao do limite quando n tende aoinfinito na Equacao C.6, onde na parte interna dos parenteses resta a unidade, que mul-tiplicada com o termo em evidencia resulta em ESstar ≃ 2. C.Q.D.

Distancia media na topologia em linha

Lema C.3 (Distancia media na topologia em linha). A distancia media de uma topologiadescrita por um grafo direcionado G = 〈N,E〉 em linha, como apresenta a Definicao C.3,e dado por

ES line =1

3

(

n− 1

n

)

, (C.8)

onde n = |N | representa a quantidade de nos do grafo.

Demonstracao. Na topologia em linha, a distancia de cada no em relacao aos demais podeser escrita como um somatorio sobre a quantidade de nos a esquerda e a direta do no emquestao. Dado um no qualquer vi, a quantidade de nos a esquerda e de (i− 1), e portantoo somatorio das distancias a esquerda pode ser representado por

∑i−1k=1 k. Por sua vez, a

quantidade de nos a direita e de (n − i) e, portanto, o somatorio das distancias a direitapode ser representado por

∑n−ij=1 j. Considerando a soma das distancias para cada um dos

nos, a distancia media em uma topologia linear pode ser representada por

ES line =1

n2

n∑

i=1

i−1∑

k=1

k +n−i∑

j=1

j

,

que pode ser reescrito da seguinte forma a partir da solucao dos somatorios interiores

ES line =1

n2

n∑

i=1

[

(n− i)2 + (n− i) + (i− 1)2 + (i− 1)]

.

A partir da solucao de cada termo do somatorio e da combinacao dos resultados, tem-sea seguinte expressao resultante

ES line =1

n2

[

1

3(n3 − n)

]

,

que pode ser reescrita como

ES line =1

3

(

n− 1

n

)

,

a partir da distribuicao do fator mais a esquerda. C.Q.D.

Corolario C.4 (Comportamento assintotico de ES line). Em uma topologia em linha,a distancia media possui um comportamento assintotico linear dado por

ES line ≃ n

3(C.9)

onde n = |N | representa a quantidade de nos do grafo.

Page 140: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

C.1. Caracterizacao de redes determinısticas 117

Demonstracao. Se limn→∞ 3 ES line/n = 1, entao a Equacao C.9 e verdadeira. Utili-zando a Equacao C.8, tem-se que

limn→∞

3

n

[

1

3

(

n− 1

n

)]

,

deve ser unitario. Distribuindo o fator em evidencia e o limite, e possıvel reescrever aexpressao como

limn→∞

1

n

(

n− 1

n

)

= 1− limn→∞

1

n2,

onde o limite a direita converge para zero, fazendo com que ES line ≃ n/3. C.Q.D.

Eficiencia media na topologia em anel

Lema C.4 (Eficiencia media na topologia em anel). A eficiencia media de uma topologiadescrita por um grafo direcionado G = 〈N,E〉 em anel, como apresenta a Definicao C.1,e dado por

EF ring =1

(n− 1)

(

H⌊n/2⌋ + H⌊(n−1)/2⌋

)

, (C.10)

onde n = |N | representa a quantidade de nos do grafo e Hn a soma dos n primeiros termosda serie harmonica (definida na Secao de Simbologia do Glossario).

Demonstracao. Devido ao caracter circular da topologia em anel, qualquer no do grafotem a mesma soma total de eficiencias para os demais nos da rede. Considerando umarede com n = |N | nos, a sequencia de distancias de cada no pode ser representada por(1+2+· · ·+(n−1)/2+(n−1)/2+· · ·+2+1) se n for ımpar e (1+2+· · ·+n/2+· · ·+2+1) sen for par. Assim, e possıvel definir a eficiencia media, de forma geral, com essas sequenciasrepresentadas pelo par de somatorios

EF ring =1

n(n− 1)

n

⌊n/2⌋∑

i=1

1

i+

⌊(n−1)/2⌋∑

i=1

1

i

,

de onde, a partir da evidenciacao do termo n e utilizando para representacao do somatorioa notacao de serie harmonica, H⌊n/2⌋ e H⌊(n−1)/2⌋, respectivamente, tem-se como resultadoa Equacao C.10. C.Q.D.

Corolario C.5 (Influencia da paridade de |N | em EF ring). Considerando a possibili-dade de valores pares e ımpares para a quantidade de nos na topologia em anel, tem-seque a eficiencia media da topologia em anel, definida no Lema C.4, pode ser escrita, paracada caso, como

EF ring | n e ımpar =2

(n− 1)

(

H((n−1)/2)

)

(C.11)

EF ring | n e par =1

(n− 1)

(

H(n/2) + H((n−2)/2)

)

, (C.12)

onde n = |N | representa a quantidade de nos do grafo e Hn a soma dos n primeiros termosda serie harmonica (definida na Secao de Simbologia do Glossario).

Page 141: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

118 Apendice C. Resultados complementares

Demonstracao. A demostracao e feita a partir da substituicao de H⌊n/2⌋ e H⌊(n−1)/2⌋, porH((n−1)/2) quando n e ımpar. E da substituicao de H⌊n/2⌋ por H(n/2), e H⌊(n−1)/2⌋, porH((n−2)/2), quando n e par. C.Q.D.

Corolario C.6 (Comportamento assintotico de EF ring). Em uma topologia em anel,a eficiencia media possui um comportamento assintotico que pode ser escrita como

EF ring ≃ 2 log n

n, (C.13)

onde n = |N | representa a quantidade de nos do grafo.

Demonstracao. Utilizando a relacao Hn ≃ logn + γ, e possıvel reescrever a Equacao C.10da seguinte forma

EF ring ≃ 1

(n− 1)

(

log⌊n

2

+ γ + log

n− 1

2

+ γ

)

. (C.14)

Se limn→∞ EF ring/f(n) = 1, entao EF ring ≃ f(n). Como EF ring depende daparidade de n, serao considerados os dois casos. Considerando que a quantidade de nosn = |N | e par, tem-se que

EF ring | n e par ≃ 1

(n− 1)

[

log(n

2

)

+ log

(

n− 2

2

)

+ 2γ

]

,

onde e possıvel aplicar a identidade log x/y = log x− log y, resultando em

EF ring | n e par ≃ 1

(n− 1)(log n + log(n− 2) + 2(γ − log 2)) .

Para se verificar a igualdade assintotica, considera-se f(n) = (2 log n)/n. Portanto o limitepode ser descrito como

limn→∞

n

2 log n

1

(n− 1)(log n + log(n− 2) + 2(γ − log 2)) ,

que pode ser representado pela soma dos limites

limn→∞

n

2 log n

logn

n− 1+ lim

n→∞

n

2 log n

log(n− 2)

n− 1+ lim

n→∞

n

2 log n

2(γ − log 2)

n− 1=

1

2+

1

2+ 0 = 1.

Enquanto os dois primeiros limites convergem para 1/2, o terceiro converge para 0. Deforma que o resultado e a unidade, confirmando a igualdade assintotica. Para o segundocaso, quando n e ımpar, temos que

EF ring | n e ımpar ≃ 2

(n− 1)(log(n− 1) + γ − log 2) ,

onde a igualdade assintotica depende do limite que pode ser descrito como

limn→∞

n

2 logn

2

(n− 1)(log(n− 1) + (γ − log 2)) ,

que pode ser representado pela soma dos limites

limn→∞

n

logn

log(n− 1)

(n− 1)+ lim

n→∞

n

log n

γ − log 2

(n− 1)= 1 + 0 = 1,

onde o primeiro limite converge para 1 enquanto o segundo converge para 0. Portanto,EF ring ≃ (2 log n)/n. C.Q.D.

Page 142: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

C.1. Caracterizacao de redes determinısticas 119

Eficiencia media na topologia em estrela

Lema C.5 (Eficiencia media na topologia em estrela). A eficiencia media de uma to-pologia descrita por um grafo direcionado G = 〈N,E〉 em estrela, como apresenta aDefinicao C.2, e dada por

EF star =1

2+

1

n, (C.15)

onde n = |N | representa a quantidade de nos do grafo.

Demonstracao. As eficiencias entre os nos de uma topologia em estrela podem ser dividasem relacao ao no central e dentre os demais nos ja que tem-se 2(n−1) eficiencias unitariasem direcao e a partir do no central e (n − 1)(n − 2) eficiencias de valor 1/2. Utilizandoa definicao de eficiencia media e possıvel descreve-la, no caso da topologia em estrela, daseguinte forma

EF star =1

n(n− 1)

[

2(n− 1) +1

2(n− 1)(n− 2)

]

,

onde e possıvel por em evidencia o termo (n−1), cancelando com o respectivo denominadorna fracao a esquerda, resultando em

EF star =1

n

[

2 +1

2(n− 2)

]

,

que, a partir da distribuicao dos termos em evidencia, pode ser reescrito como

EF star =1

n

(

1 +n

2

)

,

de onde pode-se verificar a equivalencia com a Equacao C.15. C.Q.D.

Corolario C.7 (Comportamento assintotico de EF star). Em uma topologia em estrela,a eficiencia media possui um comportamento assintotico que pode ser escrito como

EF star ≃ 1

2, (C.16)

onde n = |N | representa a quantidade de nos do grafo.

Demonstracao. Ao se considerar valores assintoticos de n o segundo termo da Equacao C.15tende a 0, restando apenas a fracao 1/2. C.Q.D.

Eficiencia media na topologia em linha

Lema C.6 (Eficiencia media na topologia em linha). A distancia media de uma topologiadescrita por um grafo direcionado G = 〈N,E〉 em linha, como apresenta a Definicao C.3,e dada por

EF line =2

(n− 1)(Hn−1) , (C.17)

onde n = |N | representa a quantidade de nos do grafo.

Page 143: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

120 Apendice C. Resultados complementares

Demonstracao. Na topologia em linha, a eficiencia de cada no em relacao aos demais podeser expressa como um somatorio do inverso multiplicativo das quantidade de nos a esquerdae a direta do no em questao. Dado um no qualquer vi, a quantidade de nos a esquerda ede (i − 1) e, portanto, o somatorio das eficiencias a esquerda pode ser representado por∑i−1

k=1 1/k. Por sua vez, a quantidade de nos a direita e de (n− i) e, portanto, o somatoriodas distancias a direita pode ser representado por

∑n−ij=1 1/j. Considerando a soma das

eficiencias para cada um dos nos, a eficiencia media em uma topologia linear pode serrepresentada por

EF line =1

n(n− 1)

n∑

i=1

i−1∑

k=1

1

k+

n−i∑

j=1

1

j

,

que, utilizando a representacao por serie harmonica dos somatorios interiores, pode serreescrito da seguinte forma

EF line =1

n(n− 1)

n∑

i=1

(

H(i−1) + H(n−i)

)

,

onde os somatorios podem ser reescritos utilizando a relacao∑n

i=1 H(i−1) =∑n−1

i=1 Hi e∑n

i=1 H(n−i) =∑n−1

i=1 Hi, resultando em

EF line =2

n(n− 1)

n−1∑

i=1

Hi ,

que, a partir da relacao∑n−1

i=1 Hi = n(Hn−1) pode ser definido como

EF line =2

(n− 1)(Hn−1) ,

de forma que o denominador n da fracao e cancelado. C.Q.D.

Corolario C.8 (Comportamento assintotico de EF line). Em uma topologia em linha,a eficiencia media possui um comportamento assintotico que pode ser dado por

EF line ≃ 2 log n

n, (C.18)

onde n = |N | representa a quantidade de nos do grafo.

Demonstracao. Se limn→∞ EF line/f(n) = 1, entao EF ring ≃ f(n). Para se verificar aigualdade assintotica, considera-se f(n) = (2 log n)/n. Portanto, dada a representacao deEF line descrita pela Equacao C.17, o limite pode ser definido como

limn→∞

n

2 log n

2

(n− 1)(log n + γ − 1),

que pode ser representado pela soma dos limites

limn→∞

n

logn

log n

(n− 1)+ lim

n→∞

n

log n

γ − 1

(n− 1)= 1 + 0 = 1,

onde o primeiro limite converge para 1 enquanto o segundo para 0. C.Q.D.

Page 144: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

C.2. Observabilidade 121

C.2 Observabilidade

Nesta secao sao apresentadas proposicoes, e suas respectivas demostracoes, que seraoutilizadas em analises relacionadas as topologias determinısticas no Capıtulo 3. Especifi-camente, essas proposicoes serao utilizadas no estudo do conjunto observador estrutural edo conjunto observador funcional das topologia em anel, em estrela e linear.

Observabilidade estrutural

Lema C.7 (Conjunto observador estrutural mınimo da topologia em anel). A cardina-lidade mınima do conjunto observador estrutural de uma topologia em anel sera sempreunitaria e podera ser composto por qualquer no.

Demonstracao. Utilizando o Corolario 3.1 e a Definicao C.1, e possıvel verificar que, emuma topologia em anel, qualquer emparelhamento maximo sempre ira emparelhar todosos nos se a quantidade de nos for par e so nao ira emparelhar um no se a quantidade denos for ımpar. Em ambos os casos, somente e necessario observar um no, o que garante aprimeira afirmacao sobre a cardinalidade unitaria e sobre a composicao no caso de n par.Para o caso em que n e ımpar, e possıvel deixar de emparelhar qualquer no da rede emanel, devido a sua natureza simetrica. Portanto, tambem e verdadeiro que qualquer nopode ser utilizado no conjunto de observacao para n ımpar. C.Q.D.

Lema C.8 (Conjunto observador estrutural mınimo da topologia em linha). A cardina-lidade mınima do conjunto observador estrutural de uma topologia em linha sera sempreunitaria e podera ser composto por qualquer no.

Demonstracao. Utilizando o Corolario 3.1 e a Definicao C.3, e possıvel verificar que, emuma topologia linear, existe um emparelhamento perfeito se a quantidade de nos for par.Nesse caso, qualquer no pode ser utilizado como observador. Se a quantidade de nosfor ımpar, todo emparelhamento maximo deixara de emparelhar um no. Em ambos oscasos, somente e necessario observar um no, o que garante a primeira afirmacao sobrea cardinalidade unitaria. Para o caso em que n e ımpar, e possıvel criar um par deemparelhamentos ao se remover um no qualquer, de forma que as cardinalidades teraomesma paridade. No caso de ambas par, o no removido e o unico nao emparelhado eportanto deve ser o unico a ser monitorado. No caso ımpar, e possıvel deixar apenas osnos vizinhos ao no removido nao emparelhados, de forma que ao adiciona-lo de volta pode-se emparelha-lo com um dos vizinhos, restando assim a observacao do outro. C.Q.D.

Lema C.9 (Conjunto observador estrutural mınimo da topologia em estrela). A car-dinalidade mınima do conjunto observador estrutural de uma topologia em estrela serasempre igual a (n− 2) e nao possuira dentre os nos observadores o no central.

Demonstracao. Utilizando o Corolario 3.1 e a Definicao C.2, e possıvel verificar que, emuma topologia em estrela, qualquer aresta inicialmente escolhida para o emparelhamentoimpossibilita a adicao de novas arestas. Qualquer emparelhamento maximo tera apenasuma aresta e ira emparelhar o no central v1 e um outro no qualquer vj , onde j 6= 1. Apartir de tal fato, e possıvel deduzir que a necessidade de observacao e reduzida em apenasdois nos. De onde se segue a primeira afirmacao, relacionada a cardinalidade do conjuntode observadores. Assim, e necessario observar n−2 nos e, como v1 sempre e emparelhado,nao requer observacao, o que confirma a segunda afirmacao. C.Q.D.

Page 145: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

122 Apendice C. Resultados complementares

Observabilidade funcional

Lema C.10 (Estado estavel da topologia em estrela). Se a probabilidade de retencaofor igual para todos os nos, entao o estado estavel da topologia em estrela caracterizaque a quantidade de trafego esperada no no central e de metade do trafego total da rede,enquanto o restante e distribuıdo uniformemente entre os outros nos.

Demonstracao. De acordo com a Equacao 3.24, a matriz estocastica de uma topologia emestrela sempre podera ser descrita na forma de

A =

pr 0 0 · · · 1n−1pt

0 pr 0 · · · 1n−1pt

0 0 pr · · · 1n−1pt

......

.... . .

...

pt pt pt · · · pr

onde pr representa a probabilidade de retencao, pt a probabilidade de transmissao emqualquer um dos nos da rede e vn e o no central. Considerando o calculo do vetor c apartir da solucao do sistema (I−A)c = 0 tem-se que

(I−A) =

1− pr 0 0 · · · − 1n−1pt

0 1− pr 0 · · · − 1n−1pt

0 0 1− pr · · · − 1n−1pt

......

.... . .

...

−pt −pt −pt · · · 1− pr

=

pt 0 0 · · · − 1n−1pt

0 pt 0 · · · − 1n−1pt

0 0 pt · · · − 1n−1pt

......

.... . .

...

−pt −pt −pt · · · pt

de onde pt pode ser posto em evidencia, dando inıcio ao processo de escalonamento, de-mostrando que o resultado nao depende de pt e, portanto, tambem nao depende de pr,pois

(I−A) = pt

1 0 0 · · · − 1n−1

0 1 0 · · · − 1n−1

0 0 1 · · · − 1n−1

......

.... . .

...

−1 −1 −1 · · · 1

=⇒

1 0 0 · · · − 1n−1

0 1 0 · · · − 1n−1

0 0 1 · · · − 1n−1

......

.... . .

...

0 0 0 · · · 0

de onde a matriz a direita e obtida a partir da soma de cada linha a ultima. O estado xnpode ser calculado ja que a soma dos estados deve ser unitaria, isto e,

(n− 1)1

n− 1xn + xn = 1 =⇒ 2xn = 1 =⇒ xn =

1

2

e os demais estados xi para i = 1, 2, . . . , (n− 1), tem-se que

xi =1

2(n− 1),

que conclui a demonstracao. C.Q.D.

Page 146: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

C.3. Visualizacao 123

C.3 Visualizacao

A relacao assintotica entre a razao de duas funcoes pode ser usada no estudo da ordemde crescimento delas. Para isso, utiliza-se a seguinte equacao [Cormen et al. 2009, Levitin2012]:

limn→∞

f(n)

g(n)=

0 =⇒ f(n) ∈ O(g(n))0 < c <∞ =⇒ f(n) ∈ Θ(g(n))∞ =⇒ f(n) ∈ Ω(g(n))

, (C.19)

onde c representa uma constante qualquer que satisfaz a inequacao 0 < c <∞.

Complexidade em tempo do calculo do espaco angular

Lema C.11 (Comportamento assintotico de f(n,m) = (nm+1−n)/(n−1)). A funcao deduas variaveis f(n,m) = (nm+1−n)/(n− 1), da mesma ordem de T4.1(l) (Equacao 4.11),possui comportamento assintotico da ordem de Θ(nm).

Demonstracao. Para verificar se duas funcoes f(n) e g(n) possuem mesmo comportamentoassintotico, isto e, f(n) ∈ Θ(g(n)) e vice-versa, deve-se analisar se o limite da razao dasduas, como definido pela Equacao C.19, converge para uma constante. Estendendo o usoda Equacao C.19 para funcoes de duas variaveis tem-se o seguinte limite

lim(n,m)→∞

nm+1 − n

(n− 1)nm=

[

lim(n,m)→∞

nm+1

(n− 1)nm

]

−[

lim(n,m)→∞

n

(n− 1)nm

]

. (C.20)

Como o termo mais a direita converge para 0 e no termo mais a esquerda o denominadornm pode ser cancelado com o numerador, o limite pode ser reescrito como

lim(n,m)→∞

n

n− 1= 1. (C.21)

Portanto, f(n,m) ∈ Θ(nm). C.Q.D.

Lema C.12 (Quantidade esperada de nos em uma arvore). A quantidade esperada de nosEN e de mesma ordem assintotica que EEH−1K, isto e, EN ∈ Θ(EEH−1K),onde EK e o grau esperado de ramificacao e EH a altura esperada da arvore.

Demonstracao. A quantidade esperada de nos EN em funcao de EH e EK podeser descrita pela relacao f(EH,EK) para a funcao f(·) definida como

f(n,m) =

0 n = 0mf(n− 1,m) + 1 n > 0

. (C.22)

A partir da solucao da recorrencia ate o caso base tem-se para f(EH,EK) o seguintesomatorio

EN =

EH−1∑

j=0

EjK (C.23)

que, para EK 6= 1, resulta em

EH−1∑

j=0

EjK =EEHK − 1

EK − 1

Page 147: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

124 Apendice C. Resultados complementares

concluindo que

EN =EEHK − 1

EK − 1. (C.24)

De forma que a relacao EN ∈ Θ(EEH−1K) e verdadeira. C.Q.D.

Escalabilidade da visualizacao radial

Lema C.13 (Comportamento assintotico linear de f(n) = 1/ arcsin(1/2n)). O compor-tamento assintotico da funcao f(n) = 1/ arcsin(1/2n) e da ordem de Θ(n).

Demonstracao. Para uma funcao g(n) = n, tem-se que, considerando o exposto pelaEquacao C.19, se limn→∞ f(n)/g(n) = c, para alguma constante 0 < c < ∞, entaof(n) ∈ Θ(g(n)) e vice-versa. De forma que se estabelece o seguinte limite

limn→∞

n−1

arcsin(

12n

) , (C.25)

de onde, a partir da aplicacao da regra de L’Hospital, tem-se que

limn→∞

2n2√

1− 14n2

n2, (C.26)

que pode ser simplificado para

2 limn→∞

1− 1

4n2. (C.27)

Utilizando-se da lei da potencia de um limite, a equacao pode ser reescrita como

2

limn→∞

(

1− 1

4n2

)

, (C.28)

que, a partir da utilizacao da propriedade da soma de limites, pode ser reescrita como

2

1− limn→∞

1

4n2, (C.29)

onde a solucao do limite e dada por 2√

1− 0, que resulta em 2. Portanto, a funcaof(n) = 1/ arcsin(1/2n) e da ordem de Θ(n), e vice-versa. C.Q.D.

Page 148: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes 125

Referencias Bibliograficas

Albert, R. & A.L. Barabasi (2002), ‘Statistical mechanics of complex networks’, Reviewsof Modern Physics 74(1), 47–97. (Citado na pagina 107, 109, 111.)

Albert, R., H. Jeong & A.L. Barabasi (2000), ‘Error and attack tolerance of complexnetworks’, Nature 406(6794), 378–382. (Citado na pagina 14.)

Alderson, David L. & John C. Doyle (2010), ‘Contrasting Views of Complexity and TheirImplications for Network-Centric Infrastructures’, IEEE Trans. Syst., Man, Cybern.A 40(4), 839–852. (Citado na pagina 14, 22.)

Anton, Howard & Robert C. Busby (2003), Contemporary Linear Algebra, John Wiley &Sons. (Citado na pagina 40.)

Arsu, Sebnem (2011), ‘Internet Filters set off Protests around Turkey’, The New YorkTimes maio(16), A5. (Citado na pagina 1.)

Bachmaier, C. (2007), ‘A Radial Adaptation of the Sugiyama Framework for VisualizingHierarchical Information’, IEEE Trans. Vis. Comput. Graphics 13(3), 583–594. (Ci-tado na pagina 4, 66.)

Bachmaier, C., F. Fischer & M. Forster (2005), Radial coordinate assignment for le-vel graphs, em ‘Proceedings of Computing and Combinatorics Conference (CO-COON’05)’, IEEE Computer Society, pp. 401–410. (Citado na pagina 66.)

Barabasi, A.L. & R. Albert (1999), ‘Emergence of Scaling in Random Networks’, Science286(5439), 509–512. (Citado na pagina 110.)

Barrat, A. & M. Weigt (2000), ‘On the properties of small-world networks’, The EuropeanPhysical Journal B 13, 547–560. (Citado na pagina 109.)

Battista, Giuseppe Di, Peter Eades, Roberto Tamassia & Ioannis G. Tollis (1998), GraphDrawing: Algorithms for the Visualization of Graphs, Prentice Hall. (Citado napagina 4, 83.)

Bellman, Richard (1958), ‘On a routing problem’, Quarterly of Applied Mathematics16, 87–90. (Citado na pagina 85.)

Bennett, C., J. Ryall, L. Spalteholz & A. Gooch (2007), The aesthetics of graph visuali-zation, em ‘Proceedings of Computational Aesthetics in Graphics, Visualization, andImaging’, pp. 1–8. (Citado na pagina 66.)

Page 149: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

126 Referencias Bibliograficas

Bertin, Jacques (1983), Semiology of Graphics: Diagrams, Networks, Maps, University ofWisconsin Press. (Citado na pagina 65.)

Bertin, Jacques (1999), Graphics and graphic information processing, Morgan KaufmannPublishers, Inc. (Citado na pagina 65.)

Bollobas, Bela (1981), ‘Degree sequences of random graphs’, Discrete Mathematics33(1), 1–19. (Citado na pagina 107.)

Bollobas, Bela (2001), Random Graphs, 2a edicao, Cambridge University Press. (Citadona pagina 107.)

Bollobas, Bela & Oliver Riordan (2004), ‘The diameter of a scale-free random graph’,Combinatorica 24(1), 5–34. (Citado na pagina 112.)

Brassard, G. & P. Bratley (1996), Fundamentals of Algorithmics, Prentice Hall. (Citadona pagina 74.)

Burch, M., N. Konevtsova, J. Heinrich, M. Hoeferlin & D. Weiskopf (2011), ‘Evaluationof Traditional, Orthogonal, and Radial Tree Diagrams by an Eye Tracking Study’,IEEE Trans. Vis. Comput. Graphics 17(12), 2440–2448. (Citado na pagina 4, 66.)

Caceres, Ramon, N. G. Duffield, J. Joseph Horowitz & Donald F. Towsley (1999),‘Multicast-based inference of network-internal loss characteristics’, IEEE Trans. Inf.Theory 45(7), 2462–2480. (Citado na pagina 3.)

Candes, Emmanuel J. & Michael B. Wakin (2008), ‘An introduction to compressive sam-pling’, IEEE Signal Process. Mag. 25(2), 21–30. (Citado na pagina 18.)

Cao, Jin, Drew Davis, Scott Vander Wiel & Bin Yu (2000), ‘Time-Varying NetworkTomography: Router Link Data’, Journal of the American Statistical Association95(452), 1063–1075. (Citado na pagina 15.)

Card, S., J. Mackinlay & B. Shneiderman, eds. (1999), Readings in Information Visualiza-tion – Using Vision to Think, Morgan Kaufmann Publishers, Inc. (Citado na pagina10, 65, 66.)

Chandy, K. Mani & Leslie Lamport (1985), ‘Distributed snapshots: determining globalstates of distributed systems’, ACM Transactions on Computer Systems (TOCS)3(1), 63–75. (Citado na pagina 19.)

Chen, Chi-Tsong (2009), Linear System Theory and Design, 3a edicao, Oxford UniversityPress. (Citado na pagina 16, 17.)

Chen, Yan, David Bindel, Han Hee Song & Randy H. Katz (2007), ‘Algebra-based scalableoverlay network monitoring: Algorithms, evaluation, and applications’, IEEE/ACMTrans. Netw. 15(5), 1084–1097. (Citado na pagina 3.)

Chiang, Mung, Steven H. Low, A. Robert Calderbank & John C. Doyle (2007), ‘Layeringas optimization decomposition: A mathematical theory of network architectures’,Proc. IEEE 95(1), 255–312. (Citado na pagina 35.)

Page 150: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Referencias Bibliograficas 127

Chung, Fan & Linyuan Lu (2001), ‘The diameter of sparse random graphs’, Advances inApplied Mathematics 26, 257–279. (Citado na pagina 107.)

Clauset, Aaron, Cosma Rohilla Shalizi & M.E.J. Newman (2009), ‘Power-Law Distributi-ons in Empirical Data’, SIAM Review 51(4), 661–703. (Citado na pagina 112.)

Coates, Mark, Alfred O. Hero III, Robert Nowak & Bin Yu (2002), ‘Internet Tomography’,IEEE Signal Process. Mag. 19(3), 47–65. (Citado na pagina 14, 22.)

Cormen, Thomas H., Charles E. Leiserson, Ronald L. Rivest & Clifford Stein (2009),Introduction to Algorithms, 3a edicao, The MIT Press. (Citado na pagina 12, 16, 74,88, 123.)

Costa, L.F., F.A. Rodrigues, G. Travieso & P.R.V. Boas (2007), ‘Characterization ofcomplex networks: A survey of measurements’, Advances in Physics 56(1), 167–242.(Citado na pagina 86, 89.)

Cvetkovic, Dragos, Peter Rowlinson & Slobodan Simic (2009), An Introduction to theTheory of Graph Spectra, 1a edicao, Cambridge University Press. (Citado na pagina41.)

Deering, S. & R. Hinden (1998), ‘Internet Protocol, Version 6 (IPv6) Specification’, In-ternet Engineering Task Force (IETF) RFC 2460 (Draft Standard). Obsoletes RFC1883. Updated by RFCs 5095, 5722, 5871.URL: http://www.ietf.org/rfc/rfc2460.txt (Citado na pagina 12.)

Deibert, Ronald J., John G. Palfrey, Rafal Rohozinski & Jonathan Zittrain, eds. (2008),Access Denied, The MIT Press. (Citado na pagina 1.)

Deibert, Ronald J., John G. Palfrey, Rafal Rohozinski & Jonathan Zittrain, eds. (2010),Access Controlled, The MIT Press. (Citado na pagina 1.)

Diehl, S., F. Beck & M. Burch (2010), ‘Uncovering Strengths and Weaknesses of Ra-dial Visualizations – an Empirical Approach’, IEEE Trans. Vis. Comput. Graphics16(6), 935–942. (Citado na pagina 4, 66.)

Dijkstra, Edsger Wybe (1959), ‘A note on two problems in connexion with graphs’, Nu-merische Mathematik 1(1), 269–271. (Citado na pagina 18, 85.)

Dilman, Mark & Danny Raz (2002), ‘Efficient Reactive Monitoring’, IEEE J. Sel. AreasCommun. 20(4), 668–676. (Citado na pagina 10, 18.)

Donoho, David L. & Jared Tanner (2010), ‘Precise undersampling theorems’, Proc. IEEE98(6), 913–924. (Citado na pagina 18.)

Doyle, John C., David L. Alderson, Lun Li, Steven Low, Matthew Roughan, StanislavShalunov, Reiko Tanaka & Walter Willinger (2005), ‘The ‘robust yet fragile’ natureof the Internet’, PNAS 102(41), 14497–14502. (Citado na pagina 14.)

Eddy, Wesley M. (2006), ‘Defenses against TCP SYN flooding attacks’, The InternetProtocol Journal 9(4), 2–16. (Citado na pagina 21.)

Page 151: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

128 Referencias Bibliograficas

Eddy, Wesley M. (2007), ‘TCP SYN Flooding Attacks and Common Mitigations’, InternetEngineering Task Force (IETF) RFC 4987 (Informational).URL: http://www.ietf.org/rfc/rfc4987.txt (Citado na pagina 21.)

Edmonds, Jack (1965), ‘Paths, trees and flowers’, Canadian Journal of Mathematics17, 449–467. (Citado na pagina 36.)

Egevang, K. & P. Francis (1994), ‘The IP Network Address Translator (NAT)’, RFC 1631(Informational). Obsoleted by RFC 3022.URL: http://www.ietf.org/rfc/rfc1631.txt (Citado na pagina 12.)

Eggemann, N. & S. D. Noble (2011), ‘The clustering coefficient of a scale-free randomgraph’, Discrete Applied Mathematics 159(10), 953–965. (Citado na pagina 112.)

Erdos, P. & A. Renyi (1959), ‘On Random Graphs I’, Publ. Math. Debrecen 6, 290–297.(Citado na pagina 106.)

Erikson, Brian, Gautam Dasarathy, Paul Barford & Robert Nowak (2012), ‘EfficientNetwork Tomography for Internet Topology Discovery’, IEEE/ACM Trans. Netw.20(3), 931–943. (Citado na pagina 14.)

Ford, Jr., Lestor R. & D. R. Fulkerson (1962), Flows in Networks, Princeton UniversityPress. (Citado na pagina 85.)

Goldberg, David E. (1989), Genetic Algorithms in Search, Optimization, and MachineLearning, Addison-Wesley. (Citado na pagina 12.)

Goodman, J. David (2011), ‘China: Censorship Suit Filed Against Web Company’, TheNew York Times maio(20), A8. (Citado na pagina 1.)

Gopalan, Abishek & Srinivasan Ramasubramanian (2012), ‘On identifying additive linkmetrics using linearly independent cycles and paths’, IEEE/ACM Trans. Netw.20(3), 906–916. (Citado na pagina 3.)

Greenwald, Lloyd G. & Tavaris J. Thomas (2007a), Toward undetected operating sys-tem fingerprinting, em ‘Proceedings of the First USENIX Workshop on OffensiveTechnologies (WOOT)’. (Citado na pagina 21.)

Greenwald, Lloyd G. & Tavaris J. Thomas (2007b), ‘Understanding and preventingnetwork device fingerprinting’, Bell Labs Technical Journal 12(3), 149–166. (Citadona pagina 21.)

Ham, F.V. & M. Wattenberg (2008), Centrality based visualization of small world graphs,em ‘Proceedings of 2008 IEEE–VGTC Symposium on Visualization (Eurographics)’,Vol. 27, pp. 954–958. (Citado na pagina 4.)

Hartmeier, Daniel (2002), Design and performance of the OpenBSD stateful packet filter(pf), em ‘Proceedings of the FREENIX Track: USENIX Annual Technical Confe-rence’, pp. 171–180. (Citado na pagina 21.)

Haupt, Jarvis, Waheed U. Bajwa, Michael Rabbat & Robert Nowak (2008), ‘Compressedsensing for networked data’, IEEE Signal Process. Mag. 25(2), 92–101. (Citado napagina 18, 22.)

Page 152: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Referencias Bibliograficas 129

Haykin, Simon (2008), Neural Networks and Learning Machines, 3a edicao, Prentice Hall.(Citado na pagina 37.)

Hopcroft, John E. & Richard M. Karp (1973), ‘An n5/2 algorithm for maximum matchingsin bipartite graphs’, SIAM Journal on Computing 2(4), 225–231. (Citado na pagina36.)

Ji, Chuanyi & Anwar Elwalid (2002), ‘Measurement-Based Network Monitoring and Infe-rence: Scalability and Missing Information’, IEEE J. Sel. Areas Commun. 20(4), 714–725. (Citado na pagina 3, 15, 22.)

Kalman, Rudolph Emil (1960a), ‘A new approach to linear filtering and prediction pro-blems’, Transactions of the ASME–Journal of Basic Engineering 82(Series D), 35–45.(Citado na pagina 37.)

Kalman, Rudolph Emil (1960b), On the general theory of control systems, em ‘Proceedingsof First IFAC Congress Automatic Control’, pp. 481–493. (Citado na pagina 16, 17.)

Kalman, Rudolph Emil (1963), ‘Mathematical Description of Linear Dynamical Systems’,SIAM Journal on Control and Optimization 1(2), 152–192. (Citado na pagina 15, 27,32.)

Kim, Dong-Hee, Jae Dong Noh & Hawoong Jeong (2004), ‘Scale-free trees: The skeletonsof complex networks’, Physical Review E 70(4), 046126. (Citado na pagina 4.)

Kim, Dong-Hee, S.W. Son, Y.Y. Ahn, P.J. Kim, Y.H. Eom & Hawoong Jeong (2005),‘Underlying scale-free trees in complex networks’, Progress of Theoretical PhysicsSupplements 157, 213–220. (Citado na pagina 4.)

Kohonen, Teuvo (2000), Self-Organizing Maps, 3a edicao, Springer. (Citado na pagina20.)

Kotelnikov, Vladimir A. (1933), On the transmission capacity of the ‘ether’ and of cablesin electrical communications, em ‘Proceedings of the first All-Union Conference onthe technological reconstruction of the communications sector and the developmentof low-current engineering’, Moscow, Russian. (Citado na pagina 18.)

Kruskal, Joseph B. (1956), ‘On the shortest spanning subtree of a graph and the travelingsalesman problem’, Proceedings of the American Mathematical Society 7(1), 48–50.(Citado na pagina 4.)

Latora, Vito & Massimo Marchiori (2001), ‘Efficient Behavior of Small-World Networks’,Physical Review Letters 87(19), 198701. (Citado na pagina 97.)

Levitin, Anany (2012), Introduction to The Design and Analysis of Computer Algorithms,3a edicao, Pearson. (Citado na pagina 123.)

Liu, Yang-Yu, Jean-Jacques Slotine & Albert-Laszlo Barabasi (2011), ‘Controllability ofcomplex networks’, Nature 473, 167–173. (Citado na pagina 15, 16, 22, 33, 35.)

Lordet, Gilles (2012), Internet enemies report 2012, Relatorio tecnico, Reporters WithoutBoarders.URL: http://en.rsf.org/ (Citado na pagina 1.)

Page 153: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

130 Referencias Bibliograficas

Luczak, Tomasz (1998), ‘Random trees and random graphs’, Random Structures Algo-rithms 13(3–4), 485–500. (Citado na pagina 107.)

Luenberger, David G. (1971), ‘An introduction to observers’, IEEE Trans. Autom. Control16(6), 596–603. (Citado na pagina 37.)

Lyon, Gordon Fyodor (2009), Nmap Network Scanning, Nmap Project. (Citado na pagina19, 21, 22.)

Markov, Andrey (1913), ‘An Example of Statistical Investigation of the Text EugeneOnegin Concerning the Connection of Samples in Chains’. Lecture at the Physical-mathematical Faculty, Royal Academy of Sciences, St. Petersburg, 23 January 1913.(Citado na pagina 29.)

Medeiros, J.P.S., A.M. Brito Jr. & P.S.M. Pires (2009), A new method for recognizingoperating systems of automation devices, em ‘Proceedings of IEEE 14th Internatio-nal Conference on Emerging Technologies and Factory Automation (ETFA)’, IEEEComputer Society, pp. 1–4. (Citado na pagina 20.)

Medeiros, J.P.S., A.M. Brito Jr. & P.S.M. Pires (2010a), ‘An Effective TCP/IP Fin-gerprinting Technique Based on Strange Attractors Classification’, Lecture Notes inComputer Sciene 5939, 208–221. (Citado na pagina 21.)

Medeiros, J.P.S., A.M. Brito Jr. & P.S.M. Pires (2010b), ‘Using Intelligent Techniquesto Extend the Applicability of Operating System Fingerprint Databases’, Journal ofInformation Assurance and Security 5(1), 554–560. (Citado na pagina 20.)

Medeiros, J.P.S., A.M. Brito Jr. & P.S.M. Pires (2011), ‘A Qualitative Survey of ActiveTCP/IP Fingerprinting Tools and Techniques for Operating Systems Identification’,Lecture Notes in Computer Sciene 6694, 68–85. (Citado na pagina 20.)

Medeiros, J.P.S., A.M. Brito Jr., P.S.M. Pires & S.R. Santos (2009), ‘Advances in NetworkTopology Security Visualisation’, International Journal of System of Systems Engi-neering 1(4), 387–400. (Citado na pagina 22, 64, 66.)

Medeiros, J.P.S. & S.R. Santos (2008), ‘RadialNet: An Interactive Network TopologyVisualization Tool with Visual Auditing Support’, Lecture Notes in Computer Sciene5508, 168–179. (Citado na pagina 4, 64.)

Micali, Silvio & Vijay V. Vazirani (1980), An O(√

|V ||E|) algorithm for finding maxi-mum matching in general graphs, em ‘Proceedings of 21st Annual Symposium onFoundations of Computer Science’, pp. 17–27. (Citado na pagina 36.)

Milgram, Stanley (1967), ‘The small world problem’, Psychology Today 2, 60–67. (Citadona pagina 108.)

Newman, M.E.J. (2003), ‘The Structure and Function of Complex Networks’, SIAM Re-view 45, 167–256. (Citado na pagina 4, 38, 89, 92, 109.)

Nyquist, Harry Theodor (1928), ‘Certain topics in telegraph transmission theory’, Trans.American Institute of Electrical Engineers 47(2), 617–644. (Citado na pagina 18.)

Page 154: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Referencias Bibliograficas 131

Oliveira, E.M.R., H.S. Ramos & A.A.F. Loureiro (2010), Centrality-based routing forwireless sensor networks, em ‘Proceedings of 2010 IFIP Wireless Days (WD)’, pp. 1–5. (Citado na pagina 4.)

Papoulis, Athanasios & S. Unnikrishna Pillai (2002), Probability, Random Variables andStochastic Process, 4a edicao, McGraw-Hill. (Citado na pagina 29, 47, 89, 107.)

Poisson, Simeon Denis (1837), Probabilite des jugements en matiere criminelle et enmatiere civile, precedees des regles generales du calcul des probabilities, Imprimeur-Libraire. (Citado na pagina 47.)

Postel, J. (1981a), ‘Internet Protocol’, Internet Engineering Task Force (IETF) RFC 791(Standard). Obsoletes RFC 760. Updated by RFC 1349.URL: http://www.ietf.org/rfc/rfc791.txt (Citado na pagina 11.)

Postel, J. (1981b), ‘Transmission Control Protocol’, Internet Engineering Task Force(IETF) RFC 793 (Standard). Obsoletes RFC 761. Updated by RFC 1122, 3168,6093, 6528.URL: http://www.ietf.org/rfc/rfc793.txt (Citado na pagina 19.)

Provos, Niels (2004), A virtual honeypot framework, em ‘Proceedings of the 13th USENIXSecurity Symposium’. (Citado na pagina 21.)

Provos, Niels & Thorsten Holz (2008), Virtual Honeypots: From Botnet Tracking to In-trusion Detection, Addison-Wesley. (Citado na pagina 21.)

Ramos, H.S., E.M.R. Oliveira, A. Boukerche, A.C. Frery & A.A.F. Loureiro (2012), Cha-racterization and mitigation of the energy hole problem of many-to-one communica-tion in wireless sensor networks, em ‘Proceedings of 2012 International Conferenceon Computing Networking and Communications (ICNC)’, pp. 954–958. (Citado napagina 4.)

Rekhter, Y., T. Li & S. Hares (2006), ‘A Border Gateway Protocol 4 (BGP-4)’, RFC 4271(Standards Track). Obsoletes RFC 1771.URL: http://www.ietf.org/rfc/rfc4271.txt (Citado na pagina 14.)

Roughan, Matthew, Walter Willinger, Olaf Maennel, Debbie Perouli & Randy Bush(2011), ‘10 Lessons from 10 Years of Measuring and Modeling the Internet’s Au-tonomous Systems’, IEEE J. Sel. Areas Commun. 29(9), 1810–1821. (Citado napagina 14, 22.)

Shannon, Claude Elwood (1949), ‘Communication in the presence of noise’, Proc. Instituteof Radio Engineers 37(1), 10–21. (Citado na pagina 18.)

Srisuresh, P. & K. Egevang (2001), ‘Traditional IP Network Address Translator (Traditi-onal NAT)’, RFC 3022 (Informational). Obsoletes RFC 1631.URL: http://www.ietf.org/rfc/rfc3022.txt (Citado na pagina 12.)

Srisuresh, P. & M. Holdrege (1999), ‘IP Network Address Translator (NAT) Terminologyand Considerations’, Internet Engineering Task Force (IETF) RFC 2663 (Informati-onal).URL: http://www.ietf.org/rfc/rfc2663.txt (Citado na pagina 21.)

Page 155: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

132 Referencias Bibliograficas

Tsirtsis, G. & P. Srisuresh (2000), ‘Network Address Translation – Protocol Translation(NAT-PT)’, Internet Engineering Task Force (IETF) RFC 2766 (Historic). (Citadona pagina 12.)

Wang, Meng, Weiyu Xu, Enrique Mallada & Ao Tang (2012), Sparse recovery with graphconstraints: Fundamental limits and measurement construction, em ‘Proceedings of31st Annual IEEE International Conference on Computer Communications (INFO-COM)’, pp. 1871–1879. (Citado na pagina 19.)

Ware, Colin (2004), Information Visualization: Perception for Design, 2a edicao, MorganKaufmann. (Citado na pagina 63, 65.)

Watson, D., M. Smart, G.R. Malan & F. Jahanian (2001), Protocol scrubbing: networksecurity through transparent flow modification, em ‘Proceedings of the DARPA Infor-mation Survivability Conference and Exposition II (DISCEX)’, pp. 108–118. (Citadona pagina 21.)

Watson, D., M. Smart, G.R. Malan & F. Jahanian (2004), ‘Protocol scrubbing: network se-curity through transparent flow modification’, IEEE/ACM Transactions on Networ-king 12(2), 261–273. (Citado na pagina 21.)

Watts, D.J. & S.H. Strogatz (1998), ‘Collective dynamics of ‘small-world’ networks’, Na-ture 393(6684), 440–442. (Citado na pagina 108.)

Whittaker, Edmund Taylor (1915), ‘On the functions which are represented by the ex-pansions of the interpolation theory’, Proc. Royal Soc. Edinburgh 35(A), 481–493.(Citado na pagina 18.)

Willinger, Walter, David Alderson & John C. Doyle (2009), ‘Mathematics and the In-ternet: A Source of Enormous Confusion and Great Potential’, Notices of the AMS56(5), 586–599. (Citado na pagina 14.)

Xu, Weiyu, Enrique Mallada & Ao Tang (2011), Compressive sensing over graphs, em‘Proceedings of 30th IEEE International Conference on Computer Communications(INFOCOM)’, pp. 2087–2095. (Citado na pagina 19.)

Yee, Ka Ping, Danyel Fisher, Rachna Dhamija & Marti A. Hearst (2001), Animated ex-ploration of dynamic graphs with radial layout, em ‘Proceedings of IEEE InformationVisualization Conference’, IEEE Computer Society, pp. 43–50. (Citado na pagina 3,4, 22, 64, 66.)

Zhang, Yu, Ricardo Oliveira, Yangyang Wang, Shen Su, Baobao Zhang, Jun Bi, HongliZhang & Lixia Zhang (2011), ‘A Framework to Quantify the Pitfalls of Using Trace-route in AS-Level Topology Measurement’, IEEE J. Sel. Areas Commun. 29(9), 1822–1836. (Citado na pagina 14.)

Page 156: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Sobre a Observabilidade e a Visualizacao no Monitoramento de Redes 133

Indice Remissivo

SımbolosΩ(·) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvΘ(·) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvi≈ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xviδ(t), δij . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv≡ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xviEX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviiHn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvO(·) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvP(Xζ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviP(Xζ | p) . . . . . . . . . . . . . . . . . . . . . . . . . . . xvii∝ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xviρ(·) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvii≃ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xvi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xiii, . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .xviC.Q.D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii

Aagrupamento

grafo aleatorio . . . . . . . . . . . . . . . . . 107grafo de mundo pequeno . . . . . . . 109grafo livre de escala . . . . . . . . . . . . 112

algoritmoagrupamento() . . . . . . . . . . . . . . . . . . 99agrupamento-medio() . . . . . . . . . . 100diametro() . . . . . . . . . . . . . . . . . . . . . . 96distancia() . . . . . . . . . . . . . . . . . . . . . . 93distancia-media() . . . . . . . . . . . . . . . . 95distribuicao-grau() . . . . . . . . . . . . . . 91eficiencia-media() . . . . . . . . . . . . . . . .98espaco-angular() . . . . . . . . . . . . . . . . .72grafo-aleatorio() . . . . . . . . . . . . . . . . 106grafo-livre-de-escala() . . . . . . . . . . 110grafo-mundo-pequeno() . . . . . . . . .108graus() . . . . . . . . . . . . . . . . . . . . . . . . . . 90matriz-estocastica() . . . . . . . . . . . . . 39menor-caminho() . . . . . . . . . . . . . . . . 94

observador-estrutural() . . . . . . . . . . 36observador-funcional() . . . . . . . . . . . 42raio-minimo() . . . . . . . . . . . . . . . . . . . 73rendimento() . . . . . . . . . . . . . . . . . . . . 38

algoritmos geneticos . . . . . . . . . . . . . . . . . 12amostragem compressiva . . . . . . . . . . . . .18analista da informacao . . . . . . . . . . . 10, 13aquisicao de dados

ativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11passiva . . . . . . . . . . . . . . . . . . . . . . . . . . 11

arvore de cobertura . . . . . . . . . . . . . . . . . . . 4mınima . . . . . . . . . . . . . . . . . . . . . . 44, 67

average shortest path . . . . . . . . . . . . . . . . 92

Bbackbone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4BFS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92BGP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14bi-implicacao . . . . . . . . . . . . . . . . . . . . . . xviii

CCAIDA . . . . . . . . . . . . . . . . . . . . . . . . . . 51, 59camada de enlace . . . . . . . . . . . . . . . . . . . . 14camada de rede . . . . . . . . . . . . . . . . . . . . . .14cardinalidade . . . . . . . . . . . . . . . . . . . . . . xviicentralidade . . . . . . . . . . . . . . . . . . . . . . .4, 38clustering coefficient . . . . . . . . . . . . . . . . . 99coeficiente binomial . . . . . . . . . . . . . . . . . xivcommunication kernel . . . . . . . . . . . . . . . . 4complexidade

agrupamento() . . . . . . . . . . . . . . . . . . 99agrupamento-medio() . . . . . . . . . . 100diametro() . . . . . . . . . . . . . . . . . . . . . . 97distancia() . . . . . . . . . . . . . . . . . . . . . . 93distancia-media() . . . . . . . . . . . . . . . . 96distribuicao-graus() . . . . . . . . . . . . . 91eficiencia-media() . . . . . . . . . . . . . . . .98espaco-angular() . . . . . . . . . . . . . . . . .73

Page 157: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

134 Indice Remissivo

grafo-aleatorio() . . . . . . . . . . . . . . . . 106grafo-livre-de-escala() . . . . . . . . . . 110grafo-mundo-pequeno() . . . . . . . . .108graus() . . . . . . . . . . . . . . . . . . . . . . . . . . 90matriz-estocastica() . . . . . . . . . . . . . 40menor-caminho() . . . . . . . . . . . . . . . . 94metricas . . . . . . . . . . . . . . . . . . . . . . . . .81observador-estrutural() . . . . . . . . . . 36observador-funcional() . . . . . . . . . . . 42raio-minimo() . . . . . . . . . . . . . . . . . . . 74rendimento() . . . . . . . . . . . . . . . . . . . . 38

compressed sensing . . . . . . . . . . . . . . . . . . 18compressive sampling . . . . . . . . . . . . . . . . 18computacao ubıqua . . . . . . . . . . . . . . . . . . . 2conjuncao . . . . . . . . . . . . . . . . . . . . . . . . . xviiiconstante de Euler-Mascheroni . . . . . . xvcontribuicoes . . . . . . . . . . . . . . . . . . . . . . . . . 5controlabilidade . . . . . . . . . . . . . . . . . .16, 17

matriz de . . . . . . . . . . . . . . . . . . . . . . . .33cruzamento entre arestas . . . . . . . . . . . . . 4

DDDoS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84degree distribution . . . . . . . . . . . . . . . . . . . 89delta de Dirac . . . . . . . . . . . . . . . . . . . . . . xivdelta de Kronecker . . . . . . . . . . . . . . . . . .xivderivada . . . . . . . . . . . . . . . . . . . . . . . . . . . . xivdesvio padrao . . . . . . . . . . . . . . . . . . . . . . .xvidiametro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

grafo aleatorio . . . . . . . . . . . . . . . . . 107matriz regular . . . . . . . . . . . . . . . . . . . 41

disjuncao . . . . . . . . . . . . . . . . . . . . . . . . . . xviiidisposicao radial

escalabilidade . . . . . . . . . . . . . . . . . . . 76distancia media

grafo aleatorio . . . . . . . . . . . . . . . . . 107grafo de mundo pequeno . . . . . . . 109grafo livre de escala . . . . . . . . . . . . 112

DoS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

Eeficacia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12eficiencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12emparelhamento

maximo . . . . . . . . . . . . . . . . . . . . . . 33–36perfeito . . . . . . . . . . . . . . . . . . . . . . 35, 46

equacao de espaco de estado . . . . . 16, 27escalabilidade . . . . . . . . . . . . . . . . . . . . . . . 12

escalonamento . . . . . . . . . . . . . . . . . . . . . . . 42estacao de monitoramento . . . . . . . . . . . 17estado da rede . . . . . . . . 16, 17, 26–28, 37estado do sistema . . .veja estado da redeestado estavel . . . . . . . . . . . . . . . . . . . . . . . 42

do processo . . . . . . . . . . . . . . . . . . . . . .40estruturas visuais . . . . . . . . . . . . . . . . . . . . 65

Ffaixa de trafego . . . . . . . . . . . . . . . . . . 54, 58fatorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xivFIFO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .93firewall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11fisiologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22funcao de pesos . . . . . . . . . . . . . . . . . . 29, 30

Ggrafo

aleatorio . . . . . . . . . . . . . . . . . . . . . . . 106caracterizacao . . . . . . . . . . . . . . . . . . . 89definicao . . . . . . . . . . . . . . . . . . . . . . . . 86densidade . . . . . . . . . . . . . . . . . . . . . . . 87direcionado com pesos . . . . . . . . . . . 86livre de escala . . veja livre de escalametricas . . . . . . . . . . . . . . . . . . . . . . . . .89mundo pequeno . . . . . . . . . . . . . . . . 108planar . . . . . . . . . . . . . . . . . . . . . . . . . . . 66robustez . . . . . . . . . . . . . . . . . . . . . . . . .89topologia em anel . . . . . . . . . . . . . . 102topologia em estrela . . . . . . . . . . . . 102topologia em linha . . . . . . . . . . . . . 102

grafo aleatorio . . . . . . . . . . . . . . . . . . . . . .106agrupamento . . . . . . . . . . . . . . . . . . . 107diametro . . . . . . . . . . . . . . . . . . . . . . . 107distancia media . . . . . . . . . . . . . . . . 107grau esperado . . . . . . . . . . . . . . . . . . 107

grafo de mundo pequeno . . . . . . . . . . . 108agrupamento . . . . . . . . . . . . . . . . . . . 109distancia media . . . . . . . . . . . . . . . . 109grau esperado . . . . . . . . . . . . . . . . . . 109

grafo livre de escalaagrupamento . . . . . . . . . . . . . . . . . . . 112distancia media . . . . . . . . . . . . . . . . 112grau esperado . . . . . . . . . . . . . . . . . . 111

graph drawing . . . . . . . . . . . . . . . . . . . . . . . 83grau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

CDF . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92de entrada . . . . . . . . . . . . . . . . . . . . . . 87

Page 158: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Indice Remissivo 135

de saıda . . . . . . . . . . . . . . . . . . . . . . . . . 87distribuicao dos . . . . . . . . . . . . . . . . . 90PDF . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90valor esperado . . . . . . . . . . . . . . . . . . . 91

grau esperadografo aleatorio . . . . . . . . . . . . . . . . . 107grafo de mundo pequeno . . . . . . . 109grafo livre de escala . . . . . . . . . . . . 111

HHoneyd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21

Iidentificacao de sistemas

projeto . . . . . . . . . . . . . . . . . . . . . . . . . . 20IDS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11igualdades . . . . . . . . . . . . . . . . . . . . . . . . . . xviimplicacao . . . . . . . . . . . . . . . . . . . . . . . . .xviiiinstrusao

deteccao de . . . . . . . . . . . . . . . . . . . . . 11prevencao de . . . . . . . . . . . . . . . . . . . . 11

Internet . . . 1, 2, 6, 14, 15, 19, 51, 59, 61Internet of Things . . . . . . . . . . . . . . . . . . . . 2Internet Protocol . . . . . . . . . . . . . . . . . . . . 11Intrusion Detection System . . . . . . . . . . 11Intrusion Prevention System . . . . . . . . .11IP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

versao 4 . . . . . . . . . . . . . . . . . . . . . . . . . 11versao 6 . . . . . . . . . . . . . . . . . .12, 51, 59

IPS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11IPv4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11IPv6 . . . . . . . . . . . . . . . . . . . . . . . . . 12, 51, 59

Llista de adjacencia . . . . . . . . . . . . . . . . . . . 88

custo em memoria . . . . . . . . . . . . . . . 88livre de escala . . . 4, 6, 43–60, 77–79, 110

Mmatriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv

de adjacencia . 16, 29, 33, 35, 38, 86de controlabilidade . . . . . . . . . . . . . . 33de observabilidade . . . . . . . . . . . . . . . 32de transicao . . . . . . . . . . . . . .30, 43, 54de transicao de estado . . . . . . . . . . . 16de transicao regular . . . . . . . . . . . . . 41estocastica . . . . . . . . . . . . . . . 30, 39, 41estocastica regular . . . . . . . . . . . . . . .40

diametro . . . . . . . . . . . . . . . . . . . . . . 41

posto da . . . . . . . . . . . . . . . . . . . . . . . xviitransposta . . . . . . . . . . . . . . . . . . . . . xvii

maximum matching . . . . . . . . . . . . . . . . . 33media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xvimetodologia . . . . . . . . . . . . . . . . . . . . . . . . . 23

procedimento . . . . . . . . . . . . . . . . . . . .23metrica

agrupamento . . . . . . . . . 50, 59, 98, 99average shortest path . . . . . . . . . . . . 92clustering coefficient . . . . . . . . . . . . .99degree distribution . . . . . . . . . . . . . . . 89densidade . . . . . . . . . . . . . . . . . . . .45, 87diametro . . . . . . . . . . . . . 49, 57, 79, 96distancia media . . . . . . . . . . . . . . . . . 92distribuicao dos graus . . . . . . . . . . . 89eficiencia . . . . . . . . . . . . . 49, 58, 80, 97rendimento . . . . . . . . . . . . . . . . . . . . . . 38

metricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89mineracao visual de dados . . . . . . . . . . . 10modelo

eficaz . . . . . . . . . . . . . . . . . . . . . . . . . . . .12eficiente . . . . . . . . . . . . . . . . . . . . . . . . . 12escalavel . . . . . . . . . . . . . . . . . . . . . . . . 12

monitoramento . . . . 13, 17, 31, 36, 52, 60centrado na rede . . . . . . . . . . . . . . . . 15definicao . . . . . . . . . . . . . . . . . . . . . . . . 10estacao de . . . . . . . . . . . . . . . . . . . . . . . 17estatıstico . . . . . . . . . . . . . . . . . . . . . . . 18etapas . . . . . . . . . . . . . . . . . . . . . . . . . . .10projeto . . . . . . . . . . . . . . . . . . . . . . . . . . 13reativo . . . . . . . . . . . . . . . . . . . . . . . . . . 18representacao . . . . . . . . . . . . . . . . . . . .10

multicast . . . . . . . . . . . . . . . . . . . . . . . . . .3, 15

NNAPT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .21NAT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12NAT-PT . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12negacao . . . . . . . . . . . . . . . . . . . . . . . . . . . xviiinetwork centric monitoring . . . . . . . . . . 15Nmap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21nos observadores . . . . . . . . . . . . . . . . . 10, 15

localizacao . . .3, 5, 14, 25, 52, 60, 62quantidade mınima . . . . . . . . . 3, 5, 61

notaprojeto da matriz de transicao . . . 43projeto observador estrutural . . . . 37

NP-arduo . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

Page 159: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

136 Indice Remissivo

Oobjetivos especıficos . . . . . . . . . . . . . . . . . 22observabilidade . . . . . . . . . . . . . . .17, 25, 34

estrutural . . . . . . . . . . . . . . . . . . . . . . . 32funcional . . . . . . . . . . . . . . . . . . . . . . . . 37matriz de . . . . . . . . . . . . . . . . . . . . . . . .32

observabilidade estrutural . . . . . . . . . . . 32experimentos . . . . . . . . . . . . . . . . . . . . 45resumo metricas . . . . . . . . . . . . . . . . . 61topologia em anel . . . . . . . . . . . . . . 121topologia em estrela . . . . . . . . . . . . 121topologia em linha . . . . . . . . . . . . . 121

observabilidade funcional . . . . . . . . . . . . 37experimentos . . . . . . . . . . . . . . . . . . . . 53resumo metricas . . . . . . . . . . . . . . . . . 61topologia em estrela . . . . . . . . . . . . 122

Observacaoagrupamento e Oo

c . . . . . . . . . . . . . . . 59agrupamento e Oo

e . . . . . . . . . . . . . . . 50cardinalidade de Oo

c . . . . . . . . . . . . . 55cardinalidade de Oo

e . . . . . . . . . . . . . 46densidade e EOc . . . . . . . . . . . . . . 55densidade e EOe . . . . . . . . . . . . . . 46diametro e Oo

c . . . . . . . . . . . . . . . . . . . 58diametro e Oo

e . . . . . . . . . . . . . . . . . . . 48eficiencia e Oo

c . . . . . . . . . . . . . . . . . . . 58eficiencia e Oo

e . . . . . . . . . . . . . . . . . . . 49grau e rendimento . . . . . . . . . . . . . . . 44grau esperado em Oo

c . . . . . . . . . . . . 57grau esperado em Oo

e . . . . . . . . . . . . 47localizacao de Oo

c . . . . . . . . . . . . . . . . 62localizacao de Oo

e . . . . . . . . . . . . . . . . 62m e rendimento . . . . . . . . . . . . . . . . . 45rendimento em Oo

c . . . . . . . . . . . . . . .54observador estrutural . . . . . . . . . . . . . . . . 37

conjunto . . . . . . . . . . . . . . . . . . . . . . . . 31conjunto mınimo . . . . . . . . . . . . . . . . 35

observador funcionalconjunto . . . . . . . . . . . . . . . . . . . . . . . . 31conjunto mınimo . . . . . . . . . . . . . . . . 41

oclusao de informacao . . . . . . . . . . . . . . . 66operating system detection . . . . . . . 11, 20overhead . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

PP2P . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22polıtica

de acesso . . . . . . . . . . . . . . . . . . . . . . . . 93

de roteamento . . . . . . . . . . . . . . . . . . . 38de transmissao . . . . . . . . . . . . . . .30, 38

port scan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11posto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xviipredicado . . . . . . . . . . . . . . . . . . . . . . . . . . . .10

aspectos . . . . . . . . . . . . . . . . . . . . . . . . . 19natureza do . . . . . . . . . . . . . . . . . . . . . 65

preferencial attachment . . . . . . . . . . . . .110premissa

atingibilidade . . . . . . . . . . . . . . . . . . . 29conservacao da informacao . . . . . . 29evolucao discreta . . . . . . . . . . . . . . . . 27invariancia topologica . . . . . . . . . . . 26

PRNG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21probabilidade . . . . . . . . . . . . . . . . . . . . . . . xvi

condicional . . . . . . . . . . . . . . . . . . . . xviide retencao . . . . . . . . . . . . . . 30, 37, 43de transmissao . . . . . . . 30, 37, 39, 53

processode propagacao . veja de transmissaode transmissao . . . . . . . . . . . . . . . . . . 29marcoviano . . . . . . . . . . .25, 29, 31, 41marcoviano regular . . . . . . . . . . . . . . 40

produto cartesiano . . . . . . . . . . . . . . . . . xviipropriedades retinais . . . . . . . . . . . . . . . . 65

eficacia . . . . . . . . . . . . . . . . . . . . . . . . . . 65proxies . . . . . . . . . . . . . . . . . . . . . . . . . . 11, 21psicologia . . . . . . . . . . . . . . . . . . . . . . . . . . . .22publicacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Qquantificador

existencial . . . . . . . . . . . . . . . . . . . . . . .xvuniversal . . . . . . . . . . . . . . . . . . . . . . . . xv

Rraio base . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

mınimo . . . . . . . . . . . . . . . . . . . . . . . . . .72random graphs . . . . . . . . . . . . . . . . . . . . . 106recorrencia . . . . . . . . . . .veja recursividaderecursividade . . . . . . . . . . .veja recorrenciarede livre de escala . .veja livre de escalaredes complexas . . . . . . . .6, 16, 24, 63, 73rendimento . . . . . . . .38, 43, 44, 53, 54, 60representacao de espaco de estado . . . 15representacao eficaz . . . . . . . . . . . . . . . . . 26

Sscale free . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

Page 160: A Influˆencia da Observabilidade e da Visualizac¸˜ao Radial ...€¦ · RN/UF/BCZM CDU 004.7 “There is no end to education. It is not that you read a book, ... Atrav´es da

Indice Remissivo 137

seguranca . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4

sensoriamento comprimido . . . . . . . . . . .18

serie harmonica . . . . . . . . xv, 97, 117, 120

sistema

eficaz . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

eficiente . . . . . . . . . . . . . . . . . . . . . . . . . 12

escalavel . . . . . . . . . . . . . . . . . . . . . . . . 12

estruturalmente controlavel . . . . . . 35

linear . . . . . . . . . . . . . . . . 16, 25, 31, 42

sistemas autonomos . . . . . . . . . . . . . . . . . . .2

sistemas complexos . . . . . . . . . . . . . . 5, 101

small world . . . . . . . . . . . . . . . . . . . . . . . . 108

sobreposicao . . . . . . . . . . . . . . . . . . . . . . . . . 69

angular . . . . . . . . . . . . . . . . . . . . . . . . . .69

parental . . . . . . . . . . . . . . . . . . . . . 69, 71

SOM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

state space equation . . . . . . . . . . . . . . 16, 27

state space representation . . . . . . . . . . . .15

steady state of the process . . . . . . . . . . . 40

substituicoes sucessivas . . . . . . . . . . . . . . 74

T

tabela de rotas . . . . . . . . . . . . . . . . . . .11, 13

TCP . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19, 21

ISN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

tecnicas de distorcao . . . . . . . . . . . . . . . . .83

tecnicas de oclusao . . . . . . . . . . . . . . . . . . 83

tempo de resposta . . . . . . . . . . . . . . . . . . . . 4

teoria de grafos . . . . . . . . . . . . . . . . . . . . . . 24

tomografia . . . . . . . . . . . . . . . . . . . . . . . . . . .14

topologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

em anel . . . . . . . . . . . . . . . . . . . . . . . . 102

em estrela . . . . . . . . . . . . . . . . . . . . . . 102

em linha . . . . . . . . . . . . . . . . . . . . . . . 102

identificacao . . . . . . . . . . . . . . . . . . . . . 14

topologia em anel

definicao . . . . . . . . . . . . . . . . . . . . . . . 113

diametro . . . . . . . . . . . . . . . . . . . . . . . 104

distancia media . . . . . . . . . . . .104, 114

distribuicao dos graus . . . . . . . . . . 103

eficiencia media . . . . . . . . . . . 105, 117

observabilidade estrutural . . . . . . 121

topologia em estreladefinicao . . . . . . . . . . . . . . . . . . . . . . . 113diametro . . . . . . . . . . . . . . . . . . . . . . . 104distancia media . . . . . . . . . . . .104, 115distribuicao dos graus . . . . . . . . . . 103eficiencia media . . . . . . . . . . . 105, 119observabilidade estrutural . . . . . . 121observabilidade funcional . . . . . . . 122

topologia em linhadefinicao . . . . . . . . . . . . . . . . . . . . . . . 113diametro . . . . . . . . . . . . . . . . . . . . . . . 104distancia media . . . . . . . . . . . .104, 116distribuicao dos graus . . . . . . . . . . 103eficiencia media . . . . . . . . . . . 105, 119observabilidade estrutural . . . . . . 121

topologias determinısticas . . . 27, 30, 102trabalhos futuros . . . . . . . . . . . . . . . . . . . . 83traceroute . . . . . . . . . . . . . . . . . . . . 11, 14, 64

Uunicast . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Vvalor absoluto . . . . . . . . . . . . . . . . . . . . . . xviivalor esperado . . . . . . . . . . . . . . . . . . . . . xvii

agrupamento . . . . . . . . . . . . . . . . . . . 100distancia . . . . . . . . . . . . . . . . . . . . . . . . 95eficiencia . . . . . . . . . . . . . . . . . . . . . . . . 97grau . . . . . . . . . . . . . . . . . . . . . . . . . . . . .91

variavel aleatoria . . . . . . . . . . . . . . . . . . . xivrealizacao . . . . . . . . . . . . . . . . . . . . . . xvi

vetor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiiivetor de estado . . . . . veja estado da redevisualizacao . . . . . . . . . . . . . . . . . . . . . . . . . 22

cientıfica . . . . . . . . . . . . . . . . . . . . . . . . 10da informacao . . . . . . . . . . . . . . . 22, 63metricas . . . . . . . . . . . . . . . . . . . . . . . . .83radial . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

escalabilidade . . . . . . . . . . . . . .75, 77experimentos . . . . . . . . . . . . . . . . . . 77expressiva . . . . . . . . . . . . . . . . . . . . . 68expressiva mınima . . . . . . . . . . . . . 68

vizinhanca . . . . . . . . . . . . . . . . . . . . . . . . . . .98