1
Descrição Com a obtenção de quantidades massivas de dados de tráfego de rede, vem a necessidade de métodos mais "inteligentes" para identificar incidentes de segurança, principalmente porque passa a ser possível encontrar informações novas por meio da correlação das informações e também porque uma análise de força bruta levaria muito tempo para ser finalizada. Neste Grupo de Trabalho, é proposto o desenvolvimento de um sistema para análise de quantidades massivas de dados heterogêneos capturados em redes de computadores, no escopo da infraestrutura de rede da RNP, a fim de possibilitar a detecção, imediata ou antecipada, de ataques que não seriam detectados com sistemas existentes e o aprendizado automático do sistema com o histórico do tráfego. Os objetivos a serem alcançados são: Definição de uma arquitetura capaz de escalar horizontal e verticalmente de forma automática, que realize análise de quantidades massivas de dados coletados por sensores distribuídos heterogêneos (pacotes e logs de aplicações e sistemas operacionais) em busca de ataques. Análise de desempenho, e de falsos positivos e falsos negativos, de diversas técnicas de correlação de dados a fim de avaliar a melhor para antecipação de ataques. Implementação de um protótipo de mecanismo de aprendizado de ataques simples para avaliar a viabilidade de um mecanismo mais robusto para ataques compostos por diversas etapas. Desenvolvimento de uma interface web para configuração do sistema e para visualização dos resultados das análises, possibilitando pelo menos: diferenciação de ataques por nível de criticidade, criação de linhas do tempo para ataques de duração prolongada, como ataques de DDoS, e criação de gráficos de índice de risco. Análise da viabilidade da utilização do sistema desenvolvido no CAIS da RNP. É possível ainda que apenas alguns mecanismos desenvolvidos sejam integrados a sistemas e procedimentos existentes no CAIS da RNP, que todos serão desenvolvidos pensando em serem facilmente integrados a padrões e protocolos bem definidos de envio de dados relacionados com segurança da informação. Como inovações tecnológicas, destacam-se: (i) mecanismo capaz de correlacionar grandes quantidades de dados de diferentes fontes heterogêneas de modo a detectar ataques que não seriam possíveis de serem detectados com dados de uma única fonte, (ii) mecanismo capaz de antecipar ataques com base nos dados coletados de vários sensores e (iii) o protótipo de mecanismo de aprendizado de ataques. O protótipo, ao término da Fase 1, deve ser capaz de realizar a análise de dados massivos que suporte a inclusão de diversas fontes e de gerar visualizações de incidentes de segurança, e a antecipação dos mesmos, utilizando a correlação de dados provenientes de diversos pontos de uma rede de computadores bem como de fontes heterogêneas, por exemplo, cabeçalhos de pacotes e logs de aplicações. GT-BIS Mecanismos para análise de Big Data em segurança da informação EQUIPE Coordenador Daniel Macêdo Batista Instituto de Matemática e Estatística (IME) Universidade de São Paulo (USP) Coordenadores-adjuntos Luiz Arthur F. dos Santos Rodrigo Campiolo Diego Bertolini Gonçalves Universidade Tecnológica Federal do Paraná (UTFPR-CM) Gerência de projeto e infraestrutura Wagner A. Monteverde (UTFPR) Pesquisa e Desenvolvimento • Universidade de São Paulo • Universidade Tecnológica Federal do Paraná ESTAGIÁRIOS • Universidade de São Paulo • Universidade Tecnológica Federal do Paraná PARCEIROS • Universidade de São Paulo • Universidade Tecnológica Federal do Paraná • CAIS/RNP (a firmar) SITE gtbis.ime.usp.br CONTATO [email protected] Figura 1: Visão geral do processamento de quantidades massivas de dados de segurança de fontes heterogêneas.

GT-BIS Mecanismos para análise de Big Data em segurança ......para análise de quantidades massivas de dados heterogêneos capturados em redes de computadores, no escopo da infraestrutura

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: GT-BIS Mecanismos para análise de Big Data em segurança ......para análise de quantidades massivas de dados heterogêneos capturados em redes de computadores, no escopo da infraestrutura

DescriçãoCom a obtenção de quantidades massivas de dados de tráfego de rede,vem a necessidade de métodos mais "inteligentes" para identificarincidentes de segurança, principalmente porque passa a ser possívelencontrar informações novas por meio da correlação das informações etambém porque uma análise de força bruta levaria muito tempo paraser finalizada.

Neste Grupo de Trabalho, é proposto o desenvolvimento de um sistemapara análise de quantidades massivas de dados heterogêneoscapturados em redes de computadores, no escopo da infraestrutura derede da RNP, a fim de possibilitar a detecção, imediata ou antecipada,de ataques que não seriam detectados com sistemas existentes e oaprendizado automático do sistema com o histórico do tráfego.

Os objetivos a serem alcançados são:

• Definição de uma arquitetura capaz de escalar horizontal everticalmente de forma automática, que realize análise dequantidades massivas de dados coletados por sensores distribuídosheterogêneos (pacotes e logs de aplicações e sistemas operacionais)em busca de ataques.

• Análise de desempenho, e de falsos positivos e falsos negativos, dediversas técnicas de correlação de dados a fim de avaliar a melhorpara antecipação de ataques.

• Implementação de um protótipo de mecanismo de aprendizado deataques simples para avaliar a viabilidade de um mecanismo maisrobusto para ataques compostos por diversas etapas.

• Desenvolvimento de uma interface web para configuração do sistemae para visualização dos resultados das análises, possibilitando pelomenos: diferenciação de ataques por nível de criticidade, criação delinhas do tempo para ataques de duração prolongada, como ataquesde DDoS, e criação de gráficos de índice de risco.

• Análise da viabilidade da utilização do sistema desenvolvido no CAISda RNP. É possível ainda que apenas alguns mecanismosdesenvolvidos sejam integrados a sistemas e procedimentos jáexistentes no CAIS da RNP, já que todos serão desenvolvidospensando em serem facilmente integrados a padrões e protocolosbem definidos de envio de dados relacionados com segurança dainformação.

Como inovações tecnológicas, destacam-se: (i) mecanismo capaz decorrelacionar grandes quantidades de dados de diferentes fontesheterogêneas de modo a detectar ataques que não seriam possíveis deserem detectados com dados de uma única fonte, (ii) mecanismo capazde antecipar ataques com base nos dados coletados de vários sensorese (iii) o protótipo de mecanismo de aprendizado de ataques.

O protótipo, ao término da Fase 1, deve ser capaz de realizar aanálise de dados massivos que suporte a inclusão de diversas fontes ede gerar visualizações de incidentes de segurança, e a antecipação dosmesmos, utilizando a correlação de dados provenientes de diversospontos de uma rede de computadores bem como de fontesheterogêneas, por exemplo, cabeçalhos de pacotes e logs deaplicações.

GT-BISMecanismos para análise de Big Dataem segurança da informação

EQUIPECoordenadorDaniel Macêdo BatistaInstituto de Matemática e Estatística (IME)Universidade de São Paulo (USP)

Coordenadores-adjuntosLuiz Arthur F. dos SantosRodrigo CampioloDiego Bertolini GonçalvesUniversidade Tecnológica Federal do Paraná (UTFPR-CM)

Gerência de projeto e infraestruturaWagner A. Monteverde (UTFPR)

Pesquisa e Desenvolvimento• Universidade de São Paulo • Universidade Tecnológica Federal do Paraná

ESTAGIÁRIOS• Universidade de São Paulo• Universidade Tecnológica Federal do Paraná

PARCEIROS• Universidade de São Paulo• Universidade Tecnológica Federal do Paraná• CAIS/RNP (a firmar)

SITEgtbis.ime.usp.br

[email protected]

Figura 1: Visão geral do processamento de quantidades massivas de dados de segurança de fontes heterogêneas.