1
DIAGNÓSTICO POR IMAGEM DIAGNÓSTICO POR IMAGEM MELHORA DO NÍVEL DE SERVIÇO EM RADIOLOGIA COM USO DE FERRAMENTAS DE MONITORAÇÃO AUTOMÁTICA DE PROCESSOS EM TI: EXPERIÊNCIAS COM O USO DO NAGIOS ® E CACTI ® PERSONA P.L., JULIO T., CRUZ L.B., FELIX M.M., DANIEL M.M., ROSEMBERG L.A., FUNARI M.B.G., WOLOSKER N. - DEPARTAMENTO DE IMAGEM DO HOSPITAL ISRAELITA ALBERT EINSTEIN CENÁRIO/EXPERIÊNCIA HIAE INTRODUÇÃO INTRODUÇÃO REFERÊNCIAS BIBLIOGRÁFICAS REFERÊNCIAS BIBLIOGRÁFICAS CONCLUSÃO CONCLUSÃO A equipe de Administradores dos Sistemas RIS e PACS do HIAE está disciplinada a focar sua atuação preventiva e corretiva nos dados coletados destas ferramentas mediante um painel (dashboard) criado para monitoração, em tempo real, dos parâmetros de missão crítica dos sistemas RIS e PACS, o que proporcionou um acompanhamento pró-ativo dos problemas e um aumento na disponibilidade das aplicações, antecipando prováveis atuações. Aqui compartilhamos nossa experiência em monitoramento ativo das soluções e serviços de missão crítica nos sistemas RIS e PACS do Hospital Israelita Albert Einstein usando as ferramentas NAGIOS e CACTI. Esta monitoração combinada foi adotada em nível corporativo em 2011 e devido sua capacidade de gerenciamento descentralizado, foi introduzida inicialmente no departamento de Diagnóstico por Imagem no controle dos sistemas e redes RIS e PACS. Desde então, mantemos uma monitoração ativa nos servidores e nodes dos sistemas RIS e PACS dos seguintes serviços: taxa de ocupação de discos, listener de rede e banco de dados, consumo de memória RAM, consumo de processadores, verificação de portas e interfaces, demais serviços inerentes à aplicação e ao banco de dados, taxas (picos e médias) de inbound e outbound, etc. Atualmente utilizamos a solução Nagios v.3.5.0 que roda em uma arquitetura de servidores virtualizados em RedHat Enterprise Linux 5, 12 vCPU e 8GB de Memória RAM. Neste momento contamos com uma monitoração ativa de 7476 serviços de missão crítica em 2277 hosts (servidores, switches, DASHBOARD RIS/PACS COMPLETO NAGIOS – lista expandida dos servidores RIS/PACS cujos serviços são monitorados pela solução. CACTI – vista expandida dos servidores RIS/PACS cuja rede e nível de acesso são monitorados pela solução. Alerta automático encaminhado pelo Nagios à caixa de correio eletrônico do Administrador do Sistema, informando a parada imotivada de um serviço de integração RIS/HIS. Vista expandida dos serviços monitorados num dos servidores de Banco de Dados da solução RIS. Alerta identificado no Nagios e isolado no servidor correspondente. Este alerta indica num primeiro momento (WARNING) que foi atingida a “marca d’água” de controle, ajustada no sistema para determinar a capacidade de armazenamento de imagens ainda disponível nos discos da aplicação. Por meio deste alerta, foi possível verificar e corrigir uma tarefa diária automática de autodelete de imagens programada na aplicação, evitando uma parada de sistema e indisponibilidade aos usuários. Exemplo de monitoração do nível de acesso a um dos servidores do sistema PACS em três dias contínuos. Por este gráfico é possível identificar picos de utilização de rede e atuar preventivamente em possíveis rearranjos. Derivações possíveis de desenvolvimento em “php”, com distinção de criticidade por cores, com apontamentos para as ferramentas Nagios e Cacti e em utilização pela equipe do “Network Operation Center” do HIAE. EXEMPLOS DE TELAS DE ALERTAS WIKIPÉDIA – A enciclopédia livre - < http://pt.wikipedia.org/wiki/Nagios >, < http://pt.wikipedia.org/wiki/Cacti > acesso em 28/03/2014 Toland C, Meenan C, Warnock M, Nagy P. Proactively monitoring departmental clinical IT systems with an open source availability system. J Digit Imaging. 2007;20(Suppl 1):119–124. doi: 10.1007/s10278-007-9063-2. Sweeney R. Monitoring your Enterprise PACS with Nagios®, Cacti and Smokeping – Whitepaper (11/03/04) Nagios é um serviço de monitoração ativo de rede desenhado em código OPEN SOURCE com o intuito de informar gestores, gerentes e administradores de sistemas, em tempo real, eventuais problemas nos seus sistemas e redes. É possível monitorar tanto hosts quanto serviços, para que sejam gerados alertas quando ocorrerem problemas e também quando os problemas forem resolvidos. Através das suas telas de monitoração, os profissionais que trabalham com operações de TI podem obter insights sobre a saúde de toda a rede da organização através de uma visão centralizada. Dentre várias possibilidades de monitoração possíveis com o Nagios, destacamos: Capacidade de monitoração dos serviços de rede (SMTP, POP3, HTTP, NNTP, ICMP, SNMP); Capacidade de monitoração dos recursos computacionais (carga do processador, uso de disco, logs do sistema); Capacidade de notificar quando um serviço ou equipamento apresenta problemas e quando o problema é resolvido (via email, pager, SMS ou qualquer outro meio definido pelo usuário por plugin); Capacidade de definir tratadores de eventos que executam tarefas em situações pré-determinadas ou para a resolução pró-ativa de problemas; Excelente interface web para visualização do atual status da rede, notificações, histórico de problemas, arquivos de log, etc. Já o Cacti é também uma ferramenta OPEN SOURCE para administração de rede que recolhe e exibe informações sobre o estado de uma rede de computadores através de gráficos. Permite o monitoramento e gerenciamento de redes simples até redes complexas, com centenas de dispositivos. Desenvolvido para ser flexível de modo a se adaptar facilmente a diversas necessidades, monitora o estado de elementos de rede e programas, bem como largura de banda utilizada e uso de CPU.

Melhora do nível de serviço em radiologia com uso de ferramentas de monitoração automática de processos em TI: experiência com o uso de Nagios® e Cacti®

Embed Size (px)

DESCRIPTION

Trabalho apresentado na Jornada Paulista de Radiologia 2014 Comitê de TI Departamento de Imagem Hospital Israelita Albert Einstein

Citation preview

Page 1: Melhora do nível de serviço em radiologia com uso de ferramentas de monitoração automática de processos em TI: experiência com o uso de Nagios® e Cacti®

DIAGNÓSTICO POR IMAGEMDIAGNÓSTICO POR IMAGEM

MELHORA DO NÍVEL DE SERVIÇO EM RADIOLOGIA COM USO DE FERRAMENTAS DE MONITORAÇÃO AUTOMÁTICA DE PROCESSOS EM TI: EXPERIÊNCIAS COM O USO DO NAGIOS®  E CACTI®

PERSONA P.L., JULIO T., CRUZ L.B., FELIX M.M., DANIEL M.M., ROSEMBERG L.A., FUNARI M.B.G., WOLOSKER N. - DEPARTAMENTO DE IMAGEM DO HOSPITAL ISRAELITA ALBERT EINSTEIN

CENÁRIO/EXPERIÊNCIA HIAE

INTRODUÇÃOINTRODUÇÃO

REFERÊNCIAS BIBLIOGRÁFICASREFERÊNCIAS BIBLIOGRÁFICAS

CONCLUSÃOCONCLUSÃO

A equipe de Administradores dos Sistemas RIS e PACS do HIAE está disciplinada a focar sua atuação preventiva e corretiva nos dados coletados destas ferramentas mediante um painel (dashboard) criado para monitoração, em tempo real, dos parâmetros de missão crítica dos sistemas RIS e PACS, o que proporcionou um acompanhamento pró-ativo dos problemas e um aumento na disponibilidade das aplicações, antecipando prováveis atuações.

Aqui compartilhamos nossa experiência em monitoramento ativo das soluções e serviços de missão crítica nos sistemas RIS e PACS do Hospital Israelita Albert Einstein usando as ferramentas NAGIOS e CACTI.

Esta monitoração combinada foi adotada em nível corporativo em 2011 e devido sua capacidade de gerenciamento descentralizado, foi introduzida inicialmente no departamento de Diagnóstico por Imagem no controle dos sistemas e redes RIS e PACS.

Desde então, mantemos uma monitoração ativa nos servidores e nodes dos sistemas RIS e PACS dos seguintes serviços: taxa de ocupação de discos, listener de rede e banco de dados, consumo de memória RAM, consumo de processadores, verificação de portas e interfaces, demais serviços inerentes à aplicação e ao banco de dados, taxas (picos e médias) de inbound e outbound, etc.

Atualmente utilizamos a solução Nagios v.3.5.0 que roda em uma arquitetura de servidores virtualizados em RedHat Enterprise Linux 5, 12 vCPU e 8GB de Memória RAM. Neste momento contamos com uma monitoração ativa de 7476 serviços de missão crítica em 2277 hosts (servidores, switches, câmeras, etc.) em nível corporativo. Nas soluções RIS e PACS, são 467 serviços ativos em 37 hosts (servidores).

DASHBOARD RIS/PACS COMPLETO

NAGIOS – lista expandida dos servidores RIS/PACS cujos serviços são monitorados pela solução.

CACTI – vista expandida dos servidores RIS/PACS cuja rede e nível de acesso são monitorados pela solução.

Alerta automático encaminhado pelo Nagios à caixa de correio eletrônico do Administrador do Sistema, informando a parada imotivada de um serviço de integração RIS/HIS.

Vista expandida dos serviços monitorados num dos servidores de Banco de Dados da solução RIS.

Alerta identificado no Nagios e isolado no servidor correspondente. Este alerta indica num primeiro momento (WARNING) que foi atingida a “marca d’água” de controle, ajustada no sistema para determinar a capacidade de armazenamento de imagens ainda disponível nos discos da aplicação. Por meio deste alerta, foi possível verificar e corrigir uma tarefa diária automática de autodelete de imagens programada na aplicação, evitando uma parada de sistema e indisponibilidade aos usuários.

Exemplo de monitoração do nível de acesso a um dos servidores do sistema PACS em três dias contínuos. Por este gráfico é possível identificar picos de utilização de rede e atuar preventivamente em possíveis rearranjos.

Derivações possíveis de desenvolvimento em “php”, com distinção de criticidade por cores, com apontamentos para as ferramentas Nagios e Cacti e em utilização pela equipe do “Network Operation Center” do HIAE.

EXEMPLOS DE TELAS DE ALERTAS

WIKIPÉDIA – A enciclopédia livre - < http://pt.wikipedia.org/wiki/Nagios>, < http://pt.wikipedia.org/wiki/Cacti> acesso em 28/03/2014

Toland C, Meenan C, Warnock M, Nagy P. Proactively monitoring departmental clinical IT systems with an open source availability system. J Digit Imaging. 2007;20(Suppl 1):119–124. doi: 10.1007/s10278-007-9063-2.

Sweeney R. Monitoring your Enterprise PACS with Nagios®, Cacti and Smokeping – Whitepaper (11/03/04)

Nagios é um serviço de monitoração ativo de rede desenhado em código OPEN SOURCE com o intuito de informar gestores, gerentes e administradores de sistemas, em tempo real, eventuais problemas nos seus sistemas e redes. É possível monitorar tanto hosts quanto serviços, para que sejam gerados alertas quando ocorrerem problemas e também quando os problemas forem resolvidos. Através das suas telas de monitoração, os profissionais que trabalham com operações de TI podem obter insights sobre a saúde de toda a rede da organização através de uma visão centralizada.

Dentre várias possibilidades de monitoração possíveis com o Nagios, destacamos:

• Capacidade de monitoração dos serviços de rede (SMTP, POP3, HTTP, NNTP, ICMP, SNMP);

• Capacidade de monitoração dos recursos computacionais (carga do processador, uso de disco, logs do sistema);

• Capacidade de notificar quando um serviço ou equipamento apresenta problemas e quando o problema é resolvido (via email, pager, SMS ou qualquer outro meio definido pelo usuário por plugin);

• Capacidade de definir tratadores de eventos que executam tarefas em situações pré-determinadas ou para a resolução pró-ativa de problemas;

• Excelente interface web para visualização do atual status da rede, notificações, histórico de problemas, arquivos de log, etc.

Já o Cacti é também uma ferramenta OPEN SOURCE para administração de rede que recolhe e exibe informações sobre o estado de uma rede de computadores através de gráficos. Permite o monitoramento e gerenciamento de redes simples até redes complexas, com centenas de dispositivos. Desenvolvido para ser flexível de modo a se adaptar facilmente a diversas necessidades, monitora o estado de elementos de rede e programas, bem como largura de banda utilizada e uso de CPU.