Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
Medicina, (Ribeirão Preto. Online)
Revista da Faculdade de Medicina de Ribeirão Preto e do Hospital das Clínicas da FMRP-USP
VOLUME 48 SUPLEMENTO 3
NOVEMBRO 2015
II WORKSHOP IBERO-AMERICANO DE SISTEMAS INTEROPERÁVEIS EM SAÚDE
Faculdade de Medicina de Ribeirão Preto - USP
26 e 27 de junho de 2015
Editorial................................................................................................................................... i-ii
Comissões ............................................................................................................................... iii
Artigos originais ................................................................................................................. 1-19
QUALIDADE DOS DADOS CODIFICADOS NOS EPISÓDIOS HOSPITALARES EM
PORTUGAL.
Alberto Freitas; Mariana F Lobo; Fernando Lopes .......................................... 1
ADVERSEMINER: MINERADOR DE EFEITOS ADVERSOS EM BASES CONVENCIONAIS
E NÃO-CONVENCIONAIS
Felipe V. Duval; Ernesto R. Caffarena; Oswaldo G. Cruz; Gilberto M. S. Silva; Fabrício A. B. da Silva ..................................................................................... 6
SERVIÇO DE ESTIMAÇÃO DE INCIDÊNCIA DE MALÁRIA: INTEGRAÇÃO DE DADOS
EPIDEMIOLÓGICOS COM MEDIÇÕES POR SATÉLITE DE OBSERVAÇÃO TERRESTRE
Pedro Pereira Rodrigues; Nuno Almeida; Alberto Freitas; Raphael Oliveira; Emanuel Catumbela; Ricardo Cruz-Correia ................................................... 13
Resumos originais ............................................................................................................. 20-26
DESENVOLVIMENTO DE UM SISTEMA COMPUTACIONAL DE AUXÍLIO À
CLASSIFICAÇÃO EM GRUPOS DE DIAGNÓSTICOS HOMOGÊNEOS E CÁLCULO DE
MEDIDAS E INDICADORES PARA CARACTERIZAÇÃO DE HOSPITAIS DA REGIÃO DE
RIBEIRÃO PRETO, SÃO PAULO, BRASIL.
Júlio Cesar Botelho de Souza; Domingos Alves; Fernando José Oliveira Lopes;
José Alberto Silva Freitas .............................................................................. 20
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
MINERAÇÃO DE TEXTOS CIENTÍFICOS VISANDO À IDENTIFICAÇÃO DE
COMPONENTES BIOATIVOS COM POTENCIAL TERAPÊUTICO PARA O COMBATE ÀS
DOENÇAS NEGLIGENCIADAS.
Milene Pereira Guimarães de Jezuz; Fabrício Alves Barbosa da Silva; Ernesto Raúl Caffarena; Oswaldo Gonçalves Cruz ................................................... 21
MINERADOR DE EVENTOS ADVERSOS UTILIZANDO O TWITTER COMO FONTE PARA FARMACOVIGILÂNCIA.
Felipe Vieira Duval; Ernesto Raúl Caffarena; Oswaldo Gonçalves Cruz; Fabrício Alves Barbosa da Silva ................................................................................ 22
DESENVOLVIMENTO DE FERRAMENTA COMPUTACIONAL PARA APOIO À
MANUTENÇÃO DE BACKUPS DE IMAGENS MÉDICAS.
Carolina Rocha Mello; Nathalia Pereira Zago; Hugo Cesar Peloggia Rodrigues; Rodolfo Dias Correia; Saulo da Silva Cordeiro; Paulo Mazzoncini de Azevedo Marques .................................................................... 23
AVALIAÇÃO DA QUALIDADE DE DADOS HOSPITALARES NA REGIÃO DE RIBEIRÃO
PRETO EM 2012.
André Luiz Teixeira Vinci e Domingos Alves .............................................................. 24
FATORES DETERMINANTES PARA A UTILIZAÇÃO DO SERVIÇO DE URGÊNCIA PEDIÁTRICA: UM CASO DE ESTUDO
João Viana; Alberto Freitas; Almeida Santos ............................................................. 25
A UTILIZAÇÃO DE UM SISTEMA INFORMATIZADO PARA ACOMPANHAMENTO DO TRATAMENTO DE TUBERCULOSE EM UMA UNIDADE DE SAÚDE.
Nathalia Yukie Crepaldi; Nathalia Halax Orfão; Maria Eugenia Firmino Brunello; Domingos Alves; Tereza Cristina Scatena Villa ......................................................... 26
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
ii
Editorial
A
Informática na Saúde estuda a compreensão dos dados, da informação e do conhecimento
biomédicos e a aplicação das tecnologias da informação nos sistemas de saúde, com o objetivo de aumentar a
segurança, a efetividade, a eficiência, a equidade e a disponibilidade da prestação de cuidados. Por isto mesmo,
os profissionais da Informática na Saúde têm um papel central no bom desempenho das atividades das suas
organizações e, por consequência, na prestação de cuidados de saúde de qualidade, pelo que as suas
responsabilidades se têm tornado cada vez mais críticas e complexas.
Estas novas exigências e o aumento da complexidade das necessidades informacionais e tecnológicas das
instituições e dos profissionais de saúde têm levado, por sua vez, ao aumento da oferta e da qualidade da formação
em Informática na Saúde.
A partilha de informação e experiências entre grupos de investigação e/ou entre indivíduos singulares, permite a
criação de equipes multidisciplinares para a resolução de problemas e torna efetivamente possível a colocação
dos utilizadores dos Sistemas de Informação em Saúde no centro das soluções tecnológicas e organizacionais
necessárias à melhoria dos serviços e produtos.
Em fevereiro de 2014 foi realizado o primeiro IASIS, que teve como objetivo promover o intercâmbio de
conhecimento nos projetos de interesse comum entre grupos de pesquisa Brasileiros e Portugueses no
desenvolvimento de Sistemas de Informação em Saúde (SIS) a partir da troca de informações e documentação de
aplicativos computacionais para a saúde, com ênfase na interoperabilidade entre sistemas.
Deve-se destacar que este primeiro evento teve como focos de pesquisa os trabalhos que estão sendo realizados
em quatro eixos principais que se referem à infraestrutura dos SIS: (1) terminologias em saúde, (2)
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
i
interoperabilidade entre sistemas de informação em saúde, (3) sistemas de auditoria e qualidade de dados e (4)
segurança.
Além dos atrativos interdisciplinares do evento, suas características levaram à discussão em plenária no último dia
sobre a nucleação de um centro internacional de referência em convergência tecnológica de sistemas de
informação em saúde com foco em utilizadores e desenvolvedores de sistemas em língua portuguesa.
Neste sentido, o IASIS 2015 foi um desdobramento desse primeiro encontro, trazendo para o debate
representantes de cinco países (Brasil, Portugal, Angola, Guiné e Moçambique) procurando estruturar
paulatinamente uma rede cooperativa interinstitucional.
Durante o evento foi possível identificar um série de oportunidades de colaboração entre grupos desses países e
os trabalhos apresentados aqui documentam um panorama um pouco mais detalhado das atividades de pesquisa
que os participantes do evento trouxeram para compartilhar.
Além disso, o site do evento com todas as informações e detalhes sobre os seus resultados está hospedado de
maneira permanente e pode ser acessado na página da FMRP-USP (http://iasis.fmrp.usp.br/).
Domingos Alves
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
1
Comissões
Comissão Organizadora
André Luiz Teixeira Vinci (FMRP – USP)
Breno Mazzieiro (FMRP- USP)
Domingos Alves (FMRP – USP)
Flávio Barbosa (CIAware)
Isabelle Carvalho (FMRP – USP)
João Mazzoncini de Azevedo Marques (FMRP – USP)
Milton Roberto Laprega (FMRP – USP)
Natália Santana Chiari (FMRP – USP)
Newton Shydeo Brandão Miyoshi (FMRP – USP)
Paulo Mazzoncini de Azevedo Marques (FMRP – USP)
Ricardo João Cruz Correia (CINTESIS – UP)
Rui Pedro Charters Lopes Rijo (IP – Leiria)
Thiago Fernandes de Freitas Dias (FMRP – USP)
Comissão Científica
Cassia Maria Buchala (FSP- USP)
Domingos Alves (FMRP – USP)
Fabrício Alves Barbosa da Silva (Fiocruz)
Inês de Castro Dutra (INESC – UP)
João Mazzoncini de Azevedo Marques (FMRP – USP)
João Paulo Dias de Souza (FMRP – USP)
José Alberto da Silva Freitas (CINTESIS – UP)
Milton Roberto Laprega (FMRP – USP)
Paula Araujo Opromolla (CCTIES – SES/SP)
Paulino Artur Ferreira de Sousa (CINTESIS – ESEnf)
Paulo Mazzoncini de Azevedo Marques (FMRP – USP)
Regina Ungerer (OMS – Genebra)
Ricardo João Cruz Correia (CINTESIS – UP) Rui
Pedro Charters Lopes Rijo (INESC – UP) Zilma
Silveira Nogueira Reis (UFMG – Medicina)
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
iii
XXARTIGO ORIGINALXX
QUALIDADE DOS DADOS CODIFICADOS NOS EPISÓDIOS HOSPITALARES EM PORTUGAL
Alberto Freitas¹,²; Mariana F Lobo¹,²; Fernando Lopes¹,²
¹ CINTESIS – Centro de Investigação em Tecnologias e Sistemas de Informação em Saúde ² FMUP – Faculdade de Medicina da Universidade do Porto
RESUMO
Introdução: As bases de dados administrativas incluem entre outros, dados demográficos dos doentes
e códigos para diagnósticos e procedimentos. Estas bases de dados podem conter dados incorretos, com determinados problemas de qualidade, mas comportam dados de âmbito nacional que estão facilmente disponíveis e são relativamente baratos. Objetivo: Com este trabalho pretende-se apresentar
alguns problemas existentes nestes dados e alertar para a necessidade de uma mais abrangente e melhor auditoria da qualidade dos dados codificados. Métodos: Análise de uma base de dados hospitalar de âmbito nacional com altas entre 2000 e 2010. Resultados: Nos exemplos apresentados,
de notar o aumento contínuo no número médio de códigos por episódio, com influência por exemplo no número de comorbilidades identificadas, e a existência de algumas situações de upcoding. Discussão e Conclusão: Os resultados apresentados mostram, por um lado, a relevância destes dados para
determinados estudos (e.g., de gestão, epidemiológicos) mas alertam, por outro, para os cuidados necessários aquando da interpretação dos resultados obtidos, bem como da necessidade de auditoria e averiguação regular da qualidade dos dados.
Palavras-chave: Auditoria. Dados administrativos. Codificação. CID-9-MC. GDH. Qualidade de dados.
INTRODUÇÃO
As bases de dados dos Grupos de Diagnóstico Homogéneos (GDH) são muitas vezes referidas no contexto dos sistemas de informação hospitalar. Estas bases de dados são compostas por dados clínico-administrativos relativos a registos de episódios (de internamento, de cirurgia de ambulatório e de ambulatório médico) e ainda outras variáveis do conjunto mínimo de dados. Estas bases de dados, ditas administrativas, podem conter dados incorretos e com determinados problemas de qualidade (1), mas comportam dados que estão facilmente disponíveis, são relativamente baratos e são frequentemente utilizados (2, 3). Em algumas situações podem ser a única fonte de dados disponível para estudar uma determinada questão clínica. Assim, e apesar de vários problemas existentes (4, 5), os dados administrativos podem, por exemplo, ser utilizados para a produção de indicadores de qualidade, para o estudo e comparação de atividades hospitalares (6-8) ou no estudo da relação entre hospitalizações e determinadas variáveis ambientais (9).
Aos vários níveis, local (cada hospital), regional (administrações regionais de saúde) ou nacional (Ministério da Saúde), são bases de dados importantes para a gestão, para a contratualização e para a definição de políticas de saúde. Apesar de poderem ter alguns problemas de qualidade de dados, estas são bases de dados com enorme potencial, que não têm sido devidamente aproveitadas.
Os GDH – no original Diagnosis Related Groups (DRG) – são um sistema de classificação de internamentos
de doentes agudos que permite definir, operacionalmente, os produtos de um hospital (10, 11). Este sistema de classificação de doentes permite relacionar o tipo de doentes que o hospital trata com os custos que estes acarretam ao hospital. Para a sua definição são usadas determinadas variáveis que podem explicar os custos hospitalares e que estão associadas aos doentes tratados, nomeadamente o diagnóstico principal, os procedimentos (cirúrgicos e outros), os diagnósticos secundários, a idade, o sexo, o destino após alta e o peso (no caso de ser recém-nascido). Um dos objetivos na sua concepção foi o da criação de grupos coerentes tanto em termos clínicos como em termos de consumo de recursos, e que fossem úteis para atividades de gestão e planeamento. O sistema dos GDH é o sistema de case-mix habitualmente mais utilizado para o reembolso e
avaliação de desempenho dos hospitais. Em Portugal é utilizado desde 1989. Upcoding pode ser definido como uma prática sistemática, deliberada, de alteração do case-mix de um
hospital de modo a aumentar o reembolso financeiro. É uma prática artificiosa onde os serviços de um prestador de cuidados de saúde são faturados por códigos de procedimentos com valor mais elevado dos que aqueles que foram efetivamente realizados, resultando em pagamentos mais elevados por parte das entidades pagadoras. Em termos mais latos, upcoding designa a existência de não conformidades na codificação das quais resultam incrementos de faturação, de financiamento ou de avaliação do Hospital ou Serviço auditado (12).
OBJETIVO
Com este trabalho pretende-se apresentar e discutir determinadas particularidades e problemas existentes nas bases de dados administrativas e alertar para a necessidade de mais e melhor auditoria da qualidade dos dados codificados.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
2
MÉTODOS
A base de dados dos GDH, que está associada ao sistema de financiamento dos hospitais portugueses, foi a principal fonte de dados para esta análise. Esta base de dados, assente no conjunto mínimo de dados (MBDS), é utilizada na maioria dos hospitais públicos de agudos do SNS português. Não foram incluídos nesta análise dados de hospitais privados. O acesso aos dados foi facultado pela Administração Central do Sistema de Saúde I.P. (ACSS).
Os dados em questão são relativos a altas hospitalares em 11 anos consecutivos, entre os anos de 2000 e 2010, e compreendem 14 873 703 episódios hospitalares, maioritariamente de internamento (71%) mas também de cirurgia de ambulatório (10%) e de ambulatório médico (19%).
Para a identificação das comorbilidades codificadas foi utilizado o método de Charlson/Deyo (13) que define 17 comorbilidades, identificadas através dos diagnósticos secundários associados a cada episódio hospitalar. O índice de comorbilidade de Charlson resulta do somatório ponderado das comorbilidades identificadas.
As análises foram efetuadas utilizando o software IBM SPSS Statistics, versão 21.
RESULTADOS
Conforme se pode ver pela figura 1, e considerando somente os episódios de internamento, o número de diagnósticos secundários codificados tem aumentado continuamente, desde, em média, 1,5 em 2000 até 2,9 em 2010. O mesmo sucede com o número médio de procedimentos de diagnósticos ou cirúrgicos, com um aumento contínuo ao longo dos anos. Já se considerarmos nesta análise também os episódios de ambulatório, podemos ver que a partir de 2006 o número médio de diagnósticos secundários, bem como o número médio de procedimentos, diminuíram, sendo a diminuição mais acentuada no último.
Figura 1 – Evolução do número médio de diagnósticos secundários e de procedimentos codificados, considerando por um lado todos os episódios (internamento e ambulatório) e por outro somente os episódios de internamento, 2000-10
Figura 2 – Evolução do número de diagnósticos secundários codificados e do índice de Charlson, considerando somente os episódios de internamento, 2000-10
3,5
3,0 2,9
2,6 2,4 2,5
2,5
2,0 2,1
2,0 1,6
1,7 1,8 1,9
1,5 1,5
Nr diagnósticos secundários
Charlson index
1,0
0,4 0,5 0,5 0,5 0,5 0,6 0,6 0,6 0,6 0,7 0,7
0,5 0,0
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
6,0
5,0
4,0
3,0
2,0
1,0
Nr diagnósticos secundários (todos)
Nr diagnósticos secundários (int)
Nr procedimentos (todos)
Nr procedimentos (int)
0,0
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
3
Relativamente ao índice de comorbilidade de Charlson/Deyo podemos observar o seu aumento contínuo ao logo dos anos, tendo praticamente duplicado durante o período em análise (figura 2). Este aumento está naturalmente ligado ao aumento contínuo do número de diagnósticos secundários codificados, que estão na base do seu cálculo.
Tabela 1 – Comorbilidades (Charlson/Deyo) por 1000 internamentos (2000-10)
Comorbilidade (Charlson/Deyo)
2000
2005
2010 Diferença
2000/2010 (%)
Diferença 2000/2010,
ajustada (%)*
Myocardial infarction 6,63 9,61 15,26 130,2 17,0
Congestive heart failure 29,04 38,42 55,54 91,2 -2,8
Peripheral vascular disease 6,34 9,16 12,91 103,8 3,6
Cerebrovascular disease 25,89 33,79 43,11 66,5 -15,4
Dementia 6,37 9,60 16,81 164,0 34,2
Chronic pulmonary disease 26,68 35,07 50,23 88,2 -4,3
Rheumatic disease 2,40 3,71 5,17 115,8 9,7
Peptic ulcer disease 4,52 3,95 3,92 -13,4 -56,0
Mild liver disease 11,56 15,73 20,49 77,3 -9,9
Diabetes without chronic complication 50,09 74,79 101,22 102,1 2,7
Diabetes with chronic complication 6,33 7,57 13,40 111,7 7,6
Hemiplegia or paraplegia 6,65 8,37 8,61 29,5 -34,2
Renal disease 17,71 23,61 43,97 148,3 26,2
Any malignancy, including lymphoma and leukemia, except malignant neoplasm of skin
27,20
29,06
35,66
31,1
-33,3
Moderate or severe liver disease 6,16 6,64 7,63 23,9 -37,0
Metastatic solid tumor 20,01 24,90 29,35 46,7 -25,4
AIDS/HIV 2,04 1,76 1,67 -18,0 -58,3 * Diferença ajustado ao número médio de diagnósticos secundários codificados (1,45 em 2000 e 2,86 em 2010)
Numa análise mais detalhada das várias comorbilidades associadas ao índice de Carlson/Deyo, pode-se observar que a maioria das comorbilidades aumentou consideravelmente a sua frequência no período em análise, tendo algumas mais do que duplicado (tabela 1). No entanto, se ajustarmos as diferenças observadas ao número de diagnósticos secundários verificamos que, face a uma maior codificação, não existe um correspondente aumento nas comorbilidades codificadas.
Nas figuras seguintes (figura 3) podemos ver as variações na codificação de dois procedimentos: a implantação de um cateter venoso central (CVC), tunelizado ou não, classificado na ICD-9-CM com o código 38.93, e a implantação de um cateter venoso central totalmente implantável (CVCTI), classificado com o código 86.07. São procedimentos realizados habitualmente em doentes que necessitam de administração endovenosa de fármacos antineoplásicos por períodos mais ou menos longos em ciclos designados por quimioterapia. Os cateteres totalmente implantáveis têm uma vida útil de alguns meses e os cateteres tunelizado não são utilizáveis mais do que alguns dias ou semanas.
Acontece que estes cateteres são implantados por cirurgiões preferencialmente no ambiente de assepsia duma sala de bloco operatório em doentes que estão internados, ou em doentes ambulatórios que acedem ao hospital propositadamente para este efeito no âmbito da produção adicional em cirurgia de ambulatório. Apesar de implantados no bloco operatório, estes procedimentos não são considerados “intervenções cirúrgicas” (definição na Portaria 163/2013) tendo os CVCTI uma remuneração mais elevada do que os outros CVC, os quais poderão até não ser remunerados.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
4
Figura 3 – Evolução da codificação de dois procedimentos (38.93 - CVC, 86.07 - CVCTI) a nível nacional e num determinado
hospital
Este motivo tem levado os cirurgiões a classificar os CVC como se fossem CVCTI: o corpo do relato operatório descreve implantação de cateter venoso central, tunelizado ou não, o código aplicado é o 86.07 e a tradução deste, feita pelo sistema informático, é cateter venoso central totalmente implantável. Os codificadores hospitalares, confrontados com a descrição do relato codificam corretamente estes cateteres, para efeitos dos GDH, com 38.93 mas o código 86.07 fica no SAM / SONHO sem ser corrigido, sendo contabilizado como tal nas estatísticas intra-hospitalares. Não se descarta a possibilidade de serem as próprias descrições operatórias a referir “totalmente implantável” em cateteres que o não eram e, nesses casos, o médico codificador acaba por manter o código 86.07 na codificação dos GDH. Deve ainda mencionar-se os casos em que o cirurgião não faz relato operatório e a única “informação” disponível é o código (86.07) por ele aplicado não havendo qualquer hipótese de correção por parte do médico codificador.
O gráfico correspondente ao hospital A mostra claramente um número de implantações de CVCTI muito superior às implantações de CVC, quer localmente, quer a nível nacional.
DISCUSSÃO E CONCLUSÃO
Qualquer análise efetuada sobre os diagnósticos secundários deve considerar a evolução, não só nos sistemas de codificação utilizados, mas também nas práticas de codificação do dia-a-dia. Conforme foi possível
averiguar nos exemplos apresentados, o aumento de um determinado índice de comorbilidades, ou o aumento de uma comorbilidade em particular, ao longo dos anos, não está necessariamente associado a um real aumento das comorbilidades. De facto o número de diagnósticos secundários tem continuamente aumentado ao longo dos anos.
Por outro lado, é importante perceber que alterações nos dados recolhidos ou nos protocolos de recolha/codificação de dados poderão ter ocorrido ao longo dos anos, por exemplo a inclusão de dados de ambulatório, a alteração de determinadas regras de codificação ou a substituição e inclusão de novos códigos ICD-
9-CM. Situações potenciais de upcoding, como por exemplo a apresentada, deveriam dar lugar a auditorias, não
só da codificação, como da prática médica nos hospitais envolvidos, de modo a ser averiguado se as características da população e das doenças tratadas são tão diferente das de outros hospitais e se será correta a diferença dos números da realização destes procedimentos.
Todos os hospitais
4000
3000
2000
1000
0
38.93 86.07
Hospital A
120
100
80
60
40
20
0
38.93 86.07
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
5
As bases de dados administrativas têm um enorme potencial mas será sempre necessária a existência de informação de contexto que permita perceber algumas das suas potenciais limitações. Uma boa parte dessas limitações poderia ser minorada com mais e melhores auditorias, bem como com a existência de ferramentas nos sistemas de informação que ajudem os médicos, os codificadores e os gestores, entre outros profissionais de saúde, nos processos de recolha, processamento, análise e apresentação de dados.
AGRADECIMENTOS
Os autores agradecem à Administração Central do Sistema de Saúde (ACSS) a disponibilização dos dados.
REFERÊNCIAS
1. Freitas A, Silva-Costa T, Marques B, Costa-Pereira A. Implications of Data Quality Problems within Hospital
Administrative Databases. In: Bamidis PD, Pallikarakis N, editors. IFMBE Proceedings. IFMBE Proceedings. 29: Springer
Berlin Heidelberg; 2010. p. 823-6.
2. Iezzoni LI. Assessing quality using administrative data. Annals of internal medicine. 1997;127(8 Pt 2):666-74.
3. Torchiana DF, Meyer GS. Use of administrative data for clinical quality measurement. The Journal of thoracic and
cardiovascular surgery. 2005;129(6):1223-5.
4. Calle JE, Saturno PJ, Parra P, Rodenas J, Perez MJ, Eustaquio FS, et al. Quality of the information contained in the
minimum basic data set: results from an evaluation in eight hospitals. European journal of epidemiology. 2000;16(11):1073-
80.
5. Freitas A, Silva-Costa T, Lopes F, Garcia-Lema I, Teixeira-Pinto A, Brazdil P, et al. Factors influencing hospital high
length of stay outliers. BMC health services research. 2012;12:265.
6. Freitas A, Costa T, Marques B, Gaspar J, Gomes J, Lopes F, et al. A framework for the production and analysis of hospital
quality indicators. Information Technology in Bio-and Medical Informatics: Springer; 2011. p. 96-105.
7. Jarman B, Gault S, Alves B, Hider A, Dolan S, Cook A, et al. Explaining differences in English hospital death rates using
routinely collected data. Bmj. 1999;318(7197):1515-20.
8. Scott I, Youlden D, Coory M. Are diagnosis specific outcome indicators based on administrative data useful in assessing
quality of hospital care? Quality & safety in health care. 2004;13(1):32-9.
9. Ayres-Sampaio D, Teodoro AC, Sillero N, Santos C, Fonseca J, Freitas A. An investigation of the environmental
determinants of asthma hospitalizations: An applied spatial approach. Applied Geography. 2014;47:10-9.
10. Rodrigues J-M. DRGs: Origin and dissemination throughout Europe. Diagnosis Related Groups in Europe: Springer;
1993. p. 17-29.
11. Urbano J, Bentes M. Definição da produção do hospital: os Grupos de Diagnósticos Homogéneos. Revista Portuguesa de
Saúde Pública. 1990;8(1):49-60.
12. Lopes F. Upcoding 2011 [updated 26/05/2011]. Available from: http://portalcodgdh.min-
saude.pt/index.php/Upcoding.
13. Quan H, Sundararajan V, Halfon P, Fong A, Burnand B, Luthi JC, et al. Coding algorithms for defining comorbidities in
ICD-9-CM and ICD-10 administrative data. Medical care. 2005;43(11):1130-9.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
6
XXARTIGO ORIGINALXX
ADVERSEMINER: MINERADOR DE EFEITOS ADVERSOS EM BASES CONVENCIONAIS E NÃO- CONVENCIONAIS
Felipe V. Duval¹, Ernesto R. Caffarena², Oswaldo G. Cruz², Gilberto M. S. Silva³, Fabrício A. B. da Silva²
¹ Instituto Oswaldo Cruz/FIOCRUZ ² Programa de Computação Científica/FIOCRUZ ³ Instituto Nacional de Infectologia Evandro Chagas/FIOCRUZ
RESUMO
Introdução: Durante o período de pós-comercialização, quando medicamentos são usados por grandes
populações e por longos períodos de tempo, eventos adversos (EA) não identificados podem ocorrer e alterar a relação risco-benefício dos mesmos o suficiente para exigir uma ação regulatória. Monitorar EA aos medicamentos pode ser entendido como um dos objetivos da farmacovigilância. Vários países possuem sistemas de vigilância farmacológica baseados em relatórios voluntários de EA. Tradicionalmente, as metodologias de detecção de sinais de EA analisam dados de uma única fonte, tipicamente bancos de dados de notificações voluntárias. Uma hipótese emergente na pesquisa em farmacovigilância é que a combinação de informações de múltiplas fontes de dados pode levar a descoberta mais eficaz e precisa desses eventos. No caso do Brasil, acreditamos que a combinação de múltiplas fontes de dados se torna ainda mais importante se considerarmos o número relativamente reduzido de notificações voluntárias, em comparação com outros países. Objetivos: O objetivo principal
desse trabalho é desenvolver o AdverseMiner, um sistema automatizado de farmacovigilância que será capaz de processar grandes volumes de dados heterogêneos e identificar associações novas e já existentes entre medicamentos e EA. Metodologia: O sistema será baseado no processamento
simultâneo de múltiplos pipelines, um para cada tipo diferente de dado a ser processado. Cada pipeline deverá gerar uma lista de sinais específicos, que serão combinados e posteriormente avaliados tendo- se como base um padrão de referência. Cada pipeline terá três etapas básicas: processamento de dados, filtragem medicamento–efeito adverso e análise de desproporcionalidade. Resultados: Dentre
os resultados se destaca a construção do pipeline do Twitter no qual já gerou bons resultados na análise de desproporcionalidade e construção de um padrão de referência para a língua inglesa. Conclusão:
Um primeiro protótipo do pipeline de processamento de dados obtidos do Twitter foi implementado e os valores encontrados em sua análise de desproporcionalidade indicam que este pode ser utilizado para encontrar EA já existentes.
Palavras-chave: Farmacovigilância. Mineração de Dados. Big Data. Eventos Adversos
INTRODUÇÃO
Durante o período de pós-comercialização, quando medicamentos são usados por grandes populações e por períodos de tempo longos, eventos adversos (EA) podem ocorrer, o que altera a relação risco-benefício dos medicamentos o suficiente para exigir uma ação regulatória. Os EA são definidos como agravos à saúde de um usuário ou de um paciente que podem surgir durante o tratamento com um produto farmacêutico, podendo ser erros de medicação, desvio de qualidade dos medicamentos, reações adversas a medicamentos (RAM), interações medicamentosas e intoxicações [1].
RAM é qualquer resposta prejudicial ou indesejável, não intencional, a um medicamento, que ocorre nas doses usualmente empregadas no homem para profilaxia, diagnóstico, terapia da doença ou para a modificação de funções fisiológicas [2].
Os EA podem ser identificados durante a fase de estudo sobre o medicamento que ocorre antes da comercialização, conhecida como fase clínica. Os testes clínicos com medicamentos ocorrem em três etapas distintas, conhecidas como Fases I, II e III, sendo iniciado com voluntários saudáveis e número limitado de pacientes [1]. Contudo, o número de pacientes submetidos aos estudos nas Fases I a III é limitado e a seleção e tratamento dos pacientes geralmente difere dos métodos utilizados na prática clínica [3]. Além disso, há· a exclusão de muitos subgrupos importantes da população que são potenciais usuários, e estes estudos são realizados por tempo geralmente curto. Por outro lado, EA detectados tardiamente no período pós-comercialização (também conhecido como Fase IV) podem requerer um aumento significativo de cuidados de saúde e resultar em danos desnecessários, muitas vezes fatais, ao paciente [4]. Portanto, monitorar EA aos medicamentos pode ser entendido como um dos objetivos da farmacovigilância.
Métodos computacionais comumente referidos como "detecção de sinais" ou algoritmos de "rastreamento" permitem que os avaliadores de segurança de medicamentos analisem grandes volumes de dados para identificar sinais de risco de potenciais EA, e provaram ser um componente fundamental na farmacovigilância. Como exemplo, a agência americana de controle de alimentos e medicamentos (Food and Drug Administration - FDA) usa rotineiramente um processo de rastreamento de sinais para calcular estatísticas relatando associações para todos os milhões de combinações de medicamentos e eventos em seu sistema de comunicações de EA [4]. Não
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
7
obstante, estes sinais por si só não são suficientes para estabelecer uma relação causal, mas são considerados indícios iniciais que requerem avaliação aprofundada por especialistas para estabelecer a causalidade. Esta nova avaliação tipicamente consiste de um processo complexo em que os avaliadores de segurança de medicamentos analisam informações adicionais, tais como relações temporais, relatos de casos publicados na literatura, plausibilidade biológica e clínica, dados de ensaios clínicos e estudos epidemiológicos em vários bancos de dados relacionados à saúde [4].
Dedicar recursos para a posterior avaliação de cada um dos múltiplos sinais normalmente gerados por algoritmos de detecção não é possível, e recursos destinados para múltiplas indicações incorretas podem inviabilizar um sistema de farmacovigilância. Portanto, estratégias automatizadas para reduzir a quantidade de falsas indicações e definir prioridades, de modo a permitir que apenas os candidatos mais promissores sejam avaliados, são imperativas.
Tradicionalmente, as metodologias de detecção de sinais de EA analisam dados de uma única fonte, tipicamente bancos de dados de notificações voluntárias. Uma hipótese emergente na pesquisa em farmacovigilância é que a combinação de informações de múltiplas fontes de dados poderia levar à descoberta mais eficaz e precisa de EA [4]. Dependendo das fontes de dados utilizadas, e do modo como elas são combinadas, acredita-se que o sistema resultante poderia levar ao aumento da significância estatística dos resultados, ou facilitaria novas descobertas que não são possíveis utilizando fontes de dados isoladas. Esta hipótese já foi confirmada recentemente de forma preliminar [4], mas novos estudos são necessários. Se considerarmos apenas eventos raros, a análise de dados de múltiplas fontes é necessária para se conseguir o poder estatístico e a heterogeneidade populacional necessários para detectar diferenças da efetividade de medicamentos em subpopulações, levando-se em conta diferenças genéticas, étnicas e clínicas [5]. No caso brasileiro, acreditamos que a combinação de múltiplas fontes de dados se torna ainda mais importante se considerarmos o número relativamente reduzido de notificações voluntárias, em comparação com outros países [1, 4, 6].
Neste artigo apresentamos o AdverseMiner, um sistema automatizado de mineração de EA que será capaz de processar dados oriundos de múltiplas fontes heterogêneas. O sistema descrito neste trabalho é de grande relevância social, pois permitirá a identificação prematura de EA ainda desconhecidos ou não confirmados, e permitirá a otimização dos recursos utilizados para a investigação detalhada dos eventos cuja causalidade ainda não tenha sido confirmada. Será possível também monitorar o aumento das incidências dos EA já descritos, muitas vezes originados por desvios da qualidade ou pelo aumento na exposição em subgrupos importantes da população mais vulneráveis (idosos, crianças, portadores de doenças crônicas, etc).
OBJETIVOS
O objetivo principal deste trabalho é descrever o AdverseMiner, um sistema automatizado de farmacovigilância que será capaz de processar um grande volume de dados heterogêneos e identificar associações novas e já existentes entre medicamentos e EA. O AdverseMiner deverá ser executado regularmente em recursos computacionais disponibilizados pela FIOCRUZ e parceiros, e servirá de apoio às redes de vigilância farmacológica implantadas no Brasil.
As fontes de dados que pretendemos usar podem se dividir em dois tipos: convencionais e não- convencionais. Várias fontes de dados a serem processadas pelo sistema serão disponibilizadas pelo Laboratório de Pesquisa Clínica em doença de Chagas do Instituto de Pesquisa Clínica Evandro Chagas, (LaPClin- Chagas/INI/FIOCRUZ), em uma colaboração entre o Programa de Computação Científica (PROCC/FIOCRUZ) e o INI/FIOCRUZ. Fontes de dados não-convencionais que vêm sendo utilizadas recentemente em farmacovigilância são redes sociais [7, 8] e logs de busca [9-11].
Como objetivos específicos propomos: - Identificar novas associações (previamente desconhecidas) entre medicamentos e EA. - Gerar dados que sirvam de apoio às redes de farmacovigilância implantadas no Brasil.
- Desenvolver um sistema que seja capaz de monitorar continuamente tanto medicamentos quanto EA selecionados previamente, com a capacidade de processar um grande número de alvos.
- Desenvolver um sistema que possa ser executado em nuvens privadas. - Criar um padrão de referência “medicamento-EA”, a ser utilizado no processo de avaliação deste sistema
e em outras pesquisas. Este projeto tem o objetivo de auxiliar o sistema de farmacovigilância coordenado pela ANVISA, acelerando
a identificação de potenciais associações entre medicamentos e EA. Consequentemente, relações causais podem ser estabelecidas mais rapidamente e medicamentos que tiverem uma nova RAM comprovada e que forem consideradas graves, poderão ser retiradas mais rapidamente do mercado, beneficiando largas populações de pacientes. Em outros casos, poderia ocorrer uma revisão da prescrição. Este projeto se caracteriza então como relevante com grande impacto social e de grande importância no contexto brasileiro, uma vez que os recursos dedicados à vigilância farmacológica no Brasil são limitados, assim como o seu alcance. É de se esperar que os resultados da pesquisa descrita nesta proposta permitirão a otimização dos recursos disponíveis e tornarão a vigilância farmacológica mais eficiente.
MÉTODOS
Uma visão geral do sistema é apresentada na Figura 1 com a utilização de 3 pipelines como exemplo, mas
número de pipelines que poderão ser incorporados ao sistema não será limitado contanto que a base de dados
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
8
utilizada no pipeline seja composta de textos, podendo ser dados da ANVISA, prontuários eletrônicos ou até mesmo mensagens do Twitter como pose ser visto na Figura 1.
Figura 1: “AdverseMiner”: Visão geral
O sistema será baseado no processamento simultâneo de múltiplos pipelines, um para cada tipo diferente
de dado a ser processado no sistema. Cada pipeline deverá gerar uma lista de sinais específicos, que serão
combinados e depois avaliados tendo-se como base um padrão de referência. Um sinal corresponde a uma
associação “medicamento-EA” identificada pelo pipeline.
Cada pipeline terá três etapas básicas de processamento:
1. Pré-processamento de dados: Nesta etapa, os dados serão processados de forma a
facilitar a identificação do medicamento e dos EA associados ao dado em questão. Esta etapa do
processamento pode ser dividida em sub-etapas adicionais, e é dependente do dado que será processado
pelo pipeline. Uma etapa inicial no caso das redes sociais é a aquisição dos dados. Os dados, no formato
de texto, deverão passar por um processamento de linguagem natural para extrair nomes de
medicamentos, doenças e sintomas, sendo então mapeados para Concept Unique Identifiers (CUIs)
definidos pelo UMLS [12] e outros padrões de linguagem médica [13] visando a sua uniformização. Nessa
fase será utilizada a ferramenta cTAKES (“Clinical Text Analysis and Knowledge Extraction System”) [14]
2. Filtragem medicamento – EA: Espera-se que cada execução do sistema seja orientada
para um ou mais medicamentos e/ou EA específicos, definidos previamente. Nesta etapa será feita uma
filtragem dos dados obtidos, de modo que permaneçam apenas os nomes de medicamentos e/ou EA que
são objetos da execução corrente.
3. Análise de desproporcionalidade: Para cada pipeline será utilizada uma medida de
análise de desproporcionalidade para os dados analisados. Esta medida será usada para classificar pares
“Medicamento-EA” identificados na etapa de processamento anterior. Ao longo desta pesquisa será
determinada a análise de desproporcionalidade mais adequada a cada tipo de dado, dependendo de suas
características e do volume de dados disponível.
O processamento de cada pipeline resultará em um conjunto de sinais, ou pares “medicamento-EA”,
classificados de acordo com a medida de análise de desproporcionalidade utilizada. Os sinais identificados
por diferentes pipelines serão condensados na etapa identificada como fusão de sinais. O objetivo desta etapa
é priorizar os pares medicamento-EA identificados simultaneamente por diversas fontes de dados diferentes.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
9
Será então gerada uma nova classificação dos sinais, onde os pares bem classificados em vários pipelines
simultaneamente receberão uma melhor classificação no processo de fusão.
Outros pipelines podem ser adicionados ao sistema à medida que os dados estejam disponíveis. Por exemplo, pode-se considerar a possibilidade de adicionar um pipeline dedicado ao processamento de logs de busca, como reportado em [15].
Após a fusão dos diversos conjuntos de sinais, a lista resultante será comparada com um padrão de referência na etapa de avaliação. Espera-se que a maior parte dos sinais resultantes já esteja incluída no padrão de referência. Sinais bem classificados que não sejam cobertos pelo padrão de referência podem indicar associações ainda desconhecidas, e deverão ser alvo de confirmação clínica posterior.
Análise de Desproporcionalidade
Métodos de análise de desproporcionalidade (ADP) em farmacovigilância representam a classe principal de métodos analíticos para a análise de dados de sistemas de relato espontâneo (SREs) [16]. SREs são relatórios que compreendem um ou mais nomes de medicamentos, da descrição de um ou mais EA, e possivelmente, alguns dados demográficos de base.
Estes métodos identificam associações relevantes em bases de dados de SREs, com foco em projeções de baixa dimensionalidade dos dados, mais especificamente, em tabelas de contingência de duas dimensões. Tanto a FDA como a OMS (Organização Mundial de Saúde) utilizam métodos de ADP para achar essas associações [16]. A Tabela 1 mostra uma tabela típica utilizada para o cálculo de diversas medidas de associação. A letra “a” representa a quantidade de tweets quem contêm o nome do medicamento i e o EA j.
Tabela 1: tabela de contingência de 2 dimensões.
EA j = Sim EA j = Não Total
Medicamento i = Sim a b n=a+b
Medicamento i = Não c d c+d
Total m=a+c b+d t=a+b+c+d
O propósito básico de um método ADP é a classificação das tabelas em ordem de “interesse”. Diferentes
métodos ADP focam em diferentes medidas estatísticas de associação como a sua medida de "interesse". As
fórmulas para as diferentes medidas de associação mais comumente usadas, juntamente com a sua interpretação
probabilística, estão mostradas na Tabela 2, onde "¬ medicamento" denota os relatórios que não incluem o
medicamento alvo.
Tabela 2: medidas comuns de associação em análises de SRE
Medida da Associação Formula Interpretação probabilística
RR – Relative Reporting Ratio (t.a)/(m.n) Pr (ea | medicamentos) / Pr (ea)
PRR – Proportional Reporting Ratio (a.(t-n))/(c.n) Pr (ea | medicamento) / Pr (ea | ¬ medicamento)
ROR – Reporting Odds Ratio
(a.d)/(c.b) ((Pr (ea | medicamento) / Pr (¬ ea | medicamento))/
((Pr (ea | ¬ medicamento) / Pr (¬ ea | medicamento))
CI - Componente de informação log2(RR) log2 (Pr (ea | medicamento)/Pr (ea))
Um medicamento em particular que é mais provável causar um EA específico do que qualquer outro
medicamento normalmente terá um valor mais elevado. Se um EA e um medicamento são estocasticamente
independentes, o valor da medida de associação receberá o valor igual a 1.
Padrão de Referência
Um banco de dados amplamente aceito de todos os EA atualmente conhecidos (“padrão-ouro”) não existe
neste momento. O padrão de referência que construímos para o escopo desta pesquisa atualmente é formado
pelas seguintes fontes:
A ontologia de termos de reações adversas ADReCS (Adverse Drug Reaction Classification System) [17].
O site www.drugs.com para relacionamento entre doenças e seus medicamentos.
O Connect Service MedlinePlus Web [18] para outras reações adversas.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
10
A RxNorm API RESTful [19] para sugestões de escritas de medicamentos.
Utilizando essas fontes, será criada uma base com as doenças estudadas, os medicamentos utilizados em seus tratamentos e reações adversas comuns aos medicamentos monitorados. Caso o processamento venha a encontrar alguma nova relação causal do medicamento utilizado e um novo EA detectado e caso este não esteja nessa base, será um sinal de uma possível nova reação adversa ao medicamento em estudo. Neste caso, será avaliada criteriosamente pela equipe clínica do Instituto Nacional de Infectologia Evandro Chagas no intuito de ratificar a nova reação adversa, será comunicado a ANVISA e solicitaremos colocar reação na bula do medicamento.
RESULTADOS
Dentre os resultados que obtivemos até o momento se encontram a construção do pipeline do Twitter que era a fonte de dados com acesso mais fácil e rápido. Mediante o uso do pipeline do Twitter encontramos que malária e dengue são as doenças negligenciadas com maior número de tweets. O pico de tweets de dengue ocorre próximo aos meses de pico da doença (Figura 2). Apesar da dengue não possuir nenhum medicamento atualmente, seus dados poderão ser úteis posteriormente para um estudo específico, de maneira similar ao que é feito no Dengue Trends[11] do Google.
Figura 2: Número de tweets com dengue por ano
As tabelas 3 e 4 mostram o resultado da análise de desproporcionalidade (usando a medida PRR) do medicamento “Cloroquina” para a doença “malária” com o efeito adverso “coceira”. Quanto maior que 1 for o valor da medida de associação, maior será a correlação entre o medicamento e o efeito adverso em questão.
Tabela 3: Exemplo malária-cloroquina-coceira
Reação adversa
Medicamento coceira = Sim coceira = Não Total
Cloroquina= Sim a=13 b=2250 n=2263
Cloroquina= Não c=251 d=1632315 1632566
Total m=264 1634565 t=1634829
Tabela 4: Medidas de associação malária-cloroquina-coceira
Medida de associação Fórmula Valor
RR – Reporting Ratio (a.(t- 35.57355
PRR – Proportional Reporting Ratio (a.(t- 37.36421
ROR – Reporting Odds Ratio (a.d)/(c.b) 37.57431
DISCUSSÃO E PERSPECTIVAS
O pipeline do Twitter já se encontra funcional, sendo necessárias somente pequenas melhorias como a inclusão de outros métodos de análise de desproporcionalidade. A maior parte deste pipeline poderá ser utilizada para a análise de outros tipos de dados, uma vez que a principal diferenciação dos pipelines está na aquisição dos dados.
200000
150000
100000
50000
0
"2006"
"2007"
"2008"
"2009"
"2010"
"2011"
"2012" jan
fev
mar
abr
mai
jun
jul
ago
set
ou
t
no
v
dez
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
10
Neste trabalho foram utilizadas diversas fontes de dados para a construção de um padrão de referência para doenças estudadas, os medicamentos utilizados em seus tratamentos e reações adversas comuns a esses medicamentos. O padrão de referência será atualizado anualmente, conforme as bases que o compõem forem atualizadas e novos nomes de doenças e medicamentos forem agregados ao sistema. O padrão de referência atualmente é somente para a língua inglesa, dadas as fontes utilizadas, mas pretendemos realizar também a construção de uma versão para a língua portuguesa. Como não existem muitas bases médicas em português, a construção provavelmente terá que ser feita a partir da tradução do inglês.
Os valores obtidos na análise de desproporcionalidade da doença malária e alguns de seus medicamentos foram bem maiores que 1, indicando o Twitter como fonte idônea para corroborar EA já existentes.
Não há consenso sobre qual é a melhor abordagem para a análise de desproporcionalidade, freqüentista ou bayesiana[20]. Atualmente estamos realizando somente análises baseadas em abordagens freqüentistas como o RR, PRR, ROR e IC, mas pretendemos realizar análises bayesianas como o BCPNN (Bayesian Confidence Propagation Neural Network)[21] e o MGPS (Multi-item Gamma-Poisson Shrinker) que são utilizadas pela FDA e OMS respectivamente[16].
A próxima etapa deste projeto objetivará desenvolver os pipelines de processamentos dos dados fornecidos pelo Laboratório de Pesquisa Clínica em doença de Chagas do Instituto Nacional de Infectologia Evandro Chagas (LaPClin-Chagas/INI/FIOCRUZ).
CONCLUSÃO
Neste artigo foi apresentado o AdverseMiner, que é um sistema automatizado de mineração de EA que
será capaz de processar dados oriundos de múltiplas fontes heterogêneas. Como primeiro resultado, um protótipo do pipeline de processamento de dados do Twitter foi implementado e seus resultados já demostram indícios promissores que é possível identificar EA já existentes. Com a adição de novos pipelines ao sistema e com a coleta de dados por tempo maiores poderá ser possível descobrir possíveis novos EA, o que seria de grande ajuda a farmacovigilância.
REFERÊNCIAS
1. Mendes, M., et al., História da farmacovigilância no Brasil. Rev Bras Farm, 2008. 89: p. 246-251.
2. ANVISA. [cited 2014 October]; Available from:
http://portal.anvisa.gov.br/wps/content/Anvisa+Portal/Anvisa/Pos+-+Comercializacao+-+Pos+-
+Uso/Farmacovigilancia.
3. Venulet, J. and M. Ten Ham, Methods for monitoring and documenting adverse drug reactions.
International journal of clinical pharmacology and therapeutics, 1996. 34(3): p. 112.
4. Harpaz, R., et al., Combing signals from spontaneous reports and electronic health records for detection of adverse
drug reactions. Journal of the American Medical Informatics Association, 2013. 20(3): p. 413-419.
5. El Emam, K., et al., A secure distributed logistic regression protocol for the detection of rare adverse drug events.
Journal of the American Medical Informatics Association, 2013. 20(3): p. 453-461.
6. Balbino, E.E. and M.F. Dias, Farmacovigilância: um passo em direção ao uso racional de plantas medicinais e
fitoterápicos. Rev bras farmacogn, 2010. 20(6): p. 992-1000.
7. Signorini, A., A.M. Segre, and P.M. Polgreen, The use of Twitter to track levels of disease activity and public
concern in the US during the influenza A H1N1 pandemic. PloS one, 2011. 6(5): p. e19467.
8. Lampos, V. and N. Cristianini, Nowcasting events from the social web with statistical learning. ACM
Transactions on Intelligent Systems and Technology (TIST), 2012. 3(4): p. 72.
9. Ginsberg, J., et al., Detecting influenza epidemics using search engine query data. Nature, 2009. 457(7232): p. 1012-
1014.
10. Flutrends. [cited 2014 October]; Available from: http://www.google.org/flutrends/br/#BR.
11. Denguetrends. [cited 2014 October]; Available from: http://www.google.org/denguetrends/br/#BR.
12. Bodenreider, O., The unified medical language system (UMLS): integrating biomedical terminology. Nucleic acids
research, 2004. 32(suppl 1): p. D267-D270.
13. 2000 UMLS Documentation UMLS Knowledge Sources. 2000.
14. cTakes. [cited 2014 October]; Available from: http://ctakes.apache.org/.
15. White, R.W., et al., Web-scale pharmacovigilance: listening to signals from the crowd. Journal of the American
Medical Informatics Association, 2013. 20(3): p. 404-408.
16. Harpaz, R., et al., Novel data-mining methodologies for adverse drug event discovery and analysis. Clinical
Pharmacology & Therapeutics, 2012. 91(6): p. 1010-1021.
17. Cai MC, X.Q., Pan YJ, Pan W, Ji N, Li YB, Jin HJ, Liu K, Ji ZL., ADReCS: an ontology database for aiding standardization and hierarchical classification of adverse drug reaction terms. Nucleic Acids Research, 2014.
18. MedlinePlus. [cited 2014 June]; Available from: http://www.nlm.nih.gov/medlineplus/connect.
11
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
12
19. RXNorm API. Available from: http://mor.nlm.nih.gov/download/rxnav/RxNormAPIREST.html.
20. Klarreich, E., In search of Bayesian inference. Communications of the ACM, 2014. 58(1): p. 21-24.
21. Bate, A., et al., A Bayesian neural network method for adverse drug reaction signal generation. European journal
of clinical pharmacology, 1998. 54(4): p. 315-321.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
12
XXARTIGO ORIGINALXX
SERVIÇO DE ESTIMAÇÃO DE INCIDÊNCIA DE MALÁRIA: INTEGRAÇÃO DE DADOS EPIDEMIOLÓGICOS
COM MEDIÇÕES POR SATÉLITE DE OBSERVAÇÃO TERRESTRE
1Pedro Pereira Rodrigues, 2Nuno Almeida, 1Alberto Freitas, 1Raphael Oliveira, 1Emanuel Catumbela, 1Ricardo Cruz- Correia
1CINTESIS 2Critical
RESUMO
A malária é uma doença endémica na maioria dos trópicos. A existência de informação sobre o número e mortalidade dos casos de malária e a sua distribuição territorial é fundamental para o desenho e implementação de programas de monitorização e controlo da doença. Um sistema para a vigilância da malária consiste, portanto, em ferramentas, procedimentos, recursos humanos e uma estrutura que permita a geração de informação sobre casos e mortalidade por malária, podendo ser utilizada para o planeamento, monitorização e avaliação dos programas de controlo da malária. O objectivo deste trabalho é descrever o desenvolvimento de um sistema de vigilância de Malária, nomeadamente para a monitorização, detecção e previsão de incidência, com recurso ao cruzamento de dados multimodais clínicos e de observação terrestre. Este sistema foi desenhado de forma a produzir web-services (Java) para a estimação de incidência de malária. Para a estimação de incidência, foram desenvolvidos modelos lineares e de redes Bayesianas, usando o software R, de forma a ser incrementalmente atualizado com novos dados de saúde e de observação terrestre. Os serviços criados já se encontram disponíveis e uma primeira versão do modelo também. Os resultados apresentados para o modelo de incidência apresentam diversas limitações, principalmente geradas pela qualidade e quantidade de dados disponíveis, mas uma vez que foi desenhado de forma a permitir a sua adaptação à medida que novos dados são recolhidos e alimentados no modelo, consideramos que a sua utilização no futuro será vantajosa para a vigilância da Malária.
INTRODUÇÃO
Malária
A malária ou paludismo é a doença parasitária mais importante e potencialmente fatal. É provocada pelos protozoários do género Plasmodium, transmitida pela picada do mosquito Anopheles fêmea infectado. A infecção por Plasmodium falciparum, a mais comum, pode ter um mau prognóstico e uma alta taxa de mortalidade se não for tratada, mas tem um excelente prognóstico se diagnosticada precocemente e tratada de forma adequada (White 2014). A malária foi eliminada dos EUA, Canadá, Europa e Rússia. No entanto, a sua prevalência ressurgiu em países tropicais entre a década de 70 e 90 devido a um menor esforço do controlo, aumento da resistência aos fármacos e aumento da resistência aos insecticidas por parte dos mosquitos. A malária é uma doença endémica na maioria dos trópicos. Em todo o mundo 3,4 mil milhões de pessoas estão anualmente expostas à malária, sendo que os 1,2 mil milhões que estão com risco elevado de contrair a doença (mais de 1 caso por 1000 habitantes) vivem maioritariamente em África (47%) e no sudeste asiático (37%) (Breman 2014). Segundo a Organização Mundial de Saúde (OMS), mais de 207 milhões de pessoas desenvolveram malária sintomática em 2012 (WHO 2013). Entre 2000 e 2010, o número anual de casos de malária relatados em 34 países onde se pretende eliminar a malária diminuiu 85%, de 1,5 milhões para 232 mil casos (WHO 2011; Noor 2014). Os principais determinantes da epidemiologia da malária são a densidade do vector, a apetência para picar o ser humano, e a longevidade do vector. A transmissão da malária é diretamente proporcional à densidade do vector (WHO 2008). A longevidade do mosquito é particularmente importante; para que exista transmissão de malária o mosquito terá que sobreviver mais do que 10 dias. No entanto, apenas 25 de mais de 400 espécies do género Anopheles são bons vectores (White 2014). Estratégias para interromper a transmissão da malária incluem o desenvolvimento de medicamentos anti-maláricos eficazes, a proteção pessoal contra mosquito, o controlo do mosquito vector e a investigação científica, que inclui o desenvolvimento de vacinas (WHO 2008).
Malária em Angola
A malária é um dos principais problemas de saúde pública na África subsaariana. Também em Angola a malária é um problema dominante da saúde pública, sendo a primeira causa de morte no país e uma doença responsável por grande parte do absentismo laboral e escolar. Neste país, a malária é responsável por 35% dos cuidados curativos, 20% dos internamentos hospitalares, 40% das mortes perinatais e 25% da mortalidade materna, estimando-se em cerca de 3,7 milhões de casos de morbilidade em 2010 (IIMA 2011). A malária é endémica nas 18 províncias do País, com a transmissão mais elevada a ser verificar nas províncias do norte (Cabinda, Uíge, Malange, Kuanza Norte, Lunda Norte e Lunda Sul), enquanto no sul ocorrem surtos epidémicos
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
14
(Namibe, Cunene, Huíla e Kuando Kubango). A transmissão aumenta durante a época de chuvas, com um pico entre os meses de Janeiro e Maio (IIMA 2011).
Vigilância Sindrómica
A existência de informação sobre o número e mortalidade dos casos de malária e a sua distribuição territorial é fundamental para o desenho e implementação de programas de monitorização e controlo da doença. Com esta informação é mais fácil perceber quais as regiões mais afectadas pela doença e poder fazer uma melhor e mais eficaz alocação de recursos. Dados sobre incidência e mortalidade da doença permitem identificar epidemias e perceber sobre o sucesso de determinados programas de vigilância, e sobre a eventual necessidade de terem que ser feitos ajustes aos mesmos. A vigilância da malária, em termos clínicos, epidemiológicos, entomológicos e parasitológicos, é necessária para a percepção e acompanhamento dos programas de controlo e erradicação da doença (Breman 2007). Neste contexto, as tecnologias de informação e comunicação actuais, como por exemplo os telemóveis e outros sistemas ou dispositivos electrónicos, serão necessários para uma melhor, mais rápida e precisa partilha de informação (Githinji 2014; Quan 2014). A capacidade dos sistemas de vigilância da malária para fornecer informações sobre a distribuição de e tendências da malária varia muito por todo o mundo. Um sistema para a vigilância da malária consiste em ferramentas, procedimentos, recursos humanos e uma estrutura que permita a geração de informação sobre casos e mortalidade por malária, podendo ser utilizada para o planeamento, monitorização e avaliação dos programas de controlo da malária. Um sistema de vigilância da malária deverá permitir a) a identificação de áreas ou grupos populacionais mais afectados pela malária; b) a identificação de tendências, número de casos e mortalidade, que requeiram intervenções adicionais; e c) a avaliação do impacto das medidas de controlo. A vigilância sindrómica pretende, através de monitorização e recolha continuada de informação (por exemplo a recolha semanal de dados de novos casos, incluindo informação sobre o local, sexo, idade, data, sintomas), fazer uma detecção precoce de um possível surto (Yukich 2014). Esta detecção atempada de um surto de doenças infecciosas pode permitir que a medidas imediatas de controlo limitem o seu impacto e ajudem na prevenção de surtos futuros. Doenças como a malária poderão beneficiar da utilização de GIS (Shirayama 2009) e tecnologias relacionadas, como a detecção remota (Mitchell 2011). Estas tecnologias são cada vez mais utilizadas para a análise da distribuição geográfica de doenças e possíveis surtos, bem como dos seus factores patogénicos (agentes causadores, pacientes, vectores e hospedeiros) e seus ambientes geográficos (Ruankaew 2005). As imagens obtidas por detecção remota associadas a variadas técnicas de processamento (Dambach 2012) apresentam um grande potencial para a saúde pública e para um melhor conhecimento da dinâmica das doenças, apesar da existência de várias possíveis limitações, por exemplo o custo e a qualidade das imagens (alta resolução, localizações específicas, imagens livres de nuvens) e a actualidade das imagens (datas específicas, séries de imagens para análise quase em tempo real) (Herbreteau 2007). A utilização destes dados tem como principal vantagem possibilitar a observação sinóptica de zonas onde a cobertura por estações de monitorização é escassa. A necessidade de sistemas de detecção, identificação e monitorização de doenças infecto-contagiosas é, há vários anos, uma realidade reconhecida tanto por clínicos como por investigadores. O recurso a fontes de informação heterogénea tem, no entanto, limitado a aplicabilidade de tais sistemas, já que um surto é dificilmente detectado com informação de apenas um centro. Além disso, a severidade de um surto pode ser muito variável e de difícil avaliação. A classificação do surto, distinguindo fenómenos isolados de infecção de surtos reais, tem sido baseada em técnicas de análise estatística que procedem à previsão da curva epidémica mas também aqui nos deparamos com uma complexidade elevada de análise. Assim, diversas estratégias tem sido recentemente tentadas, que tentam associar informação clínica com informação geográfica, de forma a agilizar o processo de detecção de surtos mas a complexidade do problema está longe de estar resolvida.
Variável Resultado
Devido à dificuldade de registo nos países onde a malária é um problema mais grave, são usadas medidas aproximadas para estimar a incidência da doença. O slide positivity rate (SPR) é uma dessas medidas que é usada como proxy para a incidência de malária:
• SPR = # casos positivos confirmados em laboratório / 100 testes casos suspeitos
Em comparação com definições clínicas de malária, o SPR apresenta vantagens considerando apenas casos laboratorialmente confirmados de malária, e pode fornecer um meio rápido e barato de avaliar o peso da malária numa população que utiliza serviços de saúde.
OBJETIVO
Este artigo tem como objetivo descrever o desenvolvimento de um sistema de vigilância de Malária, nomeadamente para a monitorização, detecção e previsão de incidência), com recurso ao cruzamento de dados clínicos e de observação terrestre.
Um sistema para a vigilância da malária consiste em ferramentas, procedimentos, recursos humanos, e uma estrutura que permita a geração de informação sobre casos e mortalidade por malária, podendo ser utilizada para o planeamento, monitorização e avaliação dos programas de controlo da malária.
Um sistema de vigilância da malária deverá permitir 1. a identificação de áreas ou grupos populacionais mais afectados pela malária; 2. a identificação de tendências, número de casos e mortalidade; e 3. a avaliação do impacto das medidas de controlo.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
15
MÉTODOS
Casos de uso
Pretende-se que a recolha de dados de saúde seja efectuada via APP mobile do utente ou aplicação WEB. Deverá haver uma visualização simples, de forma centralizada e confortável, sendo os dados clínicos recolhidos e guardados em formato normalizado (OpenEHR). A visualização cronologica (em formato timeline) permite ao prestador de cuidados de saúde uma rápida visibilidade das intervenções realizadas e dados recolhidos.
A recolha de dados de satélite em tempo real, permite aos gestores de saúde pública a visualização de diferentes camadas de dados de observação da terra (OT). O sincronismo dos dados de OT com cruzamento de dados de saúde, permite ao sistema de predição e análise de risco, quantificar risco de novas ocorrência de surtos. A possibilidade de aplicação de filtros de dados de saúde recolhidos e guardados em OpenEHR (arquetipos), permite a escalabilidade e interoperabilidade de todo o sistema. A possibilidade de drill-down permite ao gestor de saúde pública intervir nos locais mais críticos.
Haverá também um portal (Healthviewer) que permite a visualização de indicadores por categorias, de forma rápida e centralizada. O Portal permite a geração de alertas automáticos, mas também alertas manuais que comunicam com a APP Mobile do utente, permitindo uma comunicação rápida e preventiva.
O Backoffice permite gerir todas as permissões de utilização do Healthviewer, definir zonas de trabalho para recolha de dados junto da comunidade, bem como acompanhar o trabalho em curso junto das comunidades.
Variáveis
A principal variável resultado do estudo será a incidência da doença (aproximada pelo SPR) no período em análise, para cada região administrativa (província, município, comunidade). A unidade de observação, quer espacial quer temporal, que for possível obter para esta variável, irá definir a unidade de análise para as restantes variáveis, definindo assim as instâncias a analisar.
• densidade populacional, por município; • redes de transporte, divididas em ruas primárias e secundárias; • corpos de água, perenes ou não perenes; • altitude, com resoluções de 900 m ou 30 m; • precipitação média mensal, com resolução de 29 km; • temperatura média mensal, com resolução de 5 km; • índice de vegetação (NDVI) médio mensal, com resolução de 5 km; • superfície coberta (land cover), com resolução de 300 m (2009) ou 5 km (2011); • espessura óptica aerossol (AOT), com resolução de 10 km; • temperatura do ar a 2 m, com resolução de 75 km; • vapor de água, com resolução de 10 km; • ozono, com resolução de 25 km; • monóxido de carbono, com resolução de 25 km; • dióxido de azoto, com resolução de 25 km; • humidade no solo, com resolução de 100 km; • declive, com resolução de 900 m; • exposição de encosta, com resolução de 900 m;
Os dados de Earth Observation (descritos anteriormente) serão considerados na sua melhor resolução. A cada região de interesse (que será definida de forma geográfica, administrativa, ou de acordo com a pior resolução obtida para os dados clínicos) será associado um nível de expressão para cada medição (e.g. temperatura no solo) obtido por estratégias de agregação (a definir posteriormente, e.g. mediano, votação maioritária, etc.). Este valor será a expressão para esta dimensão de EO para a região em estudo, que será usada no modelo global de estimação da incidência. Cada variável será, assim, representada por uma série temporal em que a unidade de observação poderá ser diversa. De forma a possibilitar a análise em conjunto, será definido uma unidade de análise comum (e.g. uma semana) em que:
• variáveis com maior granularidade (e.g. medições diárias) serão agregadas, • variáveis com menos granularidade (e.g. dados quinzenais) serão extrapolados.
A unidade de análise comum (a seguir descrita como t) deverá ser ditada, principalmente, pela unidade de observação da variável resultado, i.e. a incidência da doença.
Para a estimação da incidência num ponto t serão então considerados os valores das séries das variáveis independentes desde um passado recente que se revele significativamente associado com o outcome (e.g. t-2 ou t-3). Caso seja ainda possível, e se verifique significativamente relevante, serão utilizados os valores das mesmas séries para o ponto t, podendo ser usados serviços externos para obtenção de previsões de qualidade para as respectivas variáveis (e.g. serviços de meteorologia para previsão da temperatura e humidade).
Finalmente, os dados clínicos obtidos serão integrados com os anteriormente descritos no modelo global de estimação de incidência, de forma a obtermos uma previsão para cada região de interesse.
Para a modelação de surtos serão tidos em conta três grupos de análise distintos: • a expressão de dados de Earth Observation na região em estudo; • a evolução dos dados de Earth Observation na região em estudo;
• a expressão de dados clínicos e epidemiológicos disponíveis na região em estudo.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
16
Arquitectura do sistema
A arquitetura do sistema proposto assenta nos seguintes componentes (ver figura): • App mobile para smartphone para uso pelo utente na recolha de dados de saúde e feed-back
• Servidor Central de recolha de dados da App mobile • Servidor EO (Earth-Observation) que recolhe os dados dos satélites e re-envia para o servidor central
• Servidor que disponibiliza serviços (web-services) do modelo matemático e que é alimentado pelo servidor de dados
• Servidor com capacidade de instanciar o modelo matemético usando o software R
• Sistemas de dashboards e alertas que recebe as notificações dos web-services do modelo matemático
Figura 1 - Arquitectura do sistema
Modelo
De forma a estimar a incidência de Malária, a metodologia seguiu dois passos: • perceber a associação e capacidade preditiva dos dados clinicos no diagnóstico de Malária • utilizar os dados mais relevantes num modelo de estimação linear O primeiro passo foi implementado com recurso a redes Bayesianas (Darwiche 2010) enquanto o segundo,
por dificuldades de obtenção de dados que permitissem a definição de modelos mais completos, implementou um modelo linear simples.
RESULTADOS
Serviços
De forma a implementar as funções descritas anteriormente, e permitindo a resposta imediata dos modelos aos pedidos de previsão, foram implementados dois tipos de serviços: a atualização de dados clínicos e de Earth Observation, e pedidos de previsão para uma unidade geográfica numa determinada semana, de casos previstos e gravidade. A figura seguinte explica a forma como é associada a atualização dos modelos de saúde e de EO.
Figura 2 - Fluxo de informação da atualização
Serviço “atualiza_modelo”
A atualização do modelo de conhecimento com os dados clínicos, é feita através do envio de uma estrutura JSON, com uma estrutura acordada entre as partes, para um webservice. É então devolvido um identificador único a este pedido de atualização, para posteriormente ser possível a resposta que o modelo encontra-se atualizado. A estrutura do JSON deve conter o período a que correspondem os dados, o array de conjunto dos dados clínicos,
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
17
associados com identificadores de zona e estes com uma lista de casos, que indicam a doença e estado. Na recepção confirma-se a estrutura e aceita os dados se esta for cumprida, podendo assim continuar com o processo de atualização do modelo.
Argumentos de entrada:
• modelo: código ICD10-CM da doença modelada (Malaria = B50, HIV = B20) • startDate: Data em formato yyyy-mm--dd referente ao período de início dos dados clínicos. • endDate: Data em formato yyyy-mm--dd referente ao período de fim dos dados clínicos. • ehrs : Array constituido por identificadores de zona e lista de casos, contendo a doença e estado.
• n_total_casos_testados: número total de pessoas testadas Argumentos de saída: • Receção_Pedido: Sucesso na receção: “Pedido: ID+Timestamp” :
• Insucesso na receção: “Erro: HTTP Status: 500 ” Erro proveniente da estrutura do JSON.
Serviço “atualiza_modelo_eo”
Para a receção dos dados de EO, de forma a atualizar o modelo de conhecimento, é utilizado o protocolo FTP e o envio de um token através de um webservice a informar a ação realizada. Para o caso, foram definidas regras para o formato e envio destes dados, como a indicação do período a que correspondem, como também a sua localização e um ficheiro em formato ‘.csv’, com um nome pré-definido. De seguida envia um token com identificador único, de forma a poder responder que a atualização foi feita com sucesso e que o modelo encontra- se atualizado.
Argumentos de entrada:
• modelo: código ICD10-CM da doença modelada (Malaria = B50, HIV = B20). • date_start: Data em formato yyyy-mm--dd referente ao período de início dos dados EO. • date_end: Data em formato yyyy-mm--dd referente ao período de fim dos dados EO. • location_code: string a identificar a localização a que se referem os dados.
• file_name: Ficheiro referente aos dados EO, em formato produto_eo_ww_yyyy.csv. Argumentos de saída: • Receção_Pedido: Sucesso na receção: “Pedido: ID+Timestamp” :
• Insucesso na receção: “Erro: ” erros na inserção dos dados (formato, localização,datas).
Serviço “casos_previstos”
Conforme indicado nos serviços, a possibilidade de previsão de casos previstos, após a atualização do modelo requer um período de datas que se pretende conhecer assim como a localidade em questão, depois é devolvido ao requerente a previsão do número de casos previstos para os dados de entrada num formato de inteiro obtido através do Slide Positivity Rate (SPR) e a média de testes realizados por semana.
Este valor de casos previstos será posteriormente também utilizado no determinar da gravidade. Argumentos de entrada: • modelo: código ICD10-CM da doença modelada (Malaria = B50, HIV = B20). • date_start: Data em formato yyyy-mm--dd referente ao período de início da previsão. • date_end: Data em formato yyyy-mm--dd referente ao período de fim da previsão. • location_code: string a identificar a localização a que se referem os dados.
• n_habitantes: inteiro que descreve o número de habitantes da região. Argumentos de saída:
• n_casos: inteiro (número de casos que se prevê para os dados de entrada; SPR * média testes realizados por semana no local)
Serviço “gravidade”
A previsão da gravidade é elaborada através da seleção de um período de datas e de uma localização que se pretenda obter a informação, é devolvido um valor de risco que toma em consideração os dados selecionados e também os casos previstos para as datas e localização escolhidas. Foram definidos cinco níveis de risco (1 - Baixo / 2 - Médio / 3 - Alto / 98 - Não aplicável / 99 - Desconhecido) a devolver pelo serviço aquando o pedido de previsão for realizado.
Argumentos de entrada: • modelo: código ICD10-CM da doença modelada (Malaria = B50, HIV = B20).
• n_casos: inteiro (número de casos que se prevê para os dados de entrada; SPR * média testes realizados por semana no local).
• date_start: Data em formato yyyy-mm--dd referente ao período de início da previsão. • date_end: Data em formato yyyy-mm--dd referente ao período de fim da previsão.
• location_code: string a identificar a localização a que se referem os dados. Argumentos de saída:
• risco: inteiro (acordado com os seguintes níveis: 1 - Baixo / 2 - Médio / 3 - Alto / 98 - Não aplicável / 99 - Desconhecido)
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
18
RESULTADOS PRELIMINARES DO MODELO
Foram utilizados os seguintes dados clínicos e laboratoriais na criação do modelo: • 3000+ pessoas • 25+ variáveis • Valores de análises clínicas • Dados demográficos • Dados socio-familiares • 45+ bairros de habitações
• ~12 semanas
Figura 3 - Gráficos de distribuição do número de casos por semanas; distribuição global de casos e distribuição global (SPR)
Três modelos de redes Bayesianas foram testados: naiveBayes (factores condicionalmente independentes dada a classe), Tree-Augmented naïve Bayes (uma dependência adicional possível em cada factor) e Hill-Climbing (sem restrições). Os seguintes gráficos (Figura 3) apresentam a capacidade discriminativa dos modelos na identificação do diagnóstico laboratorial., revelando uma capacidade preditiva superior a 80%, o que é um bom indicador para a sua utilização na estimação da incidência da doença.
No entanto, uma das principais dificuldades na criação do modelo prede-se com o facto da distribuição dos casos pelo tempo não ser muito densa (ver topo da Figura 3, onde o eixo dos xx representa a semana e o eixo dos xx o bairro registado). Apesar de o número de casos ser relativamente elevado, como os registos foram efectuados em semanas diferentes, a incidência semanal é muito enviesada para o(s) bairro(s) registado nessa semana.
De qualquer forma, na Figura 4 apresenta-se a previsão SPR usando um modelo linear. Podemos ver que, genericamente, o modelo está a aproximar o SPR mas, mais uma vez, esta aproximação está diretamente dependente dos bairros escolhidos, e não tanto da evolução natural da incidência.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
19
Figura 4 - Previsão SPR usando um modelo linear
DISCUSSÃO
A estrutura de comunicação e de serviços descrita parecenos adequada para os propósitos do projeto, e pode ser ajustada para novas doenças, bem como para a recolha de mais dados de saúde.
O modelo matemático definido sofre de várias limitações relacionadas com a falta de dados que lhe deram origem. No entanto, o projeto parte do pressuposto que haverá um fluxo de dados que irão provocar adaptações ao modelo. Assim, este modelo deve ser visto apenas como um modelo inicial que poderá sofrer grandes alterações à medida que for alimentado com dados provenientes da APP móvel.
Desta forma, a incorporação da informação de EO no modelo ainda necessita de aperfeiçoamento, e vai implicar uma modelação mais complexa usando múltiplos modelos, e modelos incrementais.
Também ambicionamos fazer vários ajustes após a avaliação no terreno do sistema desenhado.
AGRADECIMENTOS
Este projeto é financiado pelo Compete, QREN e União Europeia.
REFERÊNCIAS
(Breman 2007) Breman JG, Holloway CN. Malaria surveillance counts. Am J Trop Med Hyg. 2007 Dec;77(6 Suppl):36- 47.
(Githinji 2014) Githinji S, Kigen S, Memusi D, Nyandigisi A, Wamari A, Muturi A, Jagoe G, Ziegler R, Snow RW, Zurovac
D. Using mobile phone text messaging for malaria surveillance in rural Kenya. Malar J. 2014 Mar 19;13(1):107. (Quan
2014) Quan V, Hulth A, Kok G, Blumberg L. Timelier notification and action with mobile phones-towards malaria
elimination in South Africa. Malar J. 2014 Apr 21;13:151.
(Yukich 2014) Yukich JO, Butts J, Miles M, Berhane Y, Nahusenay H, Malone JL, Dissanayake G, Reithinger R, Keating
J. A description of malaria sentinel surveillance: a case study in Oromia Regional State, Ethiopia. Malar J. 2014 Mar
11;13(1):88.
(Shirayama 2009) Shirayama Y, Phompida S, Shibuya K. Geographic information system (GIS) maps and malaria control
monitoring: intervention coverage and health outcome in distal villages of Khammouane province, Laos. Malar J. 2009 Sep
22;8:217.
(Mitchell 2011) Mitchell S, Cockcroft A, Andersson N. Population weighted raster maps can communicate findings of social
audits: examples from three continents. BMC Health Serv Res. 2011 Dec 21;11 Suppl 2:S14.
(Ruankaew 2005) Ruankaew N. GIS and epidemiology. J Med Assoc Thai. 2005 Nov;88(11):1735-8.
(Dambach 2012) Dambach P, Machault V, Lacaux JP, Vignolles C, Sié A, Sauerborn R. Utilization of combined remote
sensing techniques to detect environmental variables influencing malaria vector densities in rural West Africa. Int J Health
Geogr. 2012 Mar 23;11:8.
(Herbreteau 2007) Herbreteau V, Salem G, Souris M, Hugot JP, Gonzalez JP. Thirty years of use and improvement of remote
sensing, applied to epidemiology: from early promises to lasting frustration. Health Place. 2007 Jun;13(2):400-3.
(Darwiche 2010) Darwiche A. Bayesian networks. Communications of the ACM 53(12):80-90.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
21
XXRESUMO ORIGINALXX
DESENVOLVIMENTO DE UM SISTEMA COMPUTACIONAL DE AUXÍLIO À CLASSIFICAÇÃO EM GRUPOS DE DIAGNÓSTICOS HOMOGÊNEOS E CÁLCULO DE MEDIDAS E INDICADORES PARA
CARACTERIZAÇÃO DE HOSPITAIS DA REGIÃO DE RIBEIRÃO PRETO, SÃO PAULO, BRASIL.
Júlio Cesar Botelho de Souza¹; Domingos Alves²; Fernando José Oliveira Lopes¹; José Alberto Silva Freitas¹
1 Departamento de Ciências da Informação e da Decisão em Saúde, Faculdade de Medicina da Universidade do Porto, Universidade do Porto. 2 Departamento de Medicina Social, Faculdade de Medicina de Ribeirão Preto, Universidade de São Paulo.
INTRODUÇÃO: A classificação de pacientes em Grupos de Diagnósticos Homogêneos (GDHs) nos permite obter
diferentes características acerca da assistência de hospitais e outras instituições de saúde, além de possibilitar
comparações da produção hospitalar entre diferentes instituições e análises estatísticas mais conclusivas sobre
as características clínicas dos pacientes. No Brasil, um dos bancos de dados mais completos e adequados para
esse tipo de classificação é o proveniente do Observatório Regional de Atenção Hospitalar (ORAH), que dispõe
de dados hospitalares da região de Ribeirão Preto (DRS-XIII). Estudos prévios avaliaram sistematicamente o banco
de dados do ORAH e os achados indicaram a aplicabilidade dos GDHs. OBJETIVOS: Desenvolver e validar um
sistema de auxílio à classificação em GDHs para internamentos brasileiros através da base de dados do ORAH.
Em adição, o sistema deverá calcular índices de complexidade baseados em casemix e indicadores de qualidade
hospitalar ajustados aos GDHs. Materiais e Métodos: Para escrever os algoritmos necessários à classificação em
GDHs, será utilizada a 31ª versão do manual de definições APR-DRG (All Patients Refined – Diagnosed Related
Groups). A validação do sistema será efetuada através da comparação com dados portugueses já classificados.
No contexto de adaptação dos dados, serão utilizados instrumentos denominados General Equivalence Mappings
(GEM) para a tradução de terminologias clínicas (ICD-9-CM, ICD-10-CM e ICD-10), visto que a terminologia padrão
presente nas especificações dos GDHs difere da terminologia utilizada nos dados do ORAH para codificar
diagnósticos clínicos. Adicionalmente, será conduzido um estudo da complexidade e da produção dos hospitais
brasileiros, inclusive em comparação com hospitais portugueses. RESULTADOS: O processo de construção do
sistema, a escrita dos algoritmos referentes aos GDHs e a tradução das terminologias clínicas está em andamento.
Relativamente a esta última tarefa, há o desafio de efetuar corretamente a tradução adequada. Devido a diferenças
estruturais entre as terminologias, cerca de 8% dos códigos não puderam ser traduzidos diretamente, o que exigirá
a elaboração de métodos de mapeamento alternativos. CONCLUSÃO: Com este projeto, pretende-se oferecer um
sistema de apoio ao planejamento e tomada de decisões em saúde que introduza o sistema de GDHs em hospitais
brasileiros, além de prover medidas de complexidade hospitalar e indicadores de qualidade.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
20
XXRESUMO ORIGINALXX
MINERAÇÃO DE TEXTOS CIENTÍFICOS VISANDO À IDENTIFICAÇÃO DE COMPONENTES BIOATIVOS COM POTENCIAL TERAPÊUTICO PARA O COMBATE ÀS DOENÇAS NEGLIGENCIADAS.
Milene Pereira Guimarães de Jezuz¹; Fabrício Alves Barbosa da Silva2; Ernesto Raúl Caffarena2; Oswaldo Gonçalves Cruz2
1 Instituto Oswaldo Cruz - Fundação Oswaldo Cruz. 2 Programa de Computação Científica (PROCC) - Fundação Oswaldo Cruz.
INTRODUÇÃO: As doenças negligenciadas, entre elas a dengue, doença de Chagas e malária, prevalecem em
países menos desenvolvidos e em ambientes afetados por condições de pobreza e carência de saneamento
básico. De acordo com a OMS, essas doenças afetam cerca de um sexto da população mundial, contribuindo
inclusive, para a manutenção das condições de desigualdade social, uma vez que representam uma força
antagônica ao desenvolvimento dos países afetados. Porém, pouco investimento tem sido feito em pesquisas
sobre essas doenças com o fim de obter fármacos menos agressivos e com ações mais eficazes. Uma alternativa
para contribuir com pesquisas neste sentindo é usufruir do grande volume de artigos científicos disponibilizados
em bibliotecas digitais. Eles podem ser processados mediante as técnicas de mineração de textos, em busca de
compostos bioativos com potencial para combater essas doenças ainda não completamente explorados.
OBJETIVOS: Prover uma abordagem computacional baseada em mineração de textos em artigos científicos para
viabilizar a busca de moléculas bioativas com potencial terapêutico em artigos científicos, de forma a estabelecer
as relações que possam auxiliar na redefinição de tratamentos contra as doenças negligenciadas. MATERIAIS E
MÉTODOS: Aplicação de metodologia composta pela identificação, construção e execução de atividades
dispostas em um workflow com auxílio das linguagens de programação R, Java e C para recuperação do total de
17648 artigos científicos sobre malária, dengue e Doenças de Chagas; análise e posterior armazenamento dos
termos extraídos dos resumos e validação com o uso de consultas aos bancos de dados UniProtKB, PDB e
DrugBank para posterior análise com a construção de grafos. RESULTADOS: Obtenção de 1883 termos dos
resumos com ligantes descritos no PDB, onde 30% destes termos foram revisados manualmente e tidos como não
válidos. Identificação de 795 entidades biológicas (proteínas) nos artigos onde 252 itens foram detectados no
DrugBank como alvos. Também foram diagnosticadas 120 proteínas relacionados aos vetores com ligantes sendo
potenciais alvos ao combate à dengue, malária e Chagas. CONCLUSÃO: A identificação de proteínas como alvos
sugere que novos tratamentos para o tratamento da dengue, malária e doença de Chagas podem ser
desenvolvidos, sendo que ainda não foi citada alguma proteína nos artigos obtidos no PubMed em 13/05/2015
relacionada a novos fármacos para o tratamento da dengue, malária e doença de Chagas.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
22
XXRESUMO ORIGINALXX
MINERADOR DE EVENTOS ADVERSOS UTILIZANDO O TWITTER COMO FONTE PARA FARMACOVIGILÂNCIA.
Felipe Vieira Duval¹; Ernesto Raúl Caffarena²; Oswaldo Gonçalves Cruz²; Fabrício Alves Barbosa da Silva²
¹ Instituto Oswaldo Cruz. ² Programa de Computação Científica.
INTRODUÇÃO: Durante o período de pós-comercialização, quando drogas são usadas por grandes populações
e por longos períodos de tempo, eventos adversos (EA) não identificados podem ocorrer e alterar a relação risco-
benefício dos mesmos o suficiente para exigir uma ação regulatória. A descoberta iminente de EA no período de
pós-comercialização é um dos objetivos principais do sistema de saúde. Alguns países possuem sistemas de
vigilância farmacológica para coletar relatórios voluntários de EA, mas estudos já demonstraram que com a
utilização de redes sociais como o Twitter é possível conseguir um número maior de documentos. OBJETIVOS:
O objetivo principal desse trabalho é construir um sistema totalmente automatizado que utilize o Twitter como fonte
de informação para encontrar EA novos e já conhecidos e fazer a análise estatística dos dados obtidos.
METODOLOGIA: Os tweets contendo palavras chaves serão coletados utilizando as API's do Twitter e
armazenados por semanas epidemiológicas. Os tweets em inglês passam pelo processador de linguagem natural
cTAKES que utiliza várias bases médicas. Após o processamento são utilizadas medidas de análise de
desproporcionalidade para classificar pares “Droga-evento adverso” identificados na etapa de processamento
anterior. Os resultados da análise de desproporcionalidade são então comparados com o padrão de referência
criado utilizando o ADReCS (Adverse Drug Reaction Classification System). RESULTADOS: Um dos principais
resultados do nosso trabalho foi a construção de uma ferramenta automática para a coleta e análise de EA no
Twitter, pois a aquisição de tweets antigos normalmente só é possível mediante pagamento a revendedores. A
nossa ferramenta coletou tweets relacionados a diversas doenças durante o ano de 2014. A análise de
desproporcionalidade foi focada em fármacos para a malária pois tratava-se da doença com mais tweets
disponíveis. Dentre os EA identificados nos tweets associados à doxiciclina destacam-se “pain” e “cough” que são
dois sintomas já conhecidos desse medicamento e estão entre os mais frequentes no ADReCS. CONCLUSÃO:
Os EA identificados no Twitter associados ao antibiótico doxiciclina comprovam que esta ferramenta pode ser
utilizada para encontrar EA já existentes. Análise de outros fármacos e doenças devem ser feitas para ratificação
desses resultados. Dentre os trabalhos futuros encontram-se: comparações com dados da FDA e da OMS, e o
processamento de tweets em português.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
23
XXRESUMO ORIGINALXX
DESENVOLVIMENTO DE FERRAMENTA COMPUTACIONAL PARA APOIO À MANUTENÇÃO DE BACKUPS DE IMAGENS MÉDICAS.
Carolina Rocha Mello1; Nathalia Pereira Zago1; Hugo Cesar Peloggia Rodrigues1; Rodolfo Dias Correia1; Saulo da Silva Cordeiro1; Paulo Mazzoncini de Azevedo Marques1
¹ Universidade de São Paulo.
INTRODUÇÃO: O conteúdo de imagens médicas gerado pelo Centro de Ciências das Imagens e Física Médica
(CCIFM-HCFMRP-USP) é administrado por meio de um sistema de armazenamento e distribuição de imagens
(PACS) instituído há aproximadamente 10 anos. Antes da implantação do PACS, grande parte do conteúdo digital
de imagens médicas era arquivada em mídias óticas. Paralelamente ao PACS, formatos como CD, DVD e o mais
recente Blu-ray continuaram sendo utilizados no CCIFM, até meados de 2013, como principal opção de backup.
Atualmente, o backup das imagens é feito com a replicação do conteúdo em servidores dedicados e tolerantes a
falhas, uma abordagem mais segura e que permite backups rapidamente disponíveis. Essa transição de meios de
armazenamento gerou, no entanto, lacunas no arquivo de imagens do PACS. Sabe-se que quase todo o conteúdo
armazenado em mídias óticas já foi migrado para o PACS. Determinar quais itens ainda precisam ser transferidos
é um desafio: são aproximadamente 20 mil discos gravados em diferentes momentos. Transferir todos os exames
de todos os discos é uma opção que demandaria muito tempo e que provavelmente resultaria na perda de arquivos
em decorrência dos danos causados pelo tempo e pelo manuseio das mídias. OBJETIVOS: Desenvolver uma
ferramenta que realize a comparação entre o conteúdo armazenado em servidores de backup e o conteúdo
presente nas mídias, indicando os exames em mídias óticas que ainda não foram replicados no backup.
MATERIAIS E MÉTODOS: A ferramenta foi desenvolvida na linguagem de programação Java. A biblioteca
Connector/J foi aplicada na conexão e em consultas aos bancos de dados MySQL que concentram informações
sobre os exames armazenados no PACS. Além disso, foi utilizada a ferramenta Dcm4Che para extrair o conteúdo
dos cabeçalhos DICOM das imagens armazenadas nas mídias. RESULTADOS: Os testes preliminares com a
ferramenta, que está em fase final de desenvolvimento, mostrou que o tempo necessário para recompor o conteúdo
do backup pode ser reduzido em até 20 vezes. Com o trabalho restrito ao grupo de exames não migrados, poupa-
se tempo nas tarefas de leitura de discos e também nas transferências em rede. CONCLUSÃO: A ferramenta
apresenta uma solução rápida e inteligente para a manutenção de ambientes heterogêneos de backup de imagens
médicas. Por utilizar alto nível de abstração no processamento dos dados, a ferramenta pode ser aplicada em
PACS com distintos modelos e configurações de backup.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
24
XXRESUMO ORIGINALXX
AVALIAÇÃO DA QUALIDADE DE DADOS HOSPITALARES NA REGIÃO DE RIBEIRÃO PRETO EM 2012.
André Luiz Teixeira Vinci1 e Domingos Alves1
1 Departamento de Medicina Social, Faculdade de Medicina de Ribeirão Preto, Universidade de São Paulo.
INTRODUÇÃO: O Observatório Regional de Atenção Hospitalar (ORAH) é tido como referência na coleta,
processamento e manutenção da qualidade de informações hospitalares devida a extensa base de dados de
internações em hospitais públicos e privados da região de Ribeirão Preto e pela adoção de um protocolo de
verificação e melhoria da qualidade de seus dados. OBJETIVOS: Estabelecer o panorama da qualidade dos dados
das altas hospitalares ocorridas em 2012 para os hospitais parceiros do ORAH. Analisar e identificar a variação de
qualidade durante as etapas de coleta e processamento dos dados. MATERIAIS E MÉTODOS: Análise da
qualidade de 108.012 Folhas de Alta armazenadas pelo ORAH, a partir de indicadores específicos de completude
e consistência. Avaliação da qualidade dos dados em cada etapa do protocolo interno de verificação adotado pelo
ORAH, a partir da criação de indicadores de qualidade específicos. Por fim, avaliação da concordância entre as
informações de uma amostra de Folhas de Alta e Prontuários Médicos do Paciente por meio da mensuração da
sensibilidade, especificidade e acurácia desses pares. RESULTADOS: A análise da qualidade das Folhas de Alta
constatou coeficientes médios de 99,6% de completude e 99,5% de consistência e um percentual de
preenchimento acima de 99,2% para cada um de seus campos. Por meio do indicador de qualidade elaborado a
partir das dimensões de completude e consistência e utilizado nas comparações entre etapas do processamento
dos dados pelo ORAH, averiguou-se a manutenção na qualidade das informações pela execução dos protocolos
adotados. Contudo, a análise da volatilidade identificou uma baixa ocorrência de mudanças dos valores contidos
nos campos entre as etapas de processamento. A exatidão dos dados presentes na Folha de Alta com os do
Prontuário do Paciente também pode ser comprovada na amostra por meio das altas sensibilidade (99,0%; IC95%
98,8% - 99,2%) e especificidade (97,9%; IC95% 97,5% - 98,2%) no preenchimento de cada campo e pela acurácia
dos valores preenchidos (96,3%; IC95% 96,0% - 96,6%). CONCLUSÃO: Em consequência dessas análises foi
possível comprovar a excelente da qualidade das informações disponibilizadas pelo ORAH que subsidiam
pesquisas sobre as hospitalizações da região, estabelecer uma metodologia para a quantificação e análise dessa
qualidade e descobrir possíveis questões a serem enfrentadas para o aperfeiçoamento constante da qualidade
das informações disponibilizadas na base de dados do ORAH.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
25
XXRESUMO ORIGINALXX
FATORES DETERMINANTES PARA A UTILIZAÇÃO DO SERVIÇO DE URGÊNCIA PEDIÁTRICA: UM CASO DE ESTUDO
João Viana1; Alberto Freitas3,4; Almeida Santos2,4
1 Mestrado em Informática Médica - Faculdade de Medicina da Universidade do Porto. 2 Serviço de Urgência Pediátrica do Hospital de São João. 3 CINTESIS - Centro de Investigação em Tecnologias e Sistemas de Informação em Saúde. 4 Faculdade de Medicina da Universidade do Porto.
INTRODUÇÃO: Pacientes com problemas não urgentes que procuram os Serviços de Urgência têm sido um
problema há várias décadas, causando problemas de sobrelotação, exposição desnecessária ao ambiente
hospitalar e custos desnecessários para o Sistema Nacional de Saúde (SNS). OBJETIVO: Este estudo tem como
objetivo analisar os episódios de urgência num Serviço de Urgência Pediátrica (SUP) e caracterizar os episódios
urgentes e não urgentes, i.e. mais apropriados para os cuidados de saúde primários. MÉTODOS: Trata-se de um
estudo retrospetivo, realizado no Hospital de São João durante o período de 1 ano (de 01/Jan/2014 a 31/Dez/2014).
As visitas ao SUP foram comparadas com dados demográficos e geográficos. Para além dessa comparação os
episódios foram separados em urgentes e semi urgentes (USU) e não urgentes (NU). Estes dois grupos foram
comparados. RESULTADOS: Existiram 82 412 episódios originados por 45 957 doentes distintos. Apenas 8 334
(10%) dos episódios tiveram origem por referenciação. 42 328 (51%) episódios referem-se a crianças com menos
de 6 anos. 72 526 (88%) foram efetuados por doentes do Porto e conselhos vizinhos da área associada ao Hospital.
24 474 (30%) episódios foram definidos como NU, desses apenas 1 841 (7,5%) vieram referenciados de alguma
entidade prestadora de cuidados de saúde. CONCLUSÃO: A evidência gerada pela análise de dados de episódio
de urgência, identificando subgrupos e tendências, fornece uma ferramenta inestimável não só para a gestão do
Serviço mas também para a definição de políticas de saúde pública.
Medicina (Ribeirão Preto) 2015; 48 (Supl. 3) http://www.fmrp.usp.br/revista
II Workshop Ibero-Americano de Sistemas Interoperáveis em Saúde
26
XXRESUMO ORIGINALXX
A UTILIZAÇÃO DE UM SISTEMA INFORMATIZADO PARA ACOMPANHAMENTO DO TRATAMENTO DE TUBERCULOSE EM UMA UNIDADE DE SAÚDE.
Nathalia Yukie Crepaldi1; Nathalia Halax Orfão1; Maria Eugenia Firmino Brunello1; Domingos Alves2; Tereza Cristina Scatena Villa1
1 Escola de Enfermagem de Ribeirão Preto da Universidade de São Paulo (EERP-USP). 2 Faculdade de Medicina de Ribeirão Preto da Universidade de São Paulo (FMRP-USP).
INTRODUÇÃO: O Sistema de Informação em Saúde(SIS) tem como propósito geral, facilitar a formulação e
avaliação das políticas, planos e programas de saúde, subsidiando o processo de tomada de decisões. O nível
local do serviço tem como compromisso, não apenas a alimentação, mas também a organização e gestão do SIS
para que seus propósitos se tornem possíveis. OBJETIVOS: Analisar a utilização de um sistema informatizado
para acompanhamento de pacientes com tuberculose (SISTB) em fase de teste piloto em uma unidade de saúde
de Ribeirão Preto-SP. MATERIAIS E MÉTODOS: Observação da rotina diária e do processo de trabalho na
unidade de saúde e coleta de dados secundários do banco de dados do SISTB. RESULTADOS: Foram realizadas
observações e coleta de dados de janeiro à dezembro de 2014. Dos 32 pacientes notificados pela unidade, 31
estavam cadastrados no SISTB, verificou-se que o não cadastrado foi notificado, mas não seguiu tratamento na
unidade. Observou-se que os profissionais que acessavam o SISTB compartilhavam a mesma senha quando este
já estava inicializado, o profissional não encerrava a sessão e entrava com a senha própria, utilizando o sistema
já em aberto. Após a disponibilização do acesso via internet no mês de maio, os profissionais utilizaram o SISTB
em horários fora do expediente de trabalho, totalizando 11 acessos deste tipo de maio à setembro de 2014,
mostrando o grau de comprometimento com o serviço e também podendo indicar a sobrecarga de trabalho. Os
meses de maio e agosto foram os que apresentaram mais dias e horas totais na utilização do SISTB mas no mês
de junho não houve nenhuma entrada. Pode-se supor que em agosto o acesso foi maior devido a Copa do Mundo
que aconteceu nos dois meses anteriores, onde os profissionais tiveram vários períodos de dispensa do serviço,
acumulando atividades para o mês seguinte. Constatou-se também que uma frequência baixa de acesso em dias
não significara que o sistema foi pouco utilizado, como é o caso de janeiro de 2014, em que o SISTB foi acessado
somente em um dia, mas as horas totais de utilização são maiores do que em meses com mais acessos em dias.
CONCLUSÃO: Houve aceitação pelos profissionais no uso do SISTB, de modo que os pacientes tratados na
unidade de saúde foram cadastrados mas circunstâncias importantes como o acesso com a própria senha e a
atualização constante do sistema ainda devem ser abordadas de maneira mais efetiva.