196
U NIVERSIDADE DE S ÃO PAULO Escola Politécnica Departamento de Engenharia Elétrica Programa de Pós-graduação em Engenharia Elétrica Ambiente para avaliação de algoritmos de processamento de imagens médicas Marcelo dos Santos Tese apresentada à Escola Politécnica da Universidade de São Paulo para obten- ção do grau de Doutor em Engenharia Elétrica Área de Concentração: Sistemas Eletrônicos São Paulo 2006

Biblioteca Digital de Teses e Dissertações da USP ......São Paulo. Departamento de Engenharia de Telecomunicações e Controle. 1.Base de imagens 2.Imagens médicas 3.Algoritmos

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

UNIVERSIDADE DE SÃO PAULOEscola Politécnica

Departamento de Engenharia ElétricaPrograma de Pós-graduação em Engenharia Elétrica

Ambiente para avaliação de algoritmos deprocessamento de imagens médicas

Marcelo dos Santos

Tese apresentada à Escola Politécnica daUniversidade de São Paulo para obten-ção do grau de Doutor em EngenhariaElétrica

Área de Concentração:Sistemas Eletrônicos

São Paulo2006

UNIVERSIDADE DE SÃO PAULOEscola Politécnica

Departamento de Engenharia ElétricaPrograma de Pós-graduação em Engenharia Elétrica

Ambiente para avaliação de algoritmos deprocessamento de imagens médicas

Marcelo dos Santos

Tese apresentada à Escola Politécnica daUniversidade de São Paulo para obten-ção do grau de Doutor em EngenhariaElétrica

São Paulo2006

UNIVERSIDADE DE SÃO PAULOEscola Politécnica

Departamento de Engenharia ElétricaPrograma de Pós-graduação em Engenharia Elétrica

Ambiente para avaliação de algoritmos deprocessamento de imagens médicas

Marcelo dos Santos

Tese apresentada à Escola Politécnica daUniversidade de São Paulo para obten-ção do grau de Doutor em EngenhariaElétrica

Área de Concentração:Sistemas Eletrônicos

Orientador:Prof. Dr. Sérgio Shiguemi Furuie

São Paulo2006

FICHA CATALOGRÁFICA – Edição Revisada

Este exemplar foi revisado e alterado em relação à versão original,

sob responsabilidade única do autor e com a anuência de seu

orientador.

São Paulo, 15 de janeiro de 2007.

Assinatura do autor

Assinatura do orientador

Santos, Marcelo dos

Ambiente para avaliação de algoritmos de processamento

de imagens médicas / M. dos Santos. – São Paulo, 2006.

168 p., il.

Tese (Doutorado) - Escola Politécnica da Universidade de

São Paulo. Departamento de Engenharia de Telecomunicações e

Controle.

1.Base de imagens 2.Imagens médicas 3.Algoritmos (Avalia-

ção) 4.Processamento de imagens I.Universidade de São Paulo.

Escola Politécnica. Departamento de Engenharia de Telecomu-

nicações e Controle II.t.

Dedico este trabalho à memória de minha mãe.

AGRADECIMENTOS

Primeiramente, a Deus pela saúde, pelas oportunidades, pelas experiências epelas conquistas.

Ao amigo, orientador e diretor, Prof. Dr. Sérgio S. Furuie, pela confiança, pa-ciência, apoio, incentivo e motivação constantes.

À dona Jandira, mãe de todas as horas, por seus valiosos conselhos e lições devida.

À minha esposa, Graziela, pelo companheirismo, carinho e incentivo, muitasvezes privada de minha companhia e devida atenção.

À minha família (pai, irmãos, sobrinhos, sogro, sogra e cunhados), pelo apoio ecompreensão de minha ausência.

Ao Bony pela companhia durante as madrugadas quando escrevi e revisei estetrabalho.

Ao Prof. Dr. Geraldo Garcia Duarte por sua amizade, incentivo e torcida porêxitos na pesquisa.

De modo especial, aos colegas da Unidade Pesquisa e Desenvolvimento do Ser-viço de Informática, bem como os colegas de todo o Serviço de Informática InCor(diretores, secretárias, funcionários, estagiários e estudantes), pela amizade, com-panheirismo e pronto atendimento às minhas solicitações.

Ao Dr. Luiz Eduardo Bacheschi, por sua valiosa ajuda durante a fase de mode-lagem da base de imagens médicas.

Ao Dr. Édson Amaro Jr. e grupo de residentes do InRad, pelo interesse nestetrabalho, oportunidade concedida para instalação de uma versão piloto no InRad(serviço de Ressonância Magnética) e suas sugestões de melhorias.

Ao Alexandre Garcez, pela cessão dos casos clínicos de Medicina Nuclear parainserção destes na base de imagens.

A todas as pessoas que, direta e/ou indiretamente, contribuíram para o desen-volvimento deste trabalho.

À Escola Politécnica da USP, incluindo seus professores, secretárias e demaisfuncionários, pela atenção e pronto-atendimento.

À Fundação Zerbini/InCor-HC, por propiciar um ambiente para realização destetrabalho de pesquisa e pela contratação.

Por último, não menos importante, à Fundação de Amparo à Pesquisa do Estadode São Paulo (FAPESP) por todo o suporte financeiro – processos 2002/00056-1 e2001/14040-7.

"...Combati o bom combate, terminei a corrida, guardei a fé..."2 TM. 4:7 (Bíblia)

RESUMO

SANTOS, M. Ambiente para avaliação de algoritmos de processamentode imagens médicas. 2006. 168p. Tese (Doutorado) – Escola Politécnica, Univer-sidade de São Paulo, São Paulo, 2006.

Constantemente, uma variedade de novos métodos de processamento de ima-gens é apresentada à comunidade. Porém, poucos têm provado sua utilidade narotina clínica. A análise e comparação de diferentes abordagens, por meio de umamesma metodologia, são essenciais para a qualificação do projeto de um algoritmo.Porém, é difícil comparar o desempenho e adequabilidade de diferentes algorit-mos de uma mesma maneira. A principal razão deve-se à dificuldade para avaliarexaustivamente um software, ou pelo menos, testá-lo num conjunto abrangente ediversificado de casos clínicos. Muitas áreas – como o desenvolvimento de softwaree treinamentos em Medicina – necessitam de um conjunto diverso e abrangente dedados sobre imagens e informações associadas. Tais conjuntos podem ser utilizadospara desenvolver, testar e avaliar novos softwares clínicos, utilizando dados públi-cos. Este trabalho propõe o desenvolvimento de um ambiente de base de imagensmédicas de diferentes modalidades para uso livre em diferentes propósitos. Esteambiente – implementado como uma arquitetura de base distribuída de imagens– armazena imagens médicas com informações de aquisição, laudos, algoritmos deprocessamento de imagens, gold standards e imagens pós-processadas. O ambien-te também possui um modelo de revisão de documentos que garante a qualidadedos conjuntos de dados. Como exemplo da facilidade e praticidade de uso, são apre-sentadas as avaliações de duas categorias de métodos de processamento de ima-gens médicas: segmentação e compressão. Em adição, a utilização do ambienteem outras atividades, como no projeto do arquivo didático digital do HC-FMUSP,demonstra a robustez da arquitetura proposta e sua aplicação em diferentes pro-pósitos.

Palavras-chave: Base de imagens, imagens médicas, algoritmos, processamentode imagens, avaliação de algoritmos.

ABSTRACT

SANTOS, M. Environment for Medical Image Processing AlgorithmsAssessment. 2006. 168p. Thesis (Doctoral) – Escola Politécnica, Universidade deSão Paulo, São Paulo, 2006.

Constantly, a variety of new image processing methods are presented to thecommunity. However, few of them have proved to be useful when used in clinicalroutine. The task of analyzing and comparing different algorithms, methods andapplications through a sound testing is an essential qualification of algorithm de-sign. However, it is usually very difficult to compare the performance and adequacyof different algorithms in the same way. The main reason is due to the difficultyto assess exhaustively the software, or at least using a comprehensive and diversenumber of clinical cases for comparison. Several areas such as software develop-ment, image processing and medical training need a diverse and comprehensivedataset of images and related information. Such datasets could be used to develop,test and evaluate new medical software, using public data. This work presents thedevelopment of a free, online, multipurpose and multimodality medical image da-tabase environment. The environment, implemented such as a distributed medicalimage database, stores medical images, reports, image processing softwares, goldstandards and post-processed images. Also, this environment implements a peerreview model which assures the quality of all datasets. As an example of feasibilityand easyness of use, it is shown the evaluation in two categories of medical imageprocessing methods: segmentation and compression. In addition, the use of the setof applications proposed in this work in other activities, such as the HC-FMUSPdigital teaching file, shows the robustness of the proposed architecture and its ap-plicability on different purposes.

Keywords: Image database, medical image, algorithm, image processing, algo-rithm evaluation.

LISTA DE FIGURAS

1.1 Lena ("Lady with a hat") (ROSENBERG, 2006). . . . . . . . . . . . . . . 5

2.1 Workflow genérico de um departamento de Radiologia (NEMA, 2001a). 112.2 Exemplo da arquitetura de um PACS. . . . . . . . . . . . . . . . . . . 122.3 Página de apresentação do Google Imagens. . . . . . . . . . . . . . . . 152.4 Página do site MIRC-RSNA. . . . . . . . . . . . . . . . . . . . . . . . . 17

3.1 Matriz de definição de verdadeiro e falso, positivo e negativo (DHAWAN,2003). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.2 Exemplo de um gráfico de curva ROC, com a curva “a” indicando omelhor cenário de classificação que a curva “b” e enquanto “c” mostrao cenário de classificação aleatória (DHAWAN, 2003). . . . . . . . . . . 34

4.1 Componentes de um use case – UML (http://www.uml.org). . . . . . . 404.2 Visão conceitual da base de IM. . . . . . . . . . . . . . . . . . . . . . . 424.3 Diagrama de caso de uso geral da aplicação. . . . . . . . . . . . . . . . 434.4 Visão geral do projeto. . . . . . . . . . . . . . . . . . . . . . . . . . . . 444.5 Gerenciamento das informações da base de IM. . . . . . . . . . . . . . 454.6 Caso de uso: arquivo didático em Radiologia. . . . . . . . . . . . . . . 474.7 Caso de uso estendido do arquivo didático. . . . . . . . . . . . . . . . . 484.8 Caso de uso: avaliação de métodos de processamento de IM. . . . . . 494.9 Modelo conceitual do CABP (SOHR; AHN; MIGGE, 2005). . . . . . . . . 524.10 Modelo padrão de CABP (MOTTA; FURUIE, 2003). . . . . . . . . . . . . 534.11 Extensão do modelo de CABP (MOTTA; FURUIE, 2003) para base de IM. 544.12 Diferentes de visões do mesmo usuário. . . . . . . . . . . . . . . . . . 554.13 Atividades de publicação. . . . . . . . . . . . . . . . . . . . . . . . . . . 554.14 Fluxo do processo de avaliação. . . . . . . . . . . . . . . . . . . . . . . 564.15 Diagrama de atividade para validação/certificação. . . . . . . . . . . . 574.16 Visão geral do modelo distribuído. . . . . . . . . . . . . . . . . . . . . 59

5.1 Composição de um objeto de informação da base de IM (caso clínico). 645.2 Fluxo de operação da base de IM. . . . . . . . . . . . . . . . . . . . . . 67

5.3 Arquitetura da base de IM. . . . . . . . . . . . . . . . . . . . . . . . . 685.4 Visão geral dos componentes da arquitetura das bases de IM e seus

relacionamentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 695.5 Arquitetura do modelo distribuído. . . . . . . . . . . . . . . . . . . . . 705.6 Visão geral da implementação da arquitetura da base de IM. . . . . . 715.7 Modelo geral da classe de serviço para inserção de materiais. . . . . . 735.8 Arquitetura do Data Grid. . . . . . . . . . . . . . . . . . . . . . . . . . 745.9 Diagrama de seqüência da construção de pesquisa. . . . . . . . . . . . 765.10 Diagrama de seqüência da recuperação de thumbnails e IM, basea-

das no SRB-Jargon. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 775.11 Arquitetura do serviço de armazenamento de IM. . . . . . . . . . . . 785.12 Modelo de dados da base de IM. . . . . . . . . . . . . . . . . . . . . . . 805.13 Modelo de dados para suporte a múltiplos documentos. . . . . . . . . 825.14 Barra de ferramentas do editor de templates. . . . . . . . . . . . . . . 825.15 Exemplo de edição de template. . . . . . . . . . . . . . . . . . . . . . . 835.16 Exemplo de uma template de documento MIRC-RSNA. . . . . . . . . 845.17 Trecho do arquivo de configuração da aplicação de inserção automá-

tica de casos clínicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 845.18 Fluxo de inserção automática de caso clínico a partir do PEP-InCor. . 855.19 Estrutura de documento MIRCquery, utilizado QueryMircDb. . . . 865.20 Modelo de documento MIRCsiteindex. . . . . . . . . . . . . . . . . . 865.21 Modelo de classe do serviço de acesso às bases de IM externas à in-

fra-estrutura. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 875.22 Exemplo de requisição de pesquisa enviada ao servidor. . . . . . . . . 885.23 Modelo de representação de IM de acordo com o CIAS. . . . . . . . . . 905.24 Interface gráfica do iView. . . . . . . . . . . . . . . . . . . . . . . . . . 915.25 Barra de ferramentas: ferramentas comuns. . . . . . . . . . . . . . . 915.26 Barra de ferramentas: estudos. . . . . . . . . . . . . . . . . . . . . . . 925.27 Ferramentas de visualização. . . . . . . . . . . . . . . . . . . . . . . . 925.28 Ferramentas de anotação. . . . . . . . . . . . . . . . . . . . . . . . . . 935.29 Exemplo do esqueleto da implementação de um plug-in ImageJ de

processamento de imagens. . . . . . . . . . . . . . . . . . . . . . . . . 935.30 Exemplo da implementação de um plug-in de processamento de IM. 94

6.1 Acesso (login). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 986.2 Registro de novo usuário. . . . . . . . . . . . . . . . . . . . . . . . . . . 996.3 Página principal da aplicação. . . . . . . . . . . . . . . . . . . . . . . . 1006.4 Lista de casos clínicos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1006.5 Dicionário ACR. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1006.6 Estudo clínico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1016.7 Lista de thumbnails do estudo – possibilidade de visualizar IM dinâmicas. . . . . 1016.8 Visualizador de IM (negatoscópio virtual). . . . . . . . . . . . . . . . . . . . . 1016.9 Ferramentas de visualização e anotação. . . . . . . . . . . . . . . . . . . . . . 1016.10 Tela de inserção de um caso clínico. . . . . . . . . . . . . . . . . . . . . 1026.11 Tela de inclusão de estudo clínico (exames baseados em IM). . . . . . 1036.12 IM com anotações. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1046.13 Fluxo de execução de pesquisas. . . . . . . . . . . . . . . . . . . . . . . . . . 1096.14 Etapas do processo de pesquisa e recuperação de IM. . . . . . . . . . 109

6.15 Estudo clínico recuperado da base de IM MyPACS.net. . . . . . . . . 1106.16 Gold standards utilizados na avaliação da segmentação do ventrículo

esquerdo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1136.17 Conjunto de imagens utilizado para avaliação dos métodos de com-

pressão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1186.18 Gráfico de comparação das taxas de compressão obtidas pelos méto-

dos JPEG-LS, LZW e JPEG-2000. . . . . . . . . . . . . . . . . . . . . . 1216.19 Gráfico de comparação dos tempos de compressão a partir dos méto-

dos JPEG-LS, LZW e JPEG-2000. . . . . . . . . . . . . . . . . . . . . . 121

LISTA DE TABELAS

2.1 Relação de algumas bases de imagens médicas (VANNIER; STAAB; CLARKE,2002). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.1 Comparação entre os conjuntos de dados utilizados em avaliações (EFMI-WG-MIP, 2002). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

6.1 Tempos médios gastos para inserção de casos clínicos. . . . . . . . . . 1066.2 Inventário de casos clínicos e IM contidas no site InCor. . . . . . . . . 1076.3 Inventário de casos clínicos: classificação em normais e patológicos. . 1086.4 Inventário de casos clínicos: relação modalidade e região anatômica. 1086.5 Tempos médios (em segundos) de pesquisa e recuperação. . . . . . . . 1116.6 Médias e desvios padrões das medidas de diferença entre os gold

standards e as respostas dos métodos de segmentação aplicados em237 IM de MRI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

6.7 Médias e desvios padrões dos valores UMAnormal. . . . . . . . . . . . . 1166.8 Características das imagens utilizadas na avaliação dos algoritmos

de compressão. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1196.9 Resumo da avaliação dos métodos de compressão. . . . . . . . . . . . 120

LISTA DE SIGLAS E ABREVIAÇÕES

3D – TridimensionalACR – American College of RadiologyAPI – Application Programming InterfaceBI-RADS – Breast Imaging Report and Data SystemBIRN – Biomedical Imaging Resource NetworkCABP – Controle de acesso baseado em papéisCIAS – Clinical Image Access ServiceCID – Código Internacional de DoençasCT – Computed TomographyDICOM – Digital Image and Communication in MedicineDTD – Document Template DefinitionEJB – Enterprise Java BeanGb – GigabyteGIF – Graphics Interchange FormatGUI – Graphical User InterfaceHC-FMUSP – Hospital das Clínicas da Faculdade de Medicina da

Universidade de São PauloHIS – Hospital Information SystemHL-7 – Health Level SevenHTTP – Hypertext Transmission ProtocolHTTPS – Hypertext Transmission Protocol SecureIGT – Image Guided TherapyIHE – Integrating the Healthcare EnterpriseIM – Imagem(ns) Médica(s)InCor – Instituto do CoraçãoJPEG – Joint Photograph Experts GroupJPEG-LS – JPEG losslessJSP – Java Server PagesLIDC – Lung Imaging Database ConsortiumMb – MegabyteMbps – Megabits por segundo

MIRC – Medical Imaging Resource CenterMN – Medicina NuclearMRI – Magnetic Resonce ImagingMVC – Model-view-controlNIH – National Institutes of HealthNLM – National Library of MedicinePACS – Picture Archiving and Communication SystemPEP – Prontuário Eletrônico do PacienteRAM – Random Access MemoryRIS – Radiology Information SystemROC – Receiver Operating CharacteristicRSNA – Radiology Society of North AmericaSNOMED – Systematized Nomenclature of MedicineSQL – Structured Query LanguageTIFF – Tagged Image File FormatUMLS – Unified Medical Language SystemUP&D – Unidade de Pesquisa e DesenvolvimentoVE – Ventrículo esquerdoWWW – World Wide WebXML – Extensible Markup Language

SUMÁRIO

1 Introdução 11.1 Contexto usual do desenvolvimento de algoritmos de processamento

de IM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.3 Motivação e justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . 51.4 Organização e apresentação do trabalho . . . . . . . . . . . . . . . . . 6

2 Sistemas de Informação para IM 92.1 Sistemas de arquivamento e comunicação de imagens . . . . . . . . . 102.2 Sistemas de recuperação baseada em conteúdo . . . . . . . . . . . . . 142.3 O estado da arte em bases de IM . . . . . . . . . . . . . . . . . . . . . 162.4 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3 Avaliação no âmbito de IM 233.1 Terminologia geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.2 Processamento e Análise de IM . . . . . . . . . . . . . . . . . . . . . . 253.3 Qualidade diagnóstica de IM . . . . . . . . . . . . . . . . . . . . . . . . 27

3.3.1 Desempenho do observador . . . . . . . . . . . . . . . . . . . . 283.4 Avaliação de algoritmos . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.4.1 Metodologia de Avaliação . . . . . . . . . . . . . . . . . . . . . 313.4.2 Instrumentos de avaliação . . . . . . . . . . . . . . . . . . . . . 323.4.3 Medidas de desempenho . . . . . . . . . . . . . . . . . . . . . . 33

3.5 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4 Base de Imagens Médicas: Modelagem 374.1 Requisitos da base de IM . . . . . . . . . . . . . . . . . . . . . . . . . . 384.2 Casos de uso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4.2.1 Modelagem dos casos de uso: O conceito . . . . . . . . . . . . . 394.2.2 O conceito da aplicação de base de IM . . . . . . . . . . . . . . 414.2.3 Caso de uso visão geral . . . . . . . . . . . . . . . . . . . . . . . 434.2.4 Caso de uso: arquivo didático em Radiologia . . . . . . . . . . 46

4.2.5 Caso de uso: avaliação de métodos de processamento de IM . 484.3 Modelo de dados para base de IM . . . . . . . . . . . . . . . . . . . . . 504.4 Controle de acessos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514.5 Serviço de revisão dos documentos . . . . . . . . . . . . . . . . . . . . 544.6 Modelo de base distribuída de IM . . . . . . . . . . . . . . . . . . . . . 574.7 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

5 Base de Imagens Médicas: Arquitetura e Implementação 615.1 Requisitos técnicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 625.2 Análise dos requisitos funcionais . . . . . . . . . . . . . . . . . . . . . 645.3 A arquitetura proposta . . . . . . . . . . . . . . . . . . . . . . . . . . . 675.4 Implementação: a infra-estrutura de base de IM . . . . . . . . . . . . 71

5.4.1 Catálogo de arquivos – Data Grid . . . . . . . . . . . . . . . . . 725.4.2 Interação com a camada de persistência . . . . . . . . . . . . . 755.4.3 Serviço de armazenamento de IM . . . . . . . . . . . . . . . . . 775.4.4 Serviços web para base de dados distribuída . . . . . . . . . . 78

5.5 Implementação: Componentes . . . . . . . . . . . . . . . . . . . . . . . 795.5.1 Base de documentos clínicos . . . . . . . . . . . . . . . . . . . . 795.5.2 Editor de templates . . . . . . . . . . . . . . . . . . . . . . . . . 815.5.3 Ferramentas para inserção automática de casos clínicos . . . 835.5.4 Conexão com outras bases de IM . . . . . . . . . . . . . . . . . 855.5.5 Serviço de pesquisa e recuperação . . . . . . . . . . . . . . . . 875.5.6 Visualizador de imagens médicas . . . . . . . . . . . . . . . . . 895.5.7 Repositório de plug-ins . . . . . . . . . . . . . . . . . . . . . . . 93

5.6 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

6 Uso da Base de IM 976.1 A base de IM em operação . . . . . . . . . . . . . . . . . . . . . . . . . 976.2 Inserção de casos clínicos . . . . . . . . . . . . . . . . . . . . . . . . . . 101

6.2.1 Inserção manual . . . . . . . . . . . . . . . . . . . . . . . . . . . 1026.2.2 Inserção automática . . . . . . . . . . . . . . . . . . . . . . . . 103

6.3 Arquivo didático digital: o uso no InRad . . . . . . . . . . . . . . . . . 1046.3.1 Características do projeto . . . . . . . . . . . . . . . . . . . . . 1056.3.2 Implantação do piloto . . . . . . . . . . . . . . . . . . . . . . . . 1056.3.3 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

6.4 Avaliação dos mecanismos de pesquisa e recuperação . . . . . . . . . 1076.4.1 Modelo de pesquisa e recuperação . . . . . . . . . . . . . . . . 1086.4.2 Tempos de pesquisa e recuperação . . . . . . . . . . . . . . . . 111

6.5 Avaliação de métodos de segmentação IM . . . . . . . . . . . . . . . . 1116.5.1 Segmentação do ventrículo esquerdo . . . . . . . . . . . . . . . 1126.5.2 Considerações sobre a avaliação . . . . . . . . . . . . . . . . . . 1136.5.3 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

6.6 Avaliação de métodos de compressão sem perdas . . . . . . . . . . . . 1166.6.1 Considerações sobre a avaliação . . . . . . . . . . . . . . . . . . 1176.6.2 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

6.7 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

7 Discussão 1237.1 Contribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

7.1.1 Modelo e arquitetura de base distribuída de IM . . . . . . . . 1247.1.2 Fomento à pesquisa e desenvolvimento de métodos de proces-

samento de IM . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1257.1.3 Arquivo didático digital . . . . . . . . . . . . . . . . . . . . . . 1267.1.4 Modelo de categorização de casos clínicos . . . . . . . . . . . . 1277.1.5 Extração de conhecimento . . . . . . . . . . . . . . . . . . . . . 1287.1.6 Base de dados com arbitragem . . . . . . . . . . . . . . . . . . 128

7.2 A memória a partir de IM . . . . . . . . . . . . . . . . . . . . . . . . . 1297.3 Centro de estudos em processamento de IM . . . . . . . . . . . . . . . 1317.4 Limitações da implementação . . . . . . . . . . . . . . . . . . . . . . . 131

8 Conclusão 1358.1 Projetos relacionados a este trabalho . . . . . . . . . . . . . . . . . . . 1368.2 Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1368.3 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

Referências Bibliográficas 139

Anexo A: Pareceres do projeto Base de IM para extração de conhe-cimentos em Medicina 151

Anexo B: Projeto WebLab de Base de Imagens Médicas 157

Anexo C: Projeto do Registro Digital Clínico Radiológico do HC-FMUSP - Sumário Executivo 159

Anexo D: Sistema Colaborativo para Distribuição de Imagens Dinâ-micas 161

Produção Acadêmica 163

Capítulo

1INTRODUÇÃO

“O olho... a janela da alma, é o principal meio pelo qual acompreensão pode apreciar mais completa e abundantemente as

obras infinitas da natureza.”LEONARDO DA VINCI

A visualização das estruturas do corpo de um paciente, em especial as estrutu-ras internas por meio de técnicas não invasivas, há muito tempo tem sido objetode estudos e pesquisas. As imagens médicas (IM) tiveram sua origem a partir de1895 quando o físico alemão, Wilhelm Konrad Röentgen, relatou a descoberta deum “novo tipo de raio” – posteriormente denominado raio-X – tido, na época, como aforma de energia mais penetrante (GLASSER, 1993). A descoberta de Röentgen teveimpactos significativos na prática da Medicina e marcou a introdução da Radio-logia Médica (CHO; JONES; SINGH, 1993). Entretanto, somente a partir da décadade 1970 é que as IM tiveram significativa evolução, com a introdução da tomogra-fia computadorizada por raio-X (X-ray Computed Tomography – CT), seguida dodesenvolvimento de outros métodos de aquisição de IM.

Segundo Sistrom (SISTROM, 2005), “nenhuma outra área de conhecimento emMedicina tem experimentado o aumento da quantidade de facilidades disponíveis,em termos de volume e variedade, como a Radiologia durante as últimas décadas”.Este crescimento deve-se, principalmente, às evoluções dos sistemas de detecção edas tecnologias de computação (LEHMANN; MEINZER; TOLXDORFF, 2004). Exempli-ficando, os equipamentos geradores de IM tomográficas, como o tomógrafo compu-tadorizado e a ressonância magnética (magnetic resonance imaging – MRI), depen-dem das características dos detectores e, fortemente, do poder de processamento

1

2 Introdução

computacional para produzir imagens de melhor qualidade para fins de diagnósti-co (GIGER, 2000).

Procedimentos clínicos que envolvem o uso de imagens são temas especialmenteabordados em trabalhos das áreas de Informática Médica e Engenharia Biomédica,uma vez que muitos diagnósticos têm sido baseados no extenso uso de imagens.Tal atenção teve origem com a digitalização das IM e evoluiu com o advento dosequipamentos digitais de diagnóstico (SIEGEL; KOLODNER, 1998).

Vários trabalhos de visão computacional e inteligência artificial com aplicaçõesclínicas têm demonstrado o potencial da computação como ferramenta de auxílioao diagnóstico (PETRAKIS; FALOUTSOS, 1997). O processamento de IM (GONZALEZ;

WOODS, 2000) – tradicionalmente, direcionado ao melhoramento da apresentaçãodas IM (contraste, suavização, aguçamento), separação de objetos (segmentação),alinhamento de sobreposições (registro de imagens) e medida de parâmetros anatô-micos e fisiológicos – tem sido a base de muitos trabalhos em aplicações de terapiaguiada por imagens (image-guided therapy – IGT) (WARFIELD, 2005).

O maior uso do processamento de IM na rotina clínica tem evidenciado a ne-cessidade de metodologias adequadas à realização de avaliações rigorosas dos al-goritmos propostos (BOWYER, 2000), conforme discutido em conferências e work-shops (GEE et al., 2000; EFMI-WG-MIP, 2002). Pois, freqüentemente, novos méto-dos de processamento1 de IM – alguns não realmente novos, mas reinventados ouadaptados – são apresentados à comunidade. Entretanto, poucos têm alcançadoalto grau de usabilidade e provado sua eficácia no domínio clínico. Uma das razõesé a dificuldade que existe para comparar, dentre outros parâmetros, o desempenhode diferentes métodos de modo singular, bem como realizar testes em diferentescenários e condições variadas (SANTOS; FURUIE, 2005).

1.1 Contexto usual do desenvolvimento de algoritmos

de processamento de IM

Desde a introdução dos primeiros algoritmos de processamento de imagens, noinício da década de 1960, esta linha de pesquisa cresce continuamente e se fazpresente em diferentes segmentos, com aplicações variadas. De modo especial, oprocessamento de imagens na Medicina tem desempenhado um importante papel,por meio do qual diferentes abordagens são utilizadas por radiologistas, clínicos efisiologistas com o objetivo de elucidar as informações contidas nas IM e tornar o

1Neste trabalho, a terminologia ‘método de processamento’ ou simplesmente ‘método’ é empre-gada para denotar um algoritmo de processamento de IM.

1.1. Contexto usual do desenvolvimento de algoritmos de processamento deIM 3

diagnóstico mais preciso (DUNCAN; AYACHE, 2000).

Vários grupos têm trabalhado na interdisciplinaridade de pesquisas da área deprocessamento de IM, em diferentes aspectos, modalidades e especialidades clíni-cas. O grupo da Unidade de Pesquisa e Desenvolvimento (UP&D) do Serviço deInformática (SInfo) do Instituto do Coração (InCor) do Hospital das Clínicas da Fa-culdade de Medicina da USP (HC-FMUSP) há anos vem trabalhando em atividadesde manipulação e tratamento de IM, desde a pesquisa mais básica em diferentesabordagens, incluindo compressão e armazenamento, até o desenvolvimento de so-fisticados algoritmos de reconstruções tomográficas e visualização multidimensio-nal, para diferentes modalidades de IM no domínio da Cardiologia.

Um dos principais obstáculos presentes no desenvolvimento de métodos de pro-cessamento de IM é a falta de conjuntos de dados abrangentes, diversificados, con-fiáveis, organizados e devidamente documentados para uso como referência nastarefas de testes (MüLLER et al., 2003). Usualmente, cada desenvolvedor (ou grupode pesquisa) adquire e organiza seu próprio conjunto de dados para testes. Em talprática, destacam-se os seguintes problemas:

• Usualmente, os métodos de processamento de IM desenvolvidos em trabalhosacadêmicos (iniciação científica, mestrado e/ou doutorado) são testados em IMadquiridas a partir de uma única fonte e/ou segundo um protocolo. Logo, taismétodos tendem ser “otimizados” para estes dados e o uso desses métodosem outras condições (como em IM provenientes de outras fontes) depende demodificações e adaptações;

• Dificuldade para elaborar comparações com outros métodos (incompatibilida-des dos dados utilizados nos testes);

• O tamanho do conjunto de dados utilizado nos testes pode não conter umaamostra significativa de casos clínicos e/ou patologias que o método se propõea auxiliar no diagnóstico;

• Ausência de informações sobre as condições de aquisição das IM utilizadasnas etapas de testes;

• Qualidade e/ou validade dos gold standards2 e conjuntos de dados utilizadospara avaliação;

• Falta de documentação dos procedimentos adotados nos testes;

2Neste trabalho, o termo gold standard refere-se à uma imagem tida como referência.

4 Introdução

• Dificuldades para reproduzir (implementar) métodos criados por terceiros,avaliá-los e compará-los com outras abordagens.

1.2 Objetivos

Uma etapa inicial, porém importante para minimizar os efeitos dos problemaselencados na seção anterior e prover meios para realizar avaliações mais abran-gentes, consiste no desenvolvimento de uma base de dados sobre IM capaz de ar-mazenar conjuntos de IM e informações associadas que possam ser utilizados emtarefas de avaliação. Esta etapa representa a preparação de um ambiente, onde osconjuntos de dados sobre IM e métodos de processamento de IM são armazenadose recuperados, bem como novas funcionalidades poderão ser incluídas a partir dainstalação de plug-ins3. Para tanto, os objetivos deste trabalho compreendem:

• Projeto e desenvolvimento de uma infra-estrutura robusta de base de dadossobre IM e informações associadas. Tal infra-estrutura deve possuir carac-terísticas de base de dados distribuída, ser escalável – tanto em termos devolume de dados, quanto de funcionalidades (serviços oferecidos);

• Possibilitar que diferentes grupos possam compartilhar dados/experimentosde processamento de IM;

• Prover acesso, por meio de navegadores de Internet, a dados para desenvolvi-mento de pesquisas em processamento de IM;

• Recuperar informações de bases públicas de IM, bem como permitir que essasbases recuperem informações a partir dos repositórios da infra-estrutura debase de IM proposta neste trabalho.

Complementando os objetivos relacionados acima, existe também a intenção deque este ambiente, inicialmente idealizado para avaliação de algoritmos de pro-cessamento de IM, possa ser utilizado em outros propósitos. Dessa forma, novostrabalhos que utilizam informações clínicas e métodos de processamento de IM po-derão ser implementados.

3Módulo de software que realiza uma tarefa específica, o qual pode ser adicionado a um outrosoftware e, então, ambos podem trabalhar em conjunto.

1.3. Motivação e justificativa 5

1.3 Motivação e justificativa

Há anos, durante o desenvolvimento de métodos de processamento de imagens,muitas das avaliações dos métodos propostos para diferentes fins, têm sido elabo-radas com base na fotografia da Lena (Figura 1.1) (MUNSON Jr, 1996; ROSENBERG,2006). Tanto que esta imagem tornou-se uma referência para a comunidade deprocessamento de imagens, principalmente em atividades didáticas.

Figura 1.1 Lena ("Lady with a hat") (ROSENBERG, 2006).

A seleção da Figura 1.1 como imagem de referência foi uma tarefa relativa-mente fácil, a qual consistiu em: selecionar uma imagem com diferentes caracterís-ticas para uso em testes variados. No entanto, para o caso de processamento de IMé muito difícil estabelecer uma referência como esta, pois a representação de umúnico domínio clínico pode implicar na seleção de milhares de IM para representá-lo. Nota-se, dessa forma, que cada domínio tem suas particularidades e estas im-pactam no desenvolvimento dos métodos de processamento de IM.

A principal motivação para o desenvolvimento deste trabalho deve-se ao fatode que a comunidade que pesquisa e desenvolve métodos de processamento de IMnecessita de conjuntos de dados organizados e de uso livre para realização de ava-liações dos métodos propostos.

Uma vez que não existe um modelo formal ou protocolo de avaliação, ocorreque o processo de avaliação é, muitas vezes, omitido. Por outro lado, quando aavaliação é realizada, em seu relato, pode existir ausência de detalhes acerca dosprocedimentos adotados.

Outro fato é a dificuldade existente para recuperar o cenário em que foram ge-rados os resultados apresentados num artigo científico ou trabalho acadêmico.

6 Introdução

A disponibilidade de repositórios de dados para livre uso em pesquisas podeencorajar novos desenvolvimentos, prover rápido avanço de pesquisas e reduzir aduplicação de esforços, conforme Vannier (VANNIER; STAAB; CLARKE, 2002).

Com a disponibilidade de uma base de IM de uso livre, a qual armazena alémde IM, softwares, IM pós-processadas, análises e documentos diversos, periódicosou comissões de eventos científicos podem solicitar dos autores a entrega ou refe-rência – além das bibliográficas – dos dados utilizados nos testes, dos algoritmosimplementados e dos resultados gerados no processo de validação. Esta abordagemvem sendo utilizada por periódicos como Science (AAAS, 2006) e Nature (NATURE,2006) porém, somente para trabalhos da área de biologia molecular. Outro exemploé o compartilhamento de dados e ferramentas de bioinformática existente entre osinstitutos envolvidos nos projetos de Genoma, como o The FAPESP – LICR HumanCancer Genome Project4. Ainda como um outro exemplo, a base de sinais fisiológi-cos, PhysioNet5 oferece acesso livre a grandes coleções de sinais e softwares paramanipulação destes (GOLDBERGER et al., 2000).

Estes exemplos reforçam a idéia de que o compartilhamento de dados promovea ampla investigação científica. Por sua vez, esta investigação fomenta – por meiode novas pesquisas – a diversidade de análises e opiniões, viabiliza testes de novashipóteses ou alternativas, facilita a formação de novos pesquisadores e habilita aexploração de assuntos não explorados anteriormente. Em contrapartida, todasessas atividades possibilitam a geração de novos conjuntos de dados a partir demúltiplas fontes.

1.4 Organização e apresentação do trabalho

Iniciando com um panorama sobre os principais tipos de aplicações que geren-ciam IM, o Capítulo 2 apresenta considerações sobre esse tipo de aplicação e fi-naliza com uma revisão sucinta das principais aplicações de base de IM de acessopúblico.

O terceiro Capítulo traz um conjunto de conceitos e práticas usuais em tarefasde avaliação relacionadas a IM. O Capítulo também aborda terminologias, proces-samento e análise de IM, apresenta considerações sobre a qualidade diagnóstica etermina com a apresentação de metodologias usualmente empregadas na avaliaçãodos métodos de processamento de IM.

4http://www.compbio.ludwig.org.br/ORESTES/5http://www.physionet.org/

1.4. Organização e apresentação do trabalho 7

A modelagem da base de imagens deste trabalho é apresentada no Capítulo 4.Este Capítulo começa relacionando os requisitos de uma aplicação de base de IM,segue com a apresentação dos modelos de caso de uso, controle de acessos, serviçode revisão de documentos e finaliza com a apresentação do modelo de base de dadosdistribuída para IM.

Na seqüência, o Capítulo 5 apresenta a arquitetura e implementação da infra-estrutura de base de IM proposta neste trabalho. O Capítulo inicia com a apresen-tação dos requisitos técnicos e funcionais da aplicação, segue com a apresentaçãoda arquitetura proposta, incluindo o modelo de base distribuída, e relata a imple-mentação dos componentes da arquitetura.

Objetivando demonstrar o uso do conjunto de aplicações implementadas nestetrabalho, o Capítulo 6 apresenta a utilização do ambiente aqui proposto, começandopela inserção de casos clínicos, avaliação do modelo de pesquisa e recuperação deinformações e finaliza demonstrando o uso da base de IM na avaliação de duasclasses de métodos de processamento de IM.

No Capítulo 7 é apresentada uma reflexão sobre a proposta do trabalho, o que foiplanejado e implementado, bem como a validação dos modelos e resultados obtidos.

O último Capítulo, Conclusão, apresenta as impressões sobre o trabalho, ativi-dades que poderão ser desenvolvidas em futuras etapas e, finalizando, as conside-rações finais.

Capítulo

2SISTEMAS DE INFORMAÇÃO PARA IM

“Art is a technique of communication. The image is the mostcomplete technique of all communication.”

CLAUS OLDENBURG

Cotidianamente, um grande conjunto de informações se faz presente na formade imagens. É incontestável a importância deste canal de informação, sobretudoem aplicações clínicas. No entanto, é difícil imaginar o amplo uso das IM sema existência de mecanismos capazes de organizá-las, possibilitando o armazena-mento, recuperação e processamento destas, de modo tão rápido e prático quando senecessite. Não é novidade afirmar que diversas áreas, em que as imagens possuemgrande relevância, necessitam do suporte provido pelas tecnologias relacionadas abancos de dados. O diagnóstico clínico baseado em IM constitui uma dessas áreas.Segundo Tagare e outros (TAGARE; JAFFE; DUNCAN, 1992), um conjunto de tecnolo-gias associadas aos métodos de aquisição de IM tem contribuído ativamente para omaior uso das IM na rotina clínica, como uma importante e pervasiva ferramentade auxílio ao diagnóstico, potencializada com a introdução dos equipamentos digi-tais.

Cada vez mais, os centros médicos têm se tornado dependentes dos recursoscomputacionais para armazenamento e processamento de informações clínicas, bemcomo das infra-estruturas de redes para transmissão e distribuição dessas informa-ções. Desde a década de 1970, os potenciais benefícios da integração entre os sis-temas que gerenciam IM e os sistemas de informações clínicas têm sido avaliados.Um exemplo pioneiro foi o sistema desenvolvido no Massachusetts General Hospi-

9

10 Sistemas de Informação para IM

tal (SHORTLIFFE et al., 1990) que incluía, juntamente com as funções de agenda-mento, o gerenciamento da biblioteca de filmes. Este sistema, anos depois, passoua incluir laudos e foi integrado ao sistema de cirurgias para acesso automatizadoaos diagnósticos confirmados.

Historicamente, os desenvolvedores dos primeiros sistemas de informações daRadiologia (Radiology Information System – RIS) já se depararam com várias ques-tões, de diferentes naturezas, inerentes ao gerenciamento de dados clínicos.

Nos últimos anos, as pesquisas no desenvolvimento de sistemas de gerencia-mento de dados sobre IM têm tido grande expansão (SHIFFMAN; SHORTLIFFE, 1996).Além das tarefas de gerenciamento de bases de dados, essas pesquisas incluem oprojeto de interfaces gráficas de apresentação de dados aos usuários (GraphicalUser Interface – GUI), suporte à entrada e armazenamento de informações estru-turadas – independentes de expressões lingüísticas – e a construção de ferramen-tas automatizadas de indexação e recuperação de informações, de modo a oferecermelhorias no armazenamento de informações clínicas (MüLLER et al., 2004).

Embora os avanços científicos e tecnológicos viabilizem que as IM de diferentesmodalidades sejam cuidadosamente adquiridas e processadas, o armazenamentodesse tipo de informação ainda é algo pouco compreendido. A questão fundamen-tal é que as IM possuem natureza (estrutura de dados, conteúdos, semântica, etc.)completamente diferente das informações que são armazenadas nas tradicionaisbases de dados, necessitando de técnicas de organização, indexação e pesquisa, di-ferentes daquelas disponíveis nessas bases. As características inerentes às IM einformações associadas a estas refletem a necessidade de considerar o desenvol-vimento de bases de dados providas de mecanismos especialmente dedicados aogerenciamento desse tipo de dado. Este Capítulo apresenta um panorama sobre osprincipais tipos de aplicações que gerenciam IM.

2.1 Sistemas de arquivamento e comunicação de ima-

gens

O advento dos sistemas de informações clínicas tem feito com que os profis-sionais envolvidos em assistência à saúde considerem o Prontuário Eletrônico doPaciente (PEP) um requisito imprescindível. Dentre os diversos benefícios espe-rados, destacam-se a melhor prestação de atendimento ao paciente por meio dorápido e fácil acesso à sua história clínica, o que torna necessária a manipulaçãode informações apresentadas em diferentes formatos (textos, sinais e imagens).

2.1. Sistemas de arquivamento e comunicação de imagens 11

Desde 1982, após uma proposta apresentada na Society of Photo-optical Ins-trumentation Engineers (SPIE) (DUERINCKX, 1997), muitos esforços têm sido dis-pendidos no desenvolvimento de sistemas capazes de realizar o arquivamento ecomunicação de IM (Picture Archiving and Communication Systems – PACS). NosPACS, semelhante às tradicionais aplicações de gerenciamento de dados, as IM emformato digital podem ser copiadas e enviadas sem perda de informações a váriosclientes, permitindo consulta por diferentes usuários, independente ou cooperati-vamente (HUANG, 2004). Além disso, outros propósitos dos PACS dizem respeitoàs facilidades com que as IM podem ser recuperadas de modo rápido e às possi-bilidades de correlacionar IM de modalidades e estudos clínicos distintos. Paratanto, as pesquisas em PACS têm estimulado vários desenvolvimentos de áreascomo comunicação em redes de alta velocidade, gerenciamento de bases de dadose visualização multimídia. Adicionalmente, os PACS têm motivado diversas pes-quisas em Informática Médica, incluindo Telemedicina, bases de dados clínicos etreinamentos baseados em computador (SHIFFMAN; SHORTLIFFE, 1996).

Figura 2.1 Workflow genérico de um departamento de Radiologia (NEMA, 2001a).

Ainda que as premissas de um PACS sejam baseadas num sistema para arqui-vamento e distribuição de IM numa instituição, pode-se notar que trata-se de umsistema capaz de fazer muito mais do que isto. No âmbito da realização dessastarefas, um PACS, consistentemente modelado e implementado, resume-se num

12 Sistemas de Informação para IM

sistema que integra dois importantes fluxos numa instituição de assistência mé-dica: (1) o de pacientes e (2) as etapas da formulação do diagnóstico. Nestes fluxosoperam: (a) o sistema de informações hospitalares (Hospital Information System –HIS), (b) o RIS, (c) os sistemas de aquisição das IM, (d) o sistema de elaboração delaudos e (e) as ferramentas de encaminhamento de laudos ao clínico requisitante.Portanto, o projeto de um PACS envolve o entendimento, por completo, do fluxode trabalho de um departamento de Radiologia, bem como a modelagem de outrosfluxos pertinentes ao ambiente hospitalar. A Figura 2.1 apresenta o exemplo deum workflow genérico, destacando a integração dos fluxos de informações entre osdiferentes sistemas, desde a chegada do paciente à instituição, passando pela con-sulta, requisição e agendamento do exame radiológico, realização do exame (tantoanalógico, quanto digital), elaboração do laudo pelo radiologista e encaminhamentodo laudo e IM ao clínico requisitante para prescrições e acompanhamentos.

Figura 2.2 Exemplo da arquitetura de um PACS.

Os principais componentes da arquitetura de um PACS (Figura 2.2) são: osequipamentos de aquisição de IM; base de dados e mecanismos de gerência do ar-mazenamento de IM e informações textuais; estações para elaboração de laudose visualização de exame; infra-estrutura de rede e interfaces com outros sistemas

2.1. Sistemas de arquivamento e comunicação de imagens 13

clínicos. Além disso, no projeto de um PACS, deve-se considerar a integração e ainter-operação de diferentes sistemas clínicos.

A heterogeneidade dos sistemas clínicos faz com que as informações provenien-tes de diversas fontes sejam armazenadas em diferentes bases dentro da mesmainstituição. Entretanto, para que essas informações possam ser realmente úteis eenviadas a diferentes sistemas, faz-se necessário o uso de padrões. Um exemplo éo padrão Health Level-7 (HL-7)1 que é bastante utilizado na transferência de in-formações clínicas (textuais) entre aplicações e, analogamente, o padrão DICOM(Digital Imaging and Communication in Medicine) (NEMA, 2001a) para IM radioló-gicas e, potencialmente, laudos estruturados (CLUNIE, 2000) e sinais (NEMA, 2000).

Com o intuito de eliminar as dificuldades que inibem o compartilhamento de da-dos e IM entre diferentes aplicações, bases de dados e especialidades clínicas numambiente hospitalar, o comitê Integrating the Healthcare Enterprise (IHE)2 tem es-pecificado uma arquitetura para troca de informações entre as diferentes bases dedados clínicos. O comitê IHE é uma iniciativa de profissionais da área da saúde eindústria. Em especial, este comitê tem direcionado seus trabalhos à Radiologia,embora tais trabalhos também tenham impactado outras áreas clínicas (CHANNIN,2001). O trabalho inicial visa promover a estabilização do uso dos padrões comoDICOM e HL-7 em aplicações clínicas. Freqüentemente, o comitê tem apresen-tado seus trabalhos em eventos da Radiology Society of North America (RSNA)e Healthcare Information Management Systems Society (HIMSS), demonstrandoa inter-operabilidade de sistemas de diferentes fabricantes (IHE, 2003; CHANNIN,2001). Os trabalhos do IHE compreendem o workflow de agendamento; reconcilia-ção de informações do paciente ( Patient Information Reconciliation – PIR): méto-dos para recuperar informações do paciente em diferentes condições; ferramentaspara visualização de IM; agrupamento e apresentação de procedimentos; acesso àsinformações radiológicas (IM e laudos); seleção de imagens significativas e laudosestruturados.

Com um PACS em operação, espera-se que sua base de dados seja acessada porclínicos de diferentes departamentos e especialidades da instituição. Uma alter-nativa (atualmente um paradigma) às tradicionais estações de trabalho (worksta-tions) especialmente desenvolvidas para manipular IM é o uso de microcomputado-res pessoais equipados com software como os navegadores de páginas de Internet(web browsers) e um servidor de páginas World Wide Web (WWW) para acesso àsIM (GELL; HOLZINGER; WILTGEN, 2000; MAURER, 2000). Muitos PACS têm sido de-

1http://www.hl7.org2http://www.ihe.net

14 Sistemas de Informação para IM

senvolvidos com essas características (MASCARINI et al., 1996; CAI; FENG; FULTON,2001; GUTIERREZ et al., 2004; FERNàNDEZ-BAYó et al., 2000), oferecendo uma formade integrar diferentes tipos de documentos. A concepção desses sistemas está fun-damentada na integração e distribuição de IM entre as diferentes áreas clínicas. Aabordagem de distribuição de informações aos diferentes setores de uma institui-ção faz necessário a existência de mecanismos que controlam o acesso dos usuáriosàs informações clínicas de cada paciente e, em adição, estes mecanismos fazem ocontrole das operações permitidas a cada usuário (MOTTA; FURUIE, 2003).

2.2 Sistemas de recuperação baseada em conteúdo

O acesso baseado em conteúdo a dados multimídia é uma linha de pesquisa bas-tante ativa, cujos trabalhos têm sido aplicados em diferentes propósitos, tanto deáudio (LOGAN; SALOMON, 2001), vídeo (SCHONFELD; LELESCU, 1998), quanto ima-gens (SMEULDERS et al., 2000; GUPTA; JAIN, 1997). A demanda por tal meio deacesso a dados tem sido gerada e estimulada pelo grande volume de dados multi-mídia que são criados e disponibilizados. Como exemplo, uma câmera fotográficapode gerar várias imagens (dados visuais) para o usuário final. Com esses dados(na forma digital) armazenados num disco, na maioria das vezes, não há outraforma de pesquisa a não ser pelo nome, data e tamanho dos arquivos ou visualizá-los no formato película (opção disponível no aplicativo Microsoft Windows Explo-rer R©). Tais abordagens funcionam muito bem quando se tem um número bastantereduzido de imagens para serem visualizadas e, dentre estas, se deseja selecionaruma ou um conjunto delas. Por outro lado, em grandes volumes, esta prática podetornar-se uma tarefa árdua e cansativa para o usuário.

O desejo do usuário é fornecer um conjunto de informações (características) ouuma imagem e, então, o sistema lhe retornar uma lista de imagens que satisfazemo critério da busca.

Vários protótipos de sistemas de recuperação de imagens com base em conteúdo(Content Based Image Retrieval – CBIR) têm sido apresentados, como o MIT Photo-book (PENTLAND; PICARD; SCLAROFF, 1994) e o Berkeley’s Blobworld (CARSON et al.,1999). Paralelamente a estes sistemas acadêmicos, também existem as soluçõescomerciais, como IBM QBIC e o Virage (BACH et al., 1996; FLICKNER et al., 1995). OGoogle Imagens (Figura 2.3), semelhante àquilo que é oferecido pelo site Google3,faz buscas por imagens a partir de palavras-chave fornecidas pelo usuário. Estas

3http://www.google.com

2.2. Sistemas de recuperação baseada em conteúdo 15

palavras são comparadas com aquelas contidas num texto criado por quem inse-riu a imagem na base de dados do site. Embora existam várias iniciativas, aindanão há uma solução genérica que contemple os diferentes objetivos em variadasaplicações de CBIR.

Figura 2.3 Página de apresentação do Google Imagens.

Numa base de IM convencional, como a de um PACS, a maioria das operaçõesde indexação e recuperação são baseadas na identificação do paciente, data e tipode exame, identificador da imagem e outras informações contidas no registro daIM. Entretanto, as informações mais abstratas (como tamanho, forma e posição),também presentes nas IM, são bem diferentes dos tipos de dados destinados ao ar-mazenamento de informações textuais. Extrair e organizar essas informações maisabstratas é um desafio enfrentado pelos desenvolvedores de trabalhos de CBIR.

Devido ao crescente uso de dados multimídia em aplicações clínicas, se as basesde IM puderem ser organizadas e permitirem a recuperação baseada em conteúdo,pode-se prever maior e melhor uso das informações clínicas dessas bases em diver-sos propósitos. Como exemplo, pode-se considerar o seguinte cenário: um estudantede graduação em Medicina ou um residente de Radiologia recebe uma radiografiade tórax para analisá-la. Uma forma de auxiliá-lo nessa análise pode ser a exis-

16 Sistemas de Informação para IM

tência de um sistema que permita, a este estudante ou residente, apresentar umaimagem e o mesmo sistema localiza as imagens semelhantes à imagem parâme-tro de pesquisa e as apresenta ao usuário requisitante. Assim, num processo deaprendizado ou treinamento, o indivíduo incumbido da análise da radiografia detórax poderá comparar a radiografia recebida com aquelas que o sistema identifi-cou como semelhantes e executar a prática do diagnóstico.

Atualmente, existem alguns sistemas de CBIR para uso em aplicações especí-ficas, desde o acesso a grandes e variadas coleções de IM, como as existentes nosPACS (LEHMANN et al., 2003), até coleções muito especializadas, principalmente,para auxílio ao diagnóstico (SCHIMID-SAUGEON; GUILLOD; THIRAN, 2003) em do-mínios específicos. Müller apresenta uma revisão abrangente sobre aplicações deCBIR em ambiente clínico em (MüLLER et al., 2004).

2.3 O estado da arte em bases de IM

Grande parte das bases de IM atualmente disponíveis é utilizada em pesquisas,com restrições de acesso e uso das informações (o uso normalmente é limitado aosparticipantes dos grupos mantenedores dessas bases). Evidentemente, as IM sãobastante sensíveis e revelam informações clínicas de natureza confidencial, o quefaz com que em tais bases as informações identificativas dos pacientes estejam anô-nimas. Algumas dessas regras são descritas no projeto do Medical Image ResourceCenter (MIRC)4 da RSNA (RSNA, 2005), Figura 2.4, cujo objetivo está centrado nodesenvolvimento de bases de dados sobre IM e padrões para uso em práticas didá-ticas em Radiologia. Uma característica desse projeto é a oportunidade oferecidaa diferentes grupos para criação de seus próprios locais de armazenamento e inte-gração destes à infra-estrutura MIRC-RSNA e outras bases de IM compatíveis como modelo de dados do projeto do MIRC.

O projeto Query By Interactive Spatial Multimedia (QBISM) é um protótipo debase para pesquisa e visualização tridimensional (3D) de IM (ARYA et al., 1996).O projeto está direcionado aos requisitos do mapeamento cerebral para uso emrelacionamentos multimodais entre múltiplos objetos. Nesta abordagem, os pes-quisadores da área médica solicitam consultas ad hoc em vários estudos de IM 3De recebem respostas rápidas (num tempo aceitável) do sistema.

O mais famoso exemplo de base de dados sobre IM é a base de imagens do pro-

4http://mirc.rsna.org

2.3. O estado da arte em bases de IM 17

Figura 2.4 Página do site MIRC-RSNA.

jeto The Visible Human5 da National Library of Medicine – NLM, vinculado aoNational Institutes of Health (NIH6), nos Estados Unidos, que apresenta uma basede IM contendo imagens dos corpos de dois indivíduos normais, um masculino e ou-tro feminino, anatomicamente detalhadas e com representações 3D. Além disso, oNIH tem disponibilizado várias outras ferramentas para uso em aplicações clínicase, também, tem trabalhado no desenvolvimento de uma base de IM de radiografiasda espinha (ANTANI; LONG; THOMA, 2002). Várias páginas de websites, como umadas páginas do Instituto Karolinska7, oferecem diversos endereços eletrônicos debases de IM destinadas a diferentes aplicações.

Um dos projetos de sistemas de informações médicas da NLM é desenvolver oprotótipo de um sistema para arquivamento de dados e uma aplicação cliente, bemcomo permitir que um grande número de usuários acesse a base, recupere, exibae manipule textos e dados sobre IM (THOMA; LONG; BERMAN, 1996). O sistema fazuso da Internet e padrões públicos para oferecer acesso às IM e metadados. Talsistema tem sido utilizado como parte do projeto The Visible Human para arma-

5http://www.nlm.nih.gov/research/visible/visible_human.html6http://www.nih.gov7http://www.mic.ki.se/MEDIMAGES.html

18 Sistemas de Informação para IM

zenar radiografias e laudos, bem como as IM tomográficas (CT e MRI) obtidas doscadáveres.

Lowe (LOWE et al., 1996) descreve o projeto Image Engine, também financiadopela NLM, como a primeira etapa da implementação de um sistema multimídia dePEP. O Image Engine é um sistema de base de dados cliente/servidor, multiusuárioe orientado a objetos, desenvolvido para realizar o armazenamento, recuperação,integração e compartilhamento de uma variedade de IM.

Outro projeto da NLM, que conta com a colaboração do National Centre forHealth Statistics e do National Institute for Arthritis and Musculoskeletal andSkin Diseases, tem por objetivo construir um sistema para armazenar as inter-pretações de radiografias geradas no National Health and Nutrition ExaminationSurvey (LONG et al., 1997). O sistema está apto a distribuir IM, via Internet, aworkstations para uso em práticas de interpretação. O objetivo do projeto é au-xiliar na verificação do grau de presença das condições de osteoartrite na colunacervical e lombar. As interpretações são armazenadas numa outra base paralela àde IM. Tal sistema faz uso de uma arquitetura cliente/servidor que realiza proces-samento distribuído das requisições dos clientes; oferece um método customizadode processamento e transmissão para rápida distribuição dos dados; workstationsclientes com monitores de alta resolução; possui funções de processamento de IM;e disponibiliza um atlas digital online como referência e um gerenciador de base deIM.

O Mammogrid8 é um projeto que objetiva a criação de uma base européia deIM de mamografia. Esta base destina-se ao uso de um conjunto de aplicações clí-nicas e os potenciais de uma infra-estrutura de GRID Computing9, objetivando acooperação entre profissionais na Comunidade Européia (AMENDOLIA et al., 2004b).

A iniciativa do Lung Imaging Database Consortium (LIDC), vinculado ao Na-tional Cancer Institute (NCI), consiste no desenvolvimento de uma base de dadossobre IM de CT de pulmão (CLARKE et al., 2001). A intenção é que esta base sejaum campo de testes para métodos de processamento de IM para melhor auxiliarna detecção e caracterização de lesões ou tumores no pulmão a partir de IM de CT.O objetivo vai além de desenvolver o campo de testes. Inclui também a criação deguidelines e métricas para avaliação, bem como a elaboração de um quadro com-parativo dos métodos desenvolvidos. O consórcio também objetiva disponibilizar abase para uso via Internet, provendo dados para pesquisas nesse segmento (NCI,2005).

8http://mammogrid.vitamib.com9http://www.gridstart.org

2.3. O estado da arte em bases de IM 19

Image Retrieval in Medical Applications (IRMA) é um projeto multi-departa-mental da Universidade de Aachen, na Alemanha, cujo objetivo é o desenvolvi-mento e implementação de métodos de CBIR para uso em tarefas de diagnósticoclínico em radiologia (LEHMANN et al., 2004). O projeto incorpora um dicionáriopróprio para classificação das IM (LEHMANN et al., 2003).

O projeto Biomedical Imaging Research Network (BIRN)10 (PAPADOPOULOS, 2006)é uma iniciativa do NIH e National Center for Research Resources (NCRR) quepromove colaborações na área de ciências biomédicas. Esta iniciativa apóia o de-senvolvimento de pesquisas em neuroimagens. Uma característica desse projetoé a facilidade de criação de locais de armazenamento de dados em outros labora-tórios. As tarefas de autenticação de usuários, integridade de dados, segurança epropriedade dos materiais submetidos ainda estão em desenvolvimento.

A Tabela 2.1 apresenta a relação de algumas das bases de IM atualmente dispo-níveis para livre acesso via Internet. A maioria dessas bases disponibilizam as IMem formatos como Joint Photograph Experts Group (JPEG) e Graphics InterchangeFormat (GIF), entre outros. Uma das exceções é a base de IM Global Rad que dis-ponibiliza IM DICOM – com qualidade diagnóstica – por meio de um visualizadorapropriado.

Título PáginaBiomedical Informatics Research Network (BIRN) http://www.nbirn.net

National Digital Mammography Archive (NDMA) http://nscp01.physics.upenn.edu/ndma/projovw.htm

Grid-based standardized mammography database (eDiamond) http://www.ediamond.ox.ac.uk

Digital Mammography Imaging Screening Trial (DMIST) http://www.dmist.org

Lung Image Database Consortium (LIDC) http://imaging.cancer.gov

Medical Image Resource Center (MIRC) http://mirc.rsna.org

Dartmouth fMRI Data Center (fMRIdc) http://www.fmridc.org

Bristol Biomedical Image Archive (Bristol BioMed) http://www.brisbio.ac.uk/index.html

Global Rad http://www.globalrad.org

Digital Database for Screening Mammography (DDSM) http://marathon.csee.usf.edu/Mammography/Database.html

Cell-Centered Database (CCDB) http://ccdb.ucsd.edu/CCDB/index.shtml

Tabela 2.1 Relação de algumas bases de imagens médicas (VANNIER; STAAB; CLARKE,2002).

10http://www.nbirn.net/

20 Sistemas de Informação para IM

2.4 Discussão

Cada vez mais, as IM têm provado sua utilidade no diagnóstico, terapia, plane-jamento cirúrgico e registro clínico para futuras avaliações. Os desenvolvimentosde sistemas clínicos estão mudando o foco da geração e aquisição de IM para oprocessamento e pós-processamento, armazenamento, análise e gerenciamento dosdados sobre IM. Por esta razão, a preocupação com o desenvolvimento de sistemasde bases de IM tem crescido substancialmente, ao mesmo tempo em que cresce ademanda por ferramentas que possibilitem explorar melhor o conjunto de informa-ções contidas numa imagem.

Atualmente, o rico conjunto de informações contidas nas IM tem sido bastanteutilizada na prática da Medicina moderna. Paradoxalmente, este rico conjuntotambém é sub-utilizado por meio de uma única forma de acesso aos arquivos (da-dos) dos PACS que é, tradicionalmente, baseada na identificação do paciente. Éevidente a carência de uma solução alternativa para acesso aos dados das IM. Al-gumas delas, como a recuperação baseada em conteúdo tem sido descrita em váriosartigos (LOWE et al., 1998; TRAINA Jr et al., 1997; ROSSET et al., 2002; PETRAKIS, 2002;TAGARE; JAFFE; DUNCAN, 1997) e vários projetos de pesquisa estão em andamento.Além disso, o número de publicações nessa área tem crescido a cada ano. Toda-via, apenas poucos projetos, como o Automatic Search and Selection Engine withRetrieval Tools (ASSERT) (SHYU et al., 1999; DY et al., 1999) e o IRMA (KEYSERS

et al., 2003; LEHMANN et al., 2003), têm observado a necessidade da criação de umambiente sobre o qual novos métodos de CBIR podem ser desenvolvidos.

Poucas das principais bases de IM com acesso público, atualmente disponíveis,são desenvolvidas com vistas a cobrir requisitos essenciais, como a distribuição dosdados, uso em atividades diversificadas, armazenamento de conjuntos heterogê-neos, integração com outras bases e oferta de IM com qualidade diagnóstica. Abase do MIRC-RSNA é uma das poucas aplicações desenvolvidas de modo a aten-der grande parte desses requisitos. Porém, o modelo de dados foi especificamentedesenvolvido para uso em atividades didáticas. O projeto do LDIC (CLARKE et al.,2001) apresenta um modelo robusto de base distribuída de IM, capaz de armaze-nar IM e outros documentos. Entretanto, o domínio de aplicação é bastante res-trito, onde o modelo de implementação foi direcionado unicamente a imagens deCT de pulmão. Outro exemplo é o BIRN (PAPADOPOULOS, 2006) que apresentaum modelo robusto, contempla várias funcionalidades necessárias em aplicaçõesde base de IM, porém não faz a integração com bases de outras instituições. Es-sas particularidades e restrições limitam o uso diverso dessas bases, bem como ocompartilhamento de seus dados. Müller em seu artigo de revisão (MüLLER et al.,

2.4. Discussão 21

2004) é categórico em afirmar que poucas ou quase nenhuma das abordagens deCBIR têm demonstrado sua verdadeira funcionalidade e a dificuldade disso estárelacionada à falta de grandes conjuntos de dados disponíveis para realização dostestes necessários.

Capítulo

3AVALIAÇÃO NO ÂMBITO DE IM

“In the universe,there are things that are known,

and things that are unknown,and in between, there are doors.”

WILLIAM BLAKE

De modo similar à formulação de um novo medicamento e tão importante quantoo esforço do desenvolvimento de métodos de processamento de IM é o processo detestes e avaliação dos mesmos, nos planos técnico e clínico, objetivando usufruir porcompleto, bem como integrá-los à rotina clínica (JANNIN et al., 2002). Como ocorrecom os medicamentos, considerando os desafios e riscos, um clínico exige garan-tias de qualidade do sistema1 antes de seu uso. No exemplo dos medicamentos, éimportante conhecer sua formulação, eficácia, efeitos, posologias e riscos, previa-mente à sua utilização. E, analogamente, com os métodos de processamento deIM, entre outros aspectos, seus potenciais e limitações. No caso dos métodos deprocessamento de IM é necessário admitir que quase não existe uma avaliação ri-gorosa destes (MüLLER et al., 2004). O que, apesar dos diversos desenvolvimentos,em parte, isto explica a pouca inserção de novos métodos na rotina clínica.

Neste Capítulo será apresentado um conjunto de conceitos e práticas normal-mente utilizados em tarefas de avaliação em atividades que envolvem IM. Tambémsão abordadas as terminologias, algumas das questões pertinentes ao processa-

1Neste Capítulo, o termo sistema também é utilizado para designar um equipamento de aquisi-ção e/ou manipulação de IM.

23

24 Avaliação no âmbito de IM

mento e análise de IM, a qualidade diagnóstica e algumas das práticas usuais deavaliação dos métodos de processamento de IM.

3.1 Terminologia geral

Num caso de avaliação, destacam-se as tarefas de detecção e estimativa. Aprimeira tem por objetivo detectar a presença/ausência de uma anomalia ou pato-logia. As tarefas de estimativa baseiam-se na avaliação de pesos e sua relação comum certo parâmetro, por exemplo a medida da fração de ejeção do ventrículo es-querdo. Neste caso, o parâmetro usado para comparação é uma referência tidacomo ideal (LEHMANN, 2002) e conhecida como gold standard ou ground truth.Contudo, na prática e no domínio clínico esta referência absoluta não existe, geral-mente, o que leva a estabelecê-la é a necessidade de uma relação de compromissoentre a realidade e o valor obtido como resultado da aplicação de um método e omodelo de anatomia “normal” (LEHMANN, 2002). Por isto, fala-se ainda em silverstandard, bronze standard e plastic standard (LEHMANN, 2002).

Usualmente, a imagem de referência pode ser uma simulação numérica, ummodelo (phantom), imagem gerada a partir de algum método (algoritmo), ou pro-veniente de atividades clínicas. Quando a referência é conhecida, a diferença entreo valor dessa referência e o valor obtido (análise) denota um peso. Em geral, esteé associado à uma medida da variabilidade sobre um grande número de experiên-cias. Assim, o peso pode ser representado por um valor mediano, médio ou médioquadrático, entre outros, e a variabilidade por meio do desvio padrão ou um índice.Geralmente, quando a referência absoluta não existe, na comparação, o métodocandidato é comparado com um método tido como estável utilizando-se, por exem-plo, a abordagem descrita por Bland e Altman (BLAND; ALTMAN, 1986).

Figura 3.1 Matriz de definição de verdadeiro e falso, positivo e negativo (DHAWAN, 2003).

As denominações habituais “positivo” e “negativo” são algumas das medidasfreqüentemente utilizadas na avaliação de algoritmo/teste de detecção de objetosestranhos à morfologia “normal”, como microcalcificações em mamografias ou uma

3.2. Processamento e Análise de IM 25

certa condição patológica. Em avaliação/teste da IM, “positivo” significa a exis-tência do objeto. Por outro lado, uma avaliação com resultado “negativo” significaque o objeto não foi identificado na avaliação. O resultado de uma avaliação, emtermos da presença ou ausência da anomalia, é denotado por meio da “condiçãoverdadeira” (o que realmente existe na IM). Para isso, são definidas quatro medi-das básicas e úteis (DHAWAN, 2003): Verdadeiro Positivo (VP), Falso Positivo (FP),Falso Negativo (FN) e Verdadeiro Negativo (VN). Nessa terminologia, “positivo” e“negativo” referem-se à decisão tomada pelo especialista, em termos de existên-cia ou não da anomalia. Os adjetivos “verdadeiro” e “falso” referem-se a quanto adecisão tomada pelo especialista está ou não de acordo com o estado clínico atual.Dessa forma (Figura 3.1), Verdadeiro Positivo indica que a observação do especia-lista está correta, de acordo com a situação real (a anomalia existe de fato); FalsoPositivo indica que a observação do especialista está incorreta (a observação dizque a anomalia existe, quando na verdade esta não existe); Falso Negativo indicaque a observação do especialista está em desacordo com a situação real (a observa-ção diz que a anomalia não existe, quando na verdade existe); Verdadeiro Negativoindica que o especialista decidiu corretamente (a observação diz que a anomalianão existe e, de fato, esta não existe).

3.2 Processamento e Análise de IM

O auxílio computacional em análises de IM é considerado uma atividade pro-missora e objetiva oferecer melhores qualidades diagnóstica e terapêutica na as-sistência à saúde. Tal automação requer a solução de um conjunto de questões quepermeiam esta área, das quais muitas estão intimamente relacionadas aos proble-mas de visão computacional e, conseqüentemente, de processamento de IM.

Analogamente aos atlas anatômicos que relatam as condições consideradas nor-mais, existem materiais que tratam das variações da anatomia humana. Estes sãograndes volumes que contêm descrições dos vários casos encontrados pelos dife-rentes especialistas. Observado em rotina clínica, cada especialista acumula seupróprio “case book” obtido com sua experiência. Assim, a habilidade para inter-pretar IM requer um vasto conjunto de experiências, além do aprendizado sobrea anatomia “normal” e, na prática, a expertise do radiologista que consiste numconhecimento capaz de guiá-lo na interpretação (ROSSET et al., 2002).

Quando se questiona um radiologista sobre como ele realiza a interpretação deuma IM, a partir de suas considerações, pode-se identificar que ele usa vários tiposde conhecimento que oferecem indícios, os quais serão utilizados durante a inves-

26 Avaliação no âmbito de IM

tigação diagnóstica e interpretação de IM. Em resumo, o conhecimento especia-lista aplicado na interpretação de IM considera os seguintes parâmetros (TAGARE;

JAFFE; DUNCAN, 1997):

• simetria (deslocamento de estruturas a partir de uma linha média);

• diferenças em padrões normais (estruturas anatomicamente corretas, mascom alterações topológicas);

• conhecimento dos padrões típicos associados à uma patologia em particular;

• parâmetros anormais que podem não pertencer à uma categoria conhecida.

A investigação diagnóstica, partindo destes quatro parâmetros, subdivide-se, i-nicialmente, em duas etapas. A primeira consiste na descrição das imagens, ouseja, reconhecer formas e objetos e, posteriormente, quantificar as característicasmorfológicas destes. Trata-se de estabelecer uma relação entre uma área de dadosda IM, sua caracterização e semântica. A segunda compreende uma fase de clas-sificação com base na síntese das características morfológicas observadas, com afinalidade de estabelecer o diagnóstico ou prognóstico.

Em IM, as informações sobre o paciente e possíveis anomalias são transferidasao radiologista em duas etapas principais: (1) aquisição dos dados e formação daIM; (2) processamento e exibição. A primeira é, basicamente, dependente das carac-terísticas técnicas e propriedades do processo de aquisição da IM. A segunda incluio desempenho do radiologista, ou seja, como ele(a) detecta e interpreta as estrutu-ras e dados contidos nas IM – modelo de observadores (ABBEY; BARRETT; ECKSTEIN,1997; ECKSTEIN; ABBEY; WHITING., 1998; KUNDEL, 1979). A qualidade de um proce-dimento radiológico deve, entretanto, ser estudada e descrita, no mínimo, segundoestas duas etapas. Atualmente, esta tarefa acaba sendo mais direta, uma vez queem função do uso de IM digitais os dois passos são devidamente decompostos.

Com a finalidade de melhor explorar o conjunto de dados contidos nas IM, aanálise de IM auxiliada por computador pode oferecer um novo conjunto de infor-mações aos clínicos e especialistas envolvidos na assistência à saúde, para encami-nhamento do caso clínico (GIGER, 2000). Deste conjunto destacam-se:

1. Extração de parâmetros quantitativos, computados em qualquer estruturaanatômica ou patológica;

2. Detecção precoce de qualquer mudança entre duas IM do mesmo paciente,obtidas em momentos diferentes – o que é bastante útil para o diagnósticoprecoce e avaliação/reavaliação das terapias prescritas;

3.3. Qualidade diagnóstica de IM 27

3. Fusão da informação proveniente de modalidades complementares, colocan-do-as num quadro comparativo;

4. Comparação de IM inter-pacientes a fim de analisar a severidade de patolo-gias ou extrair IM similares a partir de uma base de IM – o que também podeser útil na construção de atlas;

5. Construção de atlas anatômico e/ou funcional, contendo as informações ana-líticas sobre as estruturas, como os padrões de normalidade. Isto poderá au-xiliar na detecção de padrões de anomalias e, também, na interpretação deIM;

6. Análise do movimento em órgãos dinâmicos ou estruturas articuladas numintervalo de tempo, por meio de seqüências de imagens 3D;

7. Visualização volumétrica de IM, permitindo a reprodução (rendering) de es-truturas estáticas ou dinâmicas a partir de pontos aleatórios e, também, si-mulação de imagens endoscópicas.

A análise de IM também é útil em(CLEARY, 2000; YOO, 2001; JANNIN et al., 2002):(a) planejamento e simulação, onde as IM podem auxiliar na construção de um mo-delo de “paciente virtual” em que vários protocolos terapêuticos possam ser testadose comparados, podendo ser útil em treinamentos ; (b) controle: as IM, utilizadas noplanejamento cirúrgico, poderiam ser superpostas ao paciente, ou mesmo, duranteuma intervenção cirúrgica em tarefas de localização – outra aplicação é o uso des-sas imagens para guiar robôs-cirurgiões; (c) terapias: as IM obtidas antes e após aterapia podem ser superpostas, umas às outras, para se fazer comparações sobre aevolução do tratamento. Estas observações também se aplicam à radioterapia, ci-rurgia tradicional, vídeo-cirurgia, radiologia intervencionista, quimioterapia, entreoutras especialidades.

3.3 Qualidade diagnóstica de IM

É relativamente fácil reconhecer a diferença entre as aparências de imagens,particularmente quando apenas um parâmetro é modificado (SHARP, 1990). E oautor complementa que a aparência não é necessariamente sinônimo de qualidadeda imagems e a mesma não pode ser definida sem referências à tarefa em que a

28 Avaliação no âmbito de IM

imagem será utilizada (SHARP, 1990). Assim, para ele, “uma definição mais gené-rica de qualidade de imagem é aquela que consiste numa medida da efetividadecom que uma imagem pode ser utilizada no desenvolvimento de uma determinadatarefa” (SHARP, 1990).

De modo geral, Sharp considera uma imagem algo composto de duas partesprincipais: sinal e ruído (SHARP, 1990). Para Sharp, o sinal é definido como a in-formação que é relevante para interpretação da imagem, enquanto o ruído é todainformação irrelevante que, por definição, apenas viabiliza realizar a tarefa de re-conhecimento do sinal mais forte e a qualidade da imagem pode ser medida quan-titativamente por meio da relação sinal-ruído (SHARP, 1990). Com o advento dosequipamentos digitais, pondera Sharp, o problema de medida da qualidade é algorelativamente simplificado, pois nesses equipamentos é possível analisar separa-damente o desempenho do processo de aquisição de dados a partir do sistema dereconstrução da IM. Assim, a qualidade também pode ser expressa em termos daquantidade de ruído, capacidade de detecção e eleminação deste (SHARP, 1990).

Constitui uma tarefa bastante complexa e objetos de estudo de muitos traba-lhos, modelar o mecanismo de percepção do observador humano (FIETE et al., 1987;KUNDEL, 1979; ABBEY; BARRETT; ECKSTEIN, 1997). Normalmente, a qualidade daimagem é medida experimentalmente. A abordagem mais simples é produzir umpadrão de testes e medir a qualidade dos dados exibidos, em termos de habilidadedo observador em identificar certas características nessa imagem.

Em geral, a percepção pode ser dividida em três níveis (SHARP, 1990). “A ativi-dade referente ao nível mais básico e onde se tem mais trabalhos desenvolvidos é adetecção, cujo objetivo é dizer se o sinal está presente ou ausente. O próximo nível(um pouco mais complexo) que trata do reconhecimento, não consiste em simples-mente o observador relatar que uma característica anormal (sinal) está presenteou não. Adicionalmente, ele deve descrever esta característica (tamanho e forma,por exemplo). Finalmente, o terceiro nível, uma vez que a anomalia foi encontradae descrita, o terceiro nível deve categorizá-la” (SHARP, 1990). Isto dependerá decategorias próprias para um tipo particular.

3.3.1 Desempenho do observador

Historicamente, o controle de qualidade em Radiologia tem enfatizado os com-ponentes técnicos, sem políticas ou diretrizes próprias. O objetivo principal de umapolítica de controle de qualidade, em geral, consiste em garantir o melhor uso doproduto final. O controle da qualidade de IM radiológicas requer a redução da

3.3. Qualidade diagnóstica de IM 29

variabilidade e o oferecimento de acurácia no diagnóstico, pois “a qualidade dasIM pode ser objetivamente medida em termos da performance humana em tarefasque são relevantes para o diagnóstico clinico visual” (ECKSTEIN; ABBEY; WHITING.,1998). Isto pode ser feito por meio de avaliação da variabilidade intra-observadorsão passos necessários para melhoria da qualidade diagnóstica das IM.

As modernas técnicas de aquisição de imagens, juntamente com as variadastécnicas de processamento computacional, em relação aos tradicionais filmes, têmpossibilitado gerar IM com diferenciais, em termos de resolução, contraste, faixados níveis de cinza, ruídos, projeção, etc. Assim, em atividades de treinamentose desenvolvimento de métodos computacionais, faz-se necessário o preparo de umconjunto de recursos para que os especialistas possam validar uma nova técnicade aquisição. Para tanto, uma prática bastante comum é a utilização de phantomsanatômicos para simular estruturas anatômicas do corpo de um paciente, tanto“normais”, quanto com alguma patologia. Outro recurso também bastante utili-zado é a geração de IM por meio de simuladores numéricos, com o intuito de seobter variados conjuntos de dados que possam subsidiar o processo de avaliação danova técnica, bem como a capacidade e condições em que um observador humano(especialista na rotina clínica) desempenha suas atividades. Neste caso, as IM depacientes são desejáveis, o que torna necessário um grande número de IM dessacategoria, com achados do verdadeiro estado patológico em cada caso.

Quando uma nova tecnologia de IM é introduzida na rotina clínica de uma espe-cialidade, esta introdução é baseada na relação custo x benefícios que esta nova tec-nologia pode trazer. Assim, é comum observar questionamentos similares a comose pode saber que um método baseado numa nova tecnologia oferecerá bons resulta-dos e trará retorno ao investimento? Ou mesmo em termos de gestão do sistema desaúde, os resultados são comparáveis?. Nota-se que a decisão por uma ou outra mo-dalidade não pode se pautar pela “preferência” pessoal. Por isso, os estudos de de-sempenho de observadores(ABBEY; BARRETT; ECKSTEIN, 1997; BERBAUM; DORFMAN;

FRANKEN_JR, 1989; ECKSTEIN; ABBEY; WHITING., 1998; FIETE et al., 1987; KUNDEL,1979) se mostram importantes em atividades de avalição de algoritmos e técnicasde processamento de IM. Em geral, isto se deve ao fato de que a preferência pessoaltende a ser algo subjetivo e tende a privilegiar as informações estéticas, deixandode lado, muitas vezes, as informações anatômicas e patológicas.

Tradicionalmente, fala-se que uma IM com boa aparência também é de boaqualidade (SHARP, 1990). Ocasionalmente, realiza-se comparações de desempenhodiagnóstico para novas e antigas técnicas. Mas qual é o diagnóstico verdadeiro ecomo pode ser mostrado que a nova técnica tem desempenho melhor em relação à

30 Avaliação no âmbito de IM

antiga? Muitas vezes, apesar do alto interesse em novas tecnologias, as IM nãousuais e provenientes de novas modalidades são freqüentemente subestimadas porcausarem determinadas incertezas nos especialistas. Contudo, se as IM de umnovo tipo ou aparência não usual estão para serem avaliadas, a experiência prévia,impressões gerais das IM e considerações estéticas são de valor limitado. A avalia-ção de tais imagens deve ser mais flexível do que comparando somente a aparênciageral com os tradicionais filmes. Normalmente, a avaliação da qualidade de IMradiológicas pode ser categorizada em seis níveis (MANSSON, 2000; JANNIN et al.,2002): (1 ) capacidade técnica, (2 ) acurácia diagnóstica; (3 ) impacto diagnóstico; (4)impacto terapêutico; (5) coerência no resultado de procedimentos; (6) Otimizaçãode uso (relações custo-benefício e custo-efetividade).

Na literatura, estudos direcionados aos níveis de 3 a 6 são raros (JANNIN et al.,2002). Vários estudos são dedicados à negociação com as propriedades físicas ouao estudo de desempenho do observador (níveis 1 e 2). Um ponto-de-vista razoávelé aquele em que qualquer que seja a medida utilizada para qualidade da imagem,esta deve transparecer uma correlação moderada com os radiologistas no sentidoda definição de uma IM de boa qualidade (METZ, 1986; KUNDEL, 1979; FIETE et al.,1987), em outras palavras, uma IM deve possuir qualidade, tal que um radiologistatenha, segundo Månsson (MANSSON, 2000), condições de:

• Distingüir entre os estados patológico e saudável;

• Relatar, com acurácia e precisão, as estruturas relevantes para o diagnóstico;

• Classificar corretamente os diferentes tipos de anomalias;

3.4 Avaliação de algoritmos

A avaliação desempenha um importante papel no desenvolvimento de qualquertarefa. Por exemplo, em visão computacional os algoritmos não-supervisionadosde segmentação, freqüentemente, são prejudicados pela falta de um objetivo e/ouground truth explícito. Um dos grandes obstáculos no campo de processamentode IM é a falta de um conjunto de IM de referência e procedimentos para seremseguidos em tarefas de avaliação. De um modo geral, pode-se dizer que a qualidadede uma avaliação depende de três condições (JANNIN et al., 2002): (1) metodologia,(2) instrumentos de avaliação e (3) a forma com que as medidas são obtidas.

3.4. Avaliação de algoritmos 31

3.4.1 Metodologia de Avaliação

Antes de iniciar o processo de avaliação de um sistema, é necessário que umconjunto de requisitos iniciais sejam cumpridos. São eles (JANNIN et al., 2002; EFMI-

WG-MIP, 2002):

1. Identificar o objeto da avaliação.

2. Precisar a finalidade do sistema (tarefa). Nesse estágio, pode-se distingüirtrês tipos de tarefas: (a) tarefas de detecção; (b) tarefas de classificação ondea resposta é pertencente à uma categoria (benigno ou maligno, por exemplo);(c) tarefas de estimativa que visam considerar parâmetros sobre uma escala(por exemplo a medida da fração de ejeção do ventrículo esquerdo).

3. Quem realiza a avaliação? A entidade que realizará a avaliação é denominadaobservador e, usualmente, é categorizada em dois tipos:

• Observador humano: atua como um especialista que irá interpretar aIM;

• Observador numérico: um algoritmo que estimará um valor quantita-tivo.

4. Determinar o conjunto de dados sobre os quais o trabalho de avaliação serárealizado. De modo geral, os dados podem pertencer aos seguintes conjun-tos (EFMI-WG-MIP, 2002) (comparados na Tabela 3.1):

• Simulação numérica: para estes dados, o condutor da avaliação tem con-trole total, podendo direcioná-la para interesses particulares. Em con-trapartida, o realismo dos dados simulados é questionável.

• Modelos (phantoms): dados adquiridos a partir de modelos físicos. Avantagem é que estes dados são bem controlados, com relação aos errosexperimentais. Contudo, a limitação é o realismo das configurações quenão podem ser bem estudadas a partir de estruturas do interior de umphantom.

• Clínicos: O trabalho de avaliação deve ser desenvolvido em condiçõespróximas daquelas que o sistema supostamente irá operar. Em processosde análises, os dados clínicos devem ser priorizados, uma vez que estestrazem informações a priori das condições reais. Entretanto, exige-se umgrande conjunto de dados dessa natureza.

• Imagens híbridas: são IM de pacientes saudáveis, a estas imagens, aspatologias são adicionadas digitalmente.

32 Avaliação no âmbito de IM

Tipos de dados Vantagens LimitaçõesSimulações Controle perfeito da situação estudada realismoModelos Bom controle da situação estudada realismoClínicos Realidade e pertinência controleImagens híbridas Criação de novos e diferentes conjuntos realismo

Tabela 3.1 Comparação entre os conjuntos de dados utilizados em avaliações (EFMI-WG-MIP, 2002).

5. Verificar a existência de um conjunto de referência, tradicionalmente denomi-nado “gold standard” ou “ground truth” (valor verdadeiro do parâmetro quese deseja avaliar).

6. Qual questão será respondida pela avaliação? O objetivo de qualquer tra-balho de avaliação é responder à uma questão. Esta questão pode ser umaresposta calculada, figura de mérito ou, ainda, uma hipótese de teste, comopor exemplo obter uma resposta binária (aceitação ou rejeição).

7. As dificuldades de definição de um gold standard aparecem, de modo especialquando se utiliza dados clínicos reais. Em geral, em tarefas de quantificação, oparâmetro que se procura avaliar não é precisamente conhecido. Para tarefasde detecção, há um possível controle por meio de biópsias (uma possibilidadeda presença de lesão), entretanto a definição do gold standard é mais difícilde estabelecer quando as imagens não revelam anomalias.

3.4.2 Instrumentos de avaliação

Tradicionalmente, na avaliação de sistemas de auxílio ao diagnóstico mede-se asensibilidade, especificidade e acurácia. A partir das categorias VP, FP, VN e FNpode-se calcular um índice de precisão (DHAWAN, 2003):

• Sensibilidade= V PV P+FN : corresponde à fração dos casos positivos que foram iden-

tificados corretamente.

• Especi f icidade = V NV N+FP : corresponde à fração dos casos negativos que foram

identificados corretamente.

• Acuracia = V N+V PV N+V P+FP+FN : corresponde à fração dos casos (positivos ou negati-

vos) identificados corretamente.

A priori, estas grandezas, consideradas figuras de mérito, poderiam ser suficien-tes para avaliar um sistema. No entanto, estas grandezas apresentam algumas

3.4. Avaliação de algoritmos 33

limitações para se estabelecer qual seria o melhor sistema. A título de exemplo:

• (a) avaliação de sensibilidade e especificidade:

– método A: sensibilidade = 88%; especificidade = 68%.

– método B: sensibilidade = 93%; especificidade = 52%.

– Qual destes é o melhor método?

• (b) dificuldade para responder sobre acurácia:

– método A: sensibilidade = 88%; especificidade = 65%; acurácia = 92%.

– método B: sensibilidade = 63%; especificidade = 86%; acurácia = 92%.

– uma mesma acurácia pode corresponder a resultados de sensibilidade e es-pecificidade muito diferentes.

A primeira limitação é para responder à questão sobre o desempenho do sis-tema. Em geral, é necessário considerar ao mesmo tempo a sensibilidade e a es-pecificidade, mas qual destes dois sistemas é o melhor? Usando outro índice, aacurácia, observa-se que a mesma acurácia pode corresponder a compromissos desensibilidade e especificidade diferentes. Por isso, cabe ressaltar que utilizar so-mente a acurácia, sem considerar a sensibilidade e especificidade, pode induzir àconclusões equivocadas. O que evidencia a necessidade de se definir medidas dedesempenho.

3.4.3 Medidas de desempenho

Dhawan (DHAWAN, 2003), ilustra a possibilidade de construção e utilização demedidas de desempenho, conforme segue 2:

“Assumindo que o número total de casos examinados seja Ntot , dosquais Nvp é o número de casos na condição “verdadeiro positivo” coma presença da anomalia e o restante dos casos, Nvn, têm a condição“verdadeiro negativo” com ausência da anomalia. Supondo tambémque esses casos compõem o conjunto de testes para os quais seja ne-cessário avaliar os fatores de acurácia, sensibilidade e especificidade.Considerando que o observador não causa nenhuma perda de infor-mação ou faça interpretações errôneas, o número de observações “ver-dadeiro positivas” é dado por Novp a partir de Nvp casos e o número de

2Tradução nossa.

34 Avaliação no âmbito de IM

observações falso negativas é dado por No f n a partir de Nvp casos (con-dição verdadeira). Também, considerando que o número de observa-ções negativas é dado por Novn a partir de Nvn (condição verdadeironegativo) e o número de observações “falso positivas” é dado por No f p

a partir de Nvn (condição falso negativa). Assim: Nvp = Novp +No f n eNvn = Novn +No f p. Em função disso, temos os seguintes indicadores:

1. Fração de Verdadeiro Positivo (FVP) é a taxa do número de ob-servações positivas para o número de casos na condição “verda-deiro positivo”: FV P =

NovpNvp

.

2. Fração de Falso Negativo (FFN) é a taxa do número de observa-ções negativas para o número de casos na condição “verdadeiropositivo”: FFN =

No f nNvp

.

3. Fração de Falso Positivo (FFP) é a taxa do número de observa-ções positivas para o número de casos na condição “verdadeironegativo”: FFP =

No f pNvn

.

4. Fração de Verdadeiro Negativo (FVN) é a taxa do número deobservações negativas para o número de casos na condição “ver-dadeiro negativo”: FV N = Novn

Nvn.

Deve-se observar que FV P+FFN = 1 e FV N +FFP = 1.

Figura 3.2 Exemplo de um gráfico de curva ROC, com a curva “a” indicando o melhorcenário de classificação que a curva “b” e enquanto “c” mostra o cenário de classificaçãoaleatória (DHAWAN, 2003).

Um gráfico entre FVP e FFP é chamado de curva receptora da carac-terística de operação (Receiver Operating Characteristic – ROC) para

3.5. Discussão 35

um certo dispositivo de manipulação de IM ou teste diagnóstico. Vá-rios pontos na curva ROC (a, b e c mostrados na Figura 3.1) mostramos diferentes limiares de decisão utilizados para classificação de ca-sos em observações positivas e negativas e também a definição deconjuntos específicos de FVP e FFP. Deve ser observado que em casode experimentos randômicos, com probabilidades iguais de observa-ções positivas e negativas, é gerada uma linha diagonalmente retacomo curva ROC (curva c da Figura 3.2). Diferentes testes e observa-dores podem produzir diferentes curvas ROC na detecção do mesmoobjeto.

A FVP é também chamada de sensibilidade, bem como a FVN de es-pecificidade nos testes de detecção de objetos. A acurácia do teste édada por uma taxa de observações corretas para o número total de ca-sos examinados (acuracia= V P+V N

Ntot). Em outras palavras, vale lembrar

que diferentes modalidades de IM e observadores podem conduzir adiferentes níveis de acurácia, sensibilidade e especificidade.”

3.5 Discussão

Embora a medida de qualidade de uma imagem seja um estágio essencial naavaliação da qualidade das técnicas de aquisição e processamento de imagens,ainda não existe uma forma de medí-la com precisão e acurácia. As teorias atuaissugerem que a qualidade dos dados de IM adquiridos pelos equipamentos possa seravaliada independentemente da imagem apresentada.

A avaliação de um sistema envolve variáveis como precisão, acurácia, capa-cidade de resolução (eficiência), robustez dentro do contexto da avaliação, esta-bilidade (sensibilidade aos pesos estatísticos e consistência), complexidade algo-rítmica, o tempo na realização dos cálculos e os requisitos mínimos necessários(recursos) (JANNIN et al., 2002). Atualmente, para responder (afirmativa ou nega-tivamente) à uma questão (motivado pelo contexto clínico), recorre-se a testes dehipóteses estatísticas que se apóiam em índices de qualidade (ou figura de mérito).

Durante os próximos anos poderá ser visto o crescente papel da análise e proces-samento de IM auxiliados por computador e simulações em Medicina. Uma carac-terística dessa linha de pesquisa é o trabalho combinado de matemáticos, cientistasda computação, físicos e médicos, bem como as diferentes áreas relacionadas à ci-ência da computação: visão computacional, processamento de imagens, gráficos e

36 Avaliação no âmbito de IM

robótica. Tais pesquisas devem prover uma revolução na prática da Medicina emfuturo próximo. Contudo, primeiramente, se faz necessária a disponibilidade derecursos que viabilizem a avaliação dos diferentes métodos de análise e processa-mento de IM, bem como a documentação dos procedimentos e métricas adotados.

Capítulo

4BASE DE IMAGENS MÉDICAS:

MODELAGEM

“Color in a painting is like enthusiasm in life.”

VINCENT VAN GOGH

Respondendo às significativas mudanças no plano do processamento, armazena-mento e recuperação de IM e informações associadas, vários projetos têm sido de-senvolvidos objetivando suprir as diferentes demandas (VANNIER; STAAB; CLARKE,2002), como por exemplo os PACS. Tradicionalmente, os PACS compartilham umaarquitetura centralizada, empregando métodos ad-hoc de gerenciamento dos con-juntos de dados. Assim, não são raros, sistemas dessa natureza que apresentamredundâncias e inconsistências no que tange o armazenamento. Devido à concep-ção dos atuais PACS e por serem sistemas de ambiente de produção e assistênciaclínica, torna-se inviável o uso do conjunto de dados desses sistemas em diferentespropósitos, como em atividades de pesquisa.

Baseado nas considerações que permeiam o desenvolvimento de algoritmos deprocessamento de IM (seção 1.1), parte da solução dos problemas lá mencionadosenvolve a disponibilidade de uma base de IM que poderá servir de referência para acomunidade de processamento de IM. Para tanto, esta base de IM não pode ser umsimples repositório de IM, concorrente ou paralelo ao PACS e, conseqüentemente,com as mesmas limitações. Como repositório de documentos clínicos, existe grandeexpectativa em relação à capacidade de armazenar diferentes conjuntos de dados.

37

38 Base de Imagens Médicas: Modelagem

Analogamente, espera-se poder recuperar informações por meio de ferramentas es-pecializadas de pesquisa em bases de IM. Este Capítulo apresenta a especificaçãode um modelo de base de IM de uso e acesso livres, capaz de armazenar diferentestipos de documentos clínicos. O Capítulo inicia relacionando os principais requi-sitos de uma aplicação gerente de base de IM, segue apresentando o caso de usogeral da aplicação, controle de acessos, serviço de revisão de documentos, modelode pesquisas e, finalizando, é apresentado o modelo distribuído de base de IM.

4.1 Requisitos da base de IM

A disponibilidade de uma base de dados com IM, informações diagnósticas eque tal base ofereça meios para recuperação dessas informações por meio de pes-quisas especializadas, torna-se uma ferramenta de grande utilidade em diversasatividades, tanto na assistência quanto no desenvolvimento de trabalhos de pes-quisas. Um requisito primordial para facilitar a recuperação de informações é queos conjuntos de dados possam ser classificados e agrupados, pelo menos em termosde anatomia, vista (corte) e patologia.

Atualmente, no ambiente clínico existe uma variedade de sistemas que geren-ciam dados sobre as condições clínicas dos pacientes. Por outro lado, diversos usuá-rios acessam estes sistemas, no desenvolvimento de suas atividades cotidianas,rotineiramente, para inserir ou recuperar alguma informação.

O modelo de base de IM aqui proposto considera, dentre outros, os seguintesaspectos: distribuição de dados; inter-operação com outras aplicações clínicas; con-junto heterogêneo de dados; processamento e análise de dados; uso de padrões;segurança e confidencialidade dos dados clínicos. Em conseqüência, este modeloconsiste na especificação de uma infra-estrutura que gerencia dados sobre IM. Talinfra-estrutura foi planejada observando os seguintes requisitos (tidos como prin-cipais):

• Identificação única de cada conjunto de dados;

• Pesquisa, recuperação e distribuição de IM sob demanda;

• Arquivamento de análises dos diferentes grupos e ofertas de meios para cria-ção de novas análises em todos os conjuntos de dados;

• Acesso transparente aos diversos repositórios de dados da infra-estrutura,independentemente de sua localização e natureza da informação;

4.2. Casos de uso 39

• Disponibilidade de ferramentas para análise e elaboração de anotações clíni-cas em IM;

• Facilidade de acesso oferecida a diferentes usuários, divididos em grupos,onde cada grupo possui um conjunto de atribuições, as quais devem ser con-troladas por mecanismos de controle de acessos sensíveis ao contexto do usuá-rio e suas atribuições;

• Ferramentas para anonimização de IM;

• Suporte ao armazenamento e visualização de documentos clínicos multimídia(IM, sinais, gráficos e textos);

• Suporte ao armazenamento e execução remota de métodos de processamentode IM;

• Inclusão de políticas de revisão e certificação dos conjuntos de dados armaze-nados.

Ainda, no que envolve os requisitos e objetivando assegurar a compatibilidadedos conjuntos de dados, independentemente de seu uso, é imprescindível que cadaconjunto seja devidamente documentado (descrições do conteúdo, modalidade, con-texto de aquisição, indicação do gold standard, etc.).

4.2 Casos de uso

Durante a modelagem da base de IM e demais aplicações foi utilizada uma téc-nica bem estabelecida de engenharia de software, baseada em análise orientadaa objetos e padrões de projetos (JACOBSON; BOOCH; RUMBAUCH, 1982; FOWLER,1998). Em adição, a linguagem única de modelagem (Unified Modeling Language– UML1) (ERIKSSON; PENKER, 1998) foi empregada na construção dos diversos dia-gramas do projeto.

4.2.1 Modelagem dos casos de uso: O conceito

Usualmente, a modelagem de casos de uso (use case) é realizada no início dodesenvolvimento para entendimento do comportamento funcional de um sistema,

1http://www.uml.org

40 Base de Imagens Médicas: Modelagem

principalmente aqueles que requerem interações de múltiplos usuários (LEF-

FINGWELL; WIDRIG, 2003). Tradicionalmente, os use cases são utilizados em con-junto com o processo de modelagem do ambiente do sistema. Um modelo de use casedivide a construção do sistema em duas partes: (a) o sistema em si e (b) os com-ponentes que interagem com o sistema. Os componentes são referenciados comoatores. Os atores não se restringem apenas a pessoas; estes podem ser outros sis-temas, equipamentos ou uma entidade capaz de interagir ou executar alguma açãono sistema objeto da modelagem. Como exemplo, os atores num modelo de use caseda Radiologia podem ser os radiologistas, médicos assistentes, pacientes, técnicos,estudantes, pesquisadores, bem como o PACS ou o HIS. Um modelo de use casedefine um sistema com base nas interações dos atores com o sistema em questão.Por meio dos use cases, pode-se especificar claramente como, por quê e quando osatores interagem com sistema.

Um use case pode refletir um simples cenário, o qual define um processo envol-vendo o sistema sob modelagem. Formalmente, um use case é uma seqüência deeventos que resulta em algo de valor para o usuário. Um use case descreve: (a) osatores envolvidos no cenário, (b ) os objetivos dos atores (por que os atores intera-gem com o sistema), (c) o início de um evento e as pré-condições para que o mesmoevento seja iniciado, (d ) o fluxo principal e (e) o estado final do processo em termosde pós-condições. A Figura 4.1 ilustra essa descrição do fluxo de desenvolvimentode use cases.

Figura 4.1 Componentes de um use case – UML (http://www.uml.org).

Usualmente, os relacionamentos entre os cenários de use cases são especificadosnum outro diagrama de use case com o intuito de promover o entendimento dosistema como um todo. A proposta dos use cases é que, com o seu desenvolvimento,

4.2. Casos de uso 41

o projeto e a análise do sistema sejam metodologicamente formulados, guiandopara uma implementação que tende a se igualar aos requisitos do usuário e àssuas expectativas.

4.2.2 O conceito da aplicação de base de IM

O conceito geral da aplicação de base de IM pode ser resumido em três cenáriosprincipais:

1. Um desenvolvedor de métodos de processamento de IM deseja testar um mé-todo recém-criado. Tradicionalmente, um método de processamento de IM édesenvolvido para realizar uma tarefa específica dentro de um domínio. Apósa validação dos modelos matemáticos e sua implementação, é necessário tes-tar a manipulação de IM com o novo método. A seleção manual de IM quepossuem determinadas características (IM que representam um certo domí-nio), além de cansativa, não é uma tarefa muito fácil. Nesse cenário, umafuncionalidade interessante para este desenvolvedor é a possibilidade de for-necer um conjunto de parâmetros de pesquisa – como região anatômica, mo-dalidade, patologia ou requerer IM de indivíduos normais – e a aplicação debase de IM retornar uma lista de casos clínicos com IM que satisfazem es-ses critérios. Dessa lista, o desenvolvedor pode selecionar um conjunto de IMpara avaliar o método proposto.

2. Supondo que o mesmo desenvolvedor do cenário 1 tenha feito a validação deseu método num conjunto de IM selecionadas a partir da base de IM e decidapublicar este método. Paralelamente à publicação (descrição da metodolo-gia como num artigo científico), o mesmo desenvolvedor também pode colocarà disposição de outros usuários a implementação do método (código fonte ebinário), referenciar as IM utilizadas nos testes, as IM pós-processadas, a do-cumentação do processo de análise e os resultados dispostos numa planilha.

3. Outro desenvolvedor propõe uma nova abordagem ou adaptação de um mé-todo desenvolvido anteriormente. No segundo cenário o desenvolvedor dispo-nibilizou um conjunto de dados sobre o método desenvolvido. O desenvolvedordeste cenário (cenário 3) pode recuperar este conjunto de dados, reproduzir oambiente de desenvolvimento e extrair as mesmas análises do desenvolvedoranterior. Em caso de adaptação, a partir da implementação do método an-terior, a tendência é que a nova implementação se torne mais rápida, coma possibilidade de testá-la no mesmo conjunto de dados. Neste caso, torna-

42 Base de Imagens Médicas: Modelagem

se possível fazer comparações com os resultados produzidos por outro(s) mé-todo(s), num mesmo conjunto de dados.

Estes três cenários – não excludentes entre si – ilustram de forma seqüencial osprincipais casos de uso do ambiente de base de IM deste trabalho e seu objetivo emfornecer dados para o desenvolvimento de métodos de processamento de IM, cujavisão conceitual é apresentada na Figura 4.2.

Figura 4.2 Visão conceitual da base de IM.

Evidentemente, para se obter êxito em qualquer um dos cenários, é necessá-rio que a base de IM tenha conjuntos de dados para avaliações. Esses conjuntoscompõem-se de IM com informações associadas, incluindo gold standards e ano-tações. Além dos desenvolvedores dos métodos de processamento de IM, na Fi-gura 4.2 também é mostrada a área médica (radiologistas, residentes, preceptores,etc.) como ator. A área médica é a fonte das informações clínicas (casos clínicoscom IM, gold standards, anotações, laudos, etc.). É esperado que as informaçõesque alimentarão os repositórios de dados sejam fornecidas por diversos usuários.Dessa forma, os conjuntos de dados enviados para armazenamento devem passarpor um controle de qualidade realizado por moderadores especialmente designados.Este controle visa fornecer garantias em termos da validade dos conjuntos de dados

4.2. Casos de uso 43

utilizados nos testes. Exemplificando, quando um radiologista ou qualquer outromembro da área médica insere um conjunto de IM e identifica uma imagem comogold standard e/ou incluindo anotações delineando uma região para ser segmen-tada, a validade desse gold standard deve ser certificada por um outro radiologista(com perfil de moderador).

4.2.3 Caso de uso visão geral

O desenvolvimento de um ambiente de base de dados sobre IM, cujos conjun-tos de dados serão acessados por diversos usuários e estes podem editar os dados,exige que os casos de uso sejam cuidadosamente modelados. A principal motiva-ção para isso deve-se à necessidade de implementar uma aplicação que atenda damelhor forma possível aos requisitos, tanto da aplicação de base de IM, quanto dosusuários, bem como ofereça condições de melhor uso dos recursos que a aplicaçãooferece.

O caso de uso geral, apresentado na Figura 4.3 (ainda sem considerar todos osrequisitos levantados), oferece a visão geral de um repositório de materiais (casosclínicos, IM, gold standards, etc.). Este repositório disponibiliza acesso a usuáriosregistrados que, por meio de um navegador de Internet, podem enviar materiaispara armazenamento e compartilhamento, bem como recuperar esses conjuntos dedados. De acordo com a Figura 4.2, o caso de uso identifica os moderadores e estessão incumbidos da avaliação e certificação dos casos clínicos.

Figura 4.3 Diagrama de caso de uso geral da aplicação.

Detalhando o caso de uso da Figura 4.3, a abordagem proposta consiste nasseguintes idéias básicas: a) desenvolvimento de uma infra-estrutura robusta e es-calável para bases distribuídas de IM; b) prover acesso a diferentes usuários e queestes possam criar e armazenar conjuntos de dados; c) todos os conjuntos de da-

44 Base de Imagens Médicas: Modelagem

dos armazenados devem ser validados por usuários especialistas e que possuempapel de moderador; d) possibilitar que os usuários, independentemente de sualocalização geográfica, possam pesquisar e recuperar IM (muitas das quais com in-formações clínicas), IM pós-processadas, gold standards, documentos, métodos eaplicações de processamento de IM.

Figura 4.4 Visão geral do projeto.

A Figura 4.4 estende e detalha a figura do primeiro caso de uso. Este novo dia-grama apresenta uma visão, ainda macro, dos usuários e tarefas que estes podemrealizar. Cada usuário é registrado com um papel e cada papel é associado a umconjunto de operações permitidas. Todas as autorizações concedidas são avalizadaspor um modelo de controle de acessos e autenticação, baseado em papéis e sensívelao contexto do usuário. Em resumo, o modelo de caso de uso proposto destaca trêsgrupos distintos de usuários:

1. Administrador: é o usuário responsável por manter o sistema em funciona-mento, bem como organizar as políticas de controle de acesso e uso da aplica-ção.

4.2. Casos de uso 45

Figura 4.5 Gerenciamento das informações da base de IM.

2. Pesquisador: uma vez que o projeto tem por objetivo oferecer uma infra-es-trutura para armazenamento de IM e métodos de processamento dessas ima-gens, este grupo foi dividido em dois. O primeiro, formado por profissionais daárea Médica (radiologistas, preceptores ou residentes), os quais terão a impor-tante missão de organizar, criar e certificar conjuntos de dados inseridos nabase, como também, serão os principais usuários das ferramentas de pesqui-sas (uso e criação de um arquivo didático digital). O segundo grupo é formadopor pesquisadores da área de processamento de IM, os quais acessarão a basecom o intuito de realizar as tarefas descritas na subseção anterior.

3. Moderador: pelo fato de que os conjuntos de dados serão inseridos por di-ferentes usuários, visando assegurar a qualidade, todos os conjuntos serãoavaliados por usuários com papel de moderador. Estes serão os responsáveispor avaliar, corrigir, validar, rejeitar e/ou certificar cada um dos conjuntos dedados.

Os usuários com mais atribuições são os pesquisadores e os moderadores. AFigura 4.5 apresenta grande parte dos casos de uso associados a estes usuários.Embora não conste nesta figura, como já mencionado, a execução de cada umadas operações é autorizada pelo mecanismo de controle de acessos identificado naFigura 4.4 como um ator. De modo geral e de acordo com as regras criadas nomecanismo de controle de acessos, ao pesquisador estão disponíveis as operações

46 Base de Imagens Médicas: Modelagem

de submissão e pesquisa/recuperação. E, analogamente, aos moderadores cabem asoperações de pesquisa/recuperação e validação/certificação dos diferentes conjuntosde dados.

4.2.4 Caso de uso: arquivo didático em Radiologia

Em resposta às colaborações dos profissionais da área Médica – a princípio osatores incumbidos de alimentar a base com casos clínicos de diversas naturezas– o trabalho inclui a possibilidade de recuperar esses casos clínicos e utilizá-losem atividades de treinamento em Radiologia. Tal possibilidade representa a opor-tunidade de armazenar e documentar casos clínicos tidos como “interessantes” ou“raros” e que merecem especial atenção. Numa instituição que atua nas áreas deensino, assistência e pesquisa, tal arquivo oferece meios para preservar, com lon-gevidade, a memória dessa instituição.

A disponibilidade da base dados deste trabalho como um arquivo didático emRadiologia é apresentada como a visão de um subconjunto de dados e aplicações.Esta visão é fornecida por meio do modelo de controle de acessos baseado em papéis(CABP) que será descrito mais adiante.

O fundamento da aplicação de base de IM é o armazenamento de IM e infor-mações de diagnóstico. Usualmente, essas informações são disponibilizadas pormeio dos seguintes grupos: 1) Apresentação do Caso Clínico; 2) História Clínica; 3)Achados; 4) Discussão; 5) Referências; 6) Diagnóstico provável; 7) Comentários.

O modelo conceitual do arquivo didático consiste na disponibilidade de uma in-terface, pela qual os usuários possam fazer inserções de casos e realizar pesquisaspor meio de diferentes critérios. Adicionalmente, a interface oferece modos de trei-namento, que ocultam certos grupos de informações e oferecem ferramentas paraauto-avaliação. O modelo proposto neste trabalho (Figura 4.7) estende a concepçãoinicial do repositório de documentos clínicos, agregando outras funcionalidades,como: questões associadas ao caso clínico, pontuação, edição de laudo temporário,listas de discussão e bate-papo (chat). Cada uma dessas funcionalidades é descritaabaixo:

• Elaboração de laudo de teste: permite que usuários (residentes) possam abrircasos clínicos, ocultando as informações diagnósticas e visualizar a apresen-tação do caso clínico e as IM, elaborar laudo e, posteriormente, comparar como laudo inserido pelo autor do caso ou enviá-lo para ser validado por um mo-derador.

4.2. Casos de uso 47

Figura 4.6 Caso de uso: arquivo didático em Radiologia.

• Questões: na criação de um caso clínico, pode-se anexar questões de múltiplaescolha, com apenas uma resposta correta. Este recurso poderá ser utilizadonos modos de treinamento, onde será possível, a cada resposta correta, acu-mular pontos e, ao final da sessão, apresentar o resultado da avaliação aousuário, incluindo os tempos gastos para fornecer resposta a cada questão.

• Lista de discussão: uma vez que os diversos usuários poderão acessar os ca-sos clínicos e enviar questões aos demais usuários, complementar respostase conceitos relacionados ao caso clínico, semelhante ao portal da bibliotecaeletrônica Wikipedia2, sempre com a supervisão de um moderador. Esta fun-cionalidade possibilita criar uma grande base de conhecimento fruto das opi-niões e discussões entre os usuários.

• Bate-papo (chat): objetiva oferecer maior interação entre os especialistas e/ouresidentes no contexto da discussão de casos clínicos, com possibilidade desalvar a conferência.

Igualmente ocorre para todo o sistema, as autorizações de uso dos recursos doarquivo didático (acesso, submissão e edição de materiais) são concedidas pelo me-canismo de CABP. Analogamente, todos os materiais submetidos e editados passampela avaliação de um revisor (moderador).

2http://www.wikipedia.org

48 Base de Imagens Médicas: Modelagem

Figura 4.7 Caso de uso estendido do arquivo didático.

4.2.5 Caso de uso: avaliação de métodos de processamento

de IM

O processo de avaliação de algoritmos, métodos e software de processamentode IM é uma atividade crítica (SANTOS; FURUIE, 2005), porém, muito necessáriapara fins de viabilizar o uso adequado destes em atividades cotidianas. O escopodeste trabalho se restringe a: 1) prover recursos para armazenamento de IM; 2)disponibilizar essas imagens para realização de testes; 3) armazenar métodos, do-cumentos, imagens pós-processadas e gold standards; e referenciar IM utilizadasno processo de avaliação; 4) documentações e publicações relativas aos métodos deprocessamento de IM; 5) permitir que os usuários utilizem esses dados em tarefasde avaliação e armazenem os resultados. O que se pretende com tudo isso é cum-prir a primeira etapa do processo de avaliação: possuir conjuntos diversificados dedados para desenvolver avaliações mais abrangentes. Entretanto, num processode avaliação são necessárias métricas e metodologias, as quais ficarão a cargo dodesenvolvedor ou avaliador do método. Porém, independentemente da metodolo-gia e métrica adotadas, é imprescindível documentar os procedimentos utilizadosna avaliação para uso destes em futuras avaliações e/ou comparações com outros

4.2. Casos de uso 49

métodos e cenários.

Figura 4.8 Caso de uso: avaliação de métodos de processamento de IM.

A Figura 4.8 apresenta o diagrama de caso de uso geral, onde são identificadosos atores (pesquisador e moderador), bem como a comunicação com o sistema decontrole de acessos. Basicamente, as operações nesse módulo resumem-se ao usuá-rio pesquisar casos clínicos, selecionar os que são de seu interesse, baixá-los, pro-cessar as IM, analisar e documentar os resultados, submeter o método (arquivos-fonte e/ou binários), documentos e aguardar o resultado da avaliação do métodopelo moderador.

O armazenamento do método de processamento de IM, as publicações relaciona-das ao método também podem ser armazenadas, bem como as referências das IMutilizadas durante os testes. O modelo também suporta o armazenamento de publi-cações relacionadas aos métodos de processamento de IM, referenciando o conjuntode dados utilizado nos processos de avaliação.

Outro recurso, disponível aos usuários pesquisadores e apresentado como pro-

50 Base de Imagens Médicas: Modelagem

cessamento remoto, consiste na verticalização do uso da base de IM de forma queum usuário pode desenvolver um plug-in e adicioná-lo à infra-estrutura para usodireto das informações contidas nas bases de dados. Isto é feito por meio de umaplataforma que acomoda métodos de processamento de IM na forma de plug-ins epermite executá-los remotamente. Estes métodos podem utilizar os conjuntos dedados da base para processar e, ao final, o executor do plug-in devolve os resultadosdo processamento ao usuário requisitante.

4.3 Modelo de dados para base de IM

Como mencionado, a base de IM é o local onde os diferentes tipos de imagens,de diferentes modalidades, adquiridas em diversos contextos clínicos são armaze-nadas. Além de IM, a base também armazena um conjunto de informações comoo contexto de aquisição, as condições clínicas do paciente, anotações sobre IM, im-plementações de métodos de processamento, IM pós-processadas e suas análises.Analogamente, para manter toda essa infra-estrutura em funcionamento, existemas ferramentas administrativas, o serviço de revisão, o controle de acessos, o ser-viço de pesquisa e recuperação de dados locais e a partir de outras bases de IM e ainterface para execução e armazenamento de plug-ins de processamento de IM.

A natureza do tipo de dado IM e informações associadas exige uma forma es-pecial de tratamento das informações (TAGARE; JAFFE; DUNCAN, 1997), diferente-mente da tradicional abordagem de entidade-relacionamento (CHEN, 1990). Dessaforma, a modelagem também envolveu a criação uma estrutura de dados capaz desuportar e manipular, de forma semelhante, os diferentes tipos de dados. Para talpropósito, a solução encontrada foi a criação de um objeto genérico (uma interface,nos conceitos de orientação a objetos), denominado documento clínico. O documentoclínico é um tipo abstrato de dado, a partir do qual se pode criar os diferentes ti-pos de documentos que serão armazenados. O modelo de base de IM aqui propostoconta com um repositório de instâncias de documento clínico, as quais constituemtemplates para o armazenamento de dados na base.

Espera-se grande utilização das ferramentas de pesquisa e recuperação. Emresumo, a recuperação de informações baseia-se no seguinte fluxo: (1) o usuárioenvia a requisição de busca (conjunto de critérios); (2) O servidor recebe e processaesta requisição, retornando as IM e informações associadas a estas e, finalmente,exibe as IM na forma de thumbnails; (3) a partir da lista de resultados, o usuáriopode solicitar a visualização das IM na resolução de aquisição (original). Ainda, narecuperação, o usuário pode optar por fazer o download do material (caso clínico

4.4. Controle de acessos 51

ou método de processamento e as imagens propriamente ditas). Para uso em ati-vidades didáticas, dependendo do modo de treinamento selecionado, alguns gruposde informações do caso clínico são ocultados. O conjunto de operações – processa-mento, anotação, exclusão e inclusão – é oferecido a certos usuários por meio depolíticas definidas no serviço de controle de acessos. Por exemplo, a inclusão deum novo caso clínico ou método de processamento de IM é permitida a todos osusuários, porém, por razões de segurança, a exclusão é permitida somente ao pro-prietário da informação submetida (antes da validação desta pelo moderador) oupelo administrador do sistema. De modo similar, as certificações somente poderãoser realizadas por moderadores especialmente designados.

4.4 Controle de acessos

Muitos dos projetos de segurança em sistemas de informações clínicas têm sidodesenvolvidos com vistas à criptografia e autenticação (KOBAYASHI; FURUIE, 2005).Embora sejam importantes, a criptografia e autenticação não são suficientes paracontrolar o acesso a aplicações como uma base de IM. Ambas somente podem con-trolar os aspectos relativos à autenticidade e sigilo, mas não conseguem gerenciaros diferentes tipos de acesso praticados pelos usuários, de modo a manipular asrestrições no âmbito de sua individualidade, operações permitidas, conjuntos dedados que podem ser recuperados, contextos e controles de sessões.

O controle de acessos é uma parte importante do projeto de sistemas computa-cionais multiusuários. Segundo Sandhu e outros, “o acesso é definido como o direitoadquirido por um usuário para executar certas operações sobre um determinadoobjeto” (SANDHU et al., 1996). Exemplificando isto, um usuário (sujeito) pode tero direito de alterar (operação) informações demográficas do paciente num certoprontuário (objeto), mas não a concessão de excluir o prontuário.

Os modelos de controle de acessos podem ser divididos em três classes prin-cipais (LAMPSON et al., 1992): a) obrigatório (mandatory); b) arbitrário (discreti-onary); c) controle de acessos baseado em papéis – CABP. Tradicionalmente, osusuários com um conjunto diverso de qualificações e responsabilidades acessam osdiferentes sistemas de informação. Tais responsabilidades podem ser mapeadasem vários papéis. Como tal, as abordagens de CABP são apresentadas como ummecanismo bastante flexível no que tange a regulamentação do uso de sistemasclínicos (SANDHU et al., 1996). Neste modelo, ao invés das permissões serem atri-buídas a um usuário em particular, estas são associadas a um papel e este, por suavez, atribuído a um usuário, conforme apresentado na Figura 4.9.

52 Base de Imagens Médicas: Modelagem

Figura 4.9 Modelo conceitual do CABP (SOHR; AHN; MIGGE, 2005).

A noção de papéis é um requisito importante na criação das regras de auto-rização num sistema de CABP. Objetivando melhor uso desta abordagem, nestetrabalho, esta noção é considerada em conjunto com os seguintes grupos de infor-mações:

• Domínio: refere-se à(s) área(s) do conhecimento clínico à(s) qual(is) o usuárioestá vinculado. Como exemplo, num modo padrão de acesso, as IM da área deginecologia e obstetrícia não estão acessíveis aos usuários registrados apenasna área de neurorradiologia.

• Semântica do conteúdo das IM: o acesso às IM também poderá ser contro-lado a partir do conteúdo semântico destas. Por exemplo, a seleção de umconjunto de IM que contêm um certo tipo de microcalcificação em imagens demamografia, como padrão, esta seleção não é oferecida a usuários de outrosdomínios fora da mastologia.

• Localização: refere-se ao lugar a partir do qual o usuário está acessando asinformações. Vários sistemas usam a identificação do local de acesso para,também, identificar o domínio e validar o acesso. Uma vez que o modelo geraldeste projeto oferece a possibilidade de criação de vários locais de armazena-mento, compondo uma base de dados distribuídos, certas operações são proi-bidas aos usuários quando estes acessam a aplicação a partir de um outro siteque não o de origem. Exemplificando, um usuário com papel de moderadorpoderá somente certificar materiais no site onde foi registrado com este papel,o mesmo vale para os administradores.

4.4. Controle de acessos 53

• Tempo: quando conectado (“logado”) ao sistema, por meio de uma sessão, ainatividade dessa sessão por um certo período de tempo resulta na finalizaçãoda mesma.

• Propriedade: embora os domínios estabeleçam relações para acesso ao con-teúdo das informações, somente isso não é suficiente. Ainda se faz necessárioestabelecer uma relação entre os conjuntos de dados contidos na base, quemos inseriu e quem está tentando acessá-los. Esta relação é utilizada nas ope-rações de edição dos materiais.

Figura 4.10 Modelo padrão de CABP (MOTTA; FURUIE, 2003).

Visando atender aos requisitos listados acima, foi desenvolvido um modelo queestende os tradicionais modelos de CABP (THOMAS, 1997) e adequa o modelo pro-posto por Motta e Furuie (MOTTA; FURUIE, 2003) para os propósitos deste trabalho.O modelo de CABP aqui proposto contempla as especificações do relacionamentopapel–permissão e um conjunto específico de restrições, de modo a relacionar asautorizações concedidas ao usuário que possui um determinado papel. Esta práticaobjetiva possibilitar que o controle de acessos seja constituído de políticas específi-cas, flexíveis, baseadas no contexto do uso da aplicação e, futuramente, no conteúdodas informações. Basicamente, os componentes principais do modelo (Figura 4.10)são: os usuários, papéis, permissões, o relacionamento usuário-papel (user-role –U-R) e o relacionamento papel-permissão (role-permission – R-P).

A extensão do modelo padrão de CABP refere-se à inserção do contexto de am-biente de execução (Figura 4.11). Tal extensão foi dividida em duas partes, ondea primeira introduz a noção de atributos do usuário objetivando caracterizar osdiferentes grupos por meio de atributos como: identificação, domínio e localiza-ção. A informação do domínio possibilita, entre outras coisas, agrupar os conjuntosde objetos/sujeitos para fins de gerenciamento dos conteúdos de interesse de cadausuário. Este conceito é muito similar ao conceito de diretórios num sistema de

54 Base de Imagens Médicas: Modelagem

Figura 4.11 Extensão do modelo de CABP (MOTTA; FURUIE, 2003) para base de IM.

armazenamento hierárquico de arquivos, onde uma autorização associada a um do-mínio é, recursivamente, propagada a seus subdomínios e objetos internos. Quantoà localização, esta informação permite limitar a realização de certas operações (a-tualizações e certificações) somente a usuários cadastrados no site.

A segunda parte da extensão diz respeito ao relacionamento papel–permissão,considerando também as restrições obtidas a partir do contexto, de modo a as-segurar que as autorizações sejam adequadamente concedidas. A concessão dasautorizações também baseia-se no conjunto de restrições impostas pelo domínio dousuário. Dessa forma, cada relacionamento papel–permissão é uma regra que es-pecifica, além dos modos de acesso, quem detém a permissão para manipular certosconjuntos de dados, em função das restrições introduzidas a partir do contexto doambiente de execução, de forma que um mesmo usuário tenha diferentes modos deacesso ao sistema, em diferentes contextos. Esta abordagem introduz o conceito devisões apresentado na Figura 4.12.

4.5 Serviço de revisão dos documentos

A publicação de documentos, mesmo que eletrônicos, é composta de várias eta-pas incluindo o planejamento, aquisição de conteúdos, edição e distribuição. A

4.5. Serviço de revisão dos documentos 55

Figura 4.12 Diferentes de visões do mesmo usuário.

Figura 4.13 apresenta uma visão geral deste processo, mimetizando o relaciona-mento entre essas atividades, onde a primeira etapa consiste no planejamento daelaboração e aquisição de conteúdo; a segunda na edição por meio de um modelo dedocumento; e, finalmente, a terceira que consiste na distribuição eletrônica destedocumento, tornando-o visível a todos os usuários.

Figura 4.13 Atividades de publicação.

Todo material inserido nos diversos sites deve ser revisado e validado por umusuário com papel de moderador. Isto se deve à necessidade de utilizar os conjuntosde dados de cada site em processos de avaliação. Dessa forma, a prática da revisãoobjetiva assegurar a qualidade dos materiais inseridos e, também, fornecer maiorcredibilidade ao conteúdo das informações.

A Figura 4.5 ilustra o processo de inserção de materiais na base (casos clínicose/ou métodos de processamento de IM). Neste diagrama, o moderador tem a incum-

56 Base de Imagens Médicas: Modelagem

bência de avaliar os novos materiais inseridos. Este ator é, dentro de seu domínio,o encarregado de fazer a revisão dos materiais inseridos e, após esta revisão, osmateriais podem receber os seguintes status (Figura 4.14): em elaboração, em ava-liação, em revisão, com pendências, aprovado e rejeitado. Além da permissão parafazer revisões, o moderador também possui atribuições de editor, podendo melho-rar a apresentação do material, inclusive, sugerir título adequado, relacionar estematerial a certo(s) domínio(s), bem como criar referência para outro(s) material(is).

Figura 4.14 Fluxo do processo de avaliação.

O modelo de revisão de documentos aqui proposto funciona de modo similar aoprocesso de geração de notícias em um periódico, onde é comum os participantesexercerem suas atividades por meio de propostas, aprovações ou fazendo revisões.Dessa forma, internamente, com o final da edição, todo material submetido é vistocomo uma proposta que será avaliada pelo moderador. Por exemplo, um mate-rial recém-inserido fica disponível ao moderador para este decidir se o material éou não relevante para disponibilizá-lo. O moderador ainda pode fazer correções eadequações no material ou relacionar as pendências e reenviá-las ao autor. Esteprocesso é altamente iterativo, repetindo-se até que os critérios de publicação ado-tados em cada domínio sejam satisfeitos ou o moderador decida rejeitar o material.Esquematicamente, este processo é ilustrado por meio do diagrama de atividadeapresentado na Figura 4.15.

O modelo de armazenamento proposto neste trabalho também permite que ma-teriais sejam inseridos em partes, ou seja, o usuário pode começar a criação de umcaso clínico numa sessão, finalizar esta sessão e, em outro momento, continuar sua

4.6. Modelo de base distribuída de IM 57

Figura 4.15 Diagrama de atividade para validação/certificação.

edição. Os materiais nessas condições podem ser visualizados pelos demais usuá-rios, porém com status em elaboração. Somente quando o usuário, autor do caso,concluir a elaboração é que este será encaminhado ao moderador para avaliação,passando a ser visualizado com o status em avaliação. Após a avaliação do mode-rador, o status poderá ser: aprovado, rejeitado ou com pendências. Neste último, omaterial volta para o autor e o status será em revisão, até que ele corrija e submetao material para nova avaliação.

4.6 Modelo de base distribuída de IM

A modelagem de todo o trabalho foi centrada na criação de um modelo robusto debase de IM. Para fins de criação desse modelo, até então, neste Capítulo, o modeloproposto foi descrito como uma base de dados com características de armazena-mento centralizado. O trabalho não tem por objetivo tornar-se mais “uma base deIM” com acesso público e armazenamento centralizado. O objetivo também envolvea criação de locais distintos para armazenamento. Assim, os grupos que desejarempoderão instalar o serviço de armazenamento e distribuição, bem como fazer a inte-gração com outras bases de IM, por meio de um componente que realiza a conexão

58 Base de Imagens Médicas: Modelagem

com diferentes bases de IM externas à infra-estrutura deste trabalho.

O modelo de base distribuída de IM aqui proposto permite que diferentes gru-pos possam criar seus próprios locais de armazenamento (Figura 5.3), com totalcontrole sobre a organização dos dados e supervisão. Contudo, é condição que cadasite se conecte à infra-estrutura geral, de forma a cumprir fielmente o objetivo docompartilhamento dos dados de cada base. Outra característica do modelo é o re-positório de interfaces para conexão com outras bases de IM. Este recurso viabilizaa integração de conteúdos de diferentes fontes.

As características descritas para o modelo de base IM desse trabalho foram ob-tidas a partir da falta de bases de IM que suportem um número grande de usuáriosconectados simultaneamente e oferecem ferramentas para pesquisa e recuperaçãoem grandes volumes de dados. Tais observações motivaram o projeto de uma infra-estrutura de base de dados distribuída, considerando os seguintes requisitos:

• Escalabilidade: possibilidade de crescimento da infra-estrutura, bem como onúmero de usuários que inserem e recuperam informações.

• Autonomia: cada site tem total autonomia em relação aos conteúdos de seudomínio. Contudo, visando assegurar a qualidade dos dados de toda a infra-estrutura, freqüentemente, estes dados são avaliados por moderadores exter-nos.

• Extensibilidade: adicionalmente à escalabilidade, foi observada a iminênciade crescimento do número de serviços que podem ser oferecidos. Uma inter-face baseada em plug-ins é algo previsto para viabilizar a extensibilidade doprojeto.

• Coordenação: num sistema distribuído, a coordenação das atividades visamanter o funcionamento de todos os componentes, de forma a reagir corre-tamente às mudanças dos conteúdos e mantendo a integridade e consistênciados dados.

A Figura 4.16 apresenta uma visão geral do modelo distribuído que foi imple-mentado. O modelo foi concebido com a intenção de oferecer uma interface seme-lhante a um portal na Internet. Tal interface objetiva prover transparência noacesso aos diferentes conjuntos de dados, mantendo as políticas de permissões eprivilégios de cada usuário em seu respectivo domínio (onde estes foram original-mente cadastrados).

4.6. Modelo de base distribuída de IM 59

Figura 4.16 Visão geral do modelo distribuído.

Na concepção da aplicação gerente de base distribuída de IM, existe um compo-nente “master” que mantém as informações administrativas de todos os locais dearmazenamento disponíveis. Este componente é o responsável por oferecer trans-parência no acesso às informações das diferentes bases. Esta característica per-mite que os conteúdos das diferentes bases de IM sejam apresentados como quenum portal da Internet. Além da gerência de bases distribuídas, este modelo foicriado com vistas à uma aplicação capaz de interrogar e recuperar dados a partirde outras bases de IM com acesso público. Para tanto, também foi especificado umrepositório de interfaces para conexão com bases de IM externas à infra-estruturadeste trabalho. Este repositório armazena a descrição dos parâmetros e formatosutilizados para pesquisa em diferentes bases, bem como a formatação das informa-ções recuperadas a partir dessas bases.

60 Base de Imagens Médicas: Modelagem

4.7 Discussão

A modelagem da base de IM foi cuidadosamente elaborada objetivando aten-der todos os requisitos apresentados, contemplando as necessidades de controle deacessos, recursos para avaliação de software e métodos de processamento de IM,modelo de arquivo didático digital e modelo distribuído de armazenamento de da-dos. O modelo do serviço de revisão de documentos, visa oferecer uma ferramentade arbitragem para garantir a qualidade dos conjuntos de dados, primeiramentedos conjuntos locais e, conseqüentemente, na infra-estrutura como um todo.

A possibilidade de armazenar diferentes tipos de documentos clínicos por meiode templates constitui uma característica bastante poderosa, principalmente, na-quilo que se busca em termos de flexibilidade e escalabilidade no armazenamentode informações clínicas.

O modelo de dados distribuído reflete o objetivo de integrar os diferentes gru-pos e instituições de pesquisa. Contudo, mais do que isto, além da possibilidadede facilitar a criação de sites para armazenamento de IM, o modelo prevê o de-senvolvimento de interfaces capazes de interrogar e recuperar dados a partir deoutras bases de IM de acesso público. Esta característica satisfaz os requisitosde escalabilidade e futuras adições de novas funcionalidades à infra-estrutura. Emadição, o grande benefício dessa abordagem é a possibilidade de rápido crescimentodo volume de dados disponíveis na infra-estrutura, a partir dos conjuntos de dadosexistentes em bases externas, às quais a infra-estrutura poderá conectar-se.

Capítulo

5BASE DE IMAGENS MÉDICAS:

ARQUITETURA E IMPLEMENTAÇÃO

“There are painters who transform the sun into a yellow spot, butthere are others who, thanks to their art and intelligence,

transform a yellow spot into the sun.”PABLO PICASSO

Uma etapa importante do processo de implementação de uma base de IM parauso em múltiplos propósitos é o desenvolvimento de um ambiente sobre o qualas aplicações sejam desenvolvidas. Tal ambiente deve ser robusto e escalável osuficiente para suportar a inserção de novas funcionalidades, as quais serão imple-mentadas na forma de componentes de software.

De acordo com os requisitos e modelagem apresentados no Capítulo anterior, aimplementação desse ambiente é baseada num modelo cliente-servidor de três ca-madas (ECKERSON, 1995). Primeiramente, o ambiente objetiva fornecer ferramen-tas para acesso transparente ao armazenamento e recuperação de dados a partirdos diversos repositórios. Em segundo, em termos de um ambiente escalável, estefoi implementado de modo similar a um barramento, sobre o qual as aplicações(componentes de software) ficam disponíveis. Por último, o ambiente deve disporde um conjunto de ferramentas que fazem a apresentação dos dados.

Iniciando com a apresentação e análise dos requisitos técnicos e funcionais, esteCapítulo apresenta a arquitetura da base de IM e segue com implementação dainfra-estrutura para suporte aos componentes de software.

61

62 Base de Imagens Médicas: Arquitetura e Implementação

5.1 Requisitos técnicos

Devido à abrangência dos propósitos deste projeto, faz-se necessário o cumpri-mento de uma série de requisitos, tanto técnicos quanto operacionais. A seguir, sãoelencados, entre outros, alguns desses requisitos, os quais foram implementadosneste trabalho:

1. Grande número de usuários: o projeto utiliza a natureza onipresente da Inter-net para acesso e distribuição de informações. O acesso é oferecido a usuárioscom objetivos diversificados. Para tanto, foi implementado um mecanismo decontrole de acesso baseado em papéis.

2. Gerenciamento dos dados: uma vez que as informações serão utilizadas empesquisas e divulgação de resultados referenciando o conteúdo da base, faz-senecessário o controle das alterações e versionamento dos dados armazenados.

3. Segurança das informações: a maior parte dos conjuntos de dados será ori-ginária de atividades clínicas. Dessa forma, toda e qualquer informação quepossa identificar um paciente ou profissional envolvido diretamente na assis-tência é removida.

4. Tempo de resposta: o tempo é um fator crítico em operações realizadas emgrandes bases de dados, de modo especial na transmissão de IM. Neste traba-lho é utilizada uma abordagem que exibe as IM em formatos que podem serfacilmente carregados em aplicações web (GIF animado ou JPEG), de modoque o usuário tenha uma visualização preliminar das IM (thumbnails) e, casoqueira, pode selecionar uma série de IM e o sistema retorna o conjunto de IMpertencentes à série selecionada na resolução utilizada no processo de aquisi-ção.

5. Interatividade: além de uma boa interface gráfica para apresentação dos da-dos, o sistema necessita de mecanismos capazes de interrogar bases públicasde IM.

6. Escalabilidade: característica relevante na manipulação de grandes volumesde informação, cuja tendência é de crescimento;

7. Flexibilidade: possibilidade de armazenar IM codificadas em diferentes for-matos de arquivo.

8. Acesso integrado: possibilidade de acessar diferentes fontes de dados utilizan-do-se de uma mesma sintaxe para pesquisa em diferentes repositórios.

5.1. Requisitos técnicos 63

9. Arquitetura expansível: como novas bases de dados de IM podem tornar-sedisponíveis, também são necessárias formas de incorporar essas bases à infra-estrutura.

10. Mínimo impacto em bases de dados existentes: no que tange a construção deinterfaces e gateways para inter-operação com outras aplicações, a degradaçãodo desempenho causada pelo acesso da base de IM a outros sistemas – e vice-versa – deve ser mínima.

11. Flexibilidade em buscas de informações: a base de IM deve oferecer grausde liberdade nas tarefas de pesquisa e recuperação, viabilizando a realizaçãode uma variedade de buscas de diversas formas, uma vez que os formatos econteúdos de documentos clínicos nem sempre são pré-definidos.

12. Flexibilidade na apresentação dos dados: permitir ao usuário selecionar di-ferentes formatos de apresentação dos resultados de suas interações com osistema. Existem muitos padrões para representação de certos tipos de dadosem particular. Por exemplo, o padrão DICOM define um protocolo para in-ter-operação entre equipamentos, representação de IM e informações relacio-nadas ao paciente. De forma alternativa, HL-7 Extensible Markup LanguageClinical Document Architecture (HL-7 XML-CDA) (PATERSON et al., 2002) tam-bém define modelos de dados para informações clínicas. Em alguns casos,estes modelos podem se sobrepor, bem como podem ser inter-referenciadospara atender aos requisitos particulares de certas aplicações. Nessa mesmalinha, tem-se um modelo de interface gráfica adaptável aos dispositivos ondeos dados serão apresentados.

Do ponto-de-vista de sistemas distribuídos, o desenvolvimento dessa infra-es-trutura deve oferecer os seguintes níveis de transparência:

• Acesso e localização: os vários recursos oferecidos pela infra-estrutura devemestar acessíveis de forma transparente a todos os usuários, independente-mente de sua localização geográfica.

• Como a transferência de conteúdos de IM sobre a Internet é algo crítico, ainfra-estrutura dispõe de mecanismos de replicação dos recursos em locaisestratégicos. Tais mecanismos realizam a atualização automática dos dadosem cada local.

• A execução remota de operações de processamento de IM envolve um altocusto computacional. Pelo fato de existir a possibilidade de vários usuários

64 Base de Imagens Médicas: Arquitetura e Implementação

usufruírem desse serviço, a concorrência entre os diversos processos deve sertransparente a todos os usuários.

5.2 Análise dos requisitos funcionais

A utilização de uma aplicação computacional é bastante afetada pelo conjuntode funcionalidades que esta dispõe e pela facilidade em utilizar tais funcionalida-des. No Capítulo anterior foram apresentados os modelos e casos de uso no nívelconceitual – importantes para se compreender as interações entre os usuários e opróprio sistema. Nesta seção são apresentadas as funcionalidades necessárias emcada site e em toda a infra-estrutura.

Nos tradicionais sistemas de base de IM, como os PACS, o índice primário écriado em função do paciente e/ou de seu registro identificador. Neste trabalho,como as informações identificativas de paciente não existem, o centro de informa-ções passa a ser o que está definido como caso clínico. Caso clínico correspondeà apresentação de um cenário, normalmente relatado por um especialista, onde opaciente é considerado uma entidade que disponibiliza um conjunto de informaçõesque motivam o estudo de sua situação clínica. Cada caso clínico é associado a umúnico paciente, porém pode ocorrer de um mesmo paciente ser a entidade fonte deinformações em diferentes casos clínicos.

Figura 5.1 Composição de um objeto de informação da base de IM (caso clínico).

Um caso clínico completo é composto pelos seguintes grupos de informação:

5.2. Análise dos requisitos funcionais 65

principal, estudos, seguimento (acompanhamento), questões, referências na litera-tura e lista de discussão (Figura 5.1). Tais grupos são descritos a seguir:

• PrincipalEste grupo tem por objetivo fazer a apresentação do caso clínico e documentaro contexto da geração de todo o conjunto de informações. O grupo é subdivi-dido em: (1) Identificação: corresponde a um conjunto de informações identi-ficativas do caso clínico, como: título, palavras-chaves, especialidade clínica,autor, afiliação, se o caso poderá ser compartilhado ou não e, por fim, as datasde criação e atualizações; (2) Paciente: informações demográficas do pacienterelacionado ao caso clínico (idade, sexo, etnia, peso, altura, naturalidade e pro-cedência), exceto as informações identificativas; (3) Apresentação: descreve ocontexto do caso clínico, incluindo queixa e duração (sintomas), história pre-gressa da moléstia atual (HPMA), hábitos pessoais, história familiar, examefísico inicial, razão que motivou o estudo clínico e um campo para observações(informações adicionais).

• EstudosContêm o conjunto de exames clínicos associados ao caso. Para cada estudosão armazenados a descrição do estudo, modalidade, região anatômica exami-nada, técnica, achados, discussão, conclusão, patologia, referências e comen-tários. Ainda, vinculado a cada estudo estão as IM, as quais por questões deorganização são agrupadas em séries. As IM podem conter anotações clíni-cas e/ou seleções de região de interesse, bem como fazer referência a IM deestudos anteriores do mesmo caso clínico.

• Seguimento (acompanhamento)Correspondente ao relato das evoluções clínicas e procedimentos adotados du-rante o acompanhamento do caso clínico.

• QuestõesPara atividades didáticas, o autor do caso clínico pode criar um conjunto dequestões com múltipla escolha para uso em treinamentos.

• Referências na literaturaServem como apoio àquilo que é apresentado e descrito no caso clínico, demodo especial na análise dos achados de imagem.

• Lista de discussãoApesar da existência de toda documentação do exame e do caso clínico, algu-mas questões podem ser levantadas pelos usuários e colocadas em discussão,o que poderá enriquecer o conteúdo das informações.

66 Base de Imagens Médicas: Arquitetura e Implementação

De modo semelhante ao que foi proposto para cada caso clínico, pretende-se,igualmente, armazenar os diferentes métodos de processamento de IM, juntamentecom documentações, códigos-fonte, arquivos binários, referências às IM utilizadasem testes e imagens pós-processadas. As IM utilizadas nos processos de avaliaçãodos métodos necessitam ser agrupadas em classes de acordo com sua procedência,neste trabalho foram criados os seguintes grupos (EFMI-WG-MIP, 2002):

• Imagens reais: são imagens adquiridas de pacientes de rotina clínica;

• Imagens de phantoms: são imagens adquiridas a partir de modelos especial-mente construídos e submetidos a processos de aquisição;

• Imagens híbridas: compreendem as imagens adquiridas de pacientes de ro-tina clínica, usualmente pacientes saudáveis. A estas imagens, patologias ouartefatos são adicionados digitalmente;

• Imagens simuladas: corresponde às imagens adquiridas a partir de simula-ções numéricas.

Uma vez que algumas das classes relacionadas acima são específicas para odesenvolvimento de métodos de processamento de IM, as imagens pertencentes aestas classes não serão associadas a um caso clínico real ou completo como descritona subseção anterior. E, ainda, tais imagens não estarão disponíveis na visão doarquivo didático digital.

Com a finalidade de garantir a qualidade do conjunto de dados, torna-se neces-sária a inserção de mecanismos que possibilitem que uma pessoa isenta de qual-quer influência possa analisar os materiais e emitir um parecer. Quando um usuá-rio acessar o conjunto de dados, é importante que ele tenha ciência das avaliaçõesdo conjunto de dados que está acessando.

Entretanto, ocorre que a avaliação de um documento não é realizada imedia-tamente após sua inserção. E, mesmo quando o documento está em elaboração, énecessário documentar os vários estágios de desenvolvimento. Para tanto, serãoutilizados os seguintes estágios (descritos na seção 4.5): em elaboração, em ava-liação, com pendências, em revisão, aprovado e rejeitado. Adicionalmente, para ocaso das IM, o moderador fornece uma nota quanto à qualidade (de 0 a 5) dessasimagens que serve como parâmetro adicional na avaliação do método de processa-mento.

A Figura 5.2 apresenta o fluxo de operação da base de IM, iniciando com a in-serção de casos clínicos (na figura identificado como a criação do caso clínico), onde

5.3. A arquitetura proposta 67

Figura 5.2 Fluxo de operação da base de IM.

o autor inicia a elaboração a partir do grupo identificação, ao longo do tratamentosão realizados exames e, a partir desses exames, são realizados os acompanhamen-tos das evoluções (seguimento). Os desenvolvedores de métodos de processamentode IM podem realizar pesquisas na base, a partir de informações textuais, recupe-rar os conjuntos de dados e utilizá-los nas tarefas de avaliação. Os moderadores,por sua vez, avaliam os conjuntos de dados inseridos. Para certificação desses con-juntos de dados, a aplicação remete automaticamente os casos aos moderadores, deacordo com suas especialidades e áreas de interesse. Após o moderador inserir naaplicação o resultado da avaliação, este resultado é enviado automaticamente, pore-mail, ao autor do caso clínico.

5.3 A arquitetura proposta

Neste trabalho tem sido adotada uma abordagem de base de dados distribuída(Figura 4.16) caracterizada pela criação de uma infra-estrutura que possibilita a se-paração/replicação física dos vários conjuntos de dados. O objetivo é que esta infra-estrutura funcione como um barramento, por meio do qual vários sites estejamconectados. Todos os conjuntos de dados contidos nos sites estarão visíveis por meio

68 Base de Imagens Médicas: Arquitetura e Implementação

de um servidor web, mimetizando um portal. Além de realizar a integração dosdiferentes sites com a mesma arquitetura, a abordagem proposta também viabilizaa integração com outras bases de IM.

A Figura 5.3 apresenta a arquitetura de cada site de base de IM. Cada site é umcomponente cliente do modelo distribuído da Figura 4.16, onde um site é uma basede IM autônoma provida de todas as funcionalidades que atendem aos requisitos ecasos de uso apresentados no Capítulo anterior.

Figura 5.3 Arquitetura da base de IM.

Objetivando a escalabilidade dos serviços, cada site é constituído por componen-tes de software. Cada componente é incumbido de realizar uma tarefa específica einterage com os demais componentes e os serviços da infra-estrutura por meio deinterfaces de software especialmente desenvolvidas. Os componentes principais ebásicos de cada site (Figura 5.4) são: 1) gerenciador de meta-informações; 2) con-trole de acessos baseado em papéis (CABP); 3) sistema de gerenciamento de arqui-vos em disco; 4) ferramentas para criação de casos clínicos, pesquisa e recuperação;5) ferramentas para validação e certificação dos materiais submetidos; 6) repositó-rio de interfaces para conexão com outras bases de IM; 7) broker para interrogarbases de IM externas; 8) servidor de páginas (servidor web).

5.3. A arquitetura proposta 69

Figura 5.4 Visão geral dos componentes da arquitetura das bases de IM e seus relaciona-mentos.

A federação das bases de IM proposta neste trabalho por meio do modelo debase de dados distribuída (Figura 5.5) permite que os diferentes grupos possamcombinar os dados dos diferentes arquivos e apresentá-los numa mesma interface.Segundo Sheth e Larson (SHETH; LARSON, 1990), “uma base de dados federada éuma coleção de arquivos cooperantes, porém autônomos, com comportamento se-melhante à uma única base de dados”.

A arquitetura do modelo distribuído é baseada numa interface comum aos pares(bases de IM federadas à infra-estrutura). Tal arquitetura consiste na apresenta-ção de uma visão comum dos dados, objetivando acesso e integração das informa-ções existentes em diversas bases, distribuídas e heterogêneas de IM. A arquiteturaé composta por quatro componentes, baseados em Web Services (DEITEL et al., 2003):(1) os clientes, (2) o portal, (3) as bases da arquitetura e (4) as bases externas. Oportal é o mediador entre os clientes e as bases de IM, como também é quem faz acoordenação entre as bases de IM, internas e externas, possibilitando a integraçãodessas bases à federação.

Os clientes são aplicações web que recebem e exibem as informações. Os sites sãobases autônomas e heterogêneas que participam da federação. Cada site também

70 Base de Imagens Médicas: Arquitetura e Implementação

Figura 5.5 Arquitetura do modelo distribuído.

implementa serviços que atuam como wrappers e encapsulam suas bases e outrosdetalhes específicos. Tal abordagem oferece uma visão uniforme da aplicação debase de dados distribuída.

Basicamente, o portal oferece duas funcionalidades. A primeira refere-se à im-plementação de um serviço de registro das bases que fazem parte da federação.Como parte do registro, o portal mantém um catálogo de informações sobre as basesde IM. Este registro é utilizado na autenticação dos usuários e tarefas de pesquisa.Por meio da segunda funcionalidade, o portal recebe as requisições de pesquisaoriginárias dos clientes e faz a recuperação das informações como um documentoXML, por meio do serviço de pesquisa e recuperação que distribui a requisição entreos pares. Quando se trata de pesquisa, o serviço de pesquisa e recuperação do portalformata o resultado da pesquisa, recebido a partir dos pares, e retorna este resul-tado ao cliente requisitante. Na recuperação, o mesmo serviço identifica a origemdo material selecionado, recupera este material a partir da origem e o encaminha

5.4. Implementação: a infra-estrutura de base de IM 71

ao cliente requisitante.

5.4 Implementação: a infra-estrutura de base de IM

A infra-estrutura de base de IM deste trabalho foi implementada como umaaplicação Java 2 Platform Enterprise Edition (J2EE) baseada num modelo cliente-servidor (DEPLEDGE; TURNER; WOOG, 1995). Esta implementação (Figura 5.6) pos-sui: (1) camada cliente que consiste num navegador web; (2) camada de apli-cação (servlet com Java Server Pages – JSP) utilizando Jakarta Web Struts Fra-mework (GOODWILL, 2002) e um framework servidor de componentes, o EnterpriseJava Beans (EJB) e (3) camada de persistência que é composta pelo banco de da-dos PostgreSQL, o sistema de catálogo de arquivos e um conjunto de métodos paraacesso às informações desses repositórios.

Figura 5.6 Visão geral da implementação da arquitetura da base de IM.

O pacote de software utilizado para prover interfaces para usuário é o JakartaStruts1, cuja arquitetura utiliza um modelo de apresentação dos dados baseado natrilogia modelo-visualização-controle (model-view-control – MVC) (KRASNER; POPE,1988). Struts é um ambiente de apresentação utilizado para construir aplicaçõesweb usando Java Servlets2 e JSP. Struts usa a arquitetura JSP Model 2 que tam-bém é baseada no padrão de projeto MVC, onde a requisição do cliente é intercep-tada pelo servlet e este manipula o processamento inicial da requisição e determinaqual página JSP será exibida. O Struts também oferece uma biblioteca de tags paraJSP, mecanismos de validação, internacionalização e suporte ao tratamento de er-ros.

1http://struts.apache.org2Servlet é um componente que disponibiliza ao programador de linguagem Java uma interface

para o servidor web (ou servidor de aplicação), por meior de uma API.

72 Base de Imagens Médicas: Arquitetura e Implementação

O modelo de padrão de projetos MVC (GAMMA et al., 1995) viabiliza a decompo-sição da lógica de apresentação a partir da lógica de negócio3. A camada de apre-sentação realiza a preparação dos dados fornecidos pela lógica de negócios paraapresentá-los na aplicação cliente. Tal decomposição oferece maior flexibilidadena apresentação dos dados. Neste trabalho, a lógica de negócio possui os objetosde acesso aos dados que podem ser vistos como um mapeamento objeto-relacional,uma vez que estes mapeiam os documentos clínicos contidos em tabelas para obje-tos de informação, e vice-versa, por meio das operações de criação, leitura, atuali-zação e exclusão.

A camada de apresentação se comunica com os objetos de acesso a dados pormeio do serviço de controle de sessão (session facade) que coordena o acesso à ca-mada de persistência. Durante a execução de uma operação, a comunicação entre osobjetos de acesso a dados e a camada de apresentação ocorre por meio de uma inter-face que encapsula as operações internas da lógica de negócio. A transferência dedados entre a camada de apresentação e os objetos de acesso a dados é realizada pormeio da transferência de objetos serializados (BREG; POLYCHRONOPOULOS, 2001).

Para facilitar interação de novos serviços com os serviços básicos da infra-estru-tura – controle de acessos, autenticação e acesso a base de dados – foi implemen-tado o conceito de classe abstrata (DEITEL; DEITEL, 2001). A Figura 5.7 apresenta,em UML, o modelo geral da classe de serviço utilizada para inserção de materiaisna base de dados do servidor. Neste modelo, a classe ServiceFactory cria asdemais classes de serviço que são requisitadas pelos clientes e estas classes imple-mentam os métodos de segurança e conexão com camada de persistência.

Neste trabalho, as camadas da aplicação se comunicam umas com as outras pormeio de interfaces especialmente desenvolvidas. Sempre que a implementação deuma interface é alterada, mas se a forma de acesso é mantida, as camadas podemcontinuar se comunicando.

5.4.1 Catálogo de arquivos – Data Grid

Uma vez que os documentos clínicos são armazenados fora da base de dadosrelacional e o trabalho é implementado como uma infra-estrutura de base de da-dos distribuída, foi implementado um catálogo de arquivos de documentos clínicos,mantendo a relação de integridade desses documentos com seus “ponteiros” na basede dados relacional que também faz a organização do catálogo de arquivos. Adicio-

3Neste Capítulo, a lógica de negócio é definida como um módulo criado para manipulação dedados relevantes à aplicação, por exemplo validação de um caso clínico.

5.4. Implementação: a infra-estrutura de base de IM 73

Figura 5.7 Modelo geral da classe de serviço para inserção de materiais.

nalmente, a base de dados relacional também faz a federação dos repositórios dedados.

Objetivando longevidade da infra-estrutura, o catálogo de arquivos foi desen-volvido de modo a possibilitar a inserção desta aplicação de base de IM numainfra-estrutura que suporta outros projetos – como o Health Grid (AMENDOLIA et

al., 2004a) – que utilizam as tecnologias de Grid Computing (MAGHRAOUI et al.,2006) para armazenamento, gerenciamento e processamento de dados nos diferen-tes repositórios.

Dessa forma, o catálogo de arquivos foi implementado numa arquitetura deData Grid (STOCKINGER, 2001; CHERVENAK et al., 1999) (Figura 5.8) que imple-menta, entre outras, as seguintes características: replicação e espelhamento dedados, arquivamento em múltiplos locais e serviço de caching.

Do lado do servidor, foi utilizado o pacote de software denominado Storage Re-source Broker (SRB), desenvolvido pelo grupo de pesquisas San Diego Supercom-puter Center da Universidade da Califórnia, em San Diego. Tal pacote oferece

74 Base de Imagens Médicas: Arquitetura e Implementação

Figura 5.8 Arquitetura do Data Grid.

uma forma colaborativa de compartilhamento dos dados. O SRB é uma aplicaçãocliente-servidor que integra recursos distribuídos e heterogêneos usando interfa-ces comuns, disponibiliza uma ferramenta para integrar a manipulação de dados emetadados, bem como faz a combinação de pesquisa e navegação pelos dados. Estepacote de software é certificado pela comunidade Globus Alliance4.

Do lado do cliente (camada de aplicação) é utilizado o Jargon5 que consistenuma interface de programação de aplicações (application programming interface– API) Java criada especialmente para o desenvolvimento de aplicações com inter-faces com sistemas de Data Grid. Esta API manipula a entrada/saída e realizapesquisas em bases de arquivos locais e/ou remotas. Os métodos disponibilizadospela API são bastante similares aos oferecidos pelas classes do pacote java.io.

Diferentemente dos tradicionais sistemas de arquivos, o catálogo de arquivosnão é o proprietário dos arquivos; este catálogo apenas mantém uma associaçãoentre o nome lógico (possivelmente mais que um) e o nome físico do arquivo numsistema de organização de arquivos de um sistema operacional ou num sistema dearmazenamento. Além da localização física do arquivo, para cada arquivo tambémé armazenado o protocolo de acesso, o nome deste e o caminho. O catálogo suporta

4http://www.globus.org/5http://www.sdsc.edu/srb/jargon/index.html

5.4. Implementação: a infra-estrutura de base de IM 75

a replicação de arquivos e armazenamento temporário para uso imediato (seme-lhante a um cache). Também, de modo semelhante a uma das funcionalidades dis-poníveis num sistema multiusuário, os diretórios e arquivos possuem privilégiospara proprietários, grupo e os demais usuários.

5.4.2 Interação com a camada de persistência

Os objetos incumbidos de prover acesso às fontes de dados deste trabalho en-capsulam e tornam abstrato este acesso. De modo a fornecer, às camadas supe-riores, uma visão uniforme que facilita a portabilidade da aplicação. Um objeto deacesso a dados atua como um adaptador entre a fonte de dados (banco de dados oucatálogo de arquivos) e o componente que está utilizando esta fonte. Um objeto deacesso a dados oferece os seguintes métodos:

public void insert(Connection con, <object> bean)

public List find(Connection con, <object> criteria)

public void update(Connection con, <object> bean, <object criteria>)

public void delete(Connection con, <object> bean)

Dessa forma, cada objeto de acesso a dados fornece as operações de inserção,pesquisa, atualização e exclusão para cada esquema de objetos. O object – tipo doparâmetro dos métodos – é um Java Bean6 utilizado pelo objeto de acesso a dadose camadas da aplicação durante a transferência de dados entre elas. O métodoinsert(), recebe o bean com o documento a ser inserido e a conexão com a ca-mada de persistência (con), cria o comando em linguagem estruturada de pesquisa(Structured Query Language – SQL) de inserção (INSERT) a partir das proprieda-des do bean e faz a inserção deste na base de dados.

O método find(), a partir da conexão com a camada de persistência ecriteria (parâmetro de pesquisa), utiliza o conjunto de propriedades desse objetopara criar a cláusula WHERE da instrução SELECT do comando SQL. Para recuperartodas as linhas da tabela, usa-se o objeto criteria vazio (NULL). As linhas recupe-radas são convertidas para o objeto correspondente ao documento clínico – a partirda template – e, por último, é retornada uma lista (List) de documentos clínicosencontrados.

O método update() utiliza o bean como objeto de informação para ser atua-lizado, o criteria como parâmetro de pesquisa e a conexão com a camada depersistência. A partir disso, o comando SQL é criado e as atualizações necessárias

6Java Bean é, de um modo geral, um componente de software escrito em linguagem de progra-mação Java.

76 Base de Imagens Médicas: Arquitetura e Implementação

são realizadas.

O método delete() utiliza o bean como parâmetro de pesquisa do documentoclínico que será excluído e a conexão com a camada de persistência, gerando o co-mando SQL de atualização das tabelas correspondentes.

Para realização de pesquisa, foi implementado um módulo específico para execu-tar pesquisas nas bases de dados. A Figura 5.9 apresenta o diagrama de seqüênciailustrando as etapas de elaboração e execução das pesquisas nas bases de dados.A primeira etapa consiste no fornecimento do critério de pesquisa. Na seqüência,é apresentado um conjunto de páginas onde o usuário pode refinar os parâmetrosde sua pesquisa. A partir disso, a aplicação constrói uma lista de parâmetros queserão utilizados na realização da pesquisa.

Figura 5.9 Diagrama de seqüência da construção de pesquisa.

A partir dos resultados de uma pesquisa, o usuário pode navegar pelas infor-mações textuais e IM de um documento clínico contido na lista de resultados. Ini-cialmente, são apresentados os thumbnails das IM recuperadas partir do SRB. Aslocalizações das IM são recuperadas a partir do banco de dados PostgreSQL, bemcomo a localização dos thumbnails que representam as séries de IM. Para diminuiro tempo de resposta dos carregamentos, foi implementado na camada de aplicação

5.4. Implementação: a infra-estrutura de base de IM 77

um serviço de cache baseado nos últimos arquivos utilizados. Em paralelo, tam-bém existe um processo que periodicamente limpa o conteúdo do cache, excluindoos arquivos mais antigos. O processo de recuperação de IM e carregamento dosthumbnails é mostrado no diagrama da Figura 5.10.

Figura 5.10 Diagrama de seqüência da recuperação de thumbnails e IM, baseadas noSRB-Jargon.

5.4.3 Serviço de armazenamento de IM

Mantendo as características do modelo cliente-servidor, o serviço de armaze-namento de IM é um servlet, implementado em Java, que recebe os documentosclínicos e os armazena nos repositórios. O servlet foi desenvolvido para suportaro armazenamento e distribuição de IM. Quanto à distribuição o serviço é escalá-vel, de forma a suportar transferência de IM em múltiplos protocolos, incluindoDICOM, HTTP e TCP/IP, bem como o armazenamento de IM em diferentes forma-tos como DICOM, raw, JPEG, GIF e TIFF, entre outros.

O serviço de armazenamento ainda possui elementos de comunicação padrãoDICOM (semelhante ao servidor DICOM de um PACS), de forma que os clientespossam conectar-se a ele e realizar as operações de armazenamento e transferênciade IM (DICOM C-Store), pesquisa (DICOM C-Query), recuperação (DICOM C-Get

e C-Move) e verificação se o serviço está em execução (DICOM C-Echo).

De um modo geral, o serviço oferece uma interface apta a receber as IM viaprotocolo DICOM, ou de modo simplificado, num mecanismo baseado em socket. A

78 Base de Imagens Médicas: Arquitetura e Implementação

implementação dos serviços de armazenamento e organização dos dados é baseadanas implementações do dcm4che7 que é um projeto que implementa as especifica-ções de integração de aplicações clínicas propostas pelo IHE (IHE, 2003).

Quando o servidor recebe IM para armazenar (Figura 5.11), um processo ana-lisa o cabeçalho da IM, verificando seu tipo e instancia o decodificador específico.Caso constem informações identificativas no cabeçalho das IM, estas são removi-das e, após isso, as IM são armazenadas no catálogo de arquivos. Imediatamenteapós o armazenamento, as IM tornam-se disponíveis para visualização em toda ainfra-estrutura.

Figura 5.11 Arquitetura do serviço de armazenamento de IM.

5.4.4 Serviços web para base de dados distribuída

A implementação de um modelo de base de dados distribuída compõe-se de ummodelo de troca de mensagens, protocolo de comunicação e mecanismos para des-crição, definição e descoberta dos serviços (DEITEL et al., 2003). Normalmente, osserviços web (Web Services) usam protocolos do nível de aplicações da Internet comoo Simple Mail Transfer Protocol (SMTP) e Hypertext Transfer Protocol (HTTP) paracomunicação entre aplicações. O Simple Object Access Protocol (SOAP) é o proto-colo de troca de mensagens entre aplicações; o Web Services Description Language(WSDL) é o padrão para descrição e definição de serviços; e o Universal DescriptionDiscovery and Integration (UDDI) é o padrão para localização dos serviços.

Basicamente, a base de IM deste trabalho implementa três Web Services (videFigura 5.5): (1) Serviço de Meta-informações; (2) Serviço de Pesquisa; e (3) Serviçode Referências. Os dois primeiros referem-se aos serviços básicos da federação dasbases. O terceiro executa a tarefa de pesquisa na base de IM local e em outrasbases da infra-estrutura.

7http://sourceforge.net/projects/dcm4che

5.5. Implementação: Componentes 79

Quando um site é conectado à infra-estrutura, este é registrado no portal. Oregistro envolve o fornecimento de informações relativas aos serviços disponíveisnesse site. Para tal tarefa, o serviço de meta-informações fornece esse conjunto deinformações ao portal.

5.5 Implementação: Componentes

Tamura e Yokoya (TAMURA; YOKOYA, 1983) definem uma base de imagens como“um sistema que armazena um grande volume de dados sobre imagens e infor-mações associadas”. Especificamente, neste trabalho, um sistema dessa naturezadeve estar apto a manipular objetos de informações especialmente modelados paraacomodar a heterogeneidade das informações clínicas.

Todo o trabalho foi desenvolvido com o uso de padrões abertos (DICOM, XML,entre outros), paradigmas de Web Services e implementado com ferramentas de usolivre para desenvolvimento (Java8 2, J2EE 5.0, JSP 2.0, EJB, PostgreSQL9 versão8.0, entre outras).

Nesta seção são apresentadas as implementações dos principais componentesda base de IM deste trabalho.

5.5.1 Base de documentos clínicos

Base de documentos clínicos é uma generalização para a base de IM deste tra-balho que armazena, além de IM, diferentes tipos de dados. De acordo com Tagaree outros (TAGARE; JAFFE; DUNCAN, 1997), a diferenciação das bases de IM e os sis-temas de bases de dados textuais deve-se às seguintes características das IM:

1. A semântica do conhecimento extraído a partir das IM é imprecisa;

2. As informações das IM contêm dados de forma e espaço, os quais não são fa-cilmente expressados numa linguagem textual e são facilmente armazenadosno banco de dados relacional;

3. Grande parte das informações é geométrica;

4. As inferências diagnósticas derivadas a partir de IM residem num modeloincompleto e que está em evolução constante.

8http://java.sun.com/9http://www.postgresql.org

80 Base de Imagens Médicas: Arquitetura e Implementação

Estas características somadas à necessidade de prover armazenamento de di-versos tipos de documentos clínicos, motivou a criação de uma classe denominadaDocumentoClinico que será apresentada na próxima subseção. Estendendo essemodelo de classe, a natureza imprecisa das IM impôs vários requisitos para recu-peração e armazenamento, de forma a criar um modelo de dados específico para IM(também apresentado na próxima subseção), uma vez que o conteúdo das informa-ções é escalável e pode evoluir semanticamente.

Foram utilizadas as facilidades de organização de dados e pesquisa oferecidaspelo modelo banco de dados relacional (CHEN, 1990; DATE; DARWEN, 2006) para ar-mazenamento das meta-informações de cada caso clínico. A Figura 5.12 apresentao modelo de dados da base, onde são armazenadas as meta-informações. Os objetosDocumentoClinico são armazenados no sistema de catálogo de arquivos descritona seção anterior.

Figura 5.12 Modelo de dados da base de IM.

De modo a manter consistências entre os diferentes conjuntos de informações esuas versões, foram implementadas duas regras: (1) o repositório permite apenasoperações de inserção, pois as operações de alteração ou exclusão resultam numapotencial perda de integridades referenciais; (2) dessa forma, as operações de alte-

5.5. Implementação: Componentes 81

ração ou exclusão são realizadas por meio de inserções.

Para facilitar o desenvolvimento e representar as propriedades estática e dinâ-mica dos componentes da aplicação, o modelo de base de dados proposto agregacinco grupos de informações (Figura 5.12): (1) usuários; (2) atividades didáticas;(3) anotações em IM; (4) imagens; (5) algoritmos. O grupo de informação imagensfoi elaborado a partir do modelo de informações DICOM (NEMA, 2001b).

O modelo de dados também suporta uso de múltiplos dicionários de dados paracodificação dos diagnósticos e anatomia. Alguns dos dicionários disponíveis nainfra-estrutura são: American College of Radiology (ACR) da RSNA, Systemati-zed Nomenclature of Medicine (SNOMED) (SPACKMAN; CAMPBELL, 1998), BreastImaging Reporting and Data System (BI-RADS), Código Internacional de Doenças(CID-10) e RadLex.

5.5.2 Editor de templates

Um dos principais serviços oferecidos pela base de IM é o de autoria de casosclínicos. Este serviço deve suportar a edição de diversos tipos de documentos. Paratanto, este suporte é garantido pelo uso de templates que implementam a classedenominada DocumentoClinico como uma interface de documento (Figura 5.13).Tais templates são utilizadas na criação de documentos que serão armazenados nabase de IM.

O objetivo do uso de templates é tornar disponível um modelo flexível de basede dados, a partir do suporte a múltiplos tipos de documento. Nessa abordagem,cada material armazenado é inserido seguindo a especificação de uma template ea mesma template é utilizada para formatar a apresentação do material quandoeste é recuperado. Tal abordagem viabiliza a construção de uma interface genérica(Figura 5.13) que encapsula um conjunto de objetos de informação. Cada objetode informação possui um visualizador (viewer), disponível na forma de plug-in,encarregado de fazer a apresentação do respectivo objeto de informação. Assim,a instância de uma template é formada por um conjunto de objetos de informaçãoespecíficos e a mesma instância representa um tipo de material contido na base.

Entretanto, para determinadas classes de conjunto de dados, alguns grupos deinformações não são necessários ou aplicáveis, mas naquelas onde forem necessá-rios, tais grupos deverão ser obrigatoriamente preenchidos. Esta especificação daobrigatoriedade do preenchimento é determinada na criação da template.

Para edição de templates, a base conta uma ferramenta visual (implementada

82 Base de Imagens Médicas: Arquitetura e Implementação

Figura 5.13 Modelo de dados para suporte a múltiplos documentos.

no paradigma What You See is What You Get) de criação de formulários, por meioda qual os diferentes modelos de template são criados. Tal ferramenta é baseadanum plug-in para edição de HTML, o FCKEditor10, que disponibiliza várias fun-cionalidades num navegador web (Figura 5.14) disponíveis somente em aplicaçõesstand-alone como Microsoft Word®. Tal plug-in é portável para várias linguagensde programação e é passível de customizações, como por exemplo a seleção do idio-ma.

Figura 5.14 Barra de ferramentas do editor de templates.

A Figura 5.15 apresenta um exemplo da criação de template para documentoclínico.

O FCKEditor produz código HMTL. Uma vez que o modelo de documento foicriado e salvo, o código gerado pelo FCKEditor é convertido para XML, de formaque este código seja formatado de acordo com o modelo de templates MIRC-RSNA(Figura 5.16). Após isto, o modelo é salvo no repositório de templates.

10http://www.fckeditor.net

5.5. Implementação: Componentes 83

Figura 5.15 Exemplo de edição de template.

5.5.3 Ferramentas para inserção automática de casos clínicos

A inserção dos casos clínicos também pode ser feita de forma automatizada.Para tal propósito foi implementada uma aplicação stand-alone que se conecta aoPEP-InCor, localiza um estudo clínico, recupera o conjunto de informações desseestudo – exceto as informações identificativas – e faz a inserção dessas informaçõese imagens em alguma das bases de IM da infra-estrutura.

De início, a aplicação está customizada para recuperar exames para inserçãona base de IM somente a partir do PEP-InCor, mas esta aplicação permite a con-figuração dos parâmetros de recuperação de informações de modo que a inserçãoautomática de casos clínicos também seja realizada a partir de outros sistemas. Aconfiguração consiste no mapeamento do modelo de dados do sistema fonte para omodelo de dados das bases de IM deste trabalho. Tal mapeamento é realizado pormeio de um documento XML (Figura 5.17).

A Figura 5.18 apresenta o fluxo de operação da ferramenta de inserção auto-mática. O usuário fornece o identificador do exame clínico, a aplicação conecta-secom a base de dados do PEP-InCor, pesquisa o identificador informado, recupera asinformações demográficas pertinentes ao exame, localiza o exame na base de dadosdo PACS-InCor, recupera as IM e o laudo. Após estes processos de localização, a

84 Base de Imagens Médicas: Arquitetura e Implementação

<?xml version="1.0"encoding="iso-8859-1"?><DocumentoClinico display="mstf"first-tab="2" ><title>Documento Clínico</title><author><name>Base de Imagens</name><affiliation/><contact/>

</author><abstract><p>None.</p></abstract><keywords/><section heading="Study" ></section><section heading="Findings" ></section><section heading="Notes" ></section><section heading="Files" ><p><metadata-refs/>

</p></section><document-type>Medical image database</document-type><findings/><discussion/><differential-diagnosis/><diagnosis/><anatomy/><pathology/><organ-system/><modality/><category/><level/><authorization><owner/><read/><update/><export/>

</authorization></DocumentoClinico>

Figura 5.16 Exemplo de uma template de documento MIRC-RSNA.

aplicação inicia a inserção na base de IM a partir das informações demográficas.A etapa seguinte é a recuperação de IM e inserção destas a partir do PACS. Nesteestágio, a aplicação realiza a execução dos comandos DICOM C-Get e C-Move apartir do servidor DICOM do PACS-InCor para o servidor da base de IM, antes,anonimizando as informações.

<?xml version="1.0"encoding="iso-8859-1"?><pepDBConection>...</pepDBConection><pepDBStudyTable>...</pepDBStudyTable><pepDBStudyIDField>...</pepDBStudyIDField><pepDBStudyDateField></pepDBStudyDateField>

...

Figura 5.17 Trecho do arquivo de configuração da aplicação de inserção automática decasos clínicos.

5.5. Implementação: Componentes 85

Figura 5.18 Fluxo de inserção automática de caso clínico a partir do PEP-InCor.

5.5.4 Conexão com outras bases de IM

MIRC é uma iniciativa da RSNA para promover padrões na criação e troca decasos clínicos para fins didáticos e, atualmente, é visto como uma referência nacomunidade de radiologia (RSNA, 2005). O projeto MIRC oferece três alternativaspara grupos isolados ou organizações que desejam participar da disseminação decasos clínicos: (1) instalando o software desenvolvido pela RSNA, (2) implemen-tando os serviços de armazenamento e pesquisa de acordo com as especificações doMIRC-RSNA (MIRC, 2006a, 2006b) ou (3) acessando o índice completo de todos oscasos a partir do repositório MIRC por meio de um formato específico para acesso aoíndice principal (MIRC, 2006c). Neste trabalho, uma vez que foi desenvolvida toda ainfra-estrutura de base de IM, optamos pelas alternativas 2 e 3. Foram implemen-tados dois componentes de serviço, para cada alternativa. O primeiro, denominadoQueryMircDb (Figura 5.19), implementa apenas o serviço de pesquisa nas basesMIRC (MIRC, 2006a, 2006b), de forma a permitir que o usuário pesquise e recupereconjuntos de dados a partir do serviço de armazenamento MIRC (MIRC, 2006c). Osegundo serviço, denominado MircIndex recupera a lista de todos os casos clínicoscontidos no ambiente MIRC, utilizando o esquema MIRCsiteindex (Figura 5.20) –em tarefas de pesquisa, essa lista é utilizada pelo serviço de busca em outras basespara selecionar casos por meio de seus ponteiros.

Para recuperação de IM a partir de outras bases de IM, a arquitetura imple-menta um serviço de pesquisa e recuperação de documentos clínicos denominadoAccessExternalsDb. Objetivando escalabilidade e acesso a diversas bases de IM,o serviço possui um repositório onde são armazenados os modelos para acesso àsbases externas. Estes modelos são implementados segundo uma classe de serviçoespecialmente desenvolvida, denominada ExternalAccess (Figura 5.21). Estainterface baseia-se num modelo de conexão com a aplicação remota, onde estão dis-

86 Base de Imagens Médicas: Arquitetura e Implementação

<MIRCquery firstresult=“...” maxresults=“...” queryUID=“...” unknown=“...”><title> . . . </title><author> . . . </author><abstract> . . . </abstract><keywords> . . . </keywords><history> . . . </history><findings> . . . </findings><diagnosis> . . . </diagnosis><differential-diagnosis> . . . </differential-diagnosis><discussion> . . . </discussion><pathology> . . . </pathology><anatomy> . . . </anatomy><organ-system> . . . </organ-system><code coding-system=“...”> . . . </code><modality> . . . </modality><patient>

<pt-age><years> . . . </years><months> . . . </months><weeks> . . . </weeks><days> . . . </days>

</pt-age><pt-sex> . . . </pt-sex><pt-race> . . . </pt-race>

</patient><image>

<format> . . . </format><compression> . . . </compression><modality> . . . </modality><anatomy> . . . </anatomy><pathology> . . . </pathology>

</image><document-type> . . . </document-type><category> . . . </category><level> . . . </level><access> . . . </access><peer-review/><language code=“...”>...</language>... free text search field ...

</MIRCquery>

Figura 5.19 Estrutura de documento MIRCquery, utilizado QueryMircDb.

poníveis os seguintes métodos: setDatabases(List list), List

getDatabases(), openConnection(databaseId), closeConnection(),releaseConnection(). Os componentes de acesso às bases externas são divi-didos em dois grupos: (1) pesquisa e (2) recuperação. Dessa forma, os compo-nentes de acesso implementam as interfaces Query e Retrieve. A interfaceQuery estende a classe ExternalAccess e requer a implementação dos métodossetCriteria() e execute(). Por outro lado, a interface Retrieve também es-tende a classe ExternalAccess e possui o método getDocument() que também

<MIRCindex><doc>case1folderpath/case1.xml</doc><doc>case2folderpath/case2.xml</doc>...<index>index1path/index1.xml</index><index>index2path/index2.xml</index>...

</MIRCindex>

Figura 5.20 Modelo de documento MIRCsiteindex.

5.5. Implementação: Componentes 87

requer implementação.

Figura 5.21 Modelo de classe do serviço de acesso às bases de IM externas à infra-estru-tura.

Os componentes QueryMircDb e MircIndex foram implementados utilizandoas interfaces Query e Retrieve.

5.5.5 Serviço de pesquisa e recuperação

Os usuários, por meio de aplicações clientes, formulam a requisição de pesquisaque encapsula uma ou mais pesquisa específica para um certo conjunto de casosclínicos e a envia, como documento XML (Figura 5.22), ao servidor da base de IMque estão conectados. O documento XML da Figura 5.22 é dividido em três se-ções específicas: (a) identificação do usuário – utilizada para validar e autenticar oacesso do usuário ao servidor; (b) características da requisição de pesquisa – definealgumas propriedades como o formato de apresentação os dados; e (c) seqüência deparâmetros especificando as restrições.

Validação do usuário: cada usuário deve informar sua identificação, por meiodo nome de acesso (login) e senha (password). Neste trabalho, o e-mail é o logindo usuário. Uma vez que estas informações são codificadas diretamente num do-cumento XML, a transferência desses dados até o servidor é feita por meio de umaconexão segura (HyperText Transmission Protocol, Secure – HTTPS). Este primeironível de acesso autoriza o usuário a conectar-se à base de IM. Após isto, uma listade operações permitidas a este usuário é devolvida pelo serviço de CABP.

88 Base de Imagens Médicas: Arquitetura e Implementação

<?xml version=“1.0” encoding=“UTF-8”?><!DOCTYPE queryRequest PUBLIC ”+//Query DTD//EN” “query.dtd”><queryRequest id=“Query1”> <loginKey>marcelo</loginKey>

<password>senha12345abc</password><trueIdentityKey/><resultMode value=“summary”/><outputFormat/><longevity>

<longevityDays>1</longevityDays><longevityHours>0</longevityHours>

</longevity><querySet>

<clinicalCase><dateRange>

<beginDate year=1976/><endDate year=today/>

</dateRange></clinicalCase><study>

<anatomy>Coração</anatomy><modality>MRI</modality>

<study/></querySet>

</queryRequest>

Figura 5.22 Exemplo de requisição de pesquisa enviada ao servidor.

Características da requisição de pesquisa: o processamento da requisição de pes-quisa é controlado por um conjunto de parâmetros. O campo resultMode permiteque um cliente especifique como os dados devem ser retornados: num formato resu-mido (summary) contendo o mínimo de informações relativas ao caso clínico ou numformato detalhado (detailed) com todas as informações. Por exemplo, a recupe-ração de um laudo em formato resumido consistirá apenas no título do caso clínico,data de criação, data da última atualização e o autor. Analogamente, a recupera-ção em formato detalhado retorna o texto completo desse mesmo documento. Estafuncionalidade possibilita que os usuários recuperem informações para simples es-peculações (por exemplo: “Quais os conjuntos de imagens de MRI de pacientes comaneurisma da aorta?”) ou informações mais detalhadas sobre um caso clínico espe-cífico (por exemplo: “Retorne os últimos três exames e seguimentos do caso clínico1234”). O formato de saída é especificado na tag outputFormat e este poderá serHTML ou DICOM Structured Report (DICOM SR). A tag longevity determina otempo máximo que a resposta da pesquisa ficará disponível num cache interno dabase de IM.

Parâmetros da pesquisa: o serviço de pesquisa implementa o conceito de listapara representar uma ou mais pesquisas. Esta lista é salva num documento XMLque é utilizado na requisição de pesquisa enviada às bases conectadas ao portal daaplicação. Em tempo de execução (on-the-fly), um documento de definição de tem-plate (document template definition – DTD) é criado para especificar cada fonte de

5.5. Implementação: Componentes 89

dado que poderá ser utilizada na execução da pesquisa. A Figura 5.22 apresentaum exemplo de pesquisa contendo três parâmetros. O primeiro refere-se à moda-lidade (MRI). O segundo à região anatômica (coração). E o terceiro à faixa etária(nascidos a partir de 1976).

Processamento da pesquisa (mapeamento e manipulação): após receber a re-quisição de pesquisa, a base inicia o processamento do documento XML. Se as in-formações contidas são válidas, o processador de pesquisa extrai os parâmetrosindividuais da pesquisa e os encaminha ao construtor do objeto manipulador dapesquisa (query handler factory) cuja função consiste em mapear a pesquisa XMLpara a fonte de dados e seu DTD correspondente. O resultado é processado porum manipulador que trata cada tipo de pesquisa, incluindo os diferentes tipos dedocumento clínico.

5.5.6 Visualizador de imagens médicas

Neste trabalho também foi implementado um visualizador de IM, multiplata-forma – que funciona tanto como uma aplicação stand alone, quanto pode ser ini-cializado a partir de um navegador de Internet (via Java Webstart) – para exibiçãodas IM recuperadas a partir das bases de IM. O visualizador, denominado iView, éuma aplicação de uso geral, desenvolvida em Java com suporte a diferentes moda-lidades e formatos de arquivo de IM.

O iView suporta a visualização multi-dimensional, como também possui umaAPI para suporte ao desenvolvimento e incorporação de novos métodos para pro-cessamento e visualização de IM na forma de plug-ins compatíveis com softwareImageJ11. O que possibilita adicionar funcionalidades específicas, de forma rápida,para quantificação e/ou visualização de dados. Para tal propósito, os únicos pré-requisitos são conhecimentos de linguagem de programação Java e processamentode IM.

Para suportar as diferentes necessidades dos usuários de processamento de IM,tanto o iView quanto as aplicações de base de IM deste trabalho fazem a leitura eescrita de IM de 8, 12, 16, 24 e 32 bits em arquivos nos formatos DICOM 3.0, Raw,TIFF, JPEG e GIF, entre outros. Adicionalmente, incorpora um módulo de pesquisae recuperação para acesso a PACS ou equipamentos geradores de IM, utilizando osserviços DICOM de pesquisa e recuperação.

Internamente, as IM são manipuladas por meio de estruturas de dados que

11http://rsb.info.nih.gov/ij

90 Base de Imagens Médicas: Arquitetura e Implementação

Figura 5.23 Modelo de representação de IM de acordo com o CIAS.

suportam a maioria dos tipos básicos de dados (boolean, byte, unsigned byte,short, unsigned short, integer, float e double). A Figura 5.23 apresentao modelo de dados utilizado para manipulação de IM pelo iView. Tal modelo ébaseado no Serviço de Acesso a Imagens Clínicas (Clinical Image Access Service –CIAS) (OMG, 2000).

A GUI apresentada na Figura 5.24, baseia-se num modelo de GUI com suportea múltiplos documentos (multiple document interface – MDI), onde as séries de IMabertas são apresentadas numa janela interna à janela principal da aplicação. Naparte superior está disponível a barra de ferramentas, implementada de forma aocultar-se automaticamente quando estiver sendo utilizada e esta é semitranspa-rente, de modo a não sobrepor totalmente a(s) janela(s) de estudo.

5.5. Implementação: Componentes 91

Figura 5.24 Interface gráfica do iView.

Na barra de ferramentas (Figura 5.25) as opções são apresentadas em três gru-pos principais: (1) ferramentas comuns, (2) estudos e (3) ferramentas de visualiza-ção. No primeiro grupo, ferramentas comuns, estão disponíveis as operações paraabrir um estudo, abrir exames antigos (anteriores), ajuda, modos de execução dovisualizador (tela cheia e suporte a múltiplos monitores).

Figura 5.25 Barra de ferramentas: ferramentas comuns.

No grupo estudos (Figura 5.26), à esquerda são apresentadas as opções de visua-lização do estudo, como informações demográficas, curvas (overlays), visualizaçãodas lista de IM selecionadas para impressão, visualização do laudo, adição de IM na

92 Base de Imagens Médicas: Arquitetura e Implementação

lista de impressão e fechamento do estudo. No restante da barra são apresentadosos thumbnails das séries de IM do estudo, onde cada estudo aparece inserido numapasta identificada pelo número deste e cada thumbnail representa uma série deIM pertencentes ao estudo clínico. Para séries de IM dinâmicas, os thumbnails sãomostrados com animação, o que permite visualização prévia da série.

Figura 5.26 Barra de ferramentas: estudos.

Quando se aplica duplo clique sobre o thumbnail ou arrasta este para a janelade exibição de série, a série correspondente ao thumbnail é aberta numa janelainterna, semelhante à mostrada na Figura 5.24.

O grupo de ferramentas de visualização (Figura 5.27) oferece um conjunto deferramentas para navegação entre as séries de IM, animação das séries e mani-pulação das IM (incluindo zoom, alterações de brilho/contraste e adição de coresfalsas).

Figura 5.27 Ferramentas de visualização.

Ainda no grupo de ferramentas de visualização, é disponibilizado um conjuntode ferramentas para anotação em IM (Figura 5.28). Esse conjunto possibilita a in-serção de textos, contornos à mão livre, seleção de região de interesse e inclusão deformas geométricas – cheias ou vazadas – sobre a IM, sem alterar o conteúdo dessaIM. Para isso, o iView implementa um conceito de camadas de edição, semelhanteà uma vidraça sobre a qual as anotações são criadas.

O iView ainda possui suporte ao processamento de IM 3D. Foram implemen-tadas as ferramentas de reconstrução multiplanar (multiplanar reconstruction –MPR) e intensidade máxima nas projeções (maximum intensity projection – MIP),

5.5. Implementação: Componentes 93

Figura 5.28 Ferramentas de anotação.

disponíveis na pasta 3D. Outras ferramentas de processamento de IM 3D tambémpoderão ser desenvolvidas utilizando a API de criação e inserção de plug-ins. Osplug-ins devem ser escritos segundo a especificação do ImageJ (BAILER, 2006) einseridos na pasta identificada como plug-ins do iView (Figura 5.28).

5.5.7 Repositório de plug-ins

De forma complementar ao fluxo de operações da base de IM (Figura 5.2) – ondeo desenvolvedor de um método de processamento de IM seleciona um conjunto deIM para testes, faz o download destas e testa seus métodos – o repositório de plug-ins de processamento de IM oferece facilidades para o desenvolvedor implementarum método, enviar o método para armazenamento na base e este mesmo métodoacessar diretamente as IM, processá-las e devolver o resultado ao usuário numapágina web.

import ij.*;import ij.process.*;import ij.gui.*;import java.awt.*;import ij.plugin.*;public class MeuPlugin implements PlugInFilter {

ImagePlus imp;public int setup(String arg, ImagePlus imp) {

this.imp = imp;return DOES_ALL;

}public void run(ImageProcessor ip) {

// Implementação do método de processamento de IM}

}

Figura 5.29 Exemplo do esqueleto da implementação de um plug-in ImageJ de processa-mento de imagens.

O repositório de plug-ins tem por objetivo armazenar as implementações de mé-

94 Base de Imagens Médicas: Arquitetura e Implementação

todos de processamento de IM, como classes Java e torná-las disponíveis para uso,acessando diretamente o conjunto de IM da base. Isso permite que o usuário utilizetodas as facilidades da linguagem Java, bem como bibliotecas disponibilizadas porterceiros para manipulação das IM, como as bibliotecas Java Advanced Imaging(JAI) (JAI, 2006) e Insight Segmentation and Registration Toolkit (ITK) (ITK, 2006).

Os plug-ins devem ser implementados a partir da interface PlugInFilter doImageJ. A Figura 5.29 apresenta o exemplo de “esqueleto” da implementação deum plug-in de processamento de IM segundo as especificações do ImageJ.

Na implementação do plug-in deve ser declarada uma variável que mantémreferência para o conjunto de IM que será utilizado no processamento (ImagePlusimp). O método setup é chamado quando o plug-in é inicializado, recebendo osparâmetros de configuração (String arg) e a referência para o conjunto de IM(ImagePlus imp). Ao final, o método retorna um valor referente à capacidade doplug-in. A Figura 5.30 apresenta o exemplo de um plug-in que faz o negativo deuma IM de 8 bits.

import ij.*;import ij.process.*;import ij.gui.*;import java.awt.*;import ij.plugin.*;public class Inverter_ implements PlugInFilter {

ImagePlus imp;public int setup(String arg, ImagePlus imp) {

this.imp = imp;if (arg.equals(“about”)) {

showAbout();return DONE;

}return DOES_8G+DOES_STACKS+SUPPORTS_MASKING;;

}public void run(ImageProcessor ip) {byte[] pixels = (byte[])ip.getPixels();int width = ip.getWidth();Rectangle r = ip.getRoi();int offset, i;for (int y=r.y; y<(r.y+r.height); y++) {

offset = y*width;for (int x=r.x; x<(r.x+r.width); x++) {i = offset + x;pixels[i] = (byte)(255-pixels[i]);

}}

}

Figura 5.30 Exemplo da implementação de um plug-in de processamento de IM.

5.6. Discussão 95

Os plug-ins utilizados neste módulo também poderão ser utilizados no iView evice-versa.

5.6 Discussão

Os requisitos básicos para uma base de IM compreendem um grande númerode IM (com variedades de anatomia e patologia), qualidade diagnóstica da IM, va-lidade (certificação) do conjunto de dados inserido, ferramentas de pesquisa e re-cuperação de IM, uso de padrões e dicionários clínicos internacionalmente aceitos.Em adição, existem outras bases de IM com acesso público e tais bases mantêmum rico conjunto de informações, cujos conteúdos podem ser recuperados por estaimplementação por meio das interfaces de conexão com essas bases.

A arquitetura de bases federadas foi proposta para manter a autonomia e pro-mover o compartilhamento de dados entre os pares. Isto implica que as interfacesda infra-estrutura deste trabalho devem estar em conformidade com algum padrãopara fins de inter-operação. Basicamente, o padrão deve especificar um protocolode comunicação e um formato para troca de dados. Especificamente neste trabalho– que utiliza a infra-estrutura da Internet – para ser funcional, a federação ne-cessita de um protocolo de comunicação universalmente aceito e um formato paratroca de dados, idealmente simples e extensível.

O armazenamento de dados, em função de seu crescente volume, é uma ques-tão crítica. Para tanto, a implementação aqui proposta minimiza seus impactos deduas formas: o modelo de base distribuída e o uso de Data Grid.

A implementação do modelo de dados, em que os documentos são inseridos apartir de uma template, permite a criação de tipos específicos de documentos, adap-táveis às reais necessidades de seus usuários, bem como, oferece maior flexibilidadeem questões de armazenamento de documentos clínicos multimídia.

Uma questão a ser resolvida diz respeito à inserção e execução remota de plug-ins (métodos) de processamento de IM. Esta prática demanda a existência de po-líticas de gerência de uso do processador para cada usuário conectado e que tenhainiciado a execução de um plug-in. Apesar disso, a implementação pode ser vistae utilizada como um campo de testes de métodos de processamento de IM e CBIR.Uma vez tendo métodos dessa natureza com graus de confiabilidade, estes podemser inseridos como ferramentas na infra-estrutura.

Capítulo

6USO DA BASE DE IM

“The most beautiful thing we can experience is the mysterious. It isthe source of all art and science.”

ALBERT EINSTEIN

Uma base de IM é um valioso recurso para uso em pesquisas sobre IM digitais,tais como processamento, segmentação, visualização, compressão, PACS, sistemasde auxílio ao diagnóstico e programas de treinamento (SHIRAISHI et al., 2000). Con-tudo, para o desenvolvimento de pesquisas nessas áreas são necessários conjuntosde dados sobre IM e informações associadas a estas e que tais conjuntos sejamamplos e diversificados. Também, são necessários mecanismos que viabilizem apronta recuperação desses dados.

Nos dois últimos Capítulos foram apresentadas a modelagem e implementaçãoda base de IM deste trabalho. Este Capítulo apresenta a utilização prática doambiente de base de IM. O Capítulo inicia descrevendo o funcionamento das basesde IM, segue demonstrando a inserção de casos clínicos, aborda o uso da aplicaçãocomo um arquivo didático digital e, por último, apresenta a utilização do ambientede base de IM na avaliação de métodos de segmentação e compressão de IM.

6.1 A base de IM em operação

O principal site do ambiente de base IM deste trabalho é a base de IM criadae instalada no InCor, a qual foi utilizada no desenvolvimento deste trabalho. Estesite está instalado num servidor denominado UPDServer01, que é um computador

97

98 Uso da Base de IM

Compaq Proliant®ML350 G3 com 2 CPUs Intel Xeon de 2,4 GHz, 1 Gb de me-mória RAM, com drive interno para Digital Line Tape (DLT), com 8 discos de 72,8Gb cada (560 Gb de disco disponíveis em sistema discos redundantes) e sistemaoperacional Linux Suse 9.0, conectado à Intranet InCor a 100 megabits por se-gundo (Mbps). Neste equipamento estão instalados os software de gerenciamentode banco de dados PostgreSQL1 versão 8.0.7, servidor de páginas Tomcat2 versão5.5.20 e o aplicativo gerente de informações em disco. Este servidor, além de ser umsite e manter os discos para armazenamento das IM, também funciona como o por-tal que mantém o registro das bases conectadas à infra-estrutura (vide Figura 5.5).

A Figura 5.2 (no Capítulo anterior) apresenta esquematicamente o fluxo de ope-ração da base de IM. De forma resumida, o fluxo mostra que o usuário pode criarsua própria conta para acesso (usuário com papel mais básico), realizar o login(acesso) no sistema, realizar pesquisas e inserir novos materiais.

Figura 6.1 Acesso (login).

O identificador do usuário utilizado pela aplicação é o endereço de e-mail. A

1http://www.postgresql.org/ftp/binary/v8.0.7/linux/2http://tomcat.apache.org

6.1. A base de IM em operação 99

página inicial (página de login), apresentada na Figura 6.1, é a página de acesso àbase de IM, onde o usuário fornece o e-mail e a senha para acesso.

Ainda na página inicial, aos usuários não registrados, está disponível a opçãopara criar novas contas (novo usuário). Por outro lado, para aqueles que esquece-rem a senha, esta poderá ser recuperada e enviada para o e-mail cadastrado, pormeio da opção “Esqueci minha senha” também disponível na página inicial.

Figura 6.2 Registro de novo usuário.

Para criação de novas contas (Figura 6.2), os usuários devem fornecer nome,sobrenome, afiliação (se houver, o grupo ao qual está vinculado), e-mail, país, senhae confirmação da senha.

De acordo com as políticas de acesso definidas no serviço de CABP, um usuáriorecém-cadastrado possui acesso limitado à inclusão de novos casos e consulta aoscasos clínicos existentes.

A página principal do sistema, a qual fica disponível após o login, é apresen-tada na Figura 6.3. Ao lado esquerdo é apresentado um menu com o conjunto deopções dispostas numa estrutura de árvore e no centro é o local onde as opçõesselecionadas são executadas.

100 Uso da Base de IM

Figura 6.3 Página principal da aplicação.

As Figuras de 6.4 a 6.9 apresentam algumas telas de aplicações disponíveis aosusuários.

Figura 6.4 Lista de casos clínicos. Figura 6.5 Dicionário ACR.

6.2. Inserção de casos clínicos 101

Figura 6.6 Estudo clínico. Figura 6.7 Lista de thumbnails do estudo –possibilidade de visualizar IM dinâmicas.

Figura 6.8 Visualizador de IM (negatoscópiovirtual).

Figura 6.9 Ferramentas de visualização e ano-tação.

6.2 Inserção de casos clínicos

Há duas formas de inserir casos clínicos nas bases de IM. Uma delas é manual,onde o usuário fornece todo o conjunto de informações e a outra é automática apartir de bases de IM compatíveis com padrão MIRC ou a partir do PEP-InCor, ouainda, fornecendo as configurações do sistema de informação clínicas e do servidorDICOM ao aplicativo de inserção automática de casos. Uma vez começada a inser-ção do caso clínico de forma manual, esta deverá ser concluída também de formamanual. O mesmo vale para inserções automáticas.

102 Uso da Base de IM

6.2.1 Inserção manual

A inserção manual inicia com a criação do caso clínico (Figura ??). Nessa etapa,devem ser fornecidos os seguintes conjuntos de informações:

• Identificação do caso clínico: título, palavras-chave e domínio do caso clínico;

• Paciente: data de nascimento, sexo, etnia, peso e altura;

• Apresentação: queixa e duração, história pregressa da moléstia atual, hábi-tos pessoais, história familiar, exame físico inicial, motivação para iniciar oestudo e informações adicionais (observações);

Figura 6.10 Tela de inserção de um caso clínico.

Uma vez finalizada a criação do caso clínico, as etapas seguintes consistem nainserção de estudos clínicos (incluindo exames com IM e laudos), inserção do regis-tro de evolução e o encerramento do caso clínico. Na inserção de cada estudo clínico(Figura 6.11) devem ser fornecidos os seguintes conjuntos de informação: (a) Iden-tificação: descrição do estudo, data, modalidade, região examinada, região anatô-mica codificada de acordo com o dicionário ACR; Técnica utilizada na aquisição da

6.2. Inserção de casos clínicos 103

IM; Achados de IM; discussão; conclusão; patologia; referências; e comentários adi-cionais. Após a inserção das informações do exame, pode-se fazer a inserção dasIM. Esta tarefa é realizada por meio do upload dos arquivos (DICOM e/ou outrosformatos).

Figura 6.11 Tela de inclusão de estudo clínico (exames baseados em IM).

Com as IM inseridas na base, estas podem ser recuperadas e abertas no iView,onde é possível melhorar a apresentação dessas imagens por meio das ferramentasde controle de brilho e contraste. O iView também disponibiliza a funcionalidadepara criar anotações em IM e permite salvar essas anotações, vinculando-as àsimagens sobre as quais as anotações foram criadas. A funcionalidade de anotaçãoem IM utiliza o conceito de camadas (layers) de modo que o conteúdo original daIM não é alterado e estes layers são salvos separadamente.

6.2.2 Inserção automática

A inserção automática pode ser realizada tanto a partir de um PACS, utilizan-do-se a ferramenta de inserção de casos descrita no Capítulo anterior, quanto apartir de outras bases de IM. Nessa modalidade de inserção, durante o processo,

104 Uso da Base de IM

Figura 6.12 IM com anotações.

não há intervenção do usuário a não ser para indicar quais conjuntos de dadosserão adicionados à base.

O processo de inserção automática possibilita o aumento de forma rápida doconjunto de dados da base. No entanto, por mais flexível que sejam os modelos deimportação de dados de bases externas e os modelos de documentos clínicos criados,nesta aplicação observa-se a existência de diferenças significativas nos modelos dedados da fonte (de onde o caso clínico será recuperado) e do destino (local onde ocaso clínico será inserido). Tais diferenças, não dizem respeito apenas ao mapea-mento (o que é resolvido por meio de configurações dos parâmetros da aplicação deinserção automática), mas ao conjunto de informações contidas nas bases de ori-gem. Quando isso acontece, objetivando assegurar a qualidade dos conjuntos dedados, estes casos clínicos são armazenados numa categoria especial pois, apesardas diferenças dos modelos, estes podem conter informações relevantes para certasfinalidades.

Outra observação no processo de inserção automática é que muitas das IM, prin-cipalmente aquelas adquiridas a partir de bases externas, podem não possuir qua-lidade diagnóstica. Nesse caso, essas IM são identificadas como pertencentes àuma categoria denominada ilustração. A esta categoria também pertencem os dia-gramas ou esquemas.

6.3 Arquivo didático digital: o uso no InRad

O primeiro site criado fora do InCor foi o do Instituto de Radiologia (InRad). Aidéia foi tornar a aplicação disponível para criação de um piloto de arquivo didático

6.3. Arquivo didático digital: o uso no InRad 105

digital no Instituto, inicialmente com casos clínicos de MRI.

A proposta da implantação do piloto representou a oportunidade para testaros modelos de dados para armazenamento de IM fora do ambiente de desenvolvi-mento. Dessa forma, a base de IM do InRad foi integrada à base do site InCor quemantém as funcionalidades do portal.

6.3.1 Características do projeto

Uma etapa importante na disponibilização de um arquivo didático digital emRadiologia é o desenvolvimento de uma infra-estrutura eletrônica capaz de supor-tar tais atividades.

Primeiramente, tal sistema deve oferecer acesso fácil e integrado ao conjunto deinformações pertinentes ao paciente (objeto de um caso clínico), de modo que umusuário (residente, preceptor, assistente, etc) possa examinar o conjunto de infor-mações disponível e inferir conclusões bem fundamentadas. Tal sistema objetivafacilitar a realização de estudos retrospectivos para publicações científicas, alémde ser a fonte de materiais para a preparação de aulas, cursos ou treinamentosespecíficos.

Em segundo, a mesma infra-estrutura eletrônica deve suportar acesso aos ca-sos clínicos com graus de semelhança, o que visa ampliar os conhecimentos dosusuários por meio de correlações/comparações, bem como referências bibliográfi-cas. Todas as informações submetidas para armazenamento devem passar por umcontrole de qualidade, com o propósito de manter a qualidade de todo o conjuntode informações existentes na infra-estrutura. Este controle é realizado por um mé-dico assistente e tal controle também pode ser utilizado na avaliação de residentes,estagiários e alunos, como parte das atividades educacionais.

Objetivando assegurar a privacidade e segurança de informações clínicas, asinformações identificativas de cada paciente deverão ser anonimizadas. Todo osistema está protegido por senhas de identificação e níveis de acesso decididos pelosadministradores do sistema.

6.3.2 Implantação do piloto

Com o intuito de validar os modelos de dados propostos para o ambiente deavaliação de métodos de processamento de IM e aplicá-los no desenvolvimento doarquivo didático digital, inicialmente, o piloto foi instalado num microcomputador

106 Uso da Base de IM

com processador Intel Pentium®IV, 512 Mb de memória RAM, dois discos de 80Gbcada e sistema operacional Microsoft Windows XP Professional®.

Para gerenciar a inclusão de casos, foi treinado um preceptor e este ficou in-cumbido de disseminar o uso da base de IM entre os residentes para que estespromovessem o arquivamento de casos clínicos.

A implantação do piloto também serviu para avaliar o impacto da inserção daaplicação de base de IM no meio clínico. Foram solicitadas algumas adaptações emtermos de GUI e ergonomia, as quais foram implementadas e disponibilizadas.

Ainda, nessa fase de implantação do piloto e população da base também foramavaliados o tempo gasto para inserção de casos clínicos e a facilidade de recupera-ção das informações da base. Relembrando a modelagem, a inserção de um casoclínico completo é dividida em três etapas: (a) apresentação do caso clínico, (b)inserção de estudos clínicos e (c) seguimento ou evolução. Para avaliação da pra-ticidade de inserção de casos na base foram medidos os tempos gastos por oitoresidentes, em cada uma das etapas de inserção. Os residentes tiveram um treina-mento prático inicial e, após este treinamento fizeram a inserção de um caso clínicocompleto para registro dos tempos, de acordo com o fluxo do autor de caso clínicoapresentado na Figura 5.2. A Tabela 6.1 apresenta a média dos tempos gastospor estes residentes para inserir o mesmo caso clínico, com as informações e IMpreviamente levantadas.

Etapa de inserção Tempo médio(em minutos)

Apresentação do caso clínico 5,2Estudos clínicos 4,7Seguimento (evolução) 2,5

Tabela 6.1 Tempos médios gastos para inserção de casos clínicos.

Em média, a inserção de um caso clínico – com as informações previamenteorganizadas e contendo um estudo com IM e evolução – leva em torno de 12,4minutos.

6.3.3 Resultados

Como resultados da implantação desse piloto, tem-se:

• Acesso a dados clínicos de diferentes fontes, de forma que as informações clíni-cas contidas em cada caso possam ser prontamente utilizadas e incorporadas

6.4. Avaliação dos mecanismos de pesquisa e recuperação 107

a práticas didáticas e/ou pesquisas em Radiologia.

• Acesso rápido ao conjunto de dados da infra-estrutura. Os mecanismos debusca incluem a localização de casos por meio de palavras-chave, a pesquisaem qualquer campo de informação dos documentos clínicos e a busca a partirde termos ou expressões de dicionários clínicos.

• Crescimento da infra-estrutura em termos de volume dados, usuários e parti-cipantes (sites de armazenamento);

6.4 Avaliação dos mecanismos de pesquisa e recu-

peração

Atualmente, a base de IM (site InCor) conta com um conjunto de 505 casosclínicos completos (com laudos) de diversas modalidades, onde cada caso possuivárias IM. No site InRad existem 53 casos clínicos de MRI, onde a maioria destessão de imagens do crânio.

A Tabela 6.2 apresenta a distribuição dos casos clínicos e imagens, entre asmodalidades clínicas. A maioria deles foi inserida de forma automática, com dadose IM provenientes do PEP e PACS-InCor. Os casos clínicos de medicina nuclear(MN) foram inseridos a partir do Banco de Casos Clínicos do Centro de MedicinaNuclear do Departamento de Radiologia do HC-FMUSP.

Casos Clínicos Número deModalidade manual automático total Imagens

Angiografia por raio-X 10 90 100 35.768Mamografia – 4 4 16Medicina nuclear – 173 173 432Radiografia 5 – 5 10Ressonância Magnética 43 57 100 25.107Tomografia Computadorizada 20 80 100 40.003Ultra-som Intravascular 3 – 3 13.531Ultra-sonografia 5 15 20 1514

Totais 86 419 505 116.381

Tabela 6.2 Inventário de casos clínicos e IM contidas no site InCor.

A Tabela 6.3 apresenta a classificação do conjunto de casos clínicos (apresenta-dos na Tabela 6.2), divididos em grupos de normais e patológicos.

A Tabela 6.4 apresenta o inventário dos casos clínicos, onde é estabelecida uma

108 Uso da Base de IM

Casos ClínicosModalidade normal patológico total

Angiografia por raio-X (XA) 16 84 100Mamografia (MG) 1 3 4Medicina nuclear (MN) 33 140 173Radiografia (RX) 2 3 5Ressonância Magnética (MRI) 52 48 100Tomografia Computadorizada (CT) 63 37 100Ultra-som Intravascular (iVUS) 2 1 3Ultra-sonografia (US) 13 7 20

Totais 182 323 505

Tabela 6.3 Inventário de casos clínicos: classificação em normais e patológicos.

relação da quantidade de casos clínicos em função da região anatômica e modali-dade.

Região Anatômica XA MG MN RX MRI CT US iVUS

Abdômen – – 37 – – 17 2 –Coluna – – – 2 23 – – –Coração 100 – 45 1 38 36 18 3Crânio/cérebro – – 33 – 30 25 – –Fígado – – 12 – – – – –Joelho – – – – 9 – – –Mama – 4 – – – – – –Mãos – – – 1 – – – –Pâncreas – – 23 – – – – –Próstata – – 16 – – – – –Tórax – – 7 1 – 22 – –

Tabela 6.4 Inventário de casos clínicos: relação modalidade e região anatômica.

A possibilidade de recuperar dados a partir de outras bases de IM, externasà infra-estrutura deste projeto permite aumentar consideravelmente o número decasos clínicos disponíveis para acesso num período de tempo bastante curto (daordem de poucos minutos).

6.4.1 Modelo de pesquisa e recuperação

O modelo de pesquisa adotado é baseado em informações textuais e utiliza umesquema interno de linguagem de pesquisa, descrito em XML. A Figura 6.13 apre-senta o fluxo de informações utilizado nos procedimentos de pesquisa na infra-estrutura de base de IM. A partir de uma requisição do usuário (parâmetros de pes-

6.4. Avaliação dos mecanismos de pesquisa e recuperação 109

Figura 6.13 Fluxo de execução de pesquisas.

quisa), o portal envia as requisições de pesquisa às bases de IM da infra-estruturae bases externas, aguarda as respostas dessas bases, formata e envia tais respostasaos clientes requisitantes.

Figura 6.14 Etapas do processo de pesquisa e recuperação de IM.

A Figura 6.14 apresenta a representação do fluxo de execução da pesquisa erecuperação de IM, onde o usuário fornece os parâmetros da pesquisa, o sistemaprocessa a requisição, aplicando um esquema de formatação (formatador da pes-quisa). O manipulador de pesquisa local recebe os parâmetros formatados, geraum script SQL, interroga o gerenciador de banco dados, os resultados devolvidos

110 Uso da Base de IM

por este são formatados e enviados ao cliente. Por último, os resultados são apre-sentados na forma de lista, juntamente com os thumbnails dos casos clínicos. Apartir dessa lista, o usuário pode selecionar o caso clínico desejado.

O portal é o responsável por consolidar as respostas devolvidas pelas bases.Como as bases de IM respondem às requisições em diferentes intervalos de tempo,à medida que as respostas chegam, o portal atualiza a página de resposta no clienterequisitante.

Figura 6.15 Estudo clínico recuperado da base de IM MyPACS.net.

Quando um caso clínico é recuperado a partir de uma base de IM externa àinfra-estrutura, as informações referentes a este caso são mapeadas para o modelode apresentação da base de IM deste trabalho, de forma que a visualização doscasos clínicos externos seja similar à visualização dos casos clínicos internos. AFigura 6.15 apresenta a visualização de um caso clínico recuperado da base de IMMyPACS.net (caso clínico 1030052).

6.5. Avaliação de métodos de segmentação IM 111

6.4.2 Tempos de pesquisa e recuperação

Devido à característica de base de dados distribuída, os tempos de recuperaçãoforam medidos em três cenários distintos: (1) recuperação a partir da base de IMlocal; (2) recuperação a partir de bases da infra-estrutura e (3) recuperação a partirde outras bases de dados.

Em cada um dos cenários foram avaliados: (a) o tempo de retorno da respostaà uma certa pesquisa, (b) o tempo para abertura do caso clínico e (c) tempo paraabrir uma série de IM pertencente a um caso clínico.

O teste foi realizado no site InCor, cuja base de IM e as workstations utilizadasna recuperação estão conectadas a 100Mbps. No InRad, a conexão entre a base eas estações, bem como a conexão com o portal InCor, é de 10Mbps. A velocidade deconexão entre o portal InCor e as bases externas é dependente da velocidade da In-ternet comercial, durante os testes, conseguimos velocidade de, aproximadamente,2 Mbps.

Pesquisa Abertura RecuperaçãoCenários (a) (b) (c)

Base de IM local 0,43 0,89 23,41Bases de IM da infra-estrutura 1,12 1,02 39,62Bases de IM externas 3,27 3,14 54,74

Tabela 6.5 Tempos médios (em segundos) de pesquisa e recuperação.

A Tabela 6.5 apresenta, a média dos tempos (em segundos) de pesquisa, aber-tura do caso clínico e recuperação de IM, em cada um dos cenários mencionados.Para avaliação dos tempos, foram realizadas 50 pesquisas e recuperação de casosclínicos, aproximadamente 15 casos em cada pesquisa. Objetivando homogenei-dade nas pesquisas, foram pesquisados casos de CT e MRI por serem as principaismodalidades existentes nas principais bases de IM, com a média de 40 imagens emcada série.

6.5 Avaliação de métodos de segmentação IM

Usualmente, um sistema de análise de IM é composto de três componentes prin-cipais: segmentação, extração de características e reconhecimento (GONZALEZ; WO-

ODS, 2000). Destes três, a segmentação de IM ainda é uma questão crítica, paraa qual não se tem uma abordagem genérica capaz de realizá-la com acurácia emqualquer IM.

112 Uso da Base de IM

Segmentar uma IM consiste em dividir esta imagem em regiões significativas,separando o(s) objeto(s) de uma cena e o fundo (GONZALEZ; WOODS, 2000). A acu-rácia com que uma segmentação é realizada é, freqüentemente, o ponto crucial noque diz respeito ao desempenho de um sistema de análise de IM. Várias aborda-gens de segmentação de IM têm sido propostas (HARALICK; SHAPIRO, 1985). Porém,a seleção de uma abordagem adequada a um problema específico é, usualmente,baseada em testes e avaliações.

Objetivando demonstrar o uso do ambiente de base de IM em tarefas de avalia-ção de métodos de processamento de IM, nesta seção serão apresentadas as ava-liações de três métodos semi-automáticos de segmentação de IM utilizados parasegmentar do ventrículo esquerdo (VE) a partir de imagens de MRI.

6.5.1 Segmentação do ventrículo esquerdo

As técnicas de MRI para imageamento do coração têm sido aplicadas com êxitopara obter IM cardíacas com boas resoluções espacial e temporal. Um exame deMRI inclui um conjunto de seqüências temporais. Cada seqüência corresponde aum conjunto de imagens tomográficas (slices) adquiridas num certo plano e varian-tes no tempo em função do ciclo cardíaco.

A análise do sistema cardiovascular requer a identificação das paredes das es-truturas. Essas paredes são os contornos do endocárdio e do epicárdio.

Particularmente, a segmentação do VE é intensamente pesquisada, devido àimportância do mesmo na avaliação de parâmetros cardíacos para o diagnóstico depatologias e planejamento de intervenções cirúrgicas.

Tradicionalmente, em aplicações clínicas, as bordas são desenhadas de formamanual, o que constitui uma operação que consome bastante tempo do radiologista.Além disso, as segmentações manuais podem conter substanciais variabilidades deinter e intra-observadores.

Para reduzir estas variabilidades e as restrições inerentes à segmentação ma-nual, vários métodos de segmentação têm sido desenvolvidos. Alguns destes são ba-seados em abordagens de contorno e outros em regiões. Nesta seção serão avaliadostrês métodos: o Laplaciano do Gaussiano (Laplace of Gaussian – LoG) (GONZALEZ;

WOODS, 2000) e o método de limiarização local proposto por Eikvil e outros (EIK-

VIL; TAXT; MOEN, 1991) e o método dinâmico de limiarização proposto por Bern-sen (BERNSEN, 1986). Estes métodos foram comparados por meio de uma avaliaçãoquantitativa. Para redução de ruídos, antes de aplicar os métodos de segmentação,

6.5. Avaliação de métodos de segmentação IM 113

as imagens foram pré-processadas utilizando um filtro gaussiano, cujos parâmetrosforam variados durante a avaliação quantitativa de cada método de segmentação.

6.5.2 Considerações sobre a avaliação

Usualmente, os desenvolvedores de métodos de segmentação de IM mostram osresultados desses métodos a partir de um pequeno conjunto de IM e relatam porque os resultados são bons.

Durante a avaliação desses três métodos foram consideradas as característicasde forma e tamanho do objeto segmentado para quantificar a diferença entre assegmentações. Essas características foram calculadas a partir de:

• Área (A) e perímetro (P) de um objeto, as quais são duas características rela-cionadas ao tamanho do objeto.

• A circularidade (C), definida por C = 4π A/P2. Esta é uma característica inva-riante à escala.

• Os momentos cartesianos geométricos (YANG; ALBREGSTEN, 1994) foram uti-lizados para obter as características de forma do objeto. Entre elas: área,centróide, raio de inclinação, orientação e elipse da imagem.

• O alongamento que é medido como a relação dos tamanhos do maior e menoreixos da elipse da imagem.

(a) Imagem original (b) Radiologista 1 (c) Radiologista 2 (d) Radiologista 3

Figura 6.16 Gold standards utilizados na avaliação da segmentação do ventrículo es-querdo.

A Figura 6.16(a) foi extraída do caso clínico 315, estudo clínico 1, série número5, imagem número 7, da base de IM do site InCor. Este caso clínico possui IM deum indivíduo masculino, com 43 anos na data da realização do exame. Segundo olaudo, o estudo clínico é de um indivíduo normal.

114 Uso da Base de IM

As segmentações manuais – Figuras 6.16(b), 6.16(c) e 6.16(d) – foram obtidasa partir da Figura 6.16(a) segmentada por três radiologistas diferentes. Tais seg-mentações são os gold standards da avaliação. Para medir a diferença entre o goldstandard e a resposta dos métodos de segmentação, primeiramente foi calculado oerro de subposição (under-merging – UM) e o erro de sobreposição (over-merging –OM), propostos por Levine e Nazif (LEVINE; NAZIF, 1982). Nesta avaliação, estasduas medidas foram modificadas e calculadas para cada objeto, de forma a consi-derar também o tamanho de cada objeto. Para tanto, foi assumido que um goldstandard possui três regiões distintas: (a) uma região de fundo (B) constituída porpixels classificados como fundo por todas as três segmentações manuais; (b) a re-gião do objeto (O) constituída por pixels que compõem o objeto; e (c) uma região,denominada de incerteza, que é constituída por todos os outros pixels. A respostade um método de segmentação tem duas regiões: o fundo (B) e o objeto (O). Os errosUM e OM são definidos, respectivamente, por:

UM = area(O\O)/A

OM = area(B\B)/A

Onde a diferença da operação R1\R2 é definida por: R1\R2 = {p|p ∈ R1, p /∈ R2},na qual area(R) é a área da região R e A é média das áreas dos objetos obtidos apartir das três segmentações manuais. A medida da diferença é calculada comoDM =UM+OM.

Para obter mais informações sobre a diferença, foi utilizada a medida básicade acurácia (ultimate measurement accuracy – UMA) proposta por Zhang e Ger-brands (ZHANG; GERBRANDS, 1992), definida por UMA = |x− x|, utilizada para cal-cular a circularidade e a orientação. Onde x é o gold standard e x é a resposta dométodo de segmentação.

Uma vez que na avaliação foram utilizados três gold standards, a característicacorreta de x é calculada pela média dos três gold standards. Para área e alonga-mento, UMA foi normalizada pela média dos três valores de característica estima-dos a partir das três segmentações manuais, tendo-se: UMAnormal = |x− x|/x.

Os valores das medidas de diferença (UM, OM e DM) e UMAnormal são, primei-ramente, calculados para cada objeto e a partir disso extrai-se a média de todos osobjetos. Os desvios padrões também são calculados, pois um erro sistemático comum desvio padrão pequeno é considerado menos danoso do que um erro com desviopadrão grande.

6.5. Avaliação de métodos de segmentação IM 115

6.5.3 Resultados

Os métodos foram implementados como plug-ins e testados para processar asIM baixadas da base e, numa outra etapa, os mesmos métodos foram testados utili-zando a plataforma de armazenamento de plug-ins com suporte à execução remota.

Os três métodos de segmentação foram avaliados em combinação com a suavi-zação gaussiana. Esta suavização foi realizada com os seguintes valores de desviopadrão (σ = 1,0; 2,0; 3,0 e 4,0). O método LoG foi muito sensível a ruídos e nãofuncionou adequadamente para σ = 1.0.

Parâmetro de UM OM DMMétodo de suavização desvio desvio desvio

Segmentação (σ ) média padrão média padrão média padrão

LoG 2,0 0,033 0,028 0,093 0,133 0,126 0,1613,0 0,021 0,024 0,054 0,077 0,075 0,1014,0 0,013 0,019 0,097 0,091 0,110 0,110

Eikvil 1,0 0,065 0,061 0,007 0,027 0,072 0,0882,0 0,050 0,048 0,015 0,035 0,065 0,0833,0 0,037 0,040 0,036 0,057 0,073 0,0974,0 0,026 0,032 0,063 0,067 0,089 0,099

Bernsen 1,0 0,049 0,038 0,021 0,022 0,070 0,0602,0 0,027 0,022 0,041 0,028 0,068 0,0503,0 0,018 0,025 0,086 0,057 0,104 0,0824,0 0,012 0,018 0,105 0,061 0,117 0,079

Tabela 6.6 Médias e desvios padrões das medidas de diferença entre os gold standards eas respostas dos métodos de segmentação aplicados em 237 IM de MRI.

A Tabela 6.6 apresenta as médias e os desvios padrões dos valores de UM, OM

e DM que foram obtidos a partir do processamento de 237 IM de MRI, obtidas dediferentes casos clínicos, tanto das bases de IM da infra-estrutura, quanto de sitesexternos. Os menores valores de média e desvio padrão de DM, em cada método,estão indicados em negrito.

A Tabela 6.7 apresenta as médias e desvios padrões dos valores de UMAnormal,circularidade, orientação (em graus) e alongamento. Em cada coluna da tabela, osmenores valores de média e desvio padrão obtidos por meio dos métodos de seg-mentação também são apresentados em negrito. Na última linha da tabela sãoapresentados os valores de UMAnormal para as segmentações manuais, indicando asvariabilidades inter-observadores.

Os resultados sugerem que o método proposto por Bernsen com σ = 2.0 é omelhor. Este método oferece os menores erros para a maioria das medidas apre-

116 Uso da Base de IM

Parâmetro de Área Circularidade Orientação AlongamentoMétodo de suavização desvio desvio desvio desvio

Segmentação (σ ) média padrão média padrão média padrão média padrão

LoG 2,0 0,177 0.202 0.138 0,105 9,476 9,735 0,259 0,2383,0 0,097 0,096 0,049 0,038 5,183 4,262 0,190 0,1884,0 0,170 0,115 0,035 0,034 2,679 1,734 0,146 0,151

Eikvil 1,0 0,161 0,106 0,065 0,047 7,105 7,436 0,119 0,1242,0 0,132 0,085 0,078 0,050 2,819 1,939 0,130 0,1233,0 0,110 0,091 0,101 0,049 5,971 8,345 0,154 0,1354,0 0,157 0,113 0,116 0,050 7,613 8,193 0,174 0,154

Bernsen 1,0 0,108 0,089 0,059 0,029 4,752 7,525 0,101 0,1002,0 0,100 0,079 0,073 0,046 2,583 1,275 0,067 0,0523,0 0,142 0,104 0,100 0.048 5,374 5,688 0,154 0,1304,0 0,157 0,113 0,114 0.049 6,917 4,273 0,183 0,153

Manual – 0,086 0,052 0,037 0,018 1,873 1,316 0,065 0,053

Tabela 6.7 Médias e desvios padrões dos valores UMAnormal.

sentadas nas tabelas. Com este método, as médias e os desvios padrões dos valoresde UMAnormal não são muito maiores que os valores obtidos a partir da segmentaçãomanual. Pode-se observar que o filtro de suavização introduz o efeito de tornar osobjetos maiores. Quando o grau de borramento aumenta, o erro de OM tambémaumenta e UM decresce. Contudo, segmentações para outras finalidades podemexigir diferentes graus de suavização. Vale ressaltar que com estes dados pode-se,além de aplicar métricas distintas, utilizar metodologias para comparar estatis-ticamente os diversos métodos, podendo reproduzir o experimento e comparar osvalores da tabela.

Para minimizar os efeitos que tornam os objetos maiores a partir do métodode suavização gaussiano, as técnicas de difusão anisotrópica podem ser uma boaopção. Tais técnicas foram originalmente usadas na geração de espaço de escalasproposto por Perona e Malik (PERONA; MALIK, 1990) e foram rapidamente caracte-rizadas por suas capacidades de difusão mais rápida em objetos ou regiões e maislenta em contornos.

6.6 Avaliação de métodos de compressão sem per-

das

Com o maior volume de dados gerados a partir de IM, a compressão dessasimagens desempenham um importante papel, principalmente no armazenamentode dados pelos PACS e transmissão dessas imagens em aplicações de Telemedicina

6.6. Avaliação de métodos de compressão sem perdas 117

e Telerradiologia.

As imagens, de um modo geral, podem ser comprimidas com perdas (lossy) ousem perdas (lossless). Os métodos de compressão lossless, também chamados rever-síveis, oferecem a compressão dos dados da IM e sua descompressão sem qualquerperda de informação comparando-se com IM original (KIVIJÄRVI et al., 1998). Nor-malmente, as taxas fornecidas por estes métodos variam em torno de 2:1 a 3:1. Poroutro lado, os métodos lossy – chamados irreversíveis – não possibilitam a exatarecuperação da IM originalmente comprimida, mas as taxas de compressão podemexceder 100:1, dependendo da qualidade e conteúdo da IM.

Embora algumas técnicas de compressão lossy produzam IM cuja diferença, apartir de comparação com a imagem original, é visualmente imperceptível, estastécnicas raramente são adotadas para uso na prática clínica.

Atualmente, os métodos de compressão mais utilizados em IM é o JPEG Loss-less (JPEG-LS) (WALLACE, 1991). Os métodos baseados no padrão JPEG têm sidofortemente indicados pelo comitê DICOM Working Group, porém abordagens ba-seadas em Wavelet (ALDROUBI; UNSER, 1996) têm ganho espaço. Em novembro de2001, o DICOM Working Group adicionou o suporte para padrão JPEG 2000 (CHAR-

RIER; SANTA CRUZ; LARSSON, 1999; SANTA CRUZ; EBRAHIMI; CHRISTOPOULOS, 2001)que é baseado em Wavelet.

6.6.1 Considerações sobre a avaliação

Além de apresentar um cenário para uso da base de IM deste trabalho, estaseção compara o desempenho de três métodos usuais de compressão de IM semperdas – o JPEG-LS, o Lempel Ziv Welch (LZW) (ZIV; LEMPEL, 1977) e o JPEG-2000– objetivando selecionar um método para compressão de IM sob demanda parauso em tarefas de transmissão de IM. Nesta avaliação foram avaliados o tempopara compressão/descompressão e a taxa fornecida por estes métodos, calculadapor taxa = tamanho da IM original

tamanho da IM comprimida .

A comparação foi baseada no conjunto de IM apresentado na Figura 6.17 3,contemplando 20 IM de diferentes modalidades, características (resolução, bits porpixel e interpretação fotométrica) e provenientes de diferentes bases de IM. Ascaracterísticas das IM utilizadas na avaliação dos algoritmos de compressão estãorelacionadas na Tabela 6.8.

3Imagem 16 disponível em https://barre.dev/medical/samples/

118 Uso da Base de IM

Figura 6.17 Conjunto de imagens utilizado para avaliação dos métodos de compressão.

Durante os testes de compressão foi utilizado um microcomputador com pro-cessador Intel Pentium®IV, 512 Mb de memória RAM, 80Gb de espaço em disco esistema operacional Microsoft Windows XP Professional®. As IM foram baixadaspara este microcomputador e todo o processamento foi realizado no próprio compu-tador.

6.6. Avaliação de métodos de compressão sem perdas 119

InterpretaçãoImagem Base de IM Caso Clínico Nro. de Bits fotométrica

1 InCor 5 16 Monochrome 22 MedPix 5380 16 Monochrome 23 MIRC case33 16 Monochrome 24 MIRC case53 16 Monochrome 25 Aunt Minie 13R0PGJC 16 Monochrome 26 InCor 385 16 Monochrome 27 MedPix 5341 16 Monochrome 28 CasImage 3433 16 Monochrome 29 Gloabal Rad 2156 16 Monochrome 2

10 InCor 168 8 Monochrome 211 InRad 15 16 Monochrome 212 InCor 98 16 Monochrome 213 InRad 29 8 Monochrome 214 InCor 356 8 Monochrome 215 MyPacs.net 5301 8 Monochrome 216 InCor 45 8 Palette Color17 InCor 67 24 RGB18 InCor 59 8 RGB19 InCor 78 8 RGB20 InCor 182 8 Monochrome 2

Tabela 6.8 Características das imagens utilizadas na avaliação dos algoritmos de com-pressão.

6.6.2 Resultados

A Tabela 6.9 apresenta as taxas de compressão resultantes da aplicação dosmétodos e seus respectivos tempos (em segundos) para compressão/descompressão.Nesta tabela, é apresentada somente uma coluna de tempo, isto se deve ao fato deque os tempos de compressão e descompressão observados são muito parecidos.Assim, os valores indicados nas colunas de tempo referem-se à média aritméticadesses tempos.

As maiores taxas de compressão (vide gráfico da Figura 6.18) foram obtidas como JPEG-2000 (9,0:1, em média 4,9:1), seguida das taxas obtidas com o LZW (7,3:1,em média 2,4:1) e o JPEG-LS (3,7:1, em média 2,3:1).

Por outro lado, os menores tempos de compressão (vide gráfico da Figura 6.19)foram obtidos com o JPEG-LS (0,004s, em média 0,303s), seguido dos tempos deobtidas com o JPEG-2000 (0,062s, em média 0,829s) e o LZW (0,282s, em média10,646s).

Esta rápida comparação mostrou que os melhores métodos, em termos de taxa

120 Uso da Base de IM

Resolução Bits por Tamanho JPEG-LS LZW JPEG-2000Imagem (larg. x alt.) pixel (em KBytes) taxa tempo taxa tempo taxa tempo

1 1760 x 2368 16 8.140 3,7:1 0,438 2,5:1 16,047 6,7:1 1,7812 2200 x 2500 16 10.742 1,7:1 0,984 1,2:1 34,954 4,1:1 2,1403 2392 x 1792 16 8.372 2,1:1 0,718 1,4:1 24,390 5,0:1 1,7034 2392 x 1792 16 8.372 2,1:1 0,765 1,3:1 24,031 4,9:1 1,6255 2048 x 2500 16 10.000 2,3:1 0,782 1,7:1 22,656 5,8:1 1,9376 2424 x 5765 16 27.293 2,8:1 1,812 2,2:1 78,360 7,0:1 5,1257 440 x 440 16 378 2,9:1 0,016 1,4:1 0,750 3,9:1 0,1108 512 x 512 16 512 2,8:1 0,063 1,7:1 1,297 7,3:1 0,1099 512 x 512 16 512 2,6:1 0,015 1,7:1 1,438 6,6:1 0,12510 480 x 480 8 225 1,8:1 0,016 1,6:1 0,719 1,9:1 0,12511 256 x 256 16 128 1,9:1 0,047 1,4:1 0,391 3,2:1 0,06312 512 x 512 16 512 2,4:1 0,004 2,8:1 0,282 7,3:1 0,06213 238 x 253 8 128 2,9:1 0,016 1,9:1 0,313 2,4:1 0,06214 512 x 512 8 256 1,8:1 0,032 1,7:1 0,656 1,9:1 0,14015 512 x 512 8 256 1,8:1 0,016 1,2:1 0,907 1,7:1 0,12516 640 x 480 24 300 1,1:1 0,046 3,2:1 0,438 2,5:1 0,15617 640 x 476 24 892 2,5:1 0,110 6,1:1 1,250 7,5:1 0,40618 640 x 476 24 892 2,4:1 0,063 7,3:1 1,562 7,6:1 0,34419 640 x 476 24 892 2,4:1 0,094 5,6:1 1,516 9,0:1 0,32820 512 x 512 8 256 2,1:1 0,015 1,3:1 0,969 2,1:1 0,125

Tabela 6.9 Resumo da avaliação dos métodos de compressão.

de compressão e tempo para compressão/descompressão, são o JPEG-LS e JPEG-2000. Apesar de o LZW ter apresentado, na média, melhor taxa de compressãocomparado como JPEG-LS, quando este é aplicado em IM maiores a taxa de com-pressão é a menor do que dos outros dois métodos e o tempo gasto nas tarefasde compressão/descompressão são muito maiores do que os tempos auferidos comJPEG-LS e JPEG-2000.

6.7 Discussão

Este Capítulo demonstrou o uso do ambiente de base de IM, começando pelausabilidade da aplicação, destacando a inserção de casos clínicos e sua integraçãocom outras bases de IM. Além disso, foi demonstrado que é possível e viável utili-zar o conjunto de aplicações deste trabalho em outros propósitos como é o caso doarquivo didático digital. Tais demonstrações representam a validação do modelode dados proposto neste trabalho.

Por meio do uso ambiente na avaliação de métodos de segmentação, pode-se

6.7. Discussão 121

Figura 6.18 Gráfico de comparação das taxas de compressão obtidas pelos métodos JPEG-LS, LZW e JPEG-2000.

Figura 6.19 Gráfico de comparação dos tempos de compressão a partir dos métodos JPEG-LS, LZW e JPEG-2000.

perceber que quando o gold standard está disponível, a avaliação se restringe àquantificar a diferença entre a imagem de referência e a resposta fornecida pelométodo. Adicionalmente, esta avaliação pode ser facilmente expandida de forma acolocar em prática os contextos e cenários de uso mencionados no Capítulo 4, subse-ção 4.2.2. Outro aspecto relevante, mostrado durante a avaliação da segmentação,diz respeito à viabilidade da criação de plug-ins para processar remotamente osconjuntos de dados e o servidor retornar os resultados ao usuário requisitante.

A avaliação dos métodos de compressão serviu para, além de demonstrar quea aplicação pode ser utilizada em diferentes processos de avaliação, obter algunsindicativos sobre qual método de compressão pode ser mais adequado para uso,num futuro próximo, no armazenamento e distribuição das IM entre os pares da

122 Uso da Base de IM

infra-estrutura do ambiente de base de IM. Novamente aqui, também poderiam seraplicados testes estatísticos elaborados, como por exemplo o teste T Pareado parase verificar a diferença estatística entre os métodos.

Capítulo

7DISCUSSÃO

“Every child is an artist. The problem is how to remain an artistonce he grows up.”

VINCENT VAN GOGH

As tecnologias de informação e comunicação tornam-se mais apreciadas quandoos usuários têm a possibilidade de experimentar, a partir dessas tecnologias, assensações de segurança, maturidade e capacidade de concluir, com êxito, a realiza-ção de uma determinada tarefa.

Os primeiros desenvolvimentos na área de computação tinham – atualmente,alguns ainda têm – por objetivo demonstrar o que os computadores poderiam fazer.Com o maior uso dos computadores, em diversas atividades, os desenvolvimentospassam a considerar o que os usuários podem fazer com os recursos computacio-nais. Prova disso, é que as tecnologias mais utilizadas e disseminadas são aquelasque mantêm uma relação de harmonia com as necessidades do usuário e tais tec-nologias devem suportar o desenvolvimento de atividades capazes de enriquecer asexperiências de seus usuários (SHNEIDERMAN, 2003).

Neste Capítulo é apresentada uma reflexão sobre o desenvolvimento deste tra-balho, iniciando pelas contribuições fornecidas a diferentes atividades, como o usodo ambiente de base de IM em outros projetos de pesquisa e, por último, são apon-tadas algumas das limitações do que foi proposto neste trabalho e que poderão serresolvidas a partir da implementação de novos desenvolvimentos.

123

124 Discussão

7.1 Contribuições

Vannier (VANNIER; STAAB; CLARKE, 2002) destaca a necessidade da criação, ex-pansão, integração e compartilhamento dos arquivos de dados sobre IM como umaatividade imprescindível para o desenvolvimento de pesquisas na área de IM. Defato, muitas áreas esperam pela existência de repositórios públicos de IM parautilizá-los em tarefas como avaliação de software e desenvolvimento de aplicaçõesclínicas.

Atualmente, é difícil imaginar o desenvolvimento de trabalhos de pesquisa semo uso de ferramentas computacionais para armazenar, organizar, pesquisar, recu-perar e manipular os conjuntos de dados coletados ao longo do desenvolvimentode uma pesquisa. No Capítulo anterior, foi demonstrado que isto é factível, tantono desenvolvimento de métodos de processamento de IM, quanto nas práticas deensino da Radiologia, conduzindo à “democratização do conhecimento”.

Um exemplo da “democratização do conhecimento” e disponibilidade de dadospara pesquisas é o Portal de Periódicos1 da Coordenação de Aperfeiçoamento dePessoal de Nível Superior (CAPES), acessível a partir de qualquer computador co-nectado à Internet em universidades e institutos. Tal programa tem oferecido aoportunidade de acesso e rápida aquisição de artigos dos principais periódicos cien-tíficos por meio de acesso eletrônico.

A disponibilidade de um modelo e base de dados que suporte o armazenamentoe manipulação de diferentes conjuntos de dados, como é o caso dos documentosclínicos, constitui uma contribuição relevante às tarefas que demandam o armaze-namento desse tipo de dado. Esta característica, apoiada no uso da Internet, podeencorajar e facilitar o desenvolvimento de pesquisas multicêntricas/multi-institu-cionais.

7.1.1 Modelo e arquitetura de base distribuída de IM

As tradicionais abordagens de bases de imagens, normalmente, têm apresen-tado modelos de arquiteturas centralizadas. Com o intuito de viabilizar a criaçãoe distribuição de locais de armazenamento e recursos de processamento, este tra-balho implementou um modelo de base distribuída de IM, especialmente projetadopara atender aos requisitos de uma base de dados sobre IM, de modo a assegurara escalabilidade da arquitetura e consistência do volume de dados. Esta aborda-

1http://www.periodicos.capes.gov.br

7.1. Contribuições 125

gem representa a oportunidade de compartilhar os recursos do sistema, por meiodo balanceamento de acesso aos conteúdos das bases de IM e, como principal be-nefício, pode oferecer reduções na sobrecarga de processamento das requisições depesquisa, por meio da visão de uma única base de IM.

A abordagem de base distribuída de IM aqui proposta contribui para integraçãodas diferentes fontes de dados e locais de armazenamento. Algumas das vanta-gens são: redução de “gargalos” e problemas de desempenho; alta confiabilidade edisponibilidade do sistema; facilidades de configuração e operação; facilidades nacriação de módulos de armazenamento e crescimento da infra-estrutura.

Uma das premissas do início do desenvolvimento deste trabalho era que estenão fosse “mais uma base de IM” a se tornar disponível. Assim, complementandoo projeto da arquitetura distribuída, foram criados repositórios de interfaces paratroca de dados entre diferentes bases externas de IM e as bases de IM componentesda infra-estrutura aqui implementada.

Um exemplo é a RSNA que tem desenvolvido padrões para a criação do MIRC(RSNA, 2005). O esquema de troca de dados criado pela RSNA para o MIRC foiutilizado neste trabalho, viabilizando a troca de informações entre diferentes basesde IM, vistas atualmente como de referência. Utilizando estes esquemas e outrossemelhantes em outras bases, pode-se agregar novos casos à infra-estrutura, bemcomo compartilhar os casos clínicos existentes nas bases de IM deste trabalho.

No que concerne à integração de conteúdos de diferentes bases de IM, o modelodistribuído suporta a pesquisa e recuperação de casos clínicos a partir de bases deIM externas ao ambiente proposto. Embora haja diferença de modelos de dados, oscasos clínicos recuperados são apresentados na mesma GUI padrão deste trabalho(Figura 6.15) e a origem dos mesmos é devidamente referenciada.

O modelo proposto neste trabalho demonstrou que é possível e viável integraro conteúdo de diferentes bases de IM e apresentar esses conteúdos numa mesmaGUI, possibilitando agregar um legado de casos clínicos de diversos locais de arma-zenamento.

7.1.2 Fomento à pesquisa e desenvolvimento de métodos de

processamento de IM

Com o intuito de fomentar o desenvolvimento de novos métodos computacionaisde processamento e análise de IM, bem como fornecer condições para avaliá-los

126 Discussão

de modo mais abrangente, como demonstrado no Capítulo anterior, o trabalho de-monstrou que diferentes métodos de processamento de IM podem ser testados emgrandes e diversos conjuntos de dados, com a liberdade de seleção da métrica maisadequada.

A avaliação consiste num processo de julgamento do valor de um método, emtermos de sua habilidade e capacidade de processar IM. A avaliação em proces-samento de IM é bastante difícil em função da quantidade de nuances que esteprocedimento pode incluir. Um aspecto importante para reduzir as variabilidadesé definir claramente a natureza do estudo de avaliação para a condução deste pro-cesso. Nota-se que o processo de avaliação envolve muitos estágios, cada um envol-vendo uma investigação específica. Fryback e Thornbury (FRYBACK; THORNBURY,1991) propõe seis níveis para avaliação.

A partir dos testes realizados no Capítulo anterior, pode-se observar que o testede métodos de processamento de IM como os de segmentação e compressão inde-pende da forma com que as IM estão disponíveis para acesso. Em outras palavras,o impacto no desenvolvimento das tarefas de teste desses métodos é pequeno, em-bora este impacto poderá ser minimizado se as IM estiverem organizadas de formaque o acesso seja fácil e direto. Para o caso de testes de algoritmos de CBIR, oimpacto é muito maior se as IM não estiverem organizadas de certa forma e nãoexistir uma forma direta de acesso a essas imagens.

Por meio da interface de plug-ins, este trabalho disponibiliza um ambiente detestes para diversos métodos de processamento de IM, como sendo os métodos deCBIR um dos principais usuários dessa funcionalidade. Esta contribuição podeproduzir impactos em diversas pesquisas relacionadas ao processamento de IM,onde a maior preocupação passará a ser com o desenvolvimento dos métodos derecuperação, uma vez que a API destinada ao desenvolvimento de plug-ins provêas facilidades para acesso e manipulação dos dados contidos nas bases.

7.1.3 Arquivo didático digital

O aprendizado em Radiologia requer o estudo sistemático de um grande e di-versificado conjunto de informações. Há tempos, o arquivo didático de Radiologiatem sido um dos principais recursos de aprendizado dessa especialidade. Usual-mente, as competências dos estudantes são desenvolvidas e avaliadas por meio deIM em filmes, projeção de slides de filmes fotografados ou reproduções de filmesradiológicos (MULLINS et al., 2001). Assim, os elementos de um arquivo didáticocompreendem as IM radiológicas acompanhadas de um conjunto de dados clínicos

7.1. Contribuições 127

relevantes e a descrição das condições clínicas do paciente.

A criação e manutenção de uma “biblioteca” para tal finalidade e baseada em fil-mes, como normalmente ocorre, é uma tarefa que demanda grandes esforços (BRAM-

BLE; INSANA; DWYER, 1990; MACURA; MACURA; MORSTAD, 1995), principalmente re-cursos humanos e espaço físico. Num ambiente de desenvolvimento de atividadesde ensino, pesquisa e/ou educação continuada, a preparação de aulas, apresenta-ções e, eventualmente, o compartilhamento de casos clínicos entre os profissionaissão tarefas comuns. Outro aspecto é o tempo necessário para pesquisar e recuperarmateriais num ambiente baseado somente na organização de filmes.

O arquivo didático é uma das visões das bases de IM deste trabalho, uma vezque o trabalho propõe a criação de um ambiente de bases de IM com heterogenei-dade de casos clínicos e informações de diagnóstico. Dessa forma, está previsto oarmazenamento de um grande conjunto de informações que podem ser utilizadasnas práticas de treinamentos em Radiologia e processos de educação continuada.

Diferente das características dos tradicionais sistemas de registro de casos clí-nicos, o modelo proposto neste trabalho considera o caso clínico completo, ou seja,incluindo as informações demográficas, anamneses, evoluções, exames, prescriçõese o desfecho (encerramento) do caso clínico. Normalmente, os casos clínicos docu-mentados em bases de IM e apresentações em reuniões clínicas contêm apenas umexame e imagem(ns) significativa(s), raramente o seguimento do caso é apresen-tado. Quando isto ocorre, considera-se como um novo caso clínico.

Esta contribuição possibilita o arquivamento de IM juntamente com o conheci-mento de especialistas. Dessa forma, as atividades de ensino em Radiologia podembeneficiar-se dos conjuntos de dados disponíveis na infra-estrutura na geração deextração de conhecimentos.

7.1.4 Modelo de categorização de casos clínicos

Os diversos casos clínicos contidos nas bases podem ser classificados e agrupa-dos de acordo com vários critérios definidos pelo usuário durante a recuperaçãodestes. Dessa forma, o modelo proposto permite, de forma prática e rápida, a clas-sificação dos casos clínicos tão granular quanto se queira em função de parâmetroscomo anatomia, patologia, informações demográficas do paciente e vista (corte),entre outros.

Esta categorização é bastante útil nos diferentes usos deste ambiente de basede IM, objetivando organizar os conjuntos de dados de diversas formas.

128 Discussão

7.1.5 Extração de conhecimento

A correlação imagem, patologia e informações contidas numa imagem é algo di-fícil de oferecer de maneira prática. Mas com este ambiente que congrega váriosrepositórios de IM, com imagens e diagnósticos, a partir dos conjuntos de dados des-ses repositórios, pode-se fazer correlações entre casos ou exames clínicos de gruposdistintos. Para tanto, o ambiente proposto também pode ser utilizado no desen-volvimento de ferramentas para mineração de dados nessas bases, objetivando aextração de conhecimentos a partir das bases de IM.

Outra contribuição relacionada à extração de conhecimento diz respeito à ava-liação de protocolos clínicos. Os casos clínicos contidos na base podem ser cria-dos a partir de protocolos clínicos, os quais poderão ser agrupados, de acordo comcritérios de categorização e comparados entre si ou com outros protocolos. Estacontribuição pode subsidiar a criação de guidelines específicos de tratamentos.

7.1.6 Base de dados com arbitragem

Em função do acesso público e das diferentes fontes de informações, os diag-nósticos compartilhados podem ser enganosos, defectivos ou vagos. Por esta razão,foram incluídos os moderadores para validar a veracidade e qualidade dos dadosque são inseridos nas bases de IM. Esta característica oferece um canal de comuni-cação entre os usuários, de modo que os retornos por parte dos especialistas tendema enriquecer o conteúdo da base, por meio de perguntas, respostas e comentários.

Vale também destacar a inserção do modelo de revisão dos casos clínicos. Dife-rentemente do que ocorre em muitas bases de IM, esta característica tem possibili-tado garantir a qualidade do conjunto de dados, uma vez que todo material inseridopassa pela revisão de pelo menos um moderador.

Esta contribuição possibilita que o usuário tenha ciência do tipo de material queestá recuperando, antes de utilizá-lo.

7.2. A memória a partir de IM 129

7.2 A memória a partir de IM

Uma fotografia tirada numa viagem ou ocasião especial é o registro daquelemomento. Tradicionalmente, o objetivo de registrar esse momento reflete o desejode, futuramente, relembrá-lo ou apresentar este registro a outrem.

De forma semelhante, isso também ocorre com as IM. Tais imagens constituemuma forma de registro das informações anatômicas, funcionais e, em alguns casos,metabólicas de órgãos ou estruturas do corpo de um paciente. O uso mais comumdessas imagens é na análise, formulação do diagnóstico e/ou planejamento de in-tervenções cirúrgicas.

Um Departamento de Diagnóstico por Imagem (DDI), como é o caso do InRaddo HC-FMUSP, é capaz de realizar anualmente milhares de exames baseados emIM. Manter essas IM e informações associadas a elas é um desafio bastante grandeporém necessário. Um dos motivos para isso é a diversidade de casos clínicos quesão tratados pelos profissionais do complexo hospitalar do HC-FMUSP (o InRadé o local onde é realizada a maioria dos exames de IM deste complexo), associa-do ao fato de que o complexo está inserido numa universidade. E, nesse contexto,subsistem as premissas de ensino, assistência e pesquisa.

Ao longo do desenvolvimento deste trabalho, pôde-se observar que, o comparti-lhamento de conhecimentos no domínio clínico é algo bastante complexo, conside-rando as diversas variáveis que permeiam tal conhecimento, inclusive o aspectotácito. No entanto, também pôde-se observar que, de modo não formal, ocorreo compartilhamento de conhecimentos em diversas atividades colaborativas queocorrem num ambiente clínico – por exemplo, as reuniões de discussão de casosclínicos que são algo comum em diversas instituições.

Com isto, sobre o componente tácito do conhecimento, no caso da construçãode bases de dados sobre IM, cabe observar que trata-se de algo de grande valia,particularmente, quando se analisa as inferências diagnósticas. Portanto, umacaracterística a ser destacada é validade de opiniões de especialistas experientesna prática clínica. Embora válida, é um desafio preparar uma base dados comestas inferências, uma vez que tanto os documentos clínicos, quando as inferênciassão difíceis de serem sistematizadas, o que implica a adoção de abordagens quedependem de poder computacional para extrair informações dessas bases. Nessesentido, a infra-estrutura desenvolvida neste trabalho pode contribuir para esteestudo.

Dessa forma, frente às dificuldades inerentes à tipologia diversa da informação

130 Discussão

clínica, percebe-se a dificuldade de se ter um método único e genérico para que sefaça a manutenção desse tipo de conhecimento. Neste caso, é importante ressaltarque Nonaka (NONAKA, 1994) propõe uma distinção de conhecimentos em duas cate-gorias: explícitos e tácitos. Segundo ele, os conhecimentos explícitos são capturadosem bibliotecas, arquivos, sistemas de documentos e bases de dados. E, por outrolado, os conhecimentos tácitos comportam tanto os modelos mentais (por exemplo,esquemas, paradigmas e crenças) que fornecem perspectivas para perceber e defi-nir uma visão do mundo (aspecto cognitivo), quanto modelos bem fundamentados ehabilidades que são aplicáveis a contextos específicos (aspecto de natureza técnica).Ressalta-se nesta observação que os conhecimentos tácitos têm um aspecto subje-tivo, o que torna difícil sua comunicação e formalização demandas na construçãode bases de dados.

Dessa forma, faz-se necessário a criação de um modelo de documento clínicoque permita a extração dos conceitos a partir do domínio da aplicação clínica. Aomesmo tempo, este modelo precisa suportar a adoção de vocabulários específicos, demodo que que a representação e manutenção desses ambientes informacionais sejarealizada sem ambiguidades. Nesse sentido, destaca-se que será necessário umtrabalho próprio para especificar dicionários, nomencaluteras thesaurus, catálogose esquemas de classificação específicos para cada domínio da área Médica.

Nesse sentido, a documentação dos procedimentos adotados na prática da as-sistência clínica pode ser considerada um passo inicial no longo caminho da cons-trução de uma base de conhecimento sobre IM. Para o caso do armazenamento dasIM, também é necessário armazenar as informações pertinentes ao paciente e aocaso clínico que motivou a realização do exame, bem como as evoluções deste casoclínico.

Usualmente, as bases de IM e, muitas das reuniões clínicas de apresentaçãode casos, são centradas num certo exame, julgado interessante ou de tratamentocomplicado. O armazenamento desse conjunto de informações é necessário, poréma forma que esses casos e reuniões são apresentados inviabiliza o uso destes sema presença do autor. Como mencionado, diferentemente desse cenário, a propostadeste trabalho tem como objeto de estudo o caso clínico que compreende o arquiva-mento de toda a história clínica do indivíduo, bem como os exames realizados, asevoluções e o encerramento deste, com a cura ou óbito.

Demonstrado com a criação do arquivo didático em Radiologia, o modelo de da-dos proposto neste trabalho viabiliza a construção de uma infra-estrutura capazde oferecer meios para perenizar a memória de uma instituição de assistência pormeio do arquivamento dos casos clínicos nela tratados. Isso inclui a documenta-

7.3. Centro de estudos em processamento de IM 131

ção completa desses casos clínicos a partir de um modelo de documento clínico quepode ser aplicado em diferentes propósitos. Este modelo ainda pode evoluir acom-panhando a dinâmica do conhecimento clínico. Outro aspecto relativo ao modelode documento clínico é que este também pode ser adaptado, a partir da criação deuma template, para armazenar estudos de anatomia patológica. Esta abordagemrepresenta a principal etapa da criação de uma base de conhecimentos sobre IM.

7.3 Centro de estudos em processamento de IM

Com o desenvolvimento das tecnologias de informação os conceitos de aprendi-zado eletrônico (e-learning) têm sido aplicados em muitos contextos (LYTRAS; TSI-

LIRA, 2003; BOURAS; PHILOPOULOS; TSIATSOS, 2001). As aplicações de e-learningenvolvem o aprendizado e aquisição de conhecimento baseado em recursos compu-tacionais, salas de aula virtuais e colaboração digital.

Utilizando-se desses conceitos, a base de IM pode possuir um módulo onde do-centes de disciplinas de processamento de IM possam disponibilizar seus cursos,propor o desenvolvimento de trabalhos práticos e desenvolver atividades colabora-tivas entre os alunos.

Dessa forma, uma das visões do ambiente apresentado neste trabalho é que estetambém poderá tornar-se uma plataforma de e-learning para o ensino de proces-samento de IM, em cursos de graduação e/ou pós-graduação. O que é necessárioé o desenvolvimento de um módulo ou a inclusão de uma aplicação de e-leaning àinfra-estrutura de base de IM. Para tal propósito há várias implementações opensources disponíveis em diversos sites como no SourceForge2.

7.4 Limitações da implementação

Embora o ambiente de base de IM proposto neste trabalho atenda aos objeti-vos propostos e ofereça relevantes contribuições, alguns aspectos relativos a estaimplementação deverão ser investigados em atividades futuras. Destes aspectos,destacam-se:

• Gerenciamento dos recursos do servidor quando a funcionalidade de proces-samento remoto é utilizada: Iniciar o processamento remoto para manipularum conjunto de IM da base, pode impactar no desempenho do servidor da

2http://sourceforge.net

132 Discussão

aplicação. Este impacto pode ser minimizado com o uso de abordagens degrid computing e a criação de mecanismos que controlam o tempo de vida dosprocessos disparados por um usuário e controlam os recursos utilizados poreste processo.

• Certificação dos materiais: A certificação dos conjuntos de dados é imprescin-dível para garantir a qualidade dos conjuntos de dados da aplicação. Porém,se tiver um número muito restrito de moderadores e um grande número deusuários inserindo dados na base, a tarefa de avaliação pode se tornar bas-tante onerosa e pouco criteriosa. Uma ferramenta de avaliação automática ousemi-automática dos casos clínicos pode auxiliar os moderadores nessa tarefa.

• Ferramentas para desenvolvimento de atividades colaborativas: Embora aaplicação possua um chat para o desenvolvimento de atividades colaborativasentre os pares, os recursos deste módulo podem ser potencializados com ainclusão de recursos de áudio e vídeo, possibilitando a criação de conferências.

• Identificações impressas na própria imagem: Quando as informações identifi-cativas vêm inseridas no próprio conjunto de dados que compõem a IM, estasdevem ser removidas por meio da edição da imagem. Porém, isso só poderáser realizado quando o processo de revisão é iniciado.

• Métricas: A necessidade por regras pertinentes à avaliação de métodos deprocessamento de IM já vem sendo assinalada e esforços têm sido dispendidospara criar procedimentos de avaliação da qualidade (FURUIE et al., 1994; MA-

TEJ et al., 1994). Entretanto, ainda não se tem uma regra totalmente aceita.Esta limitação independe do conjunto de aplicações aqui desenvolvido, poisnão existe um conjunto de métricas que podem ser aplicadas na avaliação dequalquer método de processamento de IM. Para tanto, a aplicação suporta oarmazenamento de guidelines para avaliação, os quais dependem de um am-plo trabalho de pesquisa.

• Política de autoria de casos clínicos: Além das políticas de anonimização dosdados clínicos, controle de acesso e auditoria já implementadas, as políticasde publicação de casos clínicos e direitos autorais também deverão ser imple-mentadas numa próxima etapa. Para implementação dessas políticas exige-seum amplo estudo dos aspectos éticos e legais de direitos autorais vinculadosàs publicações em meio eletrônico.

Em adição a estas limitações, outras limitações dependem da disponibilidadede recursos de infra-estrutura, como é o caso de largura de banda para o tráfego

7.4. Limitações da implementação 133

de IM, embora seja possível e viável o uso de técnicas de compressão de IM semperdas, como demonstrado no Capítulo anterior.

Capítulo

8CONCLUSÃO

“Without art, the crudeness of reality would make the worldunbearable.”

GEORGE BERNARD SHAW

O processamento de IM tem se tornado essencial em muitas atividades de diag-nóstico clínico. A avaliação confiável de métodos e aplicações de processamento deIM é uma tarefa imprescindível para a inserção destes na rotina clínica e essencialpara identificar adequadamente seus potenciais e limitações.

Constantemente, uma variedade de novos métodos e sistemas de processamentode IM é apresentada. Entretanto, constitui tarefa crítica a análise e comparaçãode métodos, ou mesmo, testá-los exaustivamente. Um dos principais obstáculos éa falta de conjuntos de dados abrangentes, diversificados e confiáveis. Usualmen-te, cada grupo organiza seu próprio conjunto de dados para testes. Muitas vezes,tais conjuntos são limitados em termos de modalidades e patologias, o que dificultaavaliações reais e eficientes. O compartilhamento de diferentes conjuntos de da-dos sobre IM pode auxiliar nas tarefas de avaliação e certificação de métodos. Domesmo modo, grupos envolvidos com atividades em Radiologia Médica necessitamde ferramentas para organizar seus conjuntos de casos tidos como interessantes.

De acordo com essas questões, os objetivos de disponibilizar um ambiente sobreo qual os métodos e aplicações de processamento de IM podem ser avaliados, asIM podem ser distribuídas e diversos usuários podem acessá-las livremente, foramplenamente atingidos neste trabalho, bem como o de compartilhamento das infor-mações clínicas, a julgar pelos projetos já concluídos e os que estão em andamento.

135

136 Conclusão

8.1 Projetos relacionados a este trabalho

Em paralelo ao desenvolvimento deste trabalho, alguns projetos foram desen-volvidos e outros estão em desenvolvimento:

• Visualizador de IM para uso em prontuário eletrônico com acesso via Inter-net.

• Base de IM para Extração de Conhecimentos em Medicina: Criação eorganização de uma base de IM para extração de conhecimentos – ProjetoFAPESP 01/14040-7 (Anexo A) – já concluído.

• WebLab de Base de Imagens Médicas: Criação de uma base de IM abran-gente e sua disponibilização na infra-estrutura de Internet avançada do pro-jeto TIDIA/KyaTera (Anexo B).

• Projeto do Registro Digital Clínico Radiológico do HC-FMUSP: Tal pro-jeto utilizará grande parte do que foi desenvolvido neste trabalho para im-plantação do arquivo didático radiológico do complexo do HC-FMUSP (AnexoC).

• Sistema Colaborativo para Distribuição de Imagens Médicas Dinâmi-cas: Uso dos serviços providos por uma arquitetura de Internet avançadapara visualização de IM em conferências (Anexo D).

• Arquivo Multi-cêntrico de IM para Hemodinâmica: Criação de uma basede IM de angiografia para catalogar os exames de protocolos de pesquisasrealizados em diferentes centros.

8.2 Trabalhos futuros

• Criação de ambiente para o desenvolvimento de pesquisas clínicas multi-ins-titucionais.

• Implementação das políticas de autoria vinculadas à publicação de documen-tos em meio eletrônico.

• Inclusão das funcionalidades de grid computing.

• Desenvolvimento de ferramentas para mineração de dados em bases de infor-mações clínicas.

8.3. Considerações finais 137

• Criação de sites de armazenamento de IM na infra-estrutura do projeto Ti-dia/KyaTera.

• Avaliação do impacto do uso do arquivo didático digital para treinamentos emRadiologia.

8.3 Considerações finais

Agora que existe um ambiente para testes de métodos de processamento de IM,os desenvolvedores podem avaliar melhor seus métodos a partir de um conjuntoamplo e diversificado de IM e informações associadas. A construção de uma basede IM foi uma etapa fundamental no processo de avaliação e desenvolvimento deoutras atividades ligadas à IM. Tanto que pode-se dizer que existe uma base de IMde referência para uso no desenvolvimento de métodos de processamento de IM.

Vale lembrar que em todo o esforço de desenvolver o ambiente de base de IMdeste trabalho para tornar disponível o acesso a informações sobre IM está tambémo desejo de viabilizar a instalação desse sistema e/ou sua reprodução em outros cen-tros. O requisito é a disponibilidade de recursos computacionais para instalar asaplicações, uma vez que o desenvolvimento deste trabalho foi baseado num modeloescalável e, na implementação, foram utilizados softwares de domínio público.

Visualiza-se o uso deste ambiente em diferentes aplicações, como atividades deensino e pesquisa, incluindo educação continuada, arquivo didático em Radiologia,conjunto de dados para testes e avaliação de métodos e algoritmos de processa-mento de IM, desenvolvimento de pesquisa em CBIR, entre outros.

Por meio de uma interface transparente e com suporte a plug-ins de processa-mento de IM, o projeto simplifica a cooperação em termos de interdisciplinaridadedas equipes de desenvolvimento, permitindo que os usuários direcionem seus in-teresses ao desenvolvimento dos métodos em si. Em particular, esta abrangênciaoferece comunicação e avaliação dos processos, resultando em ciclos de desenvolvi-mento muito menores para novos métodos de auxílio ao diagnóstico. O projeto temenvolvido a interdisciplinaridade das áreas de ciência da computação, informáticamédica e Radiologia. O objetivo maior é oferecer condições para rápida avaliaçãodos métodos de processamento de IM e sua inserção na rotina clínica.

Sobre a construção de uma base de conhecimento em Medicina, vale ressaltara introdução de novas tecnologias e novas formas de disseminar o conhecimento.Esta introdução conduz à unificação das formas de pensamento sobre a tecnologia

138 Conclusão

pela promoção da educação multidisciplinar e o interesse pela diversidade. Poroutro lado, também enfatiza a necessidade de colaborações, enriquecendo os conhe-cimentos com novas perspectivas e fortalecendo parcerias.

Com o desenvolvimento deste trabalho, pôde-se notar a quantidade de esforçosrepetidos e/ou não aproveitados em novos desenvolvimentos pelo simples fato danão disponibilidade de informações sobre esses trabalhos, bem como, em funçãoda dificuldade em reproduzí-los. Nesse contexto, observa-se que as tecnologias dearmazenamento e comunicação devem ser inovadoras no sentido de suportar o ar-mazenamento de documentos multimídia e práticas colaborativas, principalmenteem aplicações clínicas e pesquisas acadêmicas de um modo geral. Vários trabalhos,inclusive este, têm mostrado que isto é possível e, sobretudo, viável.

139

REFERÊNCIAS BIBLIOGRÁFICAS

AAAS. Science: General information for authors. 2006. Disponível em:<http://www.sciencemag.org/about/authors/prep/gen_info.dtl>. Acesso em: 05 set.2006.

ABBEY, C. K.; BARRETT, H. H.; ECKSTEIN, M. P. Practical issues and methodo-logy in assessment of image quality using model observers. In: Proceedings of theSPIE. San Jose, CA, USA: SPIE, 1997. v. 3032, p. 182–194.

ALDROUBI, A.; UNSER, M. A. (Ed.). Wavelets in Medicine and Biology. Boca Ra-ton FL, USA: CRC Press, 1996. 616 p.

AMENDOLIA, S. R. et al. MammoGrid: Large-Scale Dis-tributed Mammogram Analysis. 2004. Disponível em:<http://www.citebase.org/abstract?id=oai:arXiv.org:cs/0402006>. Acesso em:11 nov. 2004.

AMENDOLIA, S. R. et al. Grid Databases for Shared ImageAnalysis in the MammoGrid Project. 2004. Disponível em:<http://www.citebase.org/abstract?id=oai:arXiv.org:cs/0405072>. Acesso em:11 nov. 2004.

ANTANI, S.; LONG, L.; THOMA, G. A biomedical information system for combinedcontent-based retrieval of spine x-ray images and associated text information. In:In Proceedings of the Indian Conference on Computer Vision Graphics, and ImageProcessing. Ahamdabad, India: ICVGIP, 2002. p. 242–247.

ARYA, M. et al. A 3d medical image database management system. ComputerizedMedical Imaging and Graphics, v. 20, n. 4, p. 269–284, July-August 1996.

BACH, J. R. et al. The virage image search engine: An open framework for imagemanagement. In: Proceedings of SPIE Storage and Retrieval for Image and VideoDatabases IV. San Jose, CA, USA: SPIE, 1996. p. 76–87.

140 Referências Bibliográficas

BAILER, W. Writing ImageJ Plugins: A tutorial. [S.l.], 2006. Disponível em:<mtd.fh-hagenberg.at/depot/imaging/imagej/tutorial171.pdf>. Acesso em: 05 mai.2006.

BERBAUM, K.; DORFMAN, D.; FRANKEN_JR, E. Measuring observer perfor-mance by roc analysis: Indications and complications. Investigative Radiology,v. 24, p. 228–233, 1989.

BERNSEN, J. Dynamic thresholding of grey-level images. Paris, France: [s.n.], out.1986. 1251–1255 p.

BLAND, J. M.; ALTMAN, D. G. Statistical methods for assessing agreementbetween two methods of clinical measurement. Lancet, v. 1, n. 8476, p. 307–310,February 1986.

BOURAS, C.; PHILOPOULOS, A.; TSIATSOS, T. e-Learning through DistributedVirtual Environments. July 2001. 175–199 p.

BOWYER, K. W. Validation of medical image analysis techniques. In: SONKA, M.;FITZPATRICK, M. J. (Ed.). Handbook of Medical Imaging – 2. Bellingham-WA:SPIE Press, 2000. v. 2, cap. 10, p. 567–607.

BRAMBLE, J. M.; INSANA, M. F.; DWYER, S. J. Information retrieval for teachinfiles: a preliminary study. Journal of Digital Imaging, v. 16, n. 4, p. 331–336, 1990.

BREG, F.; POLYCHRONOPOULOS, C. D. Java virtual machine support for objectserialization. In: JGI ’01: Proceedings of the 2001 joint ACM-ISCOPE conference onJava Grande. New York, NY, USA: ACM Press, 2001. p. 173–180. ISBN 1-58113-359-6.

CAI, W.; FENG, D.; FULTON, R. Web-based digital medical images. IEEE Comput.Graph. Appl., IEEE Computer Society Press, Los Alamitos, CA, USA, v. 21, n. 1, p.44–47, 2001. ISSN 0272-1716. Acesso em: 18 mar. 2004.

CARSON, C. et al. Blobworld: A system for region-based image indexing and retri-eval. In: Third International Conference on Visual Information Systems. New York,USA: Springer, 1999.

CHANNIN, D. S. Integrating healthcare enterprise: A primer part2. seven bridesfor seven brothers: The ihe integration profiles. Radiographics, v. 21, p. 1343–1350,June 2001.

CHARRIER, M.; SANTA CRUZ, D.; LARSSON, M. JPEG2000, the next milleniumcompression standard for still images. In: Proc. of the IEEE International Con-ference on Multimedia Computing and Systems (ICMCS). Florence, Italy: [s.n.],1999. v. 1, p. 131–132.

CHEN, P. Gerenciando Banco de Dados - A abordagem entidade-relacionamentopara projeto. São Paulo - SP: McGraw-Hill, 1990.

CHERVENAK, A. et al. The Data Grid: Towards an architecture for the distri-buted management and analysis of large scientific datasets. 1999. Disponível em:<citeseer.ist.psu.edu/chervenak99data.html>. Acesso em: 25 mar. 2006.

Referências Bibliográficas 141

CHO, Z.-H.; JONES, J. P.; SINGH, M. Foundations of Medical Imaging. New York- USA: John Wiley and Sons, 1993. 586 p.

CLARKE, L. P. et al. National cancer institute initiative: Lung image databaseresource for imaging research. Acad Radiol, n. 8, p. 447–450, 2001.

CLEARY, K. Final report of the technical requirements for image-guided spineprocedures workshop. Computer Aided Surgery, Taylor and Francis, v. 5, n. 3, p.180–215, 2000.

CLUNIE, D. A. DICOM Structured Reporting. Bangor, Pennsylvania: PixelMedPublishing, 2000. 394 p.

DATE, C. J.; DARWEN, H. Databases, Types and the Relational Model, 3/E. [S.l.]:Addison-Wesley, 2006. ISBN: 0-321-39942-0.

DEITEL, H. M.; DEITEL, P. J. Java How to Program. Upper Saddle River, NJ,USA: Prentice Hall PTR, 2001. ISBN 0130341517.

DEITEL, H. M. et al. Java Web Services For Experienced Programmers. New Jersey,USA: Prentice Hall, 2003. 723 p.

DEPLEDGE, N. G.; TURNER, W. A.; WOOG, A. An open, distributable, three-tier client-server architecture with transaction semantics. Digital Tech. J., DigitalEquipment Corp., Acton, MA, USA, v. 7, n. 1, p. 34–42, 1995. ISSN 0898-901X.

DHAWAN, A. P. Medical Image Analysis. Hoboken, NJ, USA: Wiley, 2003. ISBN0471451312.

DUERINCKX, A. J. Picture arqchiving and communication systems for medicalapplications. In: Proc. SPIE: 1stIntern. Conf. and Workshop. Newport Beach, CA:SPIE, 1997.

DUNCAN, J. S.; AYACHE, N. Medical image analysis: Progress over two decadesand the challenges ahead. IEEE Transactions on Pattern Analysis and MachineIntelligence, v. 22, n. 1, p. 85–105, 2000.

DY, J. G. et al. The customized-queries approach to cbir using em. In: Proceedings ofthe 1999 IEEE Conference on Computer Vision and Pattern Recognition (CVPR’99).[S.l.: s.n.], 1999. p. 400–406.

ECKERSON, W. W. Three-tier client/server architecture. Open Information Sys-tems, v. 10, n. 1, p. 3–22, jan. 1995.

ECKSTEIN, M.; ABBEY, C.; WHITING., J. Human vs model observers in anatomicbackgrounds. In: Proceedings of the SPIE. San Jose, CA, USA: SPIE, 1998. v. 3340,p. 15–26.

EFMI-WG-MIP. EFMI – WG Meeting. [S.l.], 2002. Disponível em:<http://www.efmi-wg-mip.net/#Meetings>. Acesso em: 10 feb. 2003.

EIKVIL, L.; TAXT, T.; MOEN, K. A fast adaptive method for binarization of docu-ment images. France: [s.n.], 1991. 435–443 p.

142 Referências Bibliográficas

ERIKSSON, H.-E.; PENKER, M. UML toolkit. New York, NY, USA: John Wiley &Sons, Inc., 1998. ISBN 0-471-19161-2.

FERNàNDEZ-BAYó, J. et al. Distributing medical images with internet technolo-gies: a dicom web server and a dicom java viewer. Radiographics, Imaging Labo-ratory, UDIAT Centre Diagnòstic, Corporació Sanitària parc Taulí, Parc Taulí s/n,08208 Sabadell, Spain., v. 20, n. 2, p. 581–590, 2000. ISSN 0271-5333.

FIETE, R. D. et al. Hotelling trace criterion and its correlation with human-observer performance. Journal of the Optical Society of America A, v. 4, n. 5, p.945–953, 1987.

FLICKNER, M. et al. Query by image and video content: The qbic system. IEEEComputer, IEEE, v. 28, n. 9, p. 23–32, 1995.

FOWLER, M. Analysis Patterns: Reusable object models. 6th. ed. New York, USA:Addison-Wesley, 1998.

FRYBACK, D. G.; THORNBURY, J. R. The efficacy of diagnostic imaging. Medi-cal decision making : an international journal of the Society for Medical DecisionMaking, v. 11, n. 2, p. 88–94, Apr-Jun 1991.

FURUIE, S. S. et al. A methodology for testing for statistically significant differen-ces between fully 3d pet reconstruction algorithms. Phys. Med. Biol., v. 39, n. 1, p.341–354, 1994.

GAMMA, E. et al. Design Patterns: Elements of Reusable Object-Oriented Software.Reading, MA: Addison-Wesley, 1995.

GEE, J. C. et al. Workshop peformance evaluation of medical image processingalgorithms. In: SPIE Conference on Image Processing. San Jose, USA: SPIE, 2000.

GELL, G.; HOLZINGER, A.; WILTGEN, M. (Ed.). From PACS to Internet/Intranet,Information Systems, Multimedia and Telemedicine, Proceeding of the 18th interna-tional EuroPACS Conference, Graz, 21-23 September 2000, v. 144. [S.l.]: AustrianComputer Society, 2000. ISBN 3-85403-144-0.

GIGER, M. L. Computed-aided diagnosis in medical imaging: A new era in imageinterpretation. WMA Business Briefing - Global Healthcare 2000, p. 75–79, 2000.Disponível em: <http://www.wma.net/e/publications/pdf/2000/giger.pdf>. Acessoem: 05 mai. 2006.

GLASSER, O. Wilhelm Conrad Röentgen and the Early History of the RöentgenRays. San Francisco-USA: Norman Publishing, 1993.

GOLDBERGER, A. L. et al. PhysioBank, PhysioToolkit, and PhysioNet: Com-ponents of a new research resource for complex physiologic signals. Circulation,v. 101, n. 23, p. e215–e220, June 2000.

GONZALEZ, R. C.; WOODS, R. W. Processamento de Imagens Digitais. São Paulo:Editora Edgard Blücher Ltda, 2000. 509 p.

Referências Bibliográficas 143

GOODWILL, J. Mastering Jakarta Struts. New York, NY, USA: John Wiley & Sons,Inc., 2002.

GUPTA, A.; JAIN, R. Visual information retrieval. Communications of the ACM,v. 40, n. 5, p. 70–79, 1997.

GUTIERREZ, M. A. et al. Implementation of an integrated hospital informationsystem using an open-source three-tier architecture. In: Proceedings of the SPIE.San Jose, CA, USA: SPIE, 2004. v. 5371, p. 23–30.

HARALICK, R. M.; SHAPIRO, L. G. Image Segmentation Techniques. 1985. 100–132 p.

HUANG, H. K. PACS and Imaging Informatics: Basic principles and applications.2. ed. New York-USA: John Wiley and Sons, 2004. 672 p.

IHE. IHE Integration Profiles. [S.l.], 2003. Disponível em:<http://www.ihe.net/Resources/upload/iheyr3_integration_profiles.pdf>. Acessoem: 13 dez. 2003.

ITK. Insight Segmentation and Registration Toolkit. 2006. Disponível em:<http://www.itk.org/>. Acesso em: 10 mai. 2006.

JACOBSON, I.; BOOCH, G.; RUMBAUCH, J. The Unified Software DevelopmentProcess. 5th. ed. New York, USA: Addison-Wesley, 1982.

JAI. Java Advanced Imaging (JAI) API. 2006. Disponível em:<http://java.sun.com/products/java-media/jai/>. Acesso em: 10 mai. 2006.

JANNIN, P. et al. Validation of medical image processingin image-guided therapy. IEEE Trans. on Medical Imaging,v. 21, n. 12, p. 1445–1449, December 2002. Disponível em:<http://ieeexplore.ieee.org/xpl/tocresult.jsp?isYear=2002&isnumber=26419>.

KEYSERS, D. et al. Statistical framework for model-based image retrieval in me-dical applications. Jounral of Electronic Imaging, v. 12, n. 1, p. 59–68, January2003.

KIVIJÄRVI, J. et al. A comparison of lossless compression methods for medicalimages. Computerized Medical Imaging and Graphics, n. 22, p. 323–339, 1998.

KOBAYASHI, L. O. M.; FURUIE, S. S. Implementation of integrity and authenticityoriented to information flow for radiological images. Chicago – USA: RSNA, 2005.

KRASNER, G.; POPE, S. A description of the model-view-controller user interfaceparadigm in the smalltalk-80 system. Journal of Object Oriented Programming,v. 1, n. 3, p. 26–49, 1988.

KUNDEL, H. L. Images, image quality and observer performance: new horizons inradiology lecture. Radiology, v. 132, p. 265–271, 1979.

LAMPSON, B. et al. Authentication in distributed systems: Theory and practice.ACM Transactions on Computer Systems, v. 10, n. 4, p. 265–310, 1992.

144 Referências Bibliográficas

LEFFINGWELL, D.; WIDRIG, D. Managing Software Requirements: A Use CaseApproach. 2nd. ed. [S.l.]: Addison-Wesley Professional, 2003. ISBN 032112247X.

LEHMANN, T. M. From plastic to gold: a unified classification scheme for referencestandards in medical image processing. In: Proceedings of SPIE Image Processing.San Jose, CA, USA: SPIE, 2002. p. 1819–1827.

LEHMANN, T. M. et al. The IRMA reference database and its use for content-basedimage retrieval in medical applications. 2004.

LEHMANN, T. M. et al. Content-based image retrieval in medical applications forpicture archiving and communication systems. In: Proceedings of SPIE MedicalImaging. San Jose, CA, USA: SPIE, 2003. v. 5033.

LEHMANN, T. M.; MEINZER, H. P.; TOLXDORFF, T. Advances in biomedi-cal image analysis: Past, present and future challenges. Methods of Informa-tion in Medicine, n. 43, p. 308–314, 2004. Disponível em: <http://libra.imib.rwth-aachen.de/lehmann/pspdf/MIM_2004434308314.pdf>. Acesso em: 15 jan. 2005.

LEHMANN, T. M. et al. The irma code for unique classification of medical images.In: Proc. SPIE 2003. [S.l.: s.n.], 2003. v. 5033, p. 440–451.

LEVINE, M. D.; NAZIF, A. M. An Experimental Rule Based System for TestingLow Level Segmentation Strategies. [S.l.]: K. Preston and L. Uhr – Academic Press,1982. 149–160 p.

LOGAN, B.; SALOMON, A. A music similarity function based on signal analysis.In: Proceedings of the Second International Conference on Multimedia and Exposi-tion (ICME’2001). Tokyo, Japan: IEEE Computer Society, 2001. p. 952–955.

LONG, L. R. et al. Distributed data collection for a database of radiological imageinterpretations. In: Proc. SPIE: Storage and Retrieval for Image and Video Data-bases. San Diego, CA: SPIE, 1997. v. 3022, p. 228–237.

LOWE, H. J. et al. Towards Knowledge-Based Retrieval of MedicalImages. The Role of Semantic Indexing, Image Content Representa-tion and Knowledge-Based Retrieval. In: American Medical Informa-tics Association Annual Symposium (AMIA). AMIA, 1998. Disponível em:<http://www.amia.org/pubs/symposia/D004973.PDF>. Acesso em: 10 jul. 2001.

LOWE, H. J. et al. The image engine¿ hpcc project: A medical digital library systemusing agent-based technology to create an integrated view of the electronic medicalrecord. In: ADL ’96: Proceedings of the 3rd International Forum on Research andTechnology Advances in Digital Libraries. Washington, DC, USA: IEEE ComputerSociety, 1996. p. 45. ISBN 0-8186-7402-4.

LYTRAS, M.; TSILIRA, A. Semantic web challenges for e-learning: A discussionof the new research agenda in the e-learning field. In: Proceedings of the IASTEDConference on Computers and Advanced Technology in Education. [S.l.: s.n.], 2003.p. 339–344.

Referências Bibliográficas 145

MACURA, K. J.; MACURA, R. T.; MORSTAD, B. D. Digital case library: A resourcefor teaching, learning, and diagnosis support in radiology. Radiographics, v. 15, p.155–164, June 1995.

MAGHRAOUI, K. E. et al. The Internet Operating System: Middleware for adap-tive distributed computing. International Journal of High Performance ComputingApplications (IJHPCA), Special Issue on Scheduling Techniques for Large-ScaleDistributed Platforms, SAGE Publications, 2006.

MANSSON, L. Methods for the evaluation of image quality: A review. RadiationProtection Dosimetry, v. 90, p. 89–99, 2000.

MASCARINI, C. et al. In-house access to pacs images and related data throughworld wide web. European Journal of Radiology, v. 22, n. 3, p. 218–220, June 1996.

MATEJ, S. et al. Evaluation of task-oriented performance of several fully 3d petreconstruction algorithms. Phys. Med. Biol., v. 39, n. 1, p. 355–367, 1994.

MAURER, H. A. New developments in the world wide web and the effects on me-dicine. In: EuroPACS. [S.l.: s.n.], 2000. p. 29–37.

METZ, C. E. Roc methodology in radiologic imaging. Investigate Radiology, v. 21,p. 720–723, 1986.

MIRC. The MIRCquery Schema. [S.l.], 2006. Disponível em:<http://mircwiki.rsna.org/index.php?title=The_MIRCquery_Schema>. Acessoem: 10 mai. 2006.

MIRC. The MIRCqueryresult Schema. [S.l.], 2006. Disponível em:<http://mircwiki.rsna.org/index.php?title=The_MIRCqueryresult_Schema>.Acesso em: 10 mai. 2006.

MIRC. The Storage Service Index File. [S.l.], 2006. Disponível em:<http://mircwiki.rsna.org/index.php?title=The_Storage_Service_Index_File>.Acesso em: 10 mai. 2006.

MOTTA, G. H.; FURUIE, S. S. A contextual role-based access control authorizationmodel for electronic patient record. IEEE Transactions on Information Technologyin Biomedicine, v. 7, n. 3, p. 202–207, 2003.

MüLLER, H. et al. A review of content-based image retrieval systems in medicalapplications - clinical benefits and future directions. International Journal of Me-dical Informatics, v. 73, n. 1, p. 1–23, Feburary 2004.

MüLLER, H. et al. A framework for benchmarking in cbir. Multimedia Tools Appl.,ACM, USA, v. 21, n. 1, p. 55–73, 2003.

MULLINS, M. E. et al. Evaluating medical students on radiology clerkships ina filmless environment: Use of an electronic test prepared from pacs and digitalteaching collection images. Academic Radiology, v. 8, n. 6, p. 514–519, June 2001.

MUNSON Jr, D. C. A note on lena. IEEE TRANSACTIONS ON IMAGE PROCES-SING, v. 5, p. 3, January 1996.

146 Referências Bibliográficas

NATURE. Science: Publication policies. 2006. Disponível em:<http://www.nature.com/nature/authors/policy/index.html>. Acesso em: 05set. 2006.

NCI. Cancer imaging program. In: . Bethesda – USA: NCI, 2005. Disponível em:<http://imaging.cancer.gov/>. Acesso em: 07 Jan. 2005.

NEMA. DICOM Supplement 30: Dicom waveforms. Rosslyn, VA, 2000. Disponívelem: <http://medical.nema.org/dicom>. Acesso em: 12 nov. 2002.

NEMA. DICOM Part 1: Introduction and Overview. Rosslyn, VA, 2001. Disponívelem: <http://medical.nema.org/dicom>. Acesso em: 13 dez. 2003.

NEMA. DICOM Part 3: Information Object Definitions. Rosslyn, VA, 2001. Dispo-nível em: <http://medical.nema.org/dicom>. Acesso em: 13 dez. 2003.

NONAKA, I. A dynamic theory of organizational knowledge creation. OrganizationScience, v. 5, n. 1, p. 14–37, 1994.

OMG. Clinical Image Access Service. [S.l.], 2000. Disponível em:<http://www.omg.org/cgi-bin/doc?corbamed/00-02-01>. Acesso em: 05 dez. 2002.

PAPADOPOULOS, P. M. Building cyber-infrastructure for the biomedical informa-tics research network. In: CCGRID ’06: Proceedings of the Sixth IEEE Internati-onal Symposium on Cluster Computing and the Grid (CCGRID’06). Washington,DC, USA: IEEE Computer Society, 2006. p. 6.

PATERSON, G. et al. Using the xml-based clinical document architecture for ex-change of structured discharge summaries. hicss, IEEE Computer Society, Los Ala-mitos, CA, USA, v. 04, p. 119–129, 2002.

PENTLAND, A.; PICARD, R. W.; SCLAROFF, S. Photobook: Tools for content-based manipulation of image databases. In: Storage and Retrieval for Image andVideo Databases (SPIE). San Diego, CA, USA: [s.n.], 1994. p. 34–47.

PERONA, P.; MALIK, J. Scale-space and edge detection using anisotropic diffusion.IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-12, n. 7,p. 629–639, jul. 1990.

PETRAKIS, E. Content–based retrieval of medical images. 2002. Disponível em:<citeseer.ist.psu.edu/petrakis02contentbased.html>.

PETRAKIS, E. G. M.; FALOUTSOS, C. Similarity searching in medical image da-tabases. Knowledge and Data Engineering, v. 9, n. 3, p. 435–447, 1997. Disponívelem: <citeseer.ist.psu.edu/petrakis97similarity.html>. Acesso em: 15 abr. 2002.

ROSENBERG, C. The Lenna Story. 2006. Disponível em:<http://www.cs.cmu.edu/chuck/lennapg/>. Acesso em: 20 jun. 2006.

ROSSET, A. et al. Integration of a multimedia teaching and reference database ina pacs environment. Radiographics, v. 22, n. 6, p. 1567–1577, 2002.

Referências Bibliográficas 147

RSNA. Radiological Society of North America (RSNA): Mirc commitee publications.[S.l.], 2005. Disponível em: <http://mirc.rsna.org>. Acesso em: 05 fev. 2005.

SANDHU, R. S. et al. Role-based access control models. IEEE Computer, v. 29, n. 2,p. 38–47, 1996.

SANTA CRUZ, D.; EBRAHIMI, T.; CHRISTOPOULOS, C. The JPEG 2000 imagecoding standard. j-DDJ, v. 26, n. 4, p. 46, 48, 50–52, 54, apr 2001. ISSN 1044-789X.

SANTOS, M.; FURUIE, S. S. Medical image database for software and algorithmevaluation. In: SPIE Proceedings: Medical Imaging 2005. San Diego, CA: SPIE,2005. v. 5748.

SCHIMID-SAUGEON, P.; GUILLOD, J.; THIRAN, J. Towards a computer-aideddiagnosis system for pigmented skin lesions. Computerized Medical Imaging andGraphics, v. 27, n. 1, p. 65–78, January 2003.

SCHONFELD, D.; LELESCU, D. Vortex: Video retrieval and tracking from com-pressed multimedia databases – template matching from mpeg2 video compressionstandard. In: Multimedia Storage and Archiving Systems III (VV02). Boston, Mas-sachusetts, USA: SPIE, 1998. p. 233–244. (SPIE Symposium on Voice, Video andData Communications).

SHARP, P. F. Quantifying image quality. Clinical Physics and Physiological Mea-surement, IOP Publishing, v. 11, n. 4A, p. 21–26, jan 1990.

SHETH, A. P.; LARSON, J. A. Federated database systems for managing distribu-ted, heterogeneous, and autonomous databases. ACM Comput. Surv., ACM Press,New York, NY, USA, v. 22, n. 3, p. 183–236, 1990. ISSN 0360-0300.

SHIFFMAN, S.; SHORTLIFFE, E. H. Biomedical imaging and the evolution ofmedical informatics. Computerized Medical Imaging and Graphics, v. 20, n. 4, p.189–192, July-August 1996.

SHIRAISHI, J. et al. Development of a digital image database for chest radiographswith and without a lung nodule: Receiver operating characteristic analysis of ra-diologists’ detection of pulmonary nodules. American Journal of Radiology, v. 174,n. 1, p. 71–74, 2000.

SHNEIDERMAN, B. Leonardo’s Laptop: Human needs and the new computingtechnologies. USA: MIT Press, 2003.

SHORTLIFFE, E. H. et al. (Ed.). Medical informatics: computer applications in he-alth care. Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc., 1990.ISBN 0-201-06741-2.

SHYU, C.-R. et al. Assert: a physician-in-the-loop content-based retrieval systemfor hrct image databases. Comput. Vis. Image Underst., Elsevier Science Inc., NewYork, NY, USA, v. 75, n. 1-2, p. 111–132, 1999. ISSN 1077-3142.

SIEGEL, E. L.; KOLODNER, R. M. Filmless Radiology. 2. ed. New York, USA:Springer-Verlag, 1998. 434 p.

148 Referências Bibliográficas

SISTROM, C. L. The acr appropriateness criteria: Translation to pratice and rese-arch. Journal of American College of Radiology, v. 2, n. 1, p. 61–67, January 2005.

SMEULDERS, A. W. M. et al. Content-based image retrieval: The end of the earlyyears. IEEE Transactions on Pattern Analysis and Machine Intelligence, v. 22,n. 12, p. 1349–1380, December 2000.

SOHR, K.; AHN, G.-J.; MIGGE, L. Articulating and enforcing authorisation poli-cies with uml and ocl. ACM SIGSOFT Software Engineering Notes, v. 30, p. 1–7, 072005.

SPACKMAN, K. A.; CAMPBELL, K. E. Compositional concept representationusing snomed: towards further convergence of clinical terminologies. In: AmericanMedical Informatics Association Annual Symposium (AMIA). [S.l.]: AMIA, 1998. p.740–744.

STOCKINGER, H. Distributed Database Management Systems and the Data Grid.2001. Disponível em: <http://citeseer.ist.psu.edu/stockinger01distributed.html>.Acesso em: 25 mar. 2006.

TAGARE, H. D.; JAFFE, C. C.; DUNCAN, J. Medical Image Databases. Connecti-cut, USA, Jan 1992.

TAGARE, H. D.; JAFFE, C. C.; DUNCAN, J. Medical image databa-ses: Content-based retrieval approach. Journal of American MedicalInformatics Association JAMIA, v. 4, n. 3, p. 184–198, May-Jun 1997.Disponível em: <http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pubmed&pubmedid=9147338>. Acesso em: 23 out. 2002.

TAMURA, H.; YOKOYA, N. Image database systems: A survey. Pattern Recogni-tion, v. 17 No 1, p. 29–43, 1983.

THOMA, G. R.; LONG, L. R.; BERMAN, L. E. A client/server system for internetaccess to biomedical text/image databanks. Computerized Medical Imaging andGraphics, v. 20, n. 4, p. 259–268, July-August 1996.

THOMAS, R. K. Team-based access control (tmac): a primitive for applying role-based access controls in collaborative environments. In: ACM Workshop on Role-Based Access Control. [S.l.: s.n.], 1997. p. 13–19.

TRAINA Jr, C. et al. A support system for content-based medical image retrievalin object oriented databases. In: CBMS’97: Proceedings of the 10th conference onComputer based medical systems. New York, NY, USA: Plenum Press, 1997. p. 339–352.

VANNIER, M. W.; STAAB, E. V.; CLARKE, L. C. Medical image archives – presentand future. In: Computer Assisted Radiology and Surgery. Paris, France: SpringerVerlag, 2002. p. 565–576.

WALLACE, G. K. The jpeg still picture compression standard. Commun. ACM,v. 34, n. 4, p. 30–44, 1991.

149

WARFIELD, S. K. Medical image analysis for image guided therapy. dicta, IEEEComputer Society, Los Alamitos, CA, USA, v. 0, p. 42, 2005.

YANG, L.; ALBREGSTEN, F. Fast computation of invariant geometric moments: anew method giving correct results. 1994. 201–204 p.

YOO, T. Toward validation databases for medical imaging: Engineering a scientificrendezvous. 10 2001.

ZHANG, Y. J.; GERBRANDS, J. J. Segmentation evaluation using ultimate measu-rement accuracy. In: Proc. SPIE Image Processing Algorithms and Techniques III.San Diego, USA: SPIE, 1992. p. 449–460.

ZIV, J.; LEMPEL, A. A universal algorithm for sequential data compression. IEEETransactions on Information Theory, v. 23, n. 3, p. 337–343, 1977.

151

ANEXO A:PROJETO BASE DE IM PARA EXTRAÇÃO DE CONHECIMENTOS EM

MEDICINA

Projeto proposto por Dr. Sérgio Shiguemi Furuie, em dezembro de 2001.

Resumo e objetivos do projeto

O objetivo desta proposta é a criação de uma base de dados que permita a ex-tração de conhecimentos a partir de imagens médicas (IM). Pretendemos, também,incorporar alguns métodos básicos para a extração de características das imagens,porém apenas para testar e avaliar a capacidade da base explicitar alguns conheci-mentos. Não faz parte do escopo deste projeto, neste momento, explorar a fundo aextração de conhecimentos a partir de imagens, mas sim fornecer as condições paraque pesquisadores possam elaborar metodologias sofisticadas para esta finalidade.Neste projeto enfocaremos a área de Cardiologia, devido à especificidade desta Ins-tituição, porém a infra-estrutura a ser construída será expansível em termos depatologias e modalidades médicas.

Objetivo específico

Criar uma infra-estrutura de banco de dados escalável com acesso pela Inter-net, utilizando Web browsers, que suporte um banco de imagens médicas no for-mato DICOM3, anotadas com diagnóstico codificado, laudos com semântica (XML),topologia e condições de aquisição. Pretende-se popular esta base com mais de

152

50 imagens para cada grupo, sendo pelo menos 3 grupos por modalidade, e consi-derando pelo menos 4 modalidades de IM cardíaca (Ressonância Magnética, Me-dicina Nuclear, Tomografia Computadorizada e Ecocardiografia) totalizando maisde 600 imagens anotadas. O sistema permitirá que usuários externos autorizadosacrescentem novos casos anotados ao banco, os quais serão verificados, validados eincorporados à base.

Resultados Esperados

Alguns produtos e subprodutos esperados ao final do projeto são:

•Base de imagens médicas para a extração de conhecimentos;

•Métodos e algoritmos para a extração de parâmetros implícitos a partir degrande volume de imagens;

•Ferramentas para gerenciamento e controle de banco de imagens anotadascom inserção de usuários internos e externos;

•Base de dados para testes e validação de algoritmos em processamento deimagens médicas, como por exemplo, compressão JPEG2000;

•Infra-estrutura para a realização de dissertações de mestrado e teses de dou-torado;

•Participações em congressos e publicações;

A premissa fundamental é que a base de imagens possa crescer continuamente comqualidade e que possa fornecer inestimáveis informações. Pretendemos ter, em 5anos, aproximadamente 10000 exames selecionados e cadastrados, implicando emuma necessidade de arquivamento da ordem de 100 Gbytes.

153

Pareceres das avaliações de desenvolvimento do pro-

jeto

154

155

157

ANEXO B:PROJETO WEBLAB DE BASE DE IMAGENS MÉDICAS

Projeto proposto por Prof. Dr. Sérgio Shiguemi Furuie.

Equipe:Sérgio S. Furuie (Coordenador)Marco A. GutierrezMarcelo dos SantosMarina F. S. RebeloAlice S. BacicMarcos Yamaguti

Aim: create and make publicly available a huge multi-modal Medical ImageDatabase in DICOM format.

Justification: Several areas such as software development, image processingand medical training need a diverse and comprehensive Medical Image Database(MIDB). Such database could be used to develop, test and evaluate new software inRadiology, and claim better performance than others based on public data. It wouldbe also important for governmental agencies that certificate medical machines andproducts. The MIDB could also be used, in conjunction with other clinical infor-mation, as a rich material for training new radiologists or for continued-education.The existence of a fast network is essential for a public medical image database,since the archives are very large and most of them involve hundreds of frames(dynamic and tri-dimensional studies). For instance, a single hemodynamic study

158

usually needs more than 200 MByte of storage. Our Institution is already physi-cally connected to a blind fiber network due to our participation in some projectssuch as REMAV-SP/CNPq and MULTICOM 21. We have also developed severalmodules for data security, spanning from IPSec to access control methodology. Infact the InCor EPR was implemented and implanted through PKI Web environ-ment. Furthermore, the EPR presents a strict access control based on professionalrole, allowing access to only authorized objects. The safety infra-structure alreadyexistent can become an important feature for the MIDB. The database will be po-pulated by contributors and will have a large load of anonymized and authorizedimages from our institution (InCor). We are only considering images in DICOM(Digital Imaging and Communications in Medicine) format, since it is an interna-tional standard widely adopted, besides it preserves acquisition information suchas calibration, space localization, and acquisition parameters. A major benefit forInCor and Clinics Hospital (HC.FMUSP) will be the availability of several cases fortraining students and residents, and as a database for development of methodolo-gies. It will also be an opportunity to make publicly available part of the rich con-tent deposited at InCor and other institutions, so the named benefits for educationand research shall be shared with the research community and School Hospitals.We declare our firm commitment with collaborative work and our involvement withstudents training in all technical-scientific aspects of the current project. We alsodeclare our willingness to participate in the corresponding Work Group meetings.

159

ANEXO C:PROJETO DO REGISTRO DIGITAL CLÍNICO RADIOLÓGICO DO

HC-FMUSP – SUMÁRIO EXECUTIVO

Coordenador GeralProf Dr Giovanni Guido Cerri

Grupo GestorAlexandre Chizzolini NetoAlexandre GarcezDr Édson Amaro JrDr Fausto Haruki HironakaMarcelo dos SantosDr Marcelo Tatit SapienzaProf Dr Sérgio S. Furuie

Objetivo: Desenvolver uma infra-estrutura que suporte uma base de imagensmédicas de várias modalidades, documentos clínicos em diversos formatos e infor-mações associadas compatível com o sistema de arquivamento e comunicação deimagens (PACS) e bancos didáticos internacionais (MIRC).

Resultado: Armazenamento de imagens didáticas integradas a dados clínicosde todas as fontes de imagem do InRad, que possa ser usada e incorporada noprocesso de ensino e pesquisa no InRad-InCor. Promover o InRad como centro deexcelência na elaboração e no uso de teaching files em sistema desenvolvido peloInCor.

160

Descrição do Produto: será composto pelo seguinte: servidor - sistema cen-tral de armazenamento, hardware e software, controle de autoria e integraçãoMIRC; workstations periféricas - população do banco de dados, supervisão, ava-liação e consulta; comunicação na rede - procura e busca no PACS - InRad sistemade acesso web, segurança e fluxo; treinamento de usuários - planejamento de cursosespecíficos e integração com práticas da rotina de ensino.

Escopo: Trata-se de projeto que envolve processos internos do InRad-InCor eque contém os seguintes itens: levantamento e análise dos requisitos funcionais;customização; adequação; testes da versão disponível; implantação; treinamento;correções; manutenção.

Premissas: O grupo de pesquisa da Unidade de Pesquisa e Desenvolvimento doServiço de Informática do InCor-HCFMUSP (UPD-SInfo) possui vasta experiênciano desenvolvimento de projetos de arquivamento e manipulação de imagens mé-dicas e informações associadas. A Base de Imagens para Avaliação de Algoritmosde Processamento de Imagens é um sistema que já contempla parte das necessi-dades a serem desenvolvidas. O InRad conta com rotina estabelecida de processosinternos de ensino, equipe de PACS e equipe definida de responsáveis pelo processoeducacional, engenheiros e físicos.

Restrições: O complexo do HCFMUSP se encontra em fase de estruturação dainformação médica. As dimensões do complexo HCFMUSP.

Envolvidos: Radiologistas estagiários, preceptores, residentes, assistentes, co-ordenadores de área, profissionais de informática, engenheiros, técnicos.

Estratégia de Implantação: Levantamento e análise dos requisitos funcio-nais será realizado pelo comitê gestor do projeto. A Customização/adequação/testesda versão disponível será desenvolvido pela equipe de UP&D do SInfo InCor parauso no InRad e desenvolver novas aplicações para pesquisas. A implantação, trei-namento e correções serão realizada pelo comitê gestor. A manutenção e treina-mento de manutenção serão realizadas pela equipe de UP&D SInfo InCor.

161

ANEXO D:SISTEMA COLABORATIVO PARA DISTRIBUIÇÃO DE IMAGENS DINÂMICAS

Equipe:Marco A. Gutierrez (Coordenador)Sérgio S. FuruieMarcelo dos SantosAlice S. BacicLuiz Octávio M. Kobayashi

Introdução

As tecnologias associadas a imagens médicas em formato digital têm oferecidosubsídios importantes para a prática da Medicina moderna. Tais imagens, ampla-mente utilizadas na prestação da assistência à saúde, oferecem não apenas umaforma de visualização de órgãos, tecidos, ossos e outras estruturas do corpo de umpaciente, mas também um meio para monitorar os efeitos de tratamentos e auxiliarno planejamento de cirurgias. Tradicionalmente, após a realização de um exame,envolvendo os processos de aquisição de dados e das imagens médicas, um profis-sional especializado incumbe-se da elaboração do laudo clínico que acompanharáo exame. Porém, mais especificamente no que diz respeito às imagens médicas dediferentes modalidades, em muitos casos a análise de certos exames é bastantedependente da experiência do radiologista ou clínico especialista.

Muitas instituições têm dificuldades em manter, em suas dependências, profissi-

162

onais especializados que possam fornecer o laudo, ou mesmo, uma segunda opiniãosobre um exame clínico. Considerando os aspectos econômicos e a localização geo-gráfica, há instituições localizadas em regiões distantes de centros especializadosde pesquisa e diagnóstico. Nestas regiões, a presença de profissionais com deter-minada especialização é algo pouco comum. Mesmo em locais onde é abundante apresença destes profissionais, nem sempre é possível reuní-los numa sala, apresen-tar e discutir um caso clínico Nesse contexto, em que profissionais da área Médicanecessitam manter contato colaborativo, muitas vezes em tempo real, com o in-tuito de trocar experiências e interagir visando a melhoria da assistência clínicaao paciente, apresentamos o desenvolvimento de um conjunto de aplicações como principal objetivo de oferecer, individualmente a cada profissional, um canal decomunicação interativo que viabiliza a troca de experiências e discussão de examesclínicos baseados em imagens, rompendo as barreiras de tempo e distância.

Objetivos

Utilizar da arquitetura oferecida pelo Serviço de Distribuição de Mídia Digital(DMD) em aplicações de Telemedicina. Tal arquitetura permite a criação de grupospara comunicação de mídia. Dessa forma, o objetivo principal é disponibilizar deforma adequada as imagens médicas para visualização nos pontos envolvidos numateleconferência (por exemplo um serviço de segunda opinião).

Resultados Esperados

O principal resultado esperado deste projeto é a possibilidade de desenvolveratividades de Telemedicina de forma confiável num ambiente integrado que su-porte informações multimídia (texto, imagens, voz e vídeos), sobre um canal decomunicação numa Internet rápida.

163

PRODUÇÃO ACADÊMICA

Publicações em periódicos e congressos – nacionais e

internacionais

1.SANTOS, M.; FURUIE, S.S. “Desenvolvimento de uma Base para Avaliaçãode Algoritmos em Imagens Médicas”. In: VIII Congresso Brasileiro de Infor-mática em Saúde (CBIS’2002), Natal-RN. Anais do VIII Congresso Brasileirode Informática em Saúde, 2002, v. 2002, p. 134-135.

2.SANTOS, M.; RUIZ, E.E.S. “Distribuição de imagens médicas com o uso detecnologias web: um servidor e cliente DICOM”. In: Anais do VIII CongressoBrasileiro de Engenharia Biomédica – (CBEB’2002), 2002, São José dos Cam-pos-SP, 2002, v. 1, p. 253-257.

3.SANTOS, M.; RUIZ, E.E.S. “Desenvolvimento de aplicações DICOM com o usode tecnologias Web: Um cliente e um servidor DICOM”. In: Anais do VIII Con-gresso Brasileiro de Informática em Saúde (CBIS’2002), 2002, v.2002, Natal-RN.

4.SANTOS, M.; RUIZ, E.E.S. “Chat para diagnóstico clínico”. In: Anais do VIIICongresso Brasileiro de Informática em Saúde (CBIS’2002), 2002, v. 2002,Natal-RN.

5.FURUIE, S.S.; REBELO, M.F.S.; MORENO, R.A.; SANTOS, M.; BERTOZZO,N.; GUTIERREZ, M.A. “Integrating Medical Images and Clinical Informa-tion: InCor’s Experience”. In: XII International Conference on Computing,

164

2003, México. Avances en: Ciencias de la Computación. México : InstitutoPolitecnico Nacional, 2003. v. 3. p. 67-72.

6.SANTOS, M.; RUIZ, E.E.S. “Chat para diagnóstico clínico”. Revista Exacta –Centro Universitário Nove de Julho, São Paulo, v. 2, n. 1, p. 105-115, 2004.

7.SANTOS, M. ; FURUIE, S.S. “High performance web viewer for cardiac ima-ges”. In: Medical Imaging 2004: PACS and Imaging Informatics, 2004, SanDiego. Proceedings of SPIE, 2004. v. 5371. p. 391-401.

8.SANTOS, M.; FURUIE, S.S. “Base de Imagens para Avaliação de Algoritmosde Processamento de Imagens Médicas". In: Anais do IX Congresso Brasileirode Informática em Saúde (CBIS’2004), v. 2004, Ribeirão Preto-SP, 2004.

9.PIRES, F.A.; GUTIERREZ, M.A.; FURUIE, S.S.; REBELO, M.F.S.; MORENO,R.A.; SANTOS, M. “Implementação de um sistema integrado de gestão hos-pitalar usando software livre em arquitetura de três camadas”. In: IX Con-gresso Brasileiro de Informática em Saúde (CBIS’2004), Ribeirão Preto. Anaisdo IX Congresso Brasileiro de Informática em Saúde, 2004. v. 2004. p. 1270-1274.

10.SANTOS, M.; FURUIE, S.S. “Ferramenta Web de Alta Performance para Vi-sualização de Imagens Médicas Cardíacas”. In: Anais do Congresso LatinoAmericano de Engenharia Biomédica (CLAEB’2004), v.2004, João Pessoa -PB - Brasil, 2004.

11.SANTOS, M.; FURUIE, S.S. “Medical Image Database for Software and Algo-rithm Evaluation”. In: Medical Imaging 2005: PACS and Imaging Informa-tics, 2005, San Diego. Proceedings of SPIE, Medical Imaging 2005, v. 5748. p.267-275.

12.SANTOS, M.; FURUIE, S.S. “Base de Imagens para Avaliação de Algoritmosde Processamento de Imagens Médicas”. In: V Workshop de Informática Mé-dica (WIM’2005), 2005, Porto Alegre-RS. Anais do V Workshop de InformáticaMédica (WIM’2005), 2005. v. 2005. p. 1-4.

13.SANTOS, M.; FURUIE, S. S. “Avaliação de algoritmos de processamento deimagens médicas: a proposta de uma base de dados de referência”. In: IISimpósio de Instrumentação e Imagens Médicas, 2005, São Pedro - SP. Anaisdo II Simpósio de Instrumentação e Imagens Médicas(SIIM’2005), 2005, v.2005. p. 10-11.

165

14.BERTOZZO, N.; FURUIE, S. S.; MORENO, R. A.; SANTOS, M.; REBELO, M.F. S. “PACS InCor”. In: II Simpósio de Instrumentação e Imagens Médicas,2005, São Pedro - SP. Anais do II Simpósio de Instrumentação e ImagensMédicas, 2005. v. 2005. p. 58-59.

15.SANTOS, M.; FURUIE, S. S. . “Weblab for multi-modal medical image data-base”. In: II Workshop FAPESP TIDIA 2005, 2005, São Paulo.http://www.kyatera.fapesp.br, 2005. v. 2005. p. 1-1.

16.SANTOS, M.; FURUIE, S.S. “Sharing Medical Images: a Proposal of a Robustand Distributed Database”. – SPIE 2006: Medical Imaging 2006: PACS andImaging Informatics, 2006, San Diego. Proceedings of SPIE, Medical Imaging2005, v. 6145. p. 6145D1–6145D9.

17.SANTOS, M.; RUIZ, E.E.S. “Distribuição de imagens médicas com o uso detecnologias web: um servidor e cliente DICOM”. Revista Exacta – Centro Uni-versitário Nove de Julho, São Paulo, v. 4, n.1, p. 105-112, 2006.

18.SANTOS, M.; FURUIE, S.S. “Framework para compartilhamento de imagensmédicas”. In: Anais do X Congresso Brasileiro de Informática em Saúde(CBIS’2006), Florianópolis-SC, v. 2006, p. 621–626, 2006, ISBN 85-60391-00-2.

Participação em congressos, simpósios, workshops e

reunições científicas – nacionais e internacionais

1.I Workshop de teses, dissertações e projetos da UP&D SInfo InCor, Março,2002, São Paulo-SP.

2.VIII CONGRESSO BRASILEIRO DE ENGENHARIA BIOMÉDICA(CBEB’2002), Sociedade Brasileira de Engenharia Biomédica, de 09 a 12 desetembro de 2002, na Universidade do Vale do Paraíba (UNIVAP), em SãoJosé dos Campos-SP.

3.VIII CONGRESSO BRASILEIRO DE INFORMÁTICA EM SAÚDE(CBIS’2002), Sociedade Brasileira de Informática em Saúde, de 29 de setem-bro a 02 de outubro de 2002, no Hotel Carlton, em Natal-RN.

4.26th Annual Symposium of the American Medical Informatics Association(AMIA’2002), de 09 a 13 de novembro de 2002, no Henry B. Gonzalez Con-vention Center, em San Antonio, Texas, USA.

166

5.III Feira Internacional de Produtos Hospitalares, Odontológicos, Laboratori-ais, medicina e Saúde de Ribeirão Preto (FEIMERP’2003), de 24 a 26 de se-tembro de 2003, no Centro de Convenções Ribeirão Preto, em Ribeirão Preto-SP.

6.III CONGRESSO LATINO AMERICANO DE ENGENHARIA BIOMÉDICA(CLAEB’2004), Sociedade Brasileira de Engenharia Biomédica, de 22 a 25 desetembro de 2004, no Hotel Tambaú, em João Pessoa-PB.

7.IX CONGRESSO BRASILEIRO DE INFORMÁTICA EM SAÚDE(CBIS’2004), Sociedade Brasileira de Informática em Saúde, de 07 a 10 de no-vembro de 2004, no Centro de Convenções Ribeirão Preto, em Ribeirão Preto-SP.

8.I Workshop TIDIA/KyaTera 2004, Projeto de TIDIA/KyaTera, de 03 a 05 denovembro de 2004, no Centro de Convenções Rebouças, em São Paulo-SP.

9.V Workshop de Informática Médica (WIM’2005), Sociedade Brasileira de Com-putação (SBC), 06 de junho de 2005, Pontifícia Universidade Católica do RioGrande do Sul (PUC-RS), em Porto Alegre-RS.

10.II Workshop TIDIA/KyaTera 2005, Projeto de TIDIA/KyaTera, de 07 a 09 denovembro de 2005, no Hospital Sírio Libanês, em São Paulo-SP.

11.II Simpósio de Instrumentação e Imagens Médicas - SIIM’2005, SociedadeBrasileira de Engenharia Biomédica, de 11 a 13 de outubro de 2006, no HotelFazenda Colina Verde, em São Pedro-SP.

12.The International Society for Optical Engineering (SPIE’2006), de 13 a 16 defevereiro de 2006, no Town & Country Hotel, em San Diego, CA, USA.

13.II Encontro KyaTera de Desenvolvedores de WebLab e Aprendizado Eletrô-nico, Projeto TIDIA/KyaTera, 5 de abril de 2006, na Unicamp, em Campinas-SP.

14.Reunião Científica de Desenvolvedores de WebLab e Aprendizado Eletrônico,Projeto TIDIA/KyaTera, 29 de junho de 2006, na ICMC-USP, em São Carlos-SP.

15.II Workshop de teses, dissertações e projetos da UP&D SInfo InCor, Julho de2006, São Paulo-SP.

16.II Encontro KyaTera de Desenvolvedores de WebLab, Projeto TIDIA/KyaTera,15 de setembro de 2006, na Unicamp, em Campinas-SP.

167

17.X CONGRESSO BRASILEIRO DE INFORMÁTICA EM SAÚDE (CBIS’2006),Sociedade Brasileira de Informática em Saúde, de 16 a 20 de outubro de 2006,no Costão de Santinho Resort & Spa em Florianópolis, SC.

Prêmios

1.Melhor trabalho científico do VIII CONGRESSO BRASILEIRO DE INFOR-MÁTICA EM SAÚDE (CBIS’2002), Sociedade Brasileira de Informática emSaúde, de 29 de setembro a 02 de outubro de 2002, no Hotel Carlton, emNatal-RN. – Trabalho: “Chat para diagnóstico clínico”.

2.Classificação entre os cinco melhores trabalhos científicos do X CONGRES-SO BRASILEIRO DE INFORMÁTICA EM SAÚDE (CBIS’2006), SociedadeBrasileira de Informática em Saúde, de 16 a 20 de outubro de 2006, no Costãode Santinho Resort & Spa em Florianópolis, SC. – Trabalho: “Framework paracompartilhamento de imagens médicas”.

Palestras, seminários e aulas

1.Seminário “Implementação de Módulos para Comunicação de Imagens Médi-cas em Protocolo DICOM”, Ciclo de seminários InCor, março de 2002.

2.SANTOS, M.; FURUIE, S.S.; RUIZ, E.E.S.; MORENO, R.A. “Tutorial Padrõespara Imagens Médicas em Prontuário Eletrônico”, VIII Congresso Brasileirode Informática em Saúde (CBIS’2002), 2002, Natal-RN.

3.Seminário “Projeto da tese de doutorado de Marcelo dos Santos”, Ciclo deseminários InCor, maio de 2003.

4.SANTOS, M.; FURUIE, S.S. “Palestra Prontuário Eletrônico do Paciente”,Feira de Produtos Médico-hopitalares de Ribeirão Preto – FEIMERP, RibeirãoPreto-SP, 2003.

5.Seminário “Visualizador de Imagens Médicas InCor - iView”, Ciclo de semi-nários InCor, maio de 2006.

6.SANTOS, M. Aula: “Como escrever Plug-ins para ImageJ e iView”, Disciplinade pós-graduação Técnicas Avançadas em Processamento de Imagens Médi-cas (PEE5750), junho de 2006.

168

Software

1.SANTOS, M.; FURUIE, S. S. “IView-InCor DICOM Viewer”. 2003. (com re-gistro).

2.SANTOS, M.; FURUIE, S. S. “InCor Modality Worklist Server”. 2004. (semregistro).

Outras atividades

1.Membro do comitê de política editorial da Revista Exacta do Centro Univer-sitário Nove Julho.

2.Revisor ad-hoc da Revista Exacta do Centro Universitário Nove Julho.

3.Membro da Sociedade Brasileira de Informática em Saúde (SBIS).

Trabalhos submetidos (em avaliação)

1.SANTOS, M.; FURUIE, S.S. “A Comprehensive Distributed Medical ImageDatabase for Software Evaluation”, III Workshop TDIA/KyaTera.

Trabalhos aceitos

1.SANTOS, M.; FURUIE, S.S., “A digital library for medical imaging activities”.– SPIE 2007 – Medical Imaging 2007 PACS: and Imaging Informatics.

2.FURUIE, S.S.; REBELO, M.S.; MORENO, R.A.; SANTOS, M.; BERTOZZO,N.; MOTTA, G.H.M.B., PIRES, F.A.; GUTIERREZ, M.A., “Managing MedicalImages and Clinical Information: InCor’s Experience” – IEEE Transactionson Information Technology in Biomedicine.