67
UNIVERSIDADE CATÓLICA DE PELOTAS CENTRO POLITÉCNICO PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para segmentação e classificação em imagens médicas por Frederico Corrêa da Silva Trabalho Individual I TI-2008/1-01 Orientador: Prof. Dr. Marilton Sanchotene de Aguiar Pelotas, julho de 2008

Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

Embed Size (px)

Citation preview

Page 1: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

UNIVERSIDADE CATÓLICA DE PELOTASCENTRO POLITÉCNICO

PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA

Um estudo sobre algoritmos genéticos,lógica fuzzy e técnicas para segmentação

e classificação em imagens médicaspor

Frederico Corrêa da Silva

Trabalho Individual ITI-2008/1-01

Orientador: Prof. Dr. Marilton Sanchotene de Aguiar

Pelotas, julho de 2008

Page 2: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

Dedico este trabalho aos meus Paispor terem orientado minha trajetória

e sempre mantido meus olhos abertos.

Page 3: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

AGRADECIMENTOS

Agradeço:

• a minha Família;

• aos amigos de infância;

• aos meus colegas que me ajudaram de alguma forma;

• aos meus Professores que me proporcionaram o conhecimento necessário para con-cluir os deveres;

• ao Professor e Orientador Marilton Sanchotene de Aguiar que me deu conselhosprecisos e decisivos durante a trajetória;

• a minha companheira que vivenciou todo esse processo e me ajudou a manter amente tranqüila para tomar as melhores decisões;

• e a CAPES, pelo auxílio em forma de bolsa.

Page 4: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

É preciso fé cega e pé atrásOlho vivo, faro fino e tanto faz

É preciso saber de tudoE não pensar em nada

Fé cega e pé atrás.— H G

Page 5: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

SUMÁRIO

LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

LISTA DE ABREVIATURAS E SIGLAS . . . . . . . . . . . . . . . . . . . . . 10

RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131.1 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2 PROCESSAMENTO DE IMAGENS DIGITAIS . . . . . . . . . . . . . . . 142.1 Considerações Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.1.1 Definição de Imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.1.2 Sistemas de Imageamento . . . . . . . . . . . . . . . . . . . . . . . . . . 152.1.3 Noções de percepção visual humana . . . . . . . . . . . . . . . . . . . . 152.1.4 Definição de Contraste . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.1.5 Definição de Cores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.1.6 Áreas de Pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.2 Arquivos Gráficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172.2.1 Formato BMP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.2.2 Formato TIFF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.2.3 Formato JPEG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.3 Processamento de Imagens . . . . . . . . . . . . . . . . . . . . . . . . . 192.3.1 Tipos de Operações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.3.2 Digitalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.3.3 Realce da Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222.4 Segmentação de Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . 262.4.1 Segmentação por Região . . . . . . . . . . . . . . . . . . . . . . . . . . 262.4.2 Segmentação por textura . . . . . . . . . . . . . . . . . . . . . . . . . . 272.4.3 Segmentação por Contorno . . . . . . . . . . . . . . . . . . . . . . . . . 282.4.4 Enlace de Bordas e Detecção de Contornos . . . . . . . . . . . . . . . . . 292.5 Análise de Imagens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302.5.1 Técnicas de classificação de imagens . . . . . . . . . . . . . . . . . . . . 302.5.2 Interpretação de imagens . . . . . . . . . . . . . . . . . . . . . . . . . . 31

Page 6: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

3 PROCESSAMENTO DE IMAGENS MÉDICAS . . . . . . . . . . . . . . . 323.1 Considerações Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.1.1 Propriedade da imagem médica . . . . . . . . . . . . . . . . . . . . . . . 323.1.2 Resolução da Imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.1.3 Textura da Imagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363.2 Protocolo DICOM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.3 Modalidades de Imagens Médicas . . . . . . . . . . . . . . . . . . . . . . 413.3.1 Radiografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423.3.2 Ultra-sonografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443.3.3 Ressonância Magnética Nuclear . . . . . . . . . . . . . . . . . . . . . . 453.3.4 Tomografia Computadorizada . . . . . . . . . . . . . . . . . . . . . . . . 453.4 Exemplos de Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . 463.4.1 Detecção de agrupamentos de microcalcificações em mamogramas . . . . 463.4.2 Detecção de assimetrias em imagens mamográficas . . . . . . . . . . . . 47

4 ALGORITMO GENÉTICO . . . . . . . . . . . . . . . . . . . . . . . . . . 504.1 Considerações Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.1.1 Histórico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 504.1.2 Conceito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 514.2 População Inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.3 Avaliação da População . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.4 Operadores Genéticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 534.4.1 Seleção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544.4.2 Cruzamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544.4.3 Mutação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 554.5 Substituição da População . . . . . . . . . . . . . . . . . . . . . . . . . . 554.6 Critério de Parada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

5 LÓGICA FUZZY . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575.2 Conjuntos Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 575.2.1 Operações Básicas entre Conjuntos Fuzzy . . . . . . . . . . . . . . . . . 595.3 Funções de Pertinência . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615.4 Sistemas Fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

6 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

Page 7: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

LISTA DE FIGURAS

Figura 2.1 Representação discreta de uma imagem (ANTUNES, 1999). . . . . . 15Figura 2.2 Exemplo de variação de contraste (ANTUNES, 1999). . . . . . . . . 16Figura 2.3 Relação entre computação gráfica, processamento de imagens e visão

computacional (ANTUNES, 1999). . . . . . . . . . . . . . . . . . . 17Figura 2.4 Diferença na geometria da amostragem (SCHARCANSK.J., 1998). . 21Figura 2.5 Histograma de uma imagem (ANTUNES, 1999). . . . . . . . . . . . 23Figura 2.6 Equalização de histograma (ANTUNES, 1999). . . . . . . . . . . . . 24Figura 2.7 Modificação de contraste (ANTUNES, 1999). . . . . . . . . . . . . . 25Figura 2.8 Representação de uma imagem segmentada usando quadtree (JAIN,

1969). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27Figura 2.9 Técnica estrutural: definição de estruturas que caracterizam a tex-

tura (SCHARCANSK.J., 1998). . . . . . . . . . . . . . . . . . . . . 28

Figura 3.1 Ilustração do conceito de vizinhança considerando o ponto centralcomo o pixel de interesse, os pixels da vizinhança são representadospelos espaços em cinza: (a) vizinhança-de-4; (b) vizinhança diagonal;(c) vizinhanca.de-8 . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

Figura 3.2 Modelo de comunicação geral do padrão DICOM (STANDARDS;PUBLICATIONS, 2006) . . . . . . . . . . . . . . . . . . . . . . . . 39

Figura 3.3 Esquema utilizado para segmentação de microcalcificações (NUNES,2005). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

Figura 3.4 Detecção de agrupamentos de microcalcificações em mamogramas.(a) imagem original; (b) região de interesse extraída da imagem ori-ginal; (c) região de interesse segmentada; (d) região de interesse apóstransformação área-ponto e (e) região de interesse após identificaçãode clusters (NUNES, 2005). . . . . . . . . . . . . . . . . . . . . . . 48

Figura 3.5 Exemplo de medição de assimetrias em mamogramas: (a) assimetriaglobal; (b) assimetrias locais (NUNES, 2005). . . . . . . . . . . . . . 49

Figura 4.1 Etapas dos algoritmos genéticos (MOREIRA, 2004). . . . . . . . . . 52

Figura 5.1 Gráfico da função de pertinência dos números inteiros “peque-nos” (SANTOS, 2007). . . . . . . . . . . . . . . . . . . . . . . . . . 58

Figura 5.2 Exemplo hipotético de conjunto fuzzy para categoria de peso corpo-ral (SOUSA, 2007). . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

Figura 5.3 Images: (a) União entre subconjuntos fuzzy ; (b) Intersecção entresubconjuntos fuzzy (c) Complementar de um conjunto fuzzy. . . . . . 60

Page 8: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

Figura 5.4 Arquitetura de um sistema fuzzy (SANTOS, 2007). . . . . . . . . . . 62

Page 9: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

LISTA DE TABELAS

Tabela 5.1 Grau de pertinência dos números inteiros considerados “peque-nos” (SANTOS, 2007). . . . . . . . . . . . . . . . . . . . . . . . . . 59

Page 10: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

LISTA DE ABREVIATURAS E SIGLAS

ACR American College of Radiology

CAD Computer Aided Diagnosis

CDI Centro de Diagnóstico por Imagem

DICOM Digital Imaging and Communications in Medicine

HCTA Health Care Technology Assessment

HIS Hospital Information System

HL7 Health Level Seven

IHE Integration Healthcare Enterprise

MIII Medical Imaging Informatics Infraestruture

MPPS Modality Procedure Performed Step

NEMA National Equipament Manufacturers Association

nm Nanometro

PACS Picture Archiving Comunication System

PDI Processamento Digital de Imagens

PET Positron emission tomography

PET Positron Emission Tomography

PID Processamento de Imagens Digitais

RGB Red Green Blue

RIS Radiology Information System

RLE Run-Length Encoding

RM Ressonância Magnética

RMN Ressonância Magnética Nuclear

SPECT Single photon emission computed tomography

TC Tomografia Computadorizada

TCP/IP Transmission Control Protocol/ Internet Protocol

US Ultra-som

Page 11: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

RESUMO

O crescente uso de programas de computador para auxílio diagnóstico está relaci-onado ao rápido desenvolvimento de algoritmos computacionais aplicados à medicina.

A ciência da computação apresenta atualmente três áreas destinadas à manipula-ção, análise ou geração de imagens através do computador; estas áreas são a computaçãográfica, o processamento digital de imagens e a visão computacional.

Por processamento digital de imagens entende-se a análise e manipulação deimagens por computador, com a finalidade de extrair informação destas ou transformá-las,de tal modo que a informação seja mais facilmente discernível por um analista humano.

O objetivo da segmentação de imagens é obter, a partir de uma imagem digitali-zada pré-processada, um conjunto de primitivas ou segmentos significativos, que contéma informação semântica relativa à imagem de origem.

Cada modalidade de imagem médica responde a um ou mais aspectos presentesnos materiais que compõem os seres da natureza. Assim, cada uma delas tem pecu-liaridades que fazem com que sejam mais ou menos adequadas para o diagnóstico dedeterminadas doenças.

Os diferentes objetivos e os diferentes problemas apresentados pelas modalidadesrequerem tratamentos diferentes, que podem ser obtidos a partir da aplicação de técnicasde processamentos de imagens.

Acredita-se que um ambiente computacional integrador de técnicas tradicionais desegmentação e classificação de imagens médicas com operadores baseados em algoritmosgenéticos possam permitir ferramentas mais versáteis e com precisão apropriada ao tipode aplicação pretendida.

Espera-se que este trabalho sirva de ponto de partida para um trabalho mais apro-fundado de proposta da integração de algoritmos genéticos e lógica fuzzy para a segmen-tação de imagens médicas.

Palavras-chave: Algoritmos Genéticos, Lógica Fuzzy, Processamento de Imagens, Pro-cessamento de Imagens Médicas.

Page 12: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

ABSTRACT

TITLE: “A STUDY ON GENETIC ALGORITHMS, FUZZY LOGIC AND TECH-NIQUES FOR SEGMENTATION AND CLASSIFICATION OF MEDICAL IMAGES”

The crescent use of computer programs for aid diagnosis it is related to the fastdevelopment of algorithms applied to the medicine.

The science of the computation presents three areas now destined to the manipu-lation, analysis or generation of images through the computer; these areas are the graphiccomputation, the digital processing of images and the vision computing.

For digital processing of images it understands each other the analysis and ma-nipulation of images for computer, with the purpose of to extract information from theseor to transform them, so that the information is more easily discernible for a human ana-lyst.

The objective of the segmentation of images is to obtain, starting from an imagepre-processed digitalized, a group of primitive or segments significant, that it contains therelative semantic information to the image of origin.

Each modality of medical image answers to one or more aspects presents in thematerials that compose the beings of the nature. Like this, each one of them has pecu-liarities that do with that you/they are more or less appropriate for the diagnosis certaindiseases.

The different objectives and the different problems presented by the modalitiesrequest different treatments, that you/they can be obtained the to leave of the applicationof techniques of processing of images.

It is believed that an atmosphere computational integrator of techniques traditionalof segmentation and classification of medical images with operators based on genetic al-gorithms can allow tools more versatile and accurately appropriate to the type of intendedapplication.

It is waited that this work serves as starting point for one I work deepened ofproposal of the integration of algorithms genetic and logic fuzzy for the segmentation ofmedical images.

Keywords: Genetic Algorithms, Fuzzy Logic, Image Segmentation, Medical Image Seg-mentation.

Page 13: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

13

1 INTRODUÇÃO

O volume de dados produzidos nos hospitais e centros médicos está em rápidaascensão. A produção anual de dados gerados por exames de imagens nos grandes centrosde radiologia é da ordem de 2 terabytes. Isto é devido à obtenção e armazenamentode dados dos pacientes, resultantes da crescente importância e utilização dos exames deimagem. É enorme a quantidade de dados que necessitam ser armazenados e indexadosde forma inteligente e segura, pois são peças fundamentais no diagnóstico clínico.

O crescente uso de programas de computador para auxílio diagnóstico está rela-cionado ao rápido desenvolvimento de algoritmos computacionais aplicados à medicina.Este trabalho tem como objetivo fazer um estudo amplo de técnicas de segmentação eclassificação de imagens médicas.

Também tem-se o intuito de apresentar os principais conceitos resultantes doestudo de algoritmos evolutivos, mais especificamente Algoritmos Genéticos e LógicaFuzzy.

Pretende-se que este trabalho se torne, em nível de grupo de pesquisa, um ma-terial que contribua na formação de futuros pesquisadores que se integrarão ao grupo,apresentando uma panorâmica da área de atuação.

1.1 MetodologiaEste trabalho está organizado da seguinte forma:

• No capítulo 2, apresentam-se conceitos básicos sobre de imagens digitais.

• No capítulo 3, enfocam-se ténicas para segmentação de imagens médicas.

• No capítulo 4, traz-se o conceito dos Algoritmos Genéticos, estudados como mé-todo alternativo para segmentação de imagens, apresentando alto desempenho.

• No capítulo 5, apresentam-se os conceitos fundamentais da Lógica Fuzzy, estuda-dos como apoio a tomada de decisão de diagnósticos médicos.

• E por fim, no capítulo 6 encontram-se algumas considerações finais sobre o desen-volvimento do trabalho.

Page 14: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

14

2 PROCESSAMENTO DE IMAGENS DIGI-TAIS

Neste capítulo abordam-se alguns conceitos referentes ao processamento de ima-gens digitais em âmbito genérico, ou seja, tratam-se de conceitos básicos do processa-mento de imagem, as diferenciações entre as áreas de pesquisa envolvendo imagens digi-tais, suas peculiaridades, técnicas de manipulação de imagem, entre outros.

2.1 Considerações IniciaisNesta seção abortaremos conseitos básicos referente ao processamento de imagens

em âmbito global.

2.1.1 Definição de ImagemUma imagem pode ser definida matematicamente como uma função f (x, y), bi-

dimensional. Este modelo é ideal para descrever imagens visuais, onde os valores as-sumidos pela função quantificam a energia captada por algum sistema de imageamento.Tomando-se como exemplo uma fotografia, a função f (x, y) representa a intensidade lu-minosa referente ao ponto (x, y) do espaço considerado. Para que uma imagem possa sermanipulada por computador, é necessário que essa imagem seja discretizada ou digitali-zada.

Uma imagem digital ou discreta é aquela cuja função é definida em uma “grade”regular de pontos da forma (m.dx, n.dy), onde dx e dy são intervalos nas direções x e y, e(m, n) são valores inteiros nos intervalos [0,m − 1] e [0, n − 1] (MASCARENHAS; VE-LASCO, 1989). Os valores assumidos pela função, em algum destes pontos, são definidosda forma k.dz, onde k está no intervalo [0, k−1] e dz representa uma dada quantidade (videFigura 2.1).

Percebe-se em (ANTUNES, 1999), que uma imagem pode ser discretizada atravésde um processo que envolve dois passos, um denominado amostragem, no qual são defi-nidos os dx e dy da grade e o outro denominado quantização, que consiste em escolherum valor múltiplo de dz para cada ponto da imagem.

Para o processamento digital de uma imagem é necessário que esta apresente umformato adequado a um tratamento computacional. Dessa forma, imagens são tratadascomo matrizes, onde para cada ponto determinado pelas coordenadas (m.dx, n.dy) corres-ponde um valor de intensidade luminosa k.dz, que para imagens monocromáticas, ou seja,que apresentam variação em apenas uma banda de freqüência, dá-se o nome de nível de

Page 15: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

15

Figura 2.1: Representação discreta de uma imagem (ANTUNES, 1999).

cinza.Imagens que apresentam variação de valores em mais de uma banda de freqüência,

necessitam ser representadas por mais de uma função do tipo f (x, y). Um exemplo são asimagens coloridas, que apresentam uma função de intensidade para cada cor primária, quesão o azul, o verde e o vermelho. A sobreposição destas três imagens, que individualmentesão monocromáticas, compõe uma imagem colorida.

O tipo de imagem e a qualidade desta dependem, necessariamente, de como estaimagem foi obtida. Os sistemas responsáveis pela obtenção ou captura de imagens sãodenominados sistemas de imageamento.

2.1.2 Sistemas de ImageamentoSistemas de imageamento são sistemas físicos destinados a produzir ou capturar

imagens. Existem vários sistemas, que apesar de diferirem na aparência, apresentam vá-rias características comuns. Entre os mais comuns estão a máquina fotográfica, a câmerade vídeo, os sensores a bordo de um satélite e os equipamentos de raio X.

Nos sistemas mais comuns de imageamento, a imagem, a qual se deseja capturar,é colocada sobre um plano através de um sistema de lentes. Neste plano são colocadossensores que medem a luz incidente, que, dependendo de sua intensidade, provocarãouma resposta proporcional por parte dos sensores.

Diferentes tipos de sensores podem capturar aspectos diferentes de uma mesmacena. Assim agem os satélites, que para uma mesma imagem, captam informações comsensores infravermelho, que ressaltam as variações de temperatura, e sensores de vapord’água para nebulosidade, entre outros.

2.1.3 Noções de percepção visual humanaSistemas ou algoritmos de processamento de imagens devem considerar as carac-

terísticas da percepção visual. Algoritmos que se baseiam em critérios estatísticos, comorealce, restauração e reconstrução de imagens, consideram critérios de fidelidade de re-sultados, que dependem das características psicofísicas do sistema visual humano.

O olho humano é um sensor de sinais de radiação eletromagnética na faixa de400nm a 700nm. A luz passa através da pupila e incide sobre a retina que possui dois tiposde sensores, os cones e os bastonetes. Estes dois tipos de fotoreceptores tem diferentesfunções; o segundo é responsável pela distinção de cores e detalhes; já o primeiro, é

Page 16: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

16

sensível a níveis mais altos de iluminação (ANTUNES, 1999).

2.1.4 Definição de ContrasteContraste representa uma diferença local de luminância, ou pode ser definido

como a razão dos níveis de cinza do objeto e do fundo. A sensibilidade do sistema vi-sual humano depende da quantidade de luz que penetra no olho, sendo que, quanto maiora intensidade luminosa, maior deve ser o contraste entre os objetos para que possa serpercebida qualquer diferença.

Dessa afirmação deriva-se o brilho aparente de um objeto, o qual depende forte-mente da intensidade do fundo. Alterações no contraste de uma imagem podem gerar umamelhor definição dos objetos contidos nesta. A Figura 2.2 demonstra, para um objeto demesmo nível de cinza, diferentes fundos, tornando o objeto mais, ou menos visível (AN-TUNES, 1999).

Figura 2.2: Exemplo de variação de contraste (ANTUNES, 1999).

2.1.5 Definição de CoresO sistema visual humano apresenta três tipos básicos de cones na retina que cor-

respondem à absorção de luz na região do azul, vermelho e verde. Este sistema permiteao homem distinguir uma enorme gama de cores. Caso a visão humana não apresentassea distinção de cores, o ser humano estaria restrito a distinção de apenas 20 ou 30 tons decinza.

As características do sistema de visualização humano e seus conceitos biológicos,serviram de base para a determinação de sistemas de cores por composição e subtração,que são implementados nos computadores (MASCARENHAS; VELASCO, 1989). Nacomposição (conhecida comumente como RGB), qualquer outra cor é determinada pelasobreposição das três cores primárias (azul, verde ou vermelho); e na subtração (denomi-nada CYMK), qualquer cor pode ser formada a partir da subtração de três cores (ciano,magenta e o amarelo) a partir do branco. Uma cor pode ainda apresentar variações detonalidade, saturação e brilho.

2.1.6 Áreas de PesquisaA ciência da computação apresenta atualmente três áreas destinadas à manipula-

ção, análise ou geração de imagens através do computador; estas áreas são a computaçãográfica, o processamento digital de imagens e a visão computacional. Com o desenvol-vimento das tecnologias de hardware, principalmente de memória e processamento, estasáreas têm apresentado um grande desenvolvimento e vislumbram ainda, pelos mesmosmotivos, um próspero futuro.

Page 17: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

17

Conforme (FREITAS, 1998), apesar de terem em comum a imagem digital, comofim ou como meio, estas três áreas apresentam diferenças como veremos a seguir:

Computação gráfica: destina-se à modelagem e construção de imagens, normalmentemanipulando dados na forma vetorial;

Processamento digital de imagens: cabe a aquisição e a manipulação da informação ad-quirida na forma de “pixels” (picture elements);

Visão computacional: é uma área voltada à análise de imagens, à interpretação de ca-racterísticas e à reconstituição do modelo de um objeto ou de uma cena.

A Figura 2.3 apresenta um diagrama de relacionamento destas três áreas de pes-quisa.

Figura 2.3: Relação entre computação gráfica, processamento de imagens e visão compu-tacional (ANTUNES, 1999).

2.2 Arquivos GráficosSegundo (ANGELO, 2007), a necessidade de se arquivar imagens digitais surgiu

no início dos anos 1950, juntamente com a computação gráfica, devido a necessidade dese armazenar gráficos e formas criadas e utilizadas pelos sistemas gráficos.

No início dos anos 1960, começaram a surgir algumas imagens com tecnologiabitmap de representação, com um efeito restrito. As pesquisas nesta área eram limitadasàs grandes instituições, pois as imagens digitais só podiam ser manipuladas em grandesestações de trabalho (workstations). Até então, as imagens digitais eram produzidas parafazer a comunicação com plotters de caneta, o que levava cada instituição a desenvolverseu sistema particular para manipular tais imagens. Não havia nenhum tipo de padrão aser seguido entre os desenvolvedores de softwares.

No início dos anos 1980, o desenvolvimento de estações gráficas de trabalho, ogrande crescimento dos computadores pessoais, o uso difundido de imagens geradas com-putacionalmente para apresentações comerciais, entre outras, geraram o crescimento daquantidade de diferentes formatos de imagem. A necessidade de fazer tais formatos se

Page 18: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

18

comunicarem com diversos sistemas por sua vez fez com que as grandes organizações doramo tentassem criar padrões para os formatos de imagens.

Apesar dos esforços para se criar um padrão e definir certos parâmetros para osarquivos de imagem, o que se nota no final é uma grande confusão. Surgiram muitosformatos diferentes, alguns desapareceram e outros se fundiram gerando novos formatos.Cada qual com suas histórias, soluções e aplicabilidades.

Paralelamente, surgiram softwares especializados em conversão de formatos, li-vros especializados em descrever formatos de imagens, padrões para aquisição e arma-zenamento de formatos gráficos e métodos de compressão de imagens que se aplicam adeterminados formatos.

Os formatos existentes, na sua maioria, são livres de qualquer tipo de direito au-toral, no entanto, para a gravação ou leitura de imagem em um determinado formato, al-gumas regras têm que ser seguidas de acordo com a documentação do formato, para queo arquivo gerado seja um arquivo válido e possa assim ser reconhecido por outros dispo-sitivos e/ou softwares. Dentre os principais formatos existentes na atualidade, podem-sedestacar: BMP, TIFF, JPEG, GIF, PSD, entre outros.

2.2.1 Formato BMPO Microsoft Windows Devide Independent Bitmap (BMP) é um formato de pro-

priedade da Microsoft Corporation, e é um arquivo que segue o padrão bitmap de repre-sentação (MARQUES FILHO; VIEIRA NETO, 1999).

Permite o armazenamento de imagens coloridas com até 24 bpp, ou seja, 8 bitspara cada uma das cores primárias (R, G e B) e pode utilizar ou não mapa de cores para suarepresentação. Admite técnica de compressão RLE (Run-Length Encoding - consiste deum algoritmo eficiente para a compressão de imagens binárias) ou nenhuma compressão,é um formato interpretado pelas plataformas PC e Macintosh.

Sua maior finalidade é o armazenamento de imagens para o uso no Microsoft Win-dows, o que se torna, ao mesmo tempo, uma vantagem e também uma desvantagem, poisfora do S.O. Windows ele é pouco utilizado.

2.2.2 Formato TIFFO nome TIFF provém de Tag Image File Format, ou seja, formatos de arquivos

etiquetados. Em outras palavras, trata-se de um arquivo cujas principais característicassão determinadas por etiquetas, ou bloco de informações.

Este formato foi criado pela Aldus Corporation, utiliza-se do padrão de represen-tação Bitmap e tem como principais características a diversidade de técnicas de compac-tação que suporta o alto valor de níveis de cores permitidos.

Tais características fazem deste formato um dos mais eficientes e utilizados emdiversos tipos de aplicação, como transmissão de satélites, processamento de imagensmédicas, vídeos, entre outras, além de trabalhar em várias plataformas (algumas estaçõesde trabalho UNIX, PCs e Macintosh), o que o torna muito utilizado na troca de dadosentre plataformas diferentes. Uma outra facilidade é o fato do formato ser muito bemdocumentado (ANGELO, 2007).

O formato TIFF possibilita a inserção de novas imagens sem invalidar as já exis-tentes, além de permitir a análise da imagem por partes, não sendo necessária a leitura detodo o arquivo. Como todos os outros formatos, ele apresenta vantagens, mas também tem

Page 19: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

19

suas desvantagens e a maior delas é justamente o fato do formato permitir inúmeras pos-sibilidades de criação de extensões do formato, o que, em certos casos, torna trabalhoso odesenvolvimento de algoritmos para a leitura dos dados (ANGELO, 2007).

2.2.3 Formato JPEGSegundo (ANGELO, 2007), o JPEG é um formato de propriedade da Joint Pho-

tographic Experts Group, segue o padrão bitmap de representação e permite o armaze-namento de imagens coloridas com até 24 bits, não sendo, no entanto, definido nenhummodelo de cor.

A grande vantagem deste formato é o fato dele permitir o uso de diversas téc-nicas de compressão, na maioria com perdas: é o formato que oferece a maior taxa decompressão existente para imagens fotográficas.

As técnicas de compressão sem perdas aceitas pelo JPEG consistem de uma codi-ficação preditiva sem perdas aliada a alguma outra técnica de compressão, a codificaçãode Huffman e a codificação aritmética são as mais comuns.

Apesar da usabilidade de formato JPEG, ele é um formato em constante desenvol-vimento, e existem algumas opções das versões dos formatos que são incompatíveis entresi. Informações como as especificações de compressão sem perda e da maneira como asinformações são alocadas em cada subloco do arquivo não são muito claras, dificultandodessa forma o entendimento da estrutura do formato.

2.3 Processamento de ImagensNesta seção abordaremos o histórico do processamento de imagens, além dos tipos

de operações possíveis sobre a imagem e algumas técnicas utilizadas.

2.3.1 Tipos de OperaçõesOs primeiros registros de estudos em Processamento Digital de Imagens datam da

década de 60, impulsionados pelos projetos de pesquisa criados pela NASA, nos EstadosUnidos da América.

Em seguida, surgiriam mais atividades que necessitariam dos adventos proporcio-nados por esta área de concentração de conhecimento; entre estas estavam a medicina, amicroscopia, a meteorologia, o televisionamento e a indústria.

Percebe-se desta forma que o processamento de imagens é essencialmente umaárea multidisciplinar, tanto na atuação quanto na derivação, pois suas técnicas baseiam-sena ótica, colorimetria, neurofisiologia, engenharia elétrica e ciência da computação.

Paralelamente, e conforme citado, o espantoso avanço dos recursos computacio-nais, gerariam o desenvolvimento veloz do processamento digital de imagens (ANTU-NES, 1999).

Segundo (JAIN, 1969), o termo processamento digital de imagens refere-se aoprocessamento de uma imagem bidimensional através de um computador digital.

Mais detalhadamente, como processamento digital de imagens entende-se a aná-lise e manipulação de imagens por computador, com a finalidade de extrair informaçãodestas ou transformá-las, de tal modo que a informação seja mais facilmente discernívelpor um analista humano. As operações realizadas com imagens podem ser classificadasem cinco tipos básicos:

Page 20: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

20

Representação da imagem: está relacionada à representatividade de cada pixel da figurae isto pode ser mensurado em termos de qualidade e quantidade.

Uma imagem pode representar a luminosidade refletida por objetos em uma cenaou pode indicar a temperatura de uma determinada região. De forma geral, umafunção bidimensional que possa armazenar informação pode ser considerada umaimagem.

E um modelo de imagem descreve lógica e quantitativamente as propriedades destafunção. É importante que o modelo ou representação da imagem obtido seja su-ficientemente capaz de armazenar as informações necessárias contidas no objetoimageado.

Realce da imagem: tem por objetivo acentuar certos aspectos da imagem para sub-seqüente análise ou visualização. No realce de imagem não são acrescidas infor-mações à imagem e sim enfatizadas determinadas características da imagem.

Um exemplo de realce é a variação de contraste, que transforma o valor de cinzade determinados pixels em valores diferentes, ressaltando determinados aspectos daimagem.

Restauração da imagem: refere-se à minimização ou remoção de degradações na ima-gem. Normalmente esta degradação é decorrente da limitação dos sensores utiliza-dos nos sistemas de imageamento, que podem gerar imagens nebulosas e geometri-camente distorcidas, entre outros problemas.

Normalmente as ferramentas geradas para correção de imagem são denominadasfiltros. Um exemplo de degradação de imagem é a apresentada por imagens prove-nientes de satélite que, para determinadas regiões, apresentam uma deformação emfunção do ângulo de curvatura terrestre.

Outro tipo de reconstrução também se dá através de projeções, onde uma imagembidimensional é reconstituída através de uma projeção unidimensional. Cada pro-jeção é adquirida através da incidência paralela de um raio X sobre o objeto.

Um algoritmo de reconstituição utiliza-se deste conjunto de projeções para geraruma imagem bidimensional. Esta tecnologia é muito utilizada pela medicina parafornecer imagens internas do corpo humano.

Como a quantidade de dados associados às imagens digitais é muito grande e oarmazenamento e transmissão destas requer uma grande capacidade de memória evelocidade de transmissão, existe uma grande preocupação em desenvolver algorit-mos que possam reduzir significativamente o tamanho destas imagens, mantendo,tanto quanto possível, a qualidade e as informações nesta contidas.

Análise da imagem: é o processo de medição quantitativa de um determinado aspectoda imagem com a finalidade de gerar uma descrição desta.

Enquanto que nos demais processos de tratamento de imagens a entrada e saída dosistema eram imagens, na análise a saída pode não ser uma imagem, mas sim umgráfico ou um valor referente à propriedade da imagem a que se deseja estimar.

Um exemplo de análise de imagem é a contagem de hemáceas em um determinadovolume de sangue. Esta atividade vale-se de técnicas de segmentação de imagenspara isolamento da característica de interesse.

Page 21: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

21

Compressão da imagem: como a quantidade de dados associados às imagens digitaisé muito grande e o armazenamento e transmissão destas requer uma grande capa-cidade de memória e velocidade de transmissão, existe uma grande preocupaçãoem desenvolver algoritmos que possam reduzir significativamente o tamanho des-tas imagens, mantendo, tanto quanto possível, a qualidade e as informações nestacontidas. Este problema também é pesquisado pelo processamento digital de ima-gens.

2.3.2 DigitalizaçãoA premissa básica para a manipulação de imagens por computador é a dispo-

nibilidade desta em formato digital. Uma imagem real apresenta-se contínua tanto emsua amplitude como em seus valores de cinza. Para tornar esta imagem real uma ima-gem manipulável por um computador, é necessário reproduzi-la ou amostrá-la em umagrade discreta e cada unidade desta grade é quantizada utilizando-se um número finito debits (ANTUNES, 1999).

2.3.2.1 Amostragem

Amostrar uma imagem significa reproduzi-la em uma forma computacionalmentemanipulável, definindo seu espaço. Ao conduzir uma imagem a uma forma digital énecessária convertê-la em um sinal, sinal este que é um meio passível de manipulaçãodigital. A definição deste sinal, o qual passa a representar a imagem, chama-se de amos-tragem.

A forma de amostragem irá influenciar na qualidade da imagem. Logo uma boaamostragem, irá facilitar uma boa reconstituição da imagem capturada. De forma maisprática, amostrar uma imagem significa definir, para uma imagem real, as característicasda matriz sobre a qual esta será representada. Esta característica é comumente reconhe-cida como resolução da imagem.

Evidentemente, dependendo das características desta matriz, ou seja, tamanho,dimensões dos pixels, mais fiel será a representação discreta da imagem. A Figura 2.4,ilustra dois diferentes tipos de amostragem para representação de uma reta.

Percebe-se que um dos casos apresenta resultado melhor. Um sistema que apre-senta uma amostragem insatisfatória irá gerar uma reprodução de baixa qualidade. Umproblema comum nestes casos é o efeito de aliasing, efeito caracterizado pela aparênciaserrilhada das bordas dos objetos na imagem (ANTUNES, 1999).

Figura 2.4: Diferença na geometria da amostragem (SCHARCANSK.J., 1998).

Page 22: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

22

2.3.2.2 Quantização

Pelo processo de quantização uma imagem com tons contínuos é transformadanuma imagem com tons discretos. Para armazenamento ou transmissão digital, cada tomé representado por um código binário. Este código é formulado atendendo a necessidadesde minimização da quantidade de bits, visando armazenamento ou transmissão destesdados (ANTUNES, 1999).

Os métodos de quantização buscam, em geral, otimizar os erros entre a imagemreal e a imagem quantizada, ou seja, procuram definir variações de tons de cinza querepresentem, de forma mais fiel possível, os níveis de cinza de uma imagem real.

Erros como o de “falsos contornos” podem ocorrer quando se usa um reduzidonúmero de tons de cinza em uma quantização. Este fenômeno se caracteriza pela transiçãode tons de cinza mais freqüentes, em áreas de pouca variação.

De uma forma geral, pode-se dizer que, dispondo de uma dada quantidade de bits,a escolha do nível de quantização e da amostragem irá depender do tipo de imagem a serdiscretizada e de critérios de avaliação subjetivos (MASCARENHAS; VELASCO, 1989).

Não existe uma regra exata para determinado tipo de imagem, no entanto é pos-sível concluir que para imagens que apresentam uma variação suave de tons de cinzaé necessária uma maior quantidade de níveis de quantização, não importando muito aamostragem. Já para imagens que apresentam um grande detalhamento é conveniente ouso de uma amostragem densa não sendo necessária uma quantização com muitos níveisde cinza.

2.3.3 Realce da ImagensConforme visto anteriormente, ao processamento de imagens cabe a manipulação

e análise de imagens, tendo como objetivo a extração de informação destas. A mani-pulação de imagens inclui duas grandes classes de transformações: as transformaçõesradiométricas onde alteram-se apenas os valores dos níveis de cinza; e, as transformaçõesgeométricas onde a geometria da imagem é alterada, mantendo-se, ao máximo possível,os valores dos níveis de cinza.

Podem distinguir-se dois grupos de transformações radiométricas: a restauraçãoque visa corrigir distorções sofridas pela imagem geradas normalmente pela limitação dossistemas de imageamento; e, o realce que visa enfatizar alguma característica de interessena imagem. Em determinados casos, estas duas transformações produzem os mesmosresultados (ANTUNES, 1999).

As técnicas de realce de imagem apresentam-se em duas grandes categorias: mé-todos “ponto a ponto” e métodos de vizinhança.

2.3.3.1 Método Ponto a Ponto

Estes métodos modificam os níveis de cinza de uma imagem preservando os con-tornos. São operações aplicadas sobre cada pixel (pontuais). A seguir são descritas algu-mas técnicas de realce ponto a ponto segundo (ANTUNES, 1999).

Histograma de uma imagem: é uma tabela que dá, para cada nível de cinza, o númerode pixels correspondentes na imagem. Fornecendo apenas o número de pixels paracada nível de cinza, e não a localização deles, o histograma gera uma descriçãoglobal da imagem e dos objetos nela contidos.

Page 23: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

23

Se todos os pontos da imagem são de um mesmo objeto, o histograma dá umaidéia da probabilidade condicional de um ponto possuir um dado nível de cinza z,considerando que pertença ao objeto.

Na Figura 2.5 pode-se observar uma imagem e seu histograma. Como se podeperceber, a imagem apresenta uma concentração maior de tons de cinza de nívelmédio, portanto, o histograma apresenta maiores valores de freqüência na faixaintermediária.

Em imagens coloridas o histograma indica a freqüência de cada componente RGBda imagem.

Figura 2.5: Histograma de uma imagem (ANTUNES, 1999).

Modificação de histograma: de forma geral, as imagens apresentam tons de cinza pró-ximos da faixa dos pretos e com pouca variação.

Assim para melhor apresentação, é necessário aprimorar o contraste e a dinâmicada imagem. Pode-se operar essas características através do histograma.

A modificação de histograma é um tipo de transformação da escala de níveis decinza, onde o objetivo da transformação é obter um formato de histograma desejado.

Como modificações no histograma, tem-se a equalização de histograma e a espe-cificação de histograma que são duas operações matemáticas realizadas sobre ohistograma de uma imagem; tais operações podem gerar resultados como realce deimagem.

Equalização de histograma: como definido anteriormente, um histograma é uma tabelaque indica para cada nível de cinza a quantidade de pixels existente na imagem.

Evidentemente, um histograma apresentará uma freqüência ou densidade maior depixels em um determinado nível de cinza que em outro.

Equalizar um histograma significa gerar uma uniformização de densidade para osníveis de cinza da imagem. A equalização do histograma de uma imagem podegerar maior contraste e nitidez na imagem, ressaltando assim objetos nela contidos,conforme ilustra a Figura 2.6.

Especificação de histograma: pode ser útil para certas aplicações escolher o tipo de den-sidade que devem seguir os pixels. A maneira de obter este resultado é a especifi-cação de histograma. Para execução desta técnica devem ser seguidos três passos:

Page 24: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

24

Figura 2.6: Equalização de histograma (ANTUNES, 1999).

• Determinar a função que equaliza o histograma da imagem original.

• Alterar a função que equaliza a imagem, pela função de densidade desejada.

• Aplicar a função sobre os níveis de cinza da primeira etapa.

A especificação de histograma é uma técnica ainda mais apurada que a equalizaçãode histograma, porém mais complexa. Na especificação de histograma é permitidoao usuário definir quais níveis de cinza sofrerão modificações, ou seja existe umaliberdade maior de operação.

Modificação de contraste: para compensar os ruídos gerados, normalmente, pelas res-trições dos sensores responsáveis pela captação de imagens, é necessário aumentara dinâmica, ou seja é necessário que exista uma variação maior entre os tons decinza definidos para a imagem.

Uma modificação do contraste é uma aplicação t tal que:

z = nível de cinzaz′ = t(z) onde zmin < z, z′ < zmax

Para aumentar o contraste, com z ∈ [a, b] ⊂ [zmin, zmax]

z′ = [(zmin − zmax)/(b − a)](z − a) + zmin (FACON, 1993)

Desta forma, os diferentes objetos na imagem apresentarão, caso possuam diferen-tes níveis de cinza, uma nitidez maior. A Figura 2.7 ilustra este efeito.

2.3.3.2 Método de Vizinhança

Estes métodos são aplicados sobre uma determinada região da imagem, para enfa-tizar determinados aspectos desta. Uma das aplicações destas técnicas de vizinhança, é aeliminação de ruídos através da suavização de imagens. Nos ítens seguintes são descritosalguns métodos de vizinhança (ANTUNES, 1999).

Page 25: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

25

Figura 2.7: Modificação de contraste (ANTUNES, 1999).

Redução de ruídos pela média de múltiplas imagens: como indica o proprio nome,nesta técnica são somadas n imagens e divididas pelo numero de imagens soma-das.

Evidentemente estas imagens somadas sao imagens semelhantes retiradas damesma cena. Dessa forma, ruídos apresentados em algumas imagens sao mini-mizados.

Tomando-se imagens f (x, y) e ruídos n(x, y) tem-se uma imagem com ruído repre-sentada por:

g(x, y) = f (x, y) + n(x, y)

a atenuação do ruido e dada por:

g′(x, y) = 1/N∑

gi(x, y) (FACON, 1993)

O grande problema desta técnica é a aquisição e armazenagem de várias imagensde uma mesma cena.

Filtragem: em uma filtragem, como já dito, o valor de nível de cinza de uma imagemdepende não só do nível de cinza original, mas dos valores de níveis de cinza de suavizinhança.

O tamanho desta vizinhança não é limitado, mas normalmente os vizinhos mais pró-ximos tem maior influência sobre os mais distantes. Os filtros podem ser divididosem duas grandes classes:

• Filtros de passa-baixa tem valores próximos de zero para as altas freqüências,portanto, a imagem apresenta-se “suavizada”.

• Filtros de passa-alta tem valores próximos de zero para as baixas freqüências.Este filtro gera um efeito de “agudização” da imagem, ou seja, as transiçõesentre diferentes regiões da imagem tornam-se mais nítidas, em compensaçãoeste filtro enfatiza o ruído que possa existir na imagem.

Os filtros, de modo geral, são projetados e implementados como ferramentas pararealizar realce de imagens. Esta atividade consiste no incremento da qualidadegeral da imagem, o que pode ser interessante para fins de visualização, e ainda pararessaltar determinados objetos ou características da imagem.

Page 26: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

26

Detecção de bordas: por vezes, sistemas de imageamento ineficazes geram imagenscom pouca nitidez, apresentando efeitos de suavização de bordas, que são regiõesde alta freqüência. Um método para realce de bordas ou detecção de arestas é utili-zar um operador de diferenciação que amplie as altas freqüência.

Operador de diferenciação: baseia-se no conceito de que uma imagem é uma seqüên-cia de regiões de tamanhos diversos, onde os níveis de cinza são constantes, e defronteiras, encontros de várias regiões, marcando uma transição entre estas regiões.

Do ponto de vista matemático, as regiões são caracterizadas por derivadas suaves epouco acentuadas e as fronteiras por derivadas fortes e acentuadas. O princípio deum operador é derivar a imagem para acentuar as bordas nela contidas.

2.4 Segmentação de ImagensO objetivo da segmentação de imagens é obter, a partir de uma imagem digitali-

zada pré-processada, um conjunto de primitivas ou segmentos significativos, que contéma informação semântica relativa à imagem de origem.

Usualmente as primitivas usadas são naturais, em geral contornos e regiões. Osdiferentes tratamentos utilizados levam à noção de contornos, regiões ou a uma noçãomista.

2.4.1 Segmentação por RegiãoA detecção de regiões em uma imagem pode ser feita com dois objetivos: extrair

uma determinada região ou dividir a imagem num conjunto de regiões distintas.Uma região de uma imagem é definida como um conjunto de pontos ligados onde,

de qualquer ponto da região pode-se chegar a qualquer outro ponto por um caminho com-pletamente contido nesta região.

Estas regiões normalmente apresentam alguma característica homogênea, que co-mumente é a continuidade do nível de cinza de seus pixels (ANTUNES, 1999).

Uma função que exprime esta continuidade é dada por R(x, y), onde R(x, y) é ho-mogênea, se e somente se, a diferença entre os níveis de cinza de dois pontos não formaior que uma constante x.

Os diferentes métodos de segmentação são a limiarização e a divisão e fusão.

2.4.1.1 Limiarização

O princípio da limiarização consiste em separar as regiões de uma imagem quandoesta apresenta duas classes, o fundo e o objeto, e utilizando-se do histograma para isto.

Caso tenha-se uma imagem com fundo e objeto bem distintos (níveis de cinzacom uma variação bem definida), ter-se-á um histograma com dois picos bem distintosseparados por um “vale” de valores relativamente baixos.

Neste caso a limiarização se dará da seguinte forma, para um objeto mais claroque o fundo (FACON, 1993):

Se I[P(x, y)] > T → P(x, y) ∈ ob jetoSenão→ P(x, y) ∈ f undo

Este limiar T fica em algum lugar do vale.

Page 27: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

27

Este processo é utilizado para dissociar o fundo das entidades presentes (hemá-ceas, bactérias, nuvens). Este processo é vantajoso pois utiliza muito pouca memória e éum processo matematicamente simples, mas peca por necessitar de imagens com caracte-rísticas específicas como bom contraste e boa nitidez.

2.4.1.2 Método de Divisão e Fusão

Este método consiste em se agrupar pixels até que se tenha regiões sobre as quaisexista uma homogeneidade H. Para isto são executadas sucessivas divisões e fusões sobrea imagem.

Este método é normalmente associado a uma estrutura quadtree que permite de-compor e agrupar partes de uma imagem. Construir esta estrutura significa dividir umaregião em quatro quadrantes, e para cada quadrante realizar a mesma divisão até encon-trar o fator H. A Figura 2.8 mostra uma imagem segmentada para uma estrutura quad-tree (ANTUNES, 1999).

Figura 2.8: Representação de uma imagem segmentada usando quadtree (JAIN, 1969).

2.4.2 Segmentação por texturaA segmentação por textura deve permitir a colocação em evidência dos motivos

considerando-se as propriedades de regularidade e de repetição.Textura caracteriza-se por apresentar um grupamento aleatório ou não de sub-

conjuntos da imagem, possuir identidades uniformes que possuam aproximadamente asmesmas dimensões em qualquer lugar da imagem e apresentar o motivo local repetidonuma região comparativamente larga em relação ao tamanho desse motivo (ANTUNES,1999).

Os três métodos principais para segmentar uma imagem pela textura são: estatís-ticos, estruturais e espectrais.

2.4.2.1 Método Estatístico

O método estatístico baseia-se na distribuição de padrões de níveis de cinza naimagem. Se ao determinar um padrão P de disposição de níveis de cinza na imagem, dotipo: “um pixel a direita e um pixel abaixo”, pode-se definir uma matriz que representaesta distribuição através da imagem.

Page 28: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

28

Valendo-se desta matriz de distribuição pode-se definir então a probabilidade queum conjunto de pixels de uma imagem tem de compor uma determinada textura (ANTU-NES, 1999).

2.4.2.2 Técnica Estrutural

A idéia é construir a partir de uma primitiva de textura simples, texturas maiscomplexas, usando regras que permitam limitar o número de arranjos das primitivas. Porexemplo:

Uma regra pode ser definida como: S → aS . Três aplicações dessa regra fornecemaaaS. Se definir que aS representa “quadrados a direita de”. Esta regra permite geraruma textura, que caracterizam-se por apresentar uma disposição estrutural característicaFigura 2.9.

Figura 2.9: Técnica estrutural: definição de estruturas que caracterizam a tex-tura (SCHARCANSK.J., 1998).

2.4.2.3 Técnica Espectral

Uma ferramenta muito utilizada é o espectro de Fourier, que permite detectar adireção das texturas em uma imagem. O Espectro de Fourier apresenta três característi-cas (FACON, 1993):

• Picos proeminentes no espectro fornecem a direção principal das texturas;

• A localização destes picos no plano das freqüências determina o período fundamen-tal espacial das texturas;

• Eliminando os componentes periódicos por filtragem, ficam os componentes nãoperiódicos que podem ser analisados pelas técnicas estatísticas.

2.4.3 Segmentação por ContornoContorno é definido como uma mudança brusca de níveis de cinza entre duas

regiões relativamente homogêneas. Ele pode aparecer como uma seqüencia de pontos,uma linha, um segmento, uma curva ou uma forte variação do nível de cinza médio. Aseguir são descritos métodos de segmentação por contorno.

Page 29: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

29

2.4.3.1 Detecção de Pontos

A maneira mais resumida de segmentar por contornos uma imagem é segmenta-laa partir de seus pontos relevantes; para isso é necessário, entretanto, eliminar o ruído daimagem a fim de evitar segmentações indesejáveis.

Esses pontos relevantes são pontos particulares que devem conter muitas informa-ções. Essa técnica é comumente utilizada para detecção de objetos e movimento (ANTU-NES, 1999).

Um exemplo de segmentação por detecção de pontos é o que utiliza o operadorde Moravec. Este operador utiliza uma janela, normalmente 5 × 5, sobre a imagem,detectando pontos que possuam uma variância significativa em quatro direções: vertical,horizontal e as duas diagonais principais.

Caso o ponto avaliado seja um ponto relevante, o nível de cinza do ponto (centro dajanela) é substituído pelo valor mínimo da variância; assim eliminam-se as possibilidadesde segmentação de pontos ruidosos na imagem.

2.4.3.2 Detecção de Contornos

O princípio de detecção de contornos baseia-se em operações de realce e contraste.Estas operações são utilizadas com a finalidade de fornecer contornos finos, mas que nãoapresentem interrupções; dessa forma torna-se possível identificar, com segurança, osobjetos da imagem (ANTUNES, 1999).

2.4.4 Enlace de Bordas e Detecção de ContornosAs técnicas de enlace e detecção de contornos permitem detectar descontinuida-

des nos tons de cinza e fornecer contornos entre as diferentes regiões. Entretanto, existe oproblema de raramente o contorno se apresentar de forma contínua e uniforme. Por estemotivo alguns conceitos de enlace de bordas são utilizados para juntar bordas (ANTU-NES, 1999).

2.4.4.1 Perseguição de Contornos

Uma técnica apropriada para enlaçar os pixels de um contorno é a de utilizar umaferramenta que possa definir, através das características do pixel, os que tenham umamaior possibilidade de pertencer ao contorno e escolher os mais relevantes.

Um algoritmo de perseguição de contornos utilizado é o algoritmo de Freeman,que analisa os 8 pontos adjacentes a um ponto já determinado, sendo este ponto perten-cente ao contorno. Este processo ainda é otimizado utilizando-se o vetor de Freeman queindica para qual direção o último ponto foi encontrado, eliminado assim a busca em todasas direções (ANTUNES, 1999).

2.4.4.2 Técnicas do Grafo

Esta técnica consiste em mapear para um grafo direcionado (estrutura compostade nodos e arcos) os pontos de contorno da imagem, de forma que, estando mapeadosos pontos relevantes da imagem, os quais possivelmente fazem parte do contorno nãocontínuo, seja possível identificar o contorno através do caminho de menor custo. Isto sefaz associando uma função de custo para os arcos entre cada par de pontos (ANTUNES,1999).

Page 30: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

30

2.5 Análise de ImagensO grande objetivo das várias aplicações do processamento digital de imagens é

a extração de importantes informações das imagens, sendo esta informação adquiridaatravés da interpretação de uma máquina. Por exemplo, um sistema que possa através daobservação indicar elementos danificados ou inválidos em uma linha de montagem.

A análise de imagens é uma técnica que se utiliza de diversos outros recursosdo processamento de imagens. Estes, estão divididos em três grandes classes: recursosde extração, de segmentação e de classificação. Os dois primeiros foram anteriormenteapresentados, portanto, optou-se por restringir a definição para os recursos ou técnicas declassificação (JAIN, 1969).

2.5.1 Técnicas de classificação de imagensA maior tarefa, depois da extração de características da imagem, é classificar o

objeto extraído em alguma categoria. A classificação de imagens e a segmentação deimagens tem objetivos bem próximos. A classificação pode levar à segmentação e vice-versa.

Um exemplo disto é a classificação de imagens de satélite; a classificação dospixels de uma imagem pode definir regiões de água, relevo, plantações de diversas culturase estas classificações levarem a segmentação da imagem (ANTUNES, 1999).

Existem duas abordagens de classificação de imagens que são: supervisionada enão supervisionada.

Aprendizado supervisionado: também denominado classificação supervisionada, podeapresentar dois métodos: o de distribuição livre e o estatístico.

A distribuição livre não necessita de nenhum tipo de conhecimento, visto que, emprincípio, funções de probabilidade são suficientes para a aplicação deste método.

As estatísticas baseiam-se em modelos de distribuição de probabilidades que po-dem ou não ser parametrizadas.

A classificação por distribuição livre pode ser entendida supondo-se que existam kdiferentes objetos, ou classes de padrões definidas por S 1, S 2, . . . , S k, cada classecaracterizada por apresentar Mk protótipos em uma imagem.

Uma função fundamental de reconhecimento de padrões, chamada função discri-minante, irá dividir o espaço em k diferentes regiões, cada uma delas apresentandopadrões similares.

Já a classificação estatística caracteriza-se por apresentar, para cada classe de pa-drões, uma função densidade de probabilidade, que, associada a cada grupo, definea probabilidade existente de uma determinada classe e seus respectivos objetos es-tarem presentes na imagem e com que densidade.

Aprendizado não supervisionado: nesta técnica, o objetivo é a identificação de agrupa-mentos (denominados clusters) na imagem. Um agrupamento é um grupo de pontosna imagem que possui uma densidade local elevada comparada com a densidade deoutras áreas da imagem.

Page 31: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

31

Esta técnica é utilizada para segmentação ou para compressão pois pode identificarpadrões em imagens, permitindo assim definir grupos não relevantes para codifica-ção.

2.5.2 Interpretação de imagensInterpretação de imagens refere-se a atividade de transformar figuras em descri-

ções ou símbolos comumente entendidos. Técnicas de reconhecimento de padrões sãoamplamente utilizadas nesta atividade, realizando a classificação da imagem para um dostipos de figura já conhecidos, o que requer também um aprendizado anterior.

Para permitir interpretação, são utilizados diferentes modelos visuais e regras prá-ticas são adotadas. Por exemplo, regras sintáticas geram gramáticas de símbolos. Outraregras descrevem as ligações entre os símbolos, e assim o conhecimento gerado pelo sis-tema permite a interpretação da imagem e geração de símbolos para esta (ANTUNES,1999).

Page 32: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

32

3 PROCESSAMENTO DE IMAGENS MÉDI-CAS

Neste capítulo apresenta-se o processamento da imagem com o foco especifica-mente na área médica, se valendo dos conceitos visto no capítulo 2.

3.1 Considerações IniciaisNesta seção abordaremos algumas propriedades das imagens médicas digitais.

3.1.1 Propriedade da imagem médicaCada modalidade de imagem médica responde a um ou mais aspectos presentes

nos materiais que compõem os seres da natureza. Assim, cada uma delas tem pecu-liaridades que fazem com que sejam mais ou menos adequadas para o diagnóstico dedeterminadas doenças.

A finalidade das imagens médicas é auxiliar na composição do diagnóstico deanomalias e fornecer material para acompanhamento de terapias.

Os diferentes objetivos e os diferentes problemas apresentados pelas modalidadesrequerem tratamentos diferentes, que podem ser obtidos a partir da aplicação de técnicasde processamentos de imagens. No tratamento de imagens médicas, é necessário, antesde qualquer decisão, definir-se o objetivo a ser alcançado.

Somente após esta definição é possível traçar estratégias a partir da utilização deuma técnica de processamento, da combinação de várias delas ou, ainda, da criação denovas técnicas.

Matematicamente, uma imagem pode ser descrita como uma função da intensi-dade do sinal retornado em um sensor. A aproximação mais clássica é a definição comouma função da “intensidade luminosa” refletida do objeto.

A maioria das imagens considera o espaço bidimensional, sendo definida comof (x, y), onde x e y são as coordenadas espaciais e o valor de f na coordenada espacial(x, y) fornece a intensidade, ou seja, o brilho da imagem no ponto.

A imagem depende da “quantidade de luz” incidente na cena e da “quantidade deluz” refletida pelos objetos da cena.

Dessa forma, afirma-se que: f (x, y) = i(x, y) ∗ r(x, y) onde:

• i(x, y) depende da fonte de luz, (0 ≤ i(x, y) ≤ ∞);

• r(x, y) depende do tipo de material que compõe o objeto, (0 ≤ r(x, y) ≤ 1).

Page 33: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

33

Verifica-se que r(x, y) assume o valor zero para absorção total e o valor 1 (um)para reflexão total.

Um caso especial de imagem é constituído pelas imagens digitais, onde a represen-tação consiste em um vetor de valores discretos. Geralmente este vetor é unidimensionale o domínio e a imagem de f (x, y) são também discretos.

O domínio é finito, geralmente uma matriz retangular, e o conjunto imagem éformado por valores no intervalo [0,M]. Para aplicações práticas, a imagem é uma funçãocontínua, representada por medidas obtidas em intervalos regularmente espaçados.

Os valores assumidos em cada ponto medido são quantificados em um númeropertencente a uma escala de diferentes cores. Em imagens médicas, geralmente essascores são relacionadas a níveis de cinza, sendo atribuído o valor zero à cor mais escura(preto) e o valor máximo M à cor mais clara da escala (branco).

Dessa forma, pode-se representar uma imagem como uma matriz onde cada pontoé um valor discreto, conforme mostra a (equação 3.1), onde n e m correspondem à quan-tidade de colunas e linhas, respectivamente.

f (x, y) =

f (0, 0) f (0, 1) . . . f (0, n − 1)f (1, 0) f (1, 1) . . . f (1, n − 1)...

f (m − 1, 0) f (m − 1, 1) . . . f (m − 1, n − 1)

(3.1)

O objetivo de definir matematicamente a imagem é a possibilidade de manipularo seu conteúdo a fim de transformá-la ou retirar dela informações importantes. Ao vastoconjunto de operações que podemos aplicar em uma matriz que representa uma imagemdenomina-se processamento de imagem.

Cada ponto ou elemento constituinte da matriz-imagem é chamado de “pixel” queé uma abreviação do termo em inglês picture element. A medida de um pixel depende daresolução espacial com a qual a imagem foi adquirida. O pixel é, então, a menor unidadesobre a qual podemos realizar operações. Para essas operações são definidas algumasrelações básicas, apresentadas a seguir:

3.1.1.1 Vizinhança

(GONZALEZ; WOODS, 2000) definem a vizinhança de um pixel da forma aseguir. Seja p, um pixel nas coordenadas (x, y):

1. A vizinhança de 4 do pixel p – ou N4(p) – é composta por seus vizinhos de coor-denadas (x + 1, y), (x − 1, y), (x, y + 1) e (x, y − 1).

2. A vizinhança diagonal do pixel p – ou ND(p) – é composta por seus vizinhos decoordenadas: (x + 1, y + 1), (x + 1, y − 1), (x − 1, y + 1) e (x − 1, y − 1).

3. A vizinhança de 8 – ou N8(p) – é composta pelo conjunto de todos os pixels vizi-nhos, ou seja, N4(p) ∪ ND(p).

Na Figura 3.1 são apresentados exemplos dos conceitos de vizinhança citados.

3.1.1.2 Adjacência

A adjacência e característica de um par de pixels vizinhos que compartilham umaborda ou um vértice, sendo que:

Page 34: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

34

Figura 3.1: Ilustração do conceito de vizinhança considerando o ponto central como opixel de interesse, os pixels da vizinhança são representados pelos espaços em cinza: (a)vizinhança-de-4; (b) vizinhança diagonal; (c) vizinhanca.de-8

1. um par de pixels compartilha uma borda e dito “adjacente por borda” ou “4-adjacente”;

2. um par de pixels de uma imagem que compartilha um vértice e dito “adjacente porvértice” ou “8-adjacente”.

Na Figura 3.1(a), por exemplo, observa-se que os pixels de cor cinza são 4-adjacentes e também 8-adjacentes do pixel de cor preta, pois compartilham uma borda eum vértice com este pixel. Na mesma figura, os pixels brancos sao somente 8-adjacentesdo pixel preto, pois compartilham somente um vértice com o mesmo.

3.1.1.3 Conectividade

A conectividade é um importante conceito usado para estabelecer bordas de ob-jetos e componentes de regiões em uma imagem. Dois pixels são conectados se: a) sãoadjacentes e; b) obedecem a um critério de similaridade dentro de uma escala de cor, istoé, seus valores estão dentro de um conjunto pré-estabelecido de valores de cinza.

Seja V = {G1,G2, . . . ,Gk} o conjunto de k valores de níveis de cinza usado paradefinir a conectividade. São definidos três tipos de conectividade:

• Conectividade-4: dois pixels p e q com valores em V e q ⊃ N4(p);

• Conectividade-8: dois pixels p e q com valores em V e q ⊃ N8(p);

• Conectividade-m: dois pixels p e q com valores em V e:

1. q ⊃ N4(p) ou

2. q ⊃ ND(p) e N4(p) ∩ N4(q) = �

3.1.1.4 Distância entre pixels

A distancia entre pixels é um valor mensurável, constituindo uma importante de-finição para grande parte dos algoritmos que manipulam a imagem.

• d(x, y) = 0, se x = y;

Page 35: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

35

• d(x, y) = d(y, x);

• d(x, y) + d(y, z) ≥ d(x, z).

Há diversas fórmulas empregadas para a definição de distância e freqüentementesão definidas e adaptadas fórmulas para aplicações especificas. Algumas das métricasmais conhecidas, aplicadas para dois pixels p = (xp, yp) e q = (xq, yq) são:

• Distância Euclidiana:

d(p, q) =√

(xp − xq)2 + (yp − yq)2

• Distância City Block (ou de Manhattan):

d(p, q) =| xp − xq | + | yp − yq |

• Distância Chessboard:

d(p, q) = max{| xp − xq |, | yp − yq |}

Introduzidos os conceitos anteriores, podemos aplicá-los ao processamento deimagens. As técnicas de processamento de imagens são, em geral, divididas em trêsníveis, cada qual com suas funções específicas:

processamento de baixo nível: responsável pela remoção de dados indesejáveis e realcede dados importantes;

processamento de nível médio: responsável pela identificação de formas significativas.A esse processo dá-se o nome de “segmentação”;

processamento de alto nível: responsável pela ligação da imagem com algum banco deconhecimento.

Os ítens a seguir apresentam técnicas aplicadas aos dois primeiros níveis citados.Não são apresentadas técnicas relacionadas ao alto nível pelo motivo de que estas en-volvem conceitos que extrapolam o domínio do processamento de imagens, englobandotarefas de inteligência artificial e estatística, entre outras áreas.

3.1.2 Resolução da ImagemTodas as imagens podem ser caracterizadas por diversos parâmetros de qualidade.

Os mais úteis desses parâmetros são a resolução espacial, a resolução de contraste e aresolução temporal (PATHOL, 1992). Esses parâmetros foram largamente usados paracaracterizar imagens de Raio X tradicionais; eles também provêem os meios para compa-ração de imagens formadas por modalidades (equipamentos de tomografia ou Ressonân-cia Magnética, entre outros) de aquisição de imagens digitais.

A resolução espacial está relacionada à distância entre as imagens 2D adquiridaspelas modalidades que empilhadas formam um volume 3D; ou seja, a separação físicaentre as imagens adjacentes de uma seqüência.

Page 36: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

36

Para a imagem digital, a resolução espacial é determinada pelo número de pixelpor área de imagem. A resolução de contraste é a medida da capacidade para distinguirpequenas diferenças de intensidade, como mudanças nos parâmetros mensuráveis, taiscomo atenuação de raios X para imagens digitais, o número de bits por pixel determina aresolução de contraste da imagem.

Finalmente, a resolução temporal é a medida de tempo necessária para formar ima-gens funcionais (produzir o comportamento dos batimentos cardíacos de um paciente), ataxa mínima para este tipo é de 30 frames (imagens) por segundo.

Uma resolução inadequada resulta na impossibilidade de distinguir estruturas;duas estruturas podem parecer uma só (baixa resolução espacial) ou uma lesão pode nãoapresentar limites precisos (baixa resolução de contraste).

Outros parâmetros que são especificamente relevantes para a produção de imagensmédicas são os que quantificam o risco do paciente, os graus de invasibilidade, a dosagemde radiações ionizantes, o grau de desconforto do paciente, o tamanho (portabilidade) doinstrumento, a capacidade de descrever as funções fisiológicas bem como as estruturasanatômicas, e o custo do procedimento.

Uma modalidade de produção de imagens perfeita deverá produzir imagens comaltas resoluções espacial de contraste e temporal; deverá ser de baixo custo, portátil, li-vre de risco, indolor, e não invasiva; não deverá usar radiações ionizantes; e deverá tercapacidade de descrever as funções fisiológicas, bem como as estruturas anatômicas.

A primeira razão para a proliferação de modalidades de produção de imagens éque nenhuma única modalidade satisfaz todos estes requisitos – cada uma é poderosapara uma ou mais dessas dimensões e fraca para outras.

A seleção da modalidade mais apropriada para um diagnóstico em particular re-quer a renuncia entre essas várias dimensões. A resolução espacial é o problema maisfreqüentemente questionado da imagem digital.

A fim de igualar a resolução espacial típica do filme, uma imagem de 14 × 17polegadas poderá ter aproximadamente 2000 × 2500 pixel, e para capturar todas as infor-mações de níveis de cinza, cada pixel deve carregar 10 bits (1024 tons de cinza). Por estemétodo o tamanho da imagem chegaria a 6,5Mb. Para dobrar-se a qualidade da resoluçãoespacial é necessário quadruplicar o número de pixel. Já a resolução de contraste varialinearmente com o número de bits requeridos.

Na geração de imagens digitais, cores podem ser usadas para representar os tonsde cinza das imagens, o que se denomina “cor falsa”. Em vez de atribuir um valor decinza diferente para cada valor binário no pixel, é usada a alteração da saturação da corprimária.

Contudo, três cores primárias são necessárias para produzir todas as outras cores.Deste modo, em imagens coloridas, cada pixel tem três componentes, uma para cada corprimária usada. Esses métodos para imagens coloridas requerem 3 vezes mais espaçopara armazenagem que os tons de cinza.

3.1.3 Textura da ImagemTextura, segundo (SANTOS, 2003), refere-se à informação auxiliar que é obtida

por meio de análises estatísticas do padrão de tons de cinza na imagem, e, portanto, dife-rentes texturas nos auxiliam a reconhecer aspectos distintos dos tecidos.

Na avaliação textural pela ressonância magnética (RM) a designação genérica parauma série de técnicas de pós-processamento das imagens usadas na quantificação da varia-

Page 37: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

37

ção espacial dos tons de cinza nas imagens, sendo que essas técnicas foram originalmentedesenvolvidas para segmentação por computador de imagens de satélite para fornecerinformação sobre a variação espacial dos tons de cinza nas imagens digitais.

De acordo com (SANTOS, 2003): Os algoritmos utilizados para avaliação texturalsão divididos em dois grandes grupos: estatísticos e estruturais.

No primeiro destes, a caracterização tecidual é feita por intermédio de parâmetrosestatísticos considerando as propriedades locais das inter-relações entre os “pixels”. Osmétodos estruturais procuram determinar os constituintes elementares de textura e suasregras de distribuição.

Para a descrição quantitativa dos aspectos da textura, como brilho, micro e ma-crotextura das imagens de RM, são utilizados parâmetros texturais de primeira e segundaordens. Os parâmetros de textura de primeira ordem caracterizam a distribuição dos tonsde cinza baseados na sua freqüência de ocorrência sem considerar suas interdependênciasespaciais, por intermédio de histogramas de tons de cinza. Os parâmetros de segundaordem estudam a interdependência espacial entre os tons de cinza, representando a uni-formidade espacial e a macrotextura.

A avaliação da textura, visualmente, é particularmente subjetiva, devendo-se con-siderar, ainda, a limitada sensibilidade que os observadores humanos possuem para pro-priedades texturais. Técnicas analíticas texturais matemáticas são significativamente maissensíveis às modificações texturais, além de serem métodos quantitativos, por conse-guinte, objetivos.

Há problemas diagnósticos em que a acurácia baseada somente na inspeção visualnão é aceitável, levando a uma busca por uma maior especificidade na caracterização pa-tológica dos tecidos nas imagens diagnósticas, com o intuito de se oferecer aos pacientestratamentos mais efetivos e menos danosos, na medida do possível.

3.2 Protocolo DICOMO gerenciamento de informação em um hospital envolve a transmissão de imagens

em redes. A integração de estações de visualização distribuídas, bases de dados on-line,sistemas de gerenciamento de imagens e redes locais de larga escala permitem que osdados ou imagens sejam compartilhados entre profissionais da saúde e que seja feita àvisualização local ou remota.

Além disso, os dados podem ser vistos em múltiplos locais simultaneamente. En-tretanto, atualmente existem diversas superposições de funções entre o HIS (HospitalInformation System), o RIS (Radiology Information System) e o PACS (Picture Archivingand Communication System) (GILLESPIE; ROWBERG, 1994).

Portanto, é necessária uma padronização de protocolos para garantir a comunica-ção entre os diversos equipamentos e softwares envolvidos no processo. Assim, permite-se a integração dos dados à estrutura do hospital e que estes possam ser armazenados,visualizados e processados por programas ou métodos de forma única.

Para esse fim, o National Equipament Manufacturers Association (NEMA) e oAmerican College of Radiology (ACR) cooperaram para criar um formato padrão, cha-mado ACR-NEMA, que foi o primeiro passo para conseguir a adesão dos fabricantes deequipamentos de imagem digital. Posteriormente, este evoluiu para o padrão DICOM quese tornou amplamente aceito na área.

O objetivo do padrão DICOM é facilitar a interoperabilidade dos dispositivos,

Page 38: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

38

em diversos aspectos, conforme apresentado a seguir (STANDARDS; PUBLICATIONS,2006):

• Semântica dos comandos e de dados associados. Para que os dispositivos interajam,devem ser definidos padrões para os dispositivos reagirem aos comandos e aos da-dos associados, não apenas à informação que deve ser transferida entre dispositivos;

• Semântica dos serviços de arquivos, formatos de arquivos e informações necessá-rias para comunicação off-line;

• Definição do protocolo de comunicação para executar o padrão. Em particular, umainformação enviada pode acionar a execução, no dispositivo remoto, de funções derecebimento que geram o reenvio de informações para o dispositivo solicitante;

• Facilidade de operações em rede;

• Estrutura permite a introdução de novos serviços (tags proprietárias), permitindo aevolução dos equipamentos e das aplicações médicas futuras;

• O padrão DICOM facilita a implementação de soluções de PACS, mas o uso dopadrão sozinho não garante que todos os objetivos de um PACS serão atingidos.Esta apenas garante a aplicação dos padrões internacionais existentes. Este padrãopermite que sistemas heterogêneos sejam construídos, desde que cada equipamento“fale” o padrão DICOM. Sendo desenvolvido com ênfase na imagem utilizada paradiagnóstico de radiologia, cardiologia; mas também pode ser aplicado em diversosambientes relacionados.

A Figura 3.2 apresenta o modelo geral de comunicação do padrão (STANDARDS;PUBLICATIONS, 2006) que implementa, tanto à parte de rede (on-line), quanto à partede armazenamento (off-line).

Portanto, as implementações do DICOM podem trabalhar com independência emrelação às camadas superior (DICOM UPPER) que fornece a comunicação com a utiliza-ção do protocolo TCP/IP) e básica (DICOM Basic File Service) que fornece o acesso aosmeios de armazenamento de maneira transparente aos formatos de físicos de armazena-mento.

A definição das informações dos objetos (Information Object Definitions) especi-fica um número de classes de informação do objeto que fornecem uma definição abstratadas entidades real-world (mundo real) aplicáveis a uma comunicação das imagens mé-dicas digitais e da informação relacionada (por exemplo, relatórios estruturados, dose daterapia de radiação, etc.).

Cada definição da classe do objeto da informação consiste em uma descrição desua finalidade e dos atributos que a definem. Uma classe de informação do objeto nãoinclui os valores para os atributos que compreendem sua definição. Dois tipos de classesde informação do objeto são definidos: normalizado e composto. As classes normalizadasde informação do objeto incluem somente aqueles atributos inerentes na entidade real-world representada.

Por exemplo, a classe de informação do objeto do estudo, que é definida comonormalizada, contém a data do estudo e a hora do estudo, isto por que são inerentes aum estudo real. O nome paciente, entretanto, não é um atributo da classe de informação

Page 39: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

39

Figura 3.2: Modelo de comunicação geral do padrão DICOM (STANDARDS; PUBLI-CATIONS, 2006)

do objeto estudo porque é inerente ao paciente em que o estudo foi executado e não aopróprio estudo (STANDARDS; PUBLICATIONS, 2006).

O serviço de especificação de classes (Service Class Specifications) define umnúmero de classes de serviço. Uma classe de serviço associa uma ou mais informaçõesdo objeto com um ou mais comandos a serem executados (aplicados) nos respectivosobjetos.

As especificações da classe de serviço indicam exigências para elementos de co-mando e como os comandos resultantes são aplicados às informações dos objetos. Opadrão de DICOM define também as características compartilhadas por todas as classesde serviço (STANDARDS; PUBLICATIONS, 2006). São exemplos de classes de serviço:

• Storage (armazenamento);

• Query / Retrieve (localização / busca);

• Worklist (lista de pacientes de trabalho);

• Backup (cópia).

Para a especificação de classes ainda são definidas as operações e as notificaçõesexecutadas em cima das informações dos objetos, comandos e protocolos. A estruturae semântica dos dados (Data Structure and Semantics) especifica como as aplicaçõesDICOM constroem e codificam a informação da série de dados referentes às informações

Page 40: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

40

dos objetos e presta serviços de manutenção às classes (STANDARDS; PUBLICATIONS,2006). A seguir são apresentados exemplos:

• o suporte a um número de técnicas padrão para compressão da imagem (por exem-plo são especificados os formatos, JPEG lossless e lossy);

• construir um conjunto de regras para saber como uma mensagem foi especificada.Este conjunto é produzido da coleção dos elementos de dados que correspondem àsérie de dados e também definem a semântica de um número de funções genéricasque são comuns a muitos objetos da informação;

• a definição das regras para o conjunto de dados referentes aos caracteres (internaci-onalização) usados dentro do DICOM.

O dicionário de dados (Data Dictionary) define o conjunto de todos os elementosdos dados DICOM disponíveis para representar a informação, ou seja, junto com os ele-mentos utilizados para os meios permutáveis que codificam as informações e uma listadas representações identificadas que são atribuídos pelo DICOM.

Para cada elemento, é especificado: Tag, que consiste em um grupo e um númeropara o elemento – exemplos, nome (nome do paciente), tipo (caractere, inteiro, etc.),multiplicidade (quantos valores por atributo) (STANDARDS; PUBLICATIONS, 2006).

A troca de mensagens (Message Exchange) especifica o serviço e o protocolo usa-dos por uma aplicação em um ambiente médico para trocar mensagens sobre os serviçosde comunicação definidos e suportados pelo DICOM. Uma mensagem é composta poruma linha de definição seguida por uma outra linha de dados opcional (STANDARDS;PUBLICATIONS, 2006). Assim, pode-se definir que:

• as operações e as notificações estarão disponíveis para prestar serviços de manuten-ção às classes definidas;

• as regras para estabelecer e terminar associações fornecerão suporte a comunicação;

• será possível controlar as transações de solicitação e resposta,

• o controle das regras necessárias para transferir as mensagens (streams) será reali-zado.

O suporte a comunicação em rede para troca de mensagens (Network Communica-tion Support for Message Exchange) descreve os serviços de comunicação e os protocolosdas camadas superiores necessários para suportar, em um ambiente de rede distribuído, acomunicação entre aplicações DICOM.

Estes serviços e protocolos de comunicação asseguram-se de que uma comunica-ção entre aplicações DICOM seja executada de forma eficiente e coordenada através darede. Os serviços de comunicação especificados são um subconjunto apropriado dos ser-viços fornecidos pela especificação OSI (ISO 8822) e do serviço de controle de associaçãoda OSI (ACSE) (ISO 8649).

Os serviços da camada superior permitem que as aplicações estabeleçam co-nexões, transfiram mensagens e terminem conexões. O protocolo da camada supe-rior do DICOM é, portanto, utilizado conjuntamente com protocolos do transporte do

Page 41: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

41

TCP/IP (STANDARDS; PUBLICATIONS, 2006) que é o principal protocolo de comuni-cação utilizado em redes locais e na internet.

As mídias para armazenamento e formatos de arquivos (Media Storage and FileFormat) especificam o armazenamento de imagens médicas em meios removíveis. A fi-nalidade desta parte é fornecer uma estrutura que permita a compatibilidade das imagense das respectivas informações associadas com uma grande variedade de formatos de ar-quivos e meios de armazenamento físicos (STANDARDS; PUBLICATIONS, 2006).

3.3 Modalidades de Imagens MédicasDesde que Röentgen, em 1895, descobriu a existência de uma radiação até então

desconhecida, capaz de atravessar materiais, ser parcial ou totalmente absorvida por elese fixar-se em anteparos, a dinâmica dos exames médicos sofreu drásticas mudanças. Coma descoberta dos Raios-X, há pouco mais de 100 anos, tornou-se possível a visualizaçãode estruturas internas do corpo e diagnosticar anomalias.

Desde então, o avanço na aquisição, processamento e armazenamento de imagensmédicas vem permitindo o aperfeiçoamento de diagnósticos e tratamentos de doenças denaturezas diversas. Cada modalidade de imagem médica atua de forma diferenciada.

Sua aquisição visa a ressaltar as diferenças entre os diversos tipos de tecidos exis-tentes na natureza e, especialmente, aqueles que compõem o corpo humano, fazendo comque estruturas de interesse se sobressaiam e, assim, possam ser identificadas como even-tuais anomalias.

Em (MAINTZ; VIERGEVER, 1998) lembram que as modalidades médicas po-dem ser classificadas em duas categorias globais: anatômicas e funcionais. As modali-dades anatômicas são dedicadas a identificar morfologias, incluindo Raio-X, TomografiaComputadorizada (TC), Ressonância Magnética Nuclear (RMN), Ultra-som (US), entreoutras.

Há outras modalidades derivadas dessas primeiras, sendo citadas por nomencla-turas diferentes como Angiografia por Ressonância Magnética (derivada da RMN), An-giografia por Tomografia Computadorizada (derivada da TC), Angiografia por SubtraçãoDigital (derivada de Raio-X) e Doppler (derivada de US).

As modalidades funcionais são aquelas que têm o objetivo de adquirir informaçãoa respeito do metabolismo relacionado a uma anatomia, incluindo cintilografia, SPECT(single photon emission computed tomography), PET (positron emission tomography),modalidades de medicina nuclear, RMN funcional, entre outras1.

As considerações e imagens apresentadas neste capítulo dedicam-se apenas a mo-dalidades anatômicas. As seções a seguir apresentam as principais características daformação de imagens médicas considerando quatro modalidades: Radiografia, Ultra-sonografia, Ressonância Magnética Nuclear e Tomografia Computadorizada.

É apresentada uma visão geral da formação da imagem em cada uma delas e pro-blemas inerentes à modalidade, aos quais as técnicas de processamento de imagens podemoferecer contribuições. Maior ênfase será atribuída à Radiografia, visto que os exemplosutilizados no capítulo são, na sua maioria, provenientes desta modalidade de imagem eque vários dos problemas relacionados a esta primeira modalidade apresentada são apli-cáveis a outras modalidades e podem ser minimizados com o emprego de técnicas deprocessamento de imagens.

Não se pretende esgotar o assunto, mas fornecer uma base teórica a fim de que

Page 42: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

42

possam ser compreendidos os conceitos e exemplos das próximas seções.

3.3.1 RadiografiaNa Radiografia a imagem se forma em conseqüência, entre outras coisas, da inte-

ração dos fótons de Raios-X com a matéria. Esses fótons atravessam o objeto, sofrendoatenuações, causadas pela sua absorção total ou parcial.

O nível de absorção depende dos elementos constituintes desse objeto. Dentro docorpo humano, por exemplo, ossos, músculos e gordura absorvem os fótons com diferen-tes níveis de absorção, levando a diferentes atenuações e, conseqüentemente, diferentesintensidades de radiação que chegam ao anteparo no qual a imagem será formada.

Isso resulta em diferentes tons de cinza. É essa diferença que possibilita a for-mação do contraste, permitindo a identificação de estruturas anatômicas. A seguir sãoapresentados alguns problemas inerentes à Radiografia que influenciam na formação daimagem.

Os Raios-X constituem radiação ionizante e o excesso deste tipo de radiação trazprejuízos ao organismo humano. Por isso, é imprescindível um controle a fim de que adose de radiação recebida pelo paciente não seja mais prejudicial do que o benefício a queela se propõe.

Alguns fatores contribuem para o aumento da dose absorvida, como o aumentoda tensão e o aumento da corrente para a produção de fótons e, ainda, o prolongamentodo tempo de exposição. Geralmente estas práticas são aplicadas quando é desejada umaimagem com intensidade mais acentuada (CURRY III; DOWDEY; MURRY JR., 1990).

Com relação a esta característica, as técnicas de processamento de imagens po-dem contribuir no sentido de realçar a imagem de acordo com a intensidade desejada,dispensando os costumeiros aumentos de tempo de exposição, tensão e/ou corrente detubo (ISHIDA M.AND FRANK; DOI; LEHR, 1983).

O efeito Heel é outro problema a ser enfrentado pelo processamento de imagens,conforme destacado por (CURRY III; DOWDEY; MURRY JR., 1990) e (WILKS, 1987):a intensidade da radiação do tubo não é uniforme em todas as regiões do campo, sendodependente do ângulo em que os fótons são emitidos do ponto focal.

Conseqüentemente, o nível de intensidade no filme poderá variar para estruturasque têm o mesmo índice de absorção. Isso causa uma preocupação constante com osmétodos a serem empregados nos sistemas de CAD: não é possível fixar valores de cores(em geral, níveis de cinza) que representem as estruturas de interesse após a digitalização.

São aplicadas, então, técnicas adaptativas à região. A radiação espalhada, causadapor fótons desviados de suas trajetórias ideais, é um outro ponto que pode constituir umproblema no processamento de imagens. Por apresentar uma característica randômica,não é possível prever o seu efeito.

Por isso, uma das possibilidades é que cause ruídos e redução do contraste naimagem, de acordo com (CURRY III; DOWDEY; MURRY JR., 1990) e (WILKS, 1987).Um dos tipos de espalhamento mais citados na literatura é o efeito Compton, onde parteda energia do fóton é absorvida pela matéria e outra parte permanece no próprio fóton.Ocorrendo o desvio deste fóton em uma direção inesperada, seu efeito pode ser desderuídos e diminuição do contraste da imagem (JACKSON et al., 1993) até aumento dadose no paciente.

O efeito da radiação espalhada pode ser diminuído com a utilização de gra-des (SCAFF, 1979), que consistem em peças compostas por uma série de faixas de

Page 43: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

43

chumbo separadas por espaços. Acopladas ao sistema, o seu funcionamento ideal deve-ria permitir a absorção da radiação espalhada sem absorver a radiação primária e, então,proporcionar o máximo contraste no filme sem aumentar a exposição do paciente.

No processamento de imagens, a forma de superar o efeito da radiação espalhadaé estabelecer procedimentos que removam ruídos e aumentem o contraste da imagem,como a limiarização e filtros que suprimam os sinais de alta freqüência. No entanto, estesprocedimentos devem ser cuidadosos, visto que alguns componentes de alta freqüênciapodem constituir estruturas de interesse em um diagnóstico.

A distorção na imagem radiográfica pode ser resultante da magnificação desigualde diferentes partes do mesmo objeto, conforme é afirmado por (CURRY III; DOWDEY;MURRY JR., 1990). Muitas vezes a magnificação é desigual devido ao posicionamentodo objeto. A distorção da imagem pode ser diferente para diferentes partes do feixe deRaios-X.

Assim, dois ou mais objetos podem sofrer distorções diferentes se estiverem po-sicionados em locais com distâncias diferentes do filme. A penumbra também constituiuma forma de distorção. Consiste em uma região de borramento que contorna a imagemreal do objeto no filme.

Na mamografia, por exemplo, geralmente a mama está em contato com o local deregistro da imagem, o que, teoricamente, deveria eliminar a possibilidade de penumbra.No entanto, a estrutura de interesse, estando espalhada pela mama, nem sempre está emcontato com o filme, causando, dessa forma, uma penumbra (SCHIABEL; VENTURA;FRèRE, 1994). Distorções causam complicações em um sistema para detecção de estru-turas pequenas e cujo formato é importante.

Muitas vezes, formato e tamanho são características empregadas para o reconheci-mento e classificação de estruturas de interesse. A sobreposição de objetos é outro aspectoque exerce grande influência no reconhecimento de padrões, considerando que a imagemradiográfica é a representação bidimensional de um objeto tridimensional.

Dependendo do posicionamento das estruturas internas do órgão cuja imagem estásendo adquirida, a imagem resultante pode apresentar sobreposição destes elementos,transformando dois ou mais objetos em um bloco único. Uma possível solução paraesta questão e o processamento da imagem a partir de projeções diferentes do mesmoobjeto, de forma que a localização de possíveis estruturas e o relacionamento entre suaslocalizações forneçam aos medicos mais subsídios para o diagnostico correto.

Outra maneira de solucionar a questão seria o processamento e a reconstrução deimagens tridimensionais.

O contraste e a resolução espacial também sao características das imagens quepodem prejudicar o diagnostico. Na imagem radiografia o contraste refere-se a diferençade densidades entre areas, conforme afirmam (DHAWAN; ROYER, 1988) e (CURRY III;DOWDEY; MURRY JR., 1990).

Se o objeto cuja imagem esta sendo registrada é formado por diferentes elementose cada um desses elementos apresenta diferentes níveis de absorção dos fótons de Raios-X, então, o padrão a ser registrado no filme apresentara diferentes intensidades.

Quanto maior for a diferença entre as intensidades, maior sera o contraste perce-bido e, provavelmente, maior facilidade oferecera para interpretação medica. Além disso,para que seja utilizado um esquema computadorizado para reconhecimento de estrutu-ras, os filmes radiográficos precisam ser digitalizados ou, então, a imagem precisa seradquirida digitalmente.

Page 44: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

44

Os equipamentos utilizados para esse processo variam muito em termos de escalade cores (ou níveis de cinza) oferecidas e resolução espacial. As cores (ou níveis de cinza)estão diretamente relacionadas com o contraste. Geralmente uma faixa de densidades óp-ticas do filme e representada por um único valor na escala de cores durante a digitalização,como mostrado por (CHAN et al., 1987).

A resolução espacial, por sua vez, refere-se a quantidade de pontos por unidade demedida que permite a maior ou menor percepção de detalhes na imagem. Em uma imagemdigitalizada, refere-se a quantidade de pontos em um centímetro ou milímetro quadradoque, ao final, estabelecera o tamanho da menor unidade da imagem digitalizada: o pixel.

Esses dois últimos aspectos abordados devem ser bem analisados e definidos parase ter um esquema CAD eficiente. As cores ou níveis de cinza serão processados a fimde informarem o tamanho e localização da estrutura reconhecida. Da mesma forma, noprocessamento, o tamanho do pixel e muito importante, principalmente na identificaçãode estruturas pequenas, como é o caso de microcalcificações em mamogramas.

Se a digitalização não fornecer um tamanho suficientemente pequeno de pixel,algumas microcalcificações pequenas podem ser desprezadas e ate mesmo desaparecerdurante o pre.processamento, conforme afirmam (CHAN et al., 1987).

Apesar dos problemas citados nesta seção estarem relacionados com as imagensradiológicas, vários deles estão presentes em imagens advindas de outras modalidades,principalmente aqueles inerentes a imagem propriamente dita, como distorção e resoluçãode contraste. Esses aspectos sao aqueles que podem ser mais beneficiados pelas técnicasde processamento de imagens.

3.3.2 Ultra-sonografia(BRONSON, 2003) e (BEGA et al., 2002) definem a Ultra-sonografia como uma

modalidade de exame baseada na reflexão de som. A imagem se forma quando uma ondasonora é refletida ao chocar-se com a região anatômica em análise.

Para formar as imagens da estrutura do corpo humano, esta modalidade utiliza umafaixa de ondas sonoras com uma freqüência maior do que a audível para o ser humano.Em aplicações de diagnósticos médicos são utilizadas freqüências de 1 a 10 MHz.

É um dos métodos, dentre os exames de diagnóstico por imagem, mais utilizadono rastreamento de doenças, especialmente por não ser invasivo, ter boa sensibilidade ebaixo custo, permitindo o exame de órgãos abdominais, pélvicos e estruturas superficiaiscomo mama, tireóide, globo ocular e sistema músculo-esquelético.

Por outro lado, pode-se citar como desvantagens o fato de que a qualidade da ima-gem depende da habilidade do operador, a baixa resolução espacial e a presença constantede ruídos na imagem (NUNES, 2005).

O equipamento de ultra-sonografia é portátil e o modelo padrão é formado pormonitor, aparelho de impressão, teclado e um emissor/receptor. As imagens são geradasem níveis de cinza e em tempo real, sendo seu tamanho definido por uma matriz quecontém geralmente 512x512 pixels.

As imagens geradas são armazenadas em memória digital, videocassete, ou dire-tamente no filme através de uma câmera multiformato. É importante destacar que ruídosde outros equipamentos podem ser captados pelo aparelho de ultra-som gerando faixaslineares ou pontos na imagem, criando certas deformações e irregularidades capazes dedificultar a análise do exame (NUNES, 2005).

Page 45: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

45

3.3.3 Ressonância Magnética Nuclear(DAINTY; SHAW, 1976) definem que a Ressonância Magnética Nuclear é base-

ada nas propriedades magnéticas dos núcleos atômicos, sendo capaz de oferecer detalhesanatômicos e informações estruturais e fisiológicas de forma superior à fornecida por ou-tras modalidades. É capaz de gerar imagens que diferenciem claramente os vários tiposde tecidos moles, mesmo que esses tenham a mesma densidade de massa.

O fenômeno de ressonância, de acordo com (LUITEN, 1981), manifesta-se nosmais diversos tipos de sistemas da natureza, ocorrendo sempre que acontece um estímulocuja freqüência seja próxima à freqüência do sistema.

No núcleo das células, esta ressonância tem natureza magnética, derivando do fatode certos núcleos terem um momento angular intrínseco chamado spin e um momentomagnético associado a ele.

(ARCURI; MCGUIRE, 2001) citam que esta técnica baseia-se no princípio de queos núcleos dos átomos, que em estado normal giram com spins em orientações randômi-cas, se orientam quando colocados num campo magnético.

Por isso, a aplicação de um pulso de rádio-freqüência a esses núcleos orientadosfaz com que estes absorvam e emitam uma quantidade de energia cuja freqüência precisade ressonância e depende das próprias características do núcleo e do campo magnético.

Quando o cérebro, por exemplo, é submetido a um campo magnético ao qual umafreqüência de rádio é superimposta, seus tecidos emitem freqüências diferentes por teremconstituições físico-químicas distintas. Isso torna possível diferenciar os sinais emitidospelas substâncias cinzenta ou branca, gerando uma imagem de grande precisão espacial.

Na formação da imagem na RMN, uma das principais propriedades mapeadas éa densidade local dos núcleos atômicos, sendo o hidrogênio o elemento mais utilizado,devido às características intrínsecas deste elemento e também pelo motivo de que o corpohumano possui grande quantidade deste elemento na sua composição.

Para gerar as imagens, uma amostra de núcleos é perturbada por uma seqüên-cia de pulsos de radiofreqüência, emitindo um sinal de RMN para cada um dos núcleosexcitados. O registro dos sinais retornados permite a formação da imagem com grandediferenciação entre os tecidos.

Durante a execução do exame, o paciente se posiciona em uma espécie de túnelno qual estão localizadas as bobinas magnéticas que geram a freqüência necessária aoprocedimento. Conforme lembram (ARCURI; MCGUIRE, 2001), a claustrofobia e obarulho do equipamento são desvantagens da técnica.

Também deve ser citado como desvantagem o fato de que esta modalidade deimagem médica pode ser perigosa para pacientes que possuem implantes metálicos, comomarcapassos.

3.3.4 Tomografia ComputadorizadaConforme define (WILKS, 1987), da mesma forma que a radiografia convencio-

nal, a Tomografia Computadorizada baseia-se no princípio de que os Raios-X são apenasparcialmente absorvidos pelo corpo.

Enquanto que na radiografia convencional o feixe de Raios-X é piramidal e a ima-gem obtida é uma imagem de projeção, na TC o feixe é emitido por uma pequena fendae tem a forma de leque. O tubo de Raios-X gira 360 graus em torno da região do corpoa ser estudada e a imagem obtida é tomográfica, ou seja, são obtidas “fatias” da região

Page 46: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

46

investigada.Em oposição ao feixe de Raios-X emitidos, tem-se um detector de fótons que gira

concomitantemente ao feixe. Os fótons emitidos dependem da espessura do objeto e dacapacidade deste de absorver os Raios-X. Os detectores de fótons da TC transformam osfótons emitidos em sinal analógico e depois digital.

Após a aquisição das seções transversais, as informações obtidas são processadasutilizando uma técnica matemática chamada de projeção retrógrada, ou outras, como atransformada de Fourier. As imagens tomográficas podem ser obtidas em dois planos:axial (perpendicular ao maior eixo do corpo) e o coronal (visão frontal).

Após a sua obtenção, recursos computacionais podem permitir reconstruções noplano sagital (paralelo à sutura sagital do crânio) ou reconstruções tridimensionais.

A principal vantagem da TC é que permite o estudo de seções transversais docorpo vivo. É uma grande melhoria em relação às capacidades da radiografia convencio-nal, pois permite a detecção ou o estudo de anomalias que não seria possível senão atravésde métodos invasivos.

Uma das principais desvantagens é a grande quantidade de radiação X imprimidaao paciente. Outra desvantagem é o seu elevado preço, especialmente quando comparadacom outros métodos como a radiografia convencional.

3.4 Exemplos de AplicaçõesOs exemplos a seguir vêm confirmar esta afirmação: em geral, é necessária a apli-

cação de um conjunto de técnicas para se atingir o objetivo almejado. Em cada exemplo, éapresentada uma breve descrição do problema e das técnicas de processamento utilizadas.

3.4.1 Detecção de agrupamentos de microcalcificações em mamogra-mas

A detecção precoce do câncer de mama vem sendo objeto de estudo bem explo-rado na área de CAD, tendo os mamogramas (imagens radiológicas da mama) como fontede dados. No mamograma são procuradas estruturas que indicam a presença de anorma-lidades ou tumores.

Entre esses elementos estão as microcalcificações, depósitos de cálcio de formatose tamanhos variados, segundo (EGAN; MCSWEENEY; SEWELL, 1980). Devido aotamanho reduzido dessas estruturas, a sua visualização em mamogramas exige grandeexperiência do examinador e, mesmo assim, muitas vezes são passadas despercebidas,visto que o sistema de Raios-X pode apresentar várias limitações que prejudicam a nitidezda imagem.

De grande interesse ainda são os clusters (aglomerações) de microcalcificações,pois são indicadores da necessidade de investigação mais aprofundada no local onde seencontram. Segundo informação do National Cancer Institute e do National Institute ofHealth, ambos dos Estados Unidos, aproximadamente metade dos cânceres detectadosatravés de mamografia é percebida inicialmente como uma aglomeração de microcalcifi-cações.

Com o objetivo de segmentar microcalcificações em mamogramas e identificaragrupamentos dessas estruturas, foi desenvolvido um procedimento que recorta regiõesde interesse de imagens mamográficas e as processa separadamente.

Page 47: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

47

O esquema do processamento pode ser visualizado na Figura 3.3, onde a imagemresultante de uma fase é utilizada como imagem de entrada para a etapa seguinte.

Figura 3.3: Esquema utilizado para segmentação de microcalcificações (NUNES, 2005).

Inicialmente é executada uma técnica para identificar de forma semiautomática asregiões de interesse em uma imagem mamográfica. Então, um processo de segmentaçãocomposto de quatro passos (subtração de imagens, limiarização global, morfologia ma-temática e limiarização) é responsável por extrair das imagens somente as estruturas deinteresse.

Na morfologia matemática, as imagens são analisadas em termos de forma e tama-nho, utilizando-se padrões elementares denominados elementos estruturantes (GONZA-LEZ; WOODS, 2000). Cada elemento estruturante interage com cada entidade contida naimagem em estudo, modificando a sua forma, o seu tamanho e permitindo, assim, extrairalgumas conclusões desejadas. O elemento estruturante é um conjunto completamentedefinido e conhecido (tamanho e forma).

A linguagem para morfologia matemática é a teoria dos conjuntos, onde os con-juntos representam os formatos dos objetos em uma imagem. No caso deste processa-mento, o elemento estruturante foi definido para eliminar da imagem aqueles sinais quecontinham menos de três pixels.

Ao final do procedimento, cada estrutura identificada é transformada em um únicoponto para facilitar a contagem de objetos e, então, identificar um agrupamento. Exem-plos de imagens processadas são apresentados na Figura 3.4.

3.4.2 Detecção de assimetrias em imagens mamográficasA assimetria é a comparação bilateral entre regiões das mamas direita e esquerda

da mesma projeção. A identificação de assimetria estrutural é um fator importante paradetecção precoce do câncer de mama porque uma desigualdade significativa entre as ma-mas pode indicar o desenvolvimento de alguma anomalia.

Para medir a assimetria entre mamas utiliza-se um procedimento que indica aporcentagem de assimetria global e as áreas particulares onde existe diferença entre astonalidades de cinza. A finalidade é utilizar os recursos oferecidos pelas técnicas de

Page 48: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

48

Figura 3.4: Detecção de agrupamentos de microcalcificações em mamogramas. (a) ima-gem original; (b) região de interesse extraída da imagem original; (c) região de interessesegmentada; (d) região de interesse após transformação área-ponto e (e) região de inte-resse após identificação de clusters (NUNES, 2005).

processamento a fim de fornecer informações adicionais pra composição de diagnósticoaos profissionais da área (mastologistas e radiologistas).

Para verificar a assimetria global, inicialmente a imagem mamográfica é segmen-tada a fim de que ruídos e estruturas dispensáveis sejam removidos. Em seguida, é re-

Page 49: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

49

alizado um deslocamento das imagens esquerda e direita com a finalidade de alinhá-las.Então, é realizada uma comparação entre as imagens, indicando-se os locais onde umamama é maior que a outra. Exemplos do procedimento executado podem ser verificadosna Figura 3.5(a).

Para obtenção das assimetrias locais é realizada uma comparação ponto a ponto naimagem, considerando-se um tamanho de template pré-definido pelo usuário. As médiasde cinza de cada área particular são calculadas para as localizações do template em ambasas imagens.

A diferença entre as médias obtidas é medida em porcentagem e representada naimagem resultante com cores diferentes, conforme pode ser observado na Figura 3.5(b).Esse processamento pode indicar ao médico a existência de uma diferença entre as ma-mas, podendo estar relacionada ao início do desenvolvimento de um tumor (NUNES,2005).

Figura 3.5: Exemplo de medição de assimetrias em mamogramas: (a) assimetria global;(b) assimetrias locais (NUNES, 2005).

Page 50: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

50

4 ALGORITMO GENÉTICO

Neste capítulo apresenta-se o conceito de Algoritmos Genéticos, que por seremalgoritmos aproximativos tem melhor desempenho em relação aos algoritmos ótimos, e,por isso, são uma boa alternativa aos métodos tradicionais na área de segmentação deimagens.

4.1 Considerações IniciaisNesta seção abordaremos os conceitos principais de Algoritmos Genéticos e seu

histórico.

4.1.1 HistóricoEm meados do século XIX os naturalistas acreditavam que cada espécie havia sido

criada separadamente por um ser supremo ou através da geração espontânea. O trabalhodo naturalista Carolus Linnaeus levou a acreditar na existência de uma relação entre asespécies.

Por outro lado Thomas Robert Malthus propôs que fatores ambientais tais comodoenças e carência de alimentos limitavam o crescimento da população.

Foi dentro desse contexto que surgiu um dos mais importantes princípios nocampo da evolução da vida, A Seleção Natural de Darwin. Esta idéia defendia que anatureza dos seres vivos tendem a sobreviver mais que os outros por ter melhores carac-terísticas (SILVA, 2001).

Em 1859, Charles Darwin formulou seu primeiro livro chamado The Origin ofSpecies, que tratava sobre a teoria da Evolução, conhecida também como teoria da Se-leção Natural. Esse livro foi a primeira tentativa de representação através de modelosmatemáticos e mostrava como era a evolução, aprendizado e forma de adaptação diferen-ciada apenas pelas escalas de tempo.

Entre os anos 50 e 60, vários cientistas da computação estudaram sistemas evo-lucionários com a idéia de que a evolução poderia ser usada como uma ferramenta deotimização para problemas na engenharia.

Os sistemas desenvolvidos pretendiam gerar uma população de candidatos à solu-ção para um dado problema. Box( 1957), Friedman(1959) e Baricelli(1967) desenvolve-ram algoritmos inspirados na evolução natural para problemas de otimização e aprendi-zagem de máquina.

Entretanto, seus trabalhos não possuíam qualquer tipo de atenção às estratégias de

Page 51: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

51

evolução, programação evolucionária e Algoritmos Genéticos atuais. Os Algoritmos Ge-néticos foram inventados por John Holland nos anos 60 e desenvolvidos por seus alunosna Universidade de Michigan em meados de 1970.

O principal objetivo de Holland não foi desenvolver algoritmos para solucio-nar problemas específicos, mas dedicar-se ao estudo formal do fenômeno de evolução,como ocorre na natureza, e desenvolver maneiras de importá-lo aos sistemas de compu-tação (AGUIAR, 2002).

Foi em 1970 que este processo de evolução biológica intrigou John Holland, poisele achava que incorporando os princípios da evolução em um programa de computa-dor pudesse resolver, por simulação, problemas complexos assim como fazia a natu-reza (BARCELLOS, 2000).

A partir disso, dedicou-se ao estudo de processos naturais adaptáveis, e junto comcolegas e alunos da Universidade de Michigan criaram os Algoritmos Genéticos (AG’s).O algoritmo criado por eles era capaz de resolver problemas complexos de uma maneiramuito simples, e assim como na natureza o algoritmo não sabia o tipo de problema queestava sendo resolvido.

O sistema trabalhava com uma população (um conjunto) de algumas cadeias debits ( 0’s e 1’s) denominados indivíduos( por convenção um indivíduo é constituído por umcromossomo). Semelhante à natureza, o sistema evoluía até o melhor cromossomo paraatender um problema específico, mesmo sem saber que tipo de problema estava sendosolucionado. A solução era encontrada de um modo automático e não-supervisionado, eas únicas informações dadas ao sistema eram os ajustes de cada cromossomo produzidopor ele (AGUIAR, 2002).

A habilidade de uma população de cromossomos explorar o espaço de busca ecombinar o melhor resultado encontrado mediante qualquer mecanismo de reprodução éintrínseca à evolução natural e é explorada pelos Algoritmos Genéticos (AGUIAR, 2002).

Em 1975, John Holland lançou, nos Estados Unidos, o seu primeiro livro Adap-tation in Natural and Artificial System (HOLLAND, 1992). Este livro trazia uma junçãode idéias e trabalhos que ele vinha desenvolvendo há anos, e este é até hoje considerado abíblia do Algoritmos Genéticos.

A partir dos anos 80, os algoritmos genéticos receberam um grande impulso emdiversas áreas de aplicação científica devido a sua versatilidade e por apresentar excelentesresultados.

4.1.2 ConceitoOs algoritmos genéticos (AG’s), são técnicas baseadas na teoria da evolução, nos

quais as variáveis são representadas como genes de um cromossomo. Juntamente com es-tratégias evolucionárias e programação evolutiva formam uma classe de pesquisa baseadoem evolução natural (CONCILIO, 2000).

AG’s são métodos que simulam, através de algoritmos, os processos de evoluçãonatural e genética buscando resolver problemas de otimização onde o espaço de buscaé muito grande e os métodos convencionais não se demonstram eficientes. O algoritmobásico foi estruturado de forma que as informações referentes a um determinado sistemapudessem ser codificadas de maneira análoga aos cromossomos biológicos (MOREIRA,2004).

Eles ocupam lugar de destaque entre os paradigmas da computação evolutiva, porconter de forma simples e natural os conceitos necessários da computação evolutiva.

Page 52: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

52

Além disso, têm resultados bastante aceitáveis com relação aos recursos empregados epela ampla gama de problemas aplicáveis.

O AG’s para um determinado problema deve ter os seguintes componentes e eta-pas:

• uma representação genética para a solução que se deseja alcançar;

• uma maneira de gerar um população inicial;

• a função de avaliação que vai classificando as soluções geradas;

• operadores genéticos para a geração de novas populações;

• valores para os diversos parâmetros testados.

Essas etapas estão representadas graficamente na Figura 4.1.Também são vistos como otimizadores de funções, embora a quantidade de pro-

blemas para qual são aplicados seja bastante abrangente. A principal vantagem deles éde trabalhar com o conceito de população, ao contrário de outros métodos que trabalhamcom um só ponto, avaliando apenas um candidato à solução por vez.

Figura 4.1: Etapas dos algoritmos genéticos (MOREIRA, 2004).

Esses algoritmos modelam uma solução para um problema específico em umaestrutura de dados como a de um cromossomo e aplicam operadores que recombinamessas estruturas preservando informações críticas, explorando a idéia de sobrevivência nosindivíduos mais adaptados e no cruzamento de população para criar novas e inovadorasestratégias de pesquisa (MOREIRA, 2004).

Page 53: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

53

4.2 População InicialA geração inicial para a criação de uma nova população, pode ser efetuada de vá-

rias formas. Uma das maneiras é através da geração aleatória, onde não haverá influênciado meio externo, ou através de uma seleção heurística.

Qualquer conhecimento que se tenha do problema deve ser utilizado na iniciali-zação da população, para minimizar o tempo de computação, encontrando mais rápido ovalor ótimo (CONCILIO, 2000).

O tamanho da população é tratado como n indivíduos e cada um destes representauma possível solução para o problema. Os problemas que possuem restrições, a populaçãoinicial não deverá gerar indivíduos inválidos nesta etapa.

Segundo (SILVA, 2001), se uma população inicial pequena for gerada de formaaleatória, provavelmente algumas regras do espaço de busca não serão apresentadas, ecomo solução para este problema deve haver uma distribuição uniforme da população.

Além dessa solução, pode-se utilizar a inversão de bits, podendo a primeira metadeda população ser gerada de forma aleatória e a segunda metade da população ser a trocade bits da primeira metade, e assim tem-se a garantia de que a cadeia de bits esteja dentrodos valores 0 e 1 (MOREIRA, 2004).

4.3 Avaliação da PopulaçãoA função objetivo gera uma avaliação do grau de adaptação de cada cromossomo

da população. Esta função está diretamente ligada as especificações do problema.A função, segundo (TAVARES, 2000), efetua a avaliação de modo que é atribuído

um valor de aptidão as possíveis soluções através da funções de aptidão, que á definidaconforme o problema que se tem a intenção de solucionar.

Para (CONCILIO, 2000), a geração desta avaliação e aptidão torna-se a parte maisimportante para o procedimento do AG. O retorno dessa função, que ordena os indivíduosconforme a sua adaptação, é uma característica intrínseca ao indivíduo, que indicará bi-ologicamente, qual é a habilidade que um indivíduo possui para sobreviver e produzir amelhor resposta.

No Algoritmo Genético essa etapa é a mais crítica, pois já que as funções deverãoser avaliadas para cada cromossomo de cada população durante todo o processo evolu-tivo (MOREIRA, 2004).

4.4 Operadores GenéticosO principal objetivo dos operadores genéticos é de serem capazes de formar uma

nova população através de sucessivas gerações para que se obtenha um resultado satisfa-tório no final do processo.

Os operadores são de extrema importância para que se tenha uma diversificaçãoda população e manter as características de adaptação adquiridas das antigas gerações.

Um algoritmo genético padrão faz a evolução em suas sucessivas gerações, medi-ante aos três operadores tratados a seguir.

Page 54: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

54

4.4.1 SeleçãoEsse processo ocorre após a função de aptidão nos cromossomos. Segundo (BAR-

CELLOS, 2000), esta etapa desempenha o papel da seleção natural na evolução, sele-cionando para sobreviver e reproduzir os organismos com melhor valor na função deadaptação.

A fase de seleção consiste em que os indivíduos mais aptos são os selecionados, eestes escolhidos vão gerar uma nova população após a aplicação de todos os operadoresgenéticos.

Essa seleção em busca dos mais aptos pode ser feita por amostras diretas, aleató-rias simples ou estocástica.

Já para (CONCILIO, 2000) a seleção de indivíduo baseia-se no princípio da so-brevivência dos melhores indivíduos, onde os cromossomos com mais alta probabilidadede sobrevivência são copiados de forma semirandônica uma ou mais vezes para um novoconjunto que formará a próxima geração da população. Os indivíduos que foram definidospor baixa aptidão na fase anterior são descartados.

A idéia central do operador de seleção nos AG’s é oferecer aos melhores indiví-duos da população corrente, preferência para o processo de reprodução permitindo queestes indivíduos possam passar as suas características para a próxima geração.

Esse método de seleção pode ser aplicado através de duas técnicas: roleta e tor-neio.

Roleta: a técnica da roleta consiste em selecionar um indivíduo com uma probabilidadeFigura 4.1, baseada na proporção de sua adequabilidade em relação ao total dasoma das adequabilidades dos indivíduos (LARSEN, 2002). O indivíduo com maischance de ser selecionado é aquele que tiver maior grau de adequabilidade;

Torneio: a seleção por torneio, onde um grupo de “n” indivíduos são obtidos aleato-riamente da população, com reposição ou sem reposição, isto é, podendo ou nãoretornar a população para outro torneio. Esses indivíduos participam do torneio,onde o indivíduo com melhor adequabilidade é escolhido para a reprodução, e oprocesso se repete até uma nova população ser gerada.

4.4.2 CruzamentoSegundo (LARSEN, 2002), o cruzamento consiste em misturar materiais genéti-

cos de dois indivíduos conhecidos como pais, obtidos na fase de seleção, produzindo doisnovos indivíduos, conhecidos como filhos que herdam as características genéticas de seusprogenitores. Durante esta troca de material genético, há uma tendência de transmissãode características dominantes para as futuras gerações.

A fase de cruzamento é a característica principal que faz a distinção de algoritmosgenéticos em relação a outras técnicas e sua idéia central é a propagação das caracterís-ticas dos indivíduos mais aptos da população trocando segmentos de informações logoapós a seleção esperando uma convergência para a situação de otimização desejada.

O processo de cruzamento faz rupturas no código genético, e quanto maior estaruptura menor será a semelhança entre pais e filhos, dificultando a convergência.

A taxa de cruzamento define-se como a medida da possibilidade de aplicação dosoperadores de cruzamento a um dado par de indivíduos. Quanto maior for a taxa de

Page 55: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

55

cruzamento, maior é a quantidade de indivíduos introduzidos na nova população de cru-zamento (BARCELLOS, 2000).

Este operador pode ser implementado de três maneiras: cruzamento de um ponto,cruzamento de 2 ou mais pontos e cruzamento uniforme.

Cruzamento de um ponto: é o operador mais comumente utilizado, pois o ponto dequebra na cadeia de bits do cromossomo é escolhido de forma aleatória. São esco-lhidos dois pais e a partir destes serão gerados dois filhos. Após o corte aleatórioé realizado a troca de material cromossômica que gerará os novos indivíduos, nocaso os filhos.

Cruzamento de dois ou mais pontos: é bastante similar ao cruzamento de um ponto,porém o corte será feito em duas ou mais partes da cadeia de bits dos cromossomospais. Os dois pontos de cortes são escolhidos aleatoriamente e o material genéticoserá invertido entre eles na posição de ruptura. O cruzamento de dois ou maispontos mantém juntos os genes que são codificados próximos uns dos outros.

Cruzamento uniforme: é bastante diferente do cruzamento de um ou mais pontos, poisos genes dos filhos serão criados a partir de uma cópia do gene correspondente deum dos pais, escolhidos por uma função que será gerada aleatoriamente. Se houverna máscara de cruzamento valor 1, o gene copiado será do primeiro pai, se houvervalor 0 será do segundo pai.

4.4.3 MutaçãoA mutação pode ser tratada como o operador responsável pela introdução e ma-

nutenção da diversidade genética da população, alterando um ou mais componentes deuma estrutura escolhida fornecendo meios para introdução de novos elementos da popu-lação (MOREIRA, 2004).

Além disso, esse operador é capaz de trazer de volta para a população os genesperdidos, durante o processo de seleção de modo que possam ser avaliados em um novocontexto pelo algoritmo.

Ele trabalha alterando um ou mais componentes de uma estrutura escolhida, as-segurando que a probabilidade de se chegar a qualquer ponto do estado de busca nuncaseja zero, além de contornar os mínimo globais previnindo que uma dada posição fiqueestagnada em um valor.

O operador de mutação funciona invertendo os valores de bits de 1 para 0 e 0 para1.

Uma baixa taxa de mutação vai determinar a probabilidade em que uma mutaçãoocorrerá, além de possibilitar que se chegue em qualquer ponto de espaço de busca. Amutação pode ser feita de forma aleatória, onde o valor do gene mutado é substituído porum valor aleatório ou por incremento.

4.5 Substituição da PopulaçãoA substituição consiste na alteração da antiga população pela nova população ge-

rada com os cromossomos escolhidos e modificados na fase dos operadores genéticos,formando uma nova população (MOREIRA, 2004).

Page 56: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

56

Os critérios com que selecionam os pais não necessariamente tem que ser osmesmo usados para selecionar os filhos. Para atender o critério de substituição existemquatro modelos:

Substituição imediata: onde os descentes substituem seus progenitores.

Substituição por fator cheio: onde os descentes substituem aqueles da população quesão mais parecidos com ele.

Substituição por inserção: os membros da população de criadores são selecionadospara serem eliminados sendo substituídos pelos seus decentes.

Substituição por inclusão: onde os descendentes são somados aos progenitores gerandouma única população, de onde serão selecionados apenas os melhores.

4.6 Critério de ParadaO critério de parada de um algoritmo genético é verificado através de um teste, e

se a condição de parada for satisfatória é parada a execução do algoritmo, caso não atinjao critério de parada estabelecido, a população retorna às fases do algoritmo para que seache a melhor solução.

O critério de parada pode ser quando o AG atingir um dado número de geraçõesou quando a função objetivo chegar a um determinado valor definido previamente. Outrocritério poderá ser a convergência, ou seja, quando não ocorrer melhoramento significa-tivo no cromossomo de maior aptidão por um dado número de gerações, o processamentopára (MOREIRA, 2004).

Page 57: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

57

5 LÓGICA FUZZY

5.1 IntroduçãoA capacidade de deduzir conclusões baseadas em respostas incertas e imprecisas,

caracteriza uma das principais aplicações da lógica fuzzy. Esse conceito, que pode causarestranheza ainda em nosso tempo, influenciou um pensamento diverso em outras épocas.

De forma mais instrutiva, podemos dizer que a lógica fuzzy é uma ferramentacapaz de capturar informações vagas, em geral descritas em uma linguagem natural econvertê-las para um formato numérico. Considere-se, por exemplo, a seguinte afirmativa:Se o nível de cálcio no sangue está médio e o nível de paratormônio sérico está muitoalto, então o risco de hiperparatiroidismo primário é alto.

Os termos, “médio”, “muito alto” e “alto” trazem consigo informações imprecisase a extração destas informações pode-se dar através do uso de conjuntos fuzzy (ZADEH,1968).

A lógica fuzzy tem como apoio a teoria dos conjuntos fuzzy para sua representação,tendo a intenção de fornecer “um tratamento matemático a certos termos lingüísticos sub-jetivos, como aproximadamente, em torno de, dentre outros” (BARROS; BASSANEZI,2006).

Formalmente, essa lógica trabalha de forma mais acessível, aproximando uma fun-ção por associações lingüísticas de entrada e saída dos dados e aplicando regras da teoriados conjuntos fuzzy para resolver problemas onde uma teoria mais rígida teria dificuldadepara modelar.

Devido a esta propriedade e a possibilidade de instruir inferências, a lógica fuzzytem encontrado grandes aplicações nas seguintes áreas: Computação com Palavras, Ra-ciocínio Aproximado, Controle de Processos, Robótica, Rede Neurais, Processamentode Imagens, Reconhecimento de Padrões, Sistemas Operacionais, Ecologia, Sistemasde Controle e Processos de Tomada de Decisão, Medicina e Epidemiologia (KLIR;FOLGER, 1988) e (COX, 1998).

5.2 Conjuntos FuzzyEm se tratando de “conjunto” no sentido clássico, segundo (BARROS, 1997), a

relação dicotômica de pertinência de um elemento e um conjunto deve estar bastante claracomo um conceito primitivo. Mais precisamente, dado um conjunto A e um elemento xtemos que x pertence a A (x ∈ A) ou x não pertence a A (x < A).

Por exemplo, sabe-se que 2 ∈ N (2 é um número inteiro positivo); 12 < N ( 1

2 não

Page 58: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

58

é um número inteiro positivo).A noção de conjunto fuzzy, dada por (ZADEH, 1965), generaliza a idéia de con-

junto quando o conceito de pertinência de um elemento a um conjunto deixa de ser umconceito primitivo como no caso clássico. Por exemplo, seja F o “conjunto” dos númerosinteiros positivos “pequenos”, isto é,

F = {x ∈ N : x é pequeno }

Exemplo 5.1 os números 2 e 20 pertencem a F? Intuitivamente pode-se dizer que se20 ∈ F então 2 ∈ F, isto é, 2 teria um grau de pertinência maior que 20 em relaçãoao conjunto F.

A atribuição de um grau de pertinência de cada elemento a um conjunto passaentão a ser uma caracterização do próprio conjunto. Se ao considerar-se a funçãou : N → [0, 1], dada por u(n) = 1

n definindo o grau de pertinência a F, tem-se que2 ∈ F com grau de pertinência 0,5 e 20 ∈ F com grau de pertinência 1

20 = 0, 05 oun ∈ F com grau de pertinência 1

n .

Observa-se que o atributo pequeno para x ∈ N é subjetivo no sentido que se poderiater uma infinidade de funções u : N → [0, 1] definindo o grau de pertinência decada elemento de F.

Pode-se ainda imaginar uma infinidade de conceitos que possuem a característicade não estarem bem definidos em suas fronteiras. Por exemplo, o “conjunto” dos homensaltos, das ruas grandes de uma cidade, o diagnóstico médico de um paciente, classifica-ção de bactérias quanto a sua natureza vegetal ou animal, o “conjunto” dos problemas deuma determinada localidade, etc. (BARROS, 1997).

A Tabela 5.1 mostra os graus de pertinência de alguns números inteiros conside-rados “pequenos”, de acordo com a função mostrada no exemplo 5.1.

O gráfico mostrado na Figura 5.1 representa a função de pertinência do exemplo5.1 que aborda os números inteiros considerados “pequenos” de acordo com a funçãoapresentada anteriormente. Os valores apresentados no gráfico estão de acordo com aTabela 5.1.

Figura 5.1: Gráfico da função de pertinência dos números inteiros “pequenos” (SANTOS,2007).

Page 59: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

59

Tabela 5.1: Grau de pertinência dos números inteiros considerados “pequenos” (SAN-TOS, 2007).

n ∈ N Grau de Pertinência1 12 0,53 0,334 0,255 0,26 0,167 0,148 0,1259 0,11110 0,115 0,0620 0,05

Definição 5.1 Seja X um conjunto (clássico). Um subconjunto fuzzy F em X é um con-junto de pares ordenados F = {(x, uF(x)) : x ∈ X} onde uF : X → [0, 1] é umafunção chamada grau de pertinência de x em F, com os graus 1 e 0 representando,respectivamente, a pertinência completa e a não pertinência do elemento ao con-junto fuzzy.

Dessa maneira, um conjunto fuzzy estende um conjunto clássico convencional,na medida em que possa assumir outros valores além de completamente verdadeiro oucompletamente falso.

A idéia principal dos conjuntos fuzzy é o grau de pertinência (valor que indica ograu com que um elemento pertence ao conjunto). Os conjuntos são denominados deforma qualitativa e os elementos destes conjuntos são caracterizados variando o grau deatribuição.

Exemplo 5.2 Um indivíduo de 100 quilos e outro de 90 são membros do conjunto fuzzy“Pesado”. Porém o indivíduo de 100 quilos tem um grau de pertinência maior nesteconjunto Figura 5.2.

A pergunta que se pode fazer é: Em que grau um indivíduo com 90 kg é “Pesado”?Um indivíduo com 90 kg está no conjunto “Pesado” com grau de pertinência de0,85. Esta expressão pode ser interpretada como grau de verdade.

O gráfico mostrado na Figura 5.2 representa a função de pertinência hipotética doexemplo 5.2 que aborda o conjunto fuzzy para categoria de peso corporal.

5.2.1 Operações Básicas entre Conjuntos FuzzySe ao assumir que A e B são dois subconjuntos fuzzy do conjunto universo U, as

operações sobre os conjuntos fuzzy união, intersecção e complemento resultam tambémem conjuntos fuzzy. Seguindo estas operações padrão para os conjuntos fuzzy, definidaspor Zadeh, obtêm-se as seguintes funções de pertinência:

Page 60: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

60

Figura 5.2: Exemplo hipotético de conjunto fuzzy para categoria de peso corpo-ral (SOUSA, 2007).

(a) (b) (c)

Figura 5.3: Images: (a) União entre subconjuntos fuzzy ; (b) Intersecção entre subcon-juntos fuzzy (c) Complementar de um conjunto fuzzy.

Funções de PertinênciaµA∪B(X) = max[µA, µB], X ∈ U (5.1)

µA∩B(X) = min[µA, µB], X ∈ U (5.2)

µA′(X) = 1 − µA(X), X ∈ U (5.3)

Então pode-se agora observar os gráfico das funções:

• a função de pertinência 5.1 tem seu gráfico representada pela Figura 5.3 (a) quedefine a união entre conjuntos fuzzy A e B

• a função de pertinência 5.2 tem seu gráfico representada pela Figura 5.3 (b) quedefine a intersecção entre conjuntos fuzzy A e B

• a função de pertinência 5.3 tem seu gráfico representada pela Figura 5.3 (c) quedefine a complementar do conjunto fuzzy A e A′

Estas são operações padrão de um conjunto de operadores possíveis (SOUSA,2007). Se A e B forem conjuntos clássicos, então as funções de pertinência descritasacima satisfazem estas igualdades, mostrando a coerência destas definições.

Page 61: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

61

5.3 Funções de PertinênciaA representação de um conjunto fuzzy pode ser representada por tipos de curvas

diferentes segundo (SANTOS, 2007), o especialista é o responsável por traçar a curvamais aproximada do comportamento da variável em questão. Em (SILVEIRA, 2002) sãoapresentados os principais tipos de curvas para representação de um conjunto fuzzy, umbreve resumo sobre estas representações são apresentados a seguir.

Representação Linear: este tipo de representação é bastante simples e uma boa alterna-tiva para aproximar conceitos de difícil compreensão.

Representação em Curva-S (Sigmóide/Logística): esta forma de representação refere-se aos tipos de curvas não lineares crescentes (Curva-S) e decrescentes (Curva-Z).Esta representação de um conjunto fuzzy é a mais adequada para a modelagemdo conhecimento, segundo (SILVEIRA, 2002) é imprecisamente condicional, emoutras palavras é o tipo do conhecimento utilizado para representar o pensamentohumano.

Representações em Curvas Tipo Sino: este tipo de reprodução é baseado na represen-tação da estimativa (avaliação) de um valor central e são graficamente visualizadascomo uma curva do tipo sino. Três importantes categorias desse tipo de curvas me-recem destaque: as curvas PI, Beta e Gaussiana. Duas importantes variações dasrepresentações em curvas tipo sino são a Representação Trapezoidal e a Represen-tação Triangular.

5.4 Sistemas FuzzyNa arquitetura padrão de um Sistema Fuzzy apresentada na Figura 5.4 é possível

observar os componentes que fazem parte deste sistema. A seguir é apresentado umabreve descrição sobre cada um dos componentes da arquitetura padrão de um sistemafuzzy, segundo (SANTOS, 2007).

Fuzzificador: nesta etapa estão contidas as funções de pertinência das variáveis lingüís-ticas de entrada. É recebido um valor do universo de discurso e retornado os grausde pertinência aos respectivos conjuntos fuzzy.

O tipo e a quantidade de funções de pertinência utilizados em um sistema dependemde alguns fatores tais como: precisão, estabilidade, facilidade de desenvolvimento,etc. Para colaborar com a construção das funções de pertinências para a descriçãode uma determinada entrada é importante a atuação de um especialista na área doque poderá ser modelado.

Máquina de inferência: neste componente do sistema as proposições (regras) são defi-nidas e depois são examinadas paralelamente, é na máquina de inferência que sãorealizadas as operações com conjuntos fuzzy propriamente ditas.

Para realizar estas operações existem métodos de inferência fuzzy, os dois mais im-portantes tipos de métodos de inferência fuzzy são o Método de Mandani (MAM-DANI; ASSILIAN, 1975) e o Método Takagi-Sugeno-Kang (ISHII; SUGENO,1985).

Page 62: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

62

Gerente de Informações: obtêm da base de regras as regras aplicáveis para entradas es-pecíficas.

Base de Regras: a base de regras fuzzy é composta por um conjunto de condições IF(usando conectivos and, or ou not), uma conclusão THEN, uma conclusão opcionalELSE (regras condicionais básicas).

Estas regras são aplicadas nas variáveis por intermédio de um processo denomi-nado propagação. As regras podem ser fornecidas por especialistas, em forma desentenças lingüísticas, e se constituem em um aspecto fundamental no desempenhode um sistema de inferência fuzzy.

Defuzzificador: processo utilizado para converter o conjunto fuzzy de saída em um valorde saída do sistema. No processo de defuzzificação estão contidas as funções depertinências das variáveis lingüísticas de saída.

No defuzzificador é que acontece a etapa de relação funcional entre as regiões Fuzzye o valor esperado. Existem vários métodos de defuzzificação, dentre os mais co-nhecidos destacam-se: (i) Centróide, (ii) Média dos máximos, (iii) Critério Má-ximo, (iv) Método da altura, (v) Barras verticais, etc.

Figura 5.4: Arquitetura de um sistema fuzzy (SANTOS, 2007).

Quanto aos métodos de inferência destacados, cada método tem suas vantagens. Ométodo de Mamdani é considerado mais simples e intuitivo, sendo facilmente compreen-dido por um especialista humano. O método de TSK é mais eficiente que o de Mamdaniquanto à rapidez computacional e possui mais propriedades matemáticas. Os modeloslingüísticos fuzzy avançaram bastante e tem sido usados em larga escala em problemas deBiomedicina, Biomatemática e epidemiologia segundo (SOUSA, 2007).

Page 63: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

63

6 CONCLUSÃO

Sabe-se que o objetivo dos sistemas de CAD é melhorar a acurácia diagnóstica,assim como aprimorar a consistência na interpretação de imagens diagnósticas, medianteo uso da sugestão de resposta diagnóstica fornecida por algum computador.

Porém, algumas ferramentas CAD que apresentam ótimos resultados ainda nãosão utilizadas na rotina clínica por apresentarem alto custo computacional, limitando seuuso a centros possuidores de computadores de alta capacidade.

As dificuldades em aplicar estes algoritmos CAD na rotina clínica e as limitaçõesainda existentes para o armazenamento, processamento, busca e recuperação de imagensem grandes bases de dados vem motivando empresas e instituições de pesquisas a encon-trarem novas soluções para essas tarefas.

AG’s são métodos que simulam, através de algoritmos, os processos de evoluçãonatural e genética buscando resolver problemas de otimização onde o espaço de busca émuito grande e os métodos convencionais não se demonstram eficientes.

Acredita-se que um ambiente computacional integrador de técnicas tradicionais desegmentação e classificação de imagens médicas com operadores baseados em algoritmosgenéticos possam permitir ferramentas mais versáteis e com precisão apropriada ao tipode aplicação pretendida.

Modelos baseados em algoritmos evolutivos têm se mostrado adequados ao avançoda computação de alto desempenho, uma vez que são modelos que usufruem de todas asprerrogativas de escalabilidade e disponibilidade de sistemas como agregados e gradescomputacionais, ou mesmo computadores de vários-núcleos (multicores), muito em voganas pesquisas atuais.

Espera-se que este trabalho sirva de ponto de partida para um trabalho mais apro-fundado de proposta da integração de algoritmos genéticos e lógica fuzzy para a segmen-tação de imagens médicas.

Page 64: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

64

REFERÊNCIAS

AGUIAR, M. Análise Formal da Complexidade de Algoritmos Genéticos. 2002. Mo-nografia de Pós-Graduação — ESIN/UCPEL, Pelotas/RS.

ANGELO, M. F. Sistema de Processamento de Imagens Mamográficas e Auxílio aoDiagnóstico via-Internet. 2007. Tese de Doutorado — Escola de Engenharia de SãoCarlos da Universidade de São Paulo.

ANTUNES, E. J. PROCESSAMENTO DE IMAGENS: Uma abordagem interdiscipli-nar aplicada a correção de prognósticos meteorológicos. UFPel/Pelotas-RS.

ARCURI, S. M.; MCGUIRE, P. K. Ressonância magnética funcional e sua contribui-ção para o estudo da cognição em esquizofrenia. In: REV. BRAS. PSIQUIATR., 2001.Anais. . . [S.l.: s.n.], 2001.

BARCELLOS, J. C. H. Algoritmos Genéticos Adaptativos: Um estudo Comparativo.2000. Dissertação de mestrado apresentada à escola politécnica da universidade de SãoPaulo, setor de Engenharia — USP/SP.

BARROS, L.; BASSANEZI, R. Tópicos de lógica fuzzy e biomatemática. Campi-nas,SP: UNICAMP/IMECC.

BARROS, L. C. Sobre Sistemas Dinâmicos Fuzzy: Teoria e Aplicações. 1997. TESEDE DOUTORADO — Campinas, SP.

BEGA, G.; LEV-TOAFF, A.; KUHLMAN, K.; KURTZ, A.; GOLDBERG, B.; WAPNER,R. Three-dimensional ultrasonographic imaging in obstetrics. In: ULTRASOUND MED.,2002. Anais. . . Canadá, 2002. v.20, p.391–408.

BRONSON, J. G. Ultrasound in Women’s Health The View in 2002.http://www.medicalimagingmag.com.

CHAN, H.-P.; DOI, K.; GALHOTRA, S.; VYBORNY C.J.AND MACMAHON, H.;JOKICH, P. Image feature analysis and computer-aided diagnosis in digital radio-graphy. I. Automated detection of microcalcifications in mammography. [S.l.]: Me-dical Physics, v. 14, n. 4, p.538-548, 1987.

CONCILIO, R. Contribuições à Solução de Problemas de Escalonamento pela Apli-cação Conjunta de Computação Evolutiva e Otimização com Restrições. 2000. Dis-sertação de mestrado apresentado a faculdade de Engenharia Elétrica e de Computação,departamento de Engenharia de Computação e Automação Industrial — Unicamp/SP.

Page 65: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

65

COX, E. The Fuzzy Systems Handbook. AP Professional.

FEBIGER, L. . (Ed.). Christensen’s Physics of Diagnostic Radiology. [S.l.]: Phila-delphia, 1990.

DAINTY, J.; SHAW, R. Image Science. In: NEW YORK, ACADEMIC PRESS., 1976.Anais. . . [S.l.: s.n.], 1976.

DHAWAN, A.; ROYER, E. L. Mammographic feature enhancement by computerizedimage processing. [S.l.]: Computer Methods and Programs in Biomedicine, v.27, p.23-35., 1988.

EGAN, R.; MCSWEENEY, M. B.; SEWELL, C. Intramammary calcifications withoutan associated mass in benign and malignant diseases. v.137, n.1, p.1.7., Radiology.

FACON, J. Processamento e Análise de Imagens. In: UNCPC, 1993. Anais. . . Córdoba,1993.

FREITAS, C. M. D. Computação Gráfica. In: VI ESCOLA DE INFORMáTICA DA SBC- REGIONAL SUL, 1998. Anais. . . Pelotas, 1998. v.1, p.1–6.

GILLESPIE, T.; ROWBERG, A. N. Displaying radiologic images on personal compu-ter: image storage and compression. [S.l.]: Digital Imaging, 1994.

GONZALEZ, R.; WOODS, R. Processamento de Imagens Digitais. [S.l.: s.n.], 2000.

BOOK, B. (Ed.). Adaptation in Natural and Artificial Systems: An Introduc-tory Analysis with Applications to Biology, Control, and Artificial Intelligence. 1.ed.[S.l.: s.n.], 1992.

ISHIDA M.AND FRANK, P.; DOI, K.; LEHR, J. High quality digital radiographicimages: improved detection of low-contrast objects and preliminary clinical studies.[S.l.]: Radiographics, v.3, n.2, p.325-338, 1983.

ISHII, K.; SUGENO, M. A Model of Human Evaluation Process Using Fuzzy Measure.Man-Machine Studies, [S.l.], v.1, n.22, p.19–38, 1985.

JACKSON, V. P.; JACHSON, V. P.; HENDRICK, E.; FEIG, S. A.; KOPANS, D. Imagingof the radiographically dense breast. v.188, p.297-301., Radiology.

JAIN, A. K. Fundamentals of Digital Image Processing. In: ENGLEWOOD CLIFF, 1969.Anais. . . [S.l.: s.n.], 1969.

KLIR, G.; FOLGER, T. Fuzzy sets: uncertainty, and Information. In: ENGLEWOODCLIFF., 1988. Anais. . . [S.l.: s.n.], 1988.

LARSEN, O. Construção de Atributos x-of-n usando Algoritmos Genéticos. 2002.Dissertação de Pós-Graduação apresentado a Universidade Católica do Paraná, setor deInformática Aplicada — Universidade Católica do Paraná/PR.

LUITEN, A. L. Introduction to nuclear magnetic resonance. In: MEDICAMUNDI, 1981.Anais. . . [S.l.: s.n.], 1981.

Page 66: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

66

MAINTZ, J. B. A.; VIERGEVER, M. A. A survey of medical image registration.[S.l.: s.n.], 1998.

MAMDANI, E. H.; ASSILIAN, S. An Experiment in Linguistic Synthesis with a FuzzyLogic controller. Man-Machine Studies, [S.l.], v.1, n.7, p.1–13, 1975.

MARQUES FILHO, O.; VIEIRA NETO, H. Processamento Digital de Imagens. Rio deJaneiro: Brasport.

EBAL (Ed.). Processamento Digital de lmagens. 2.ed. [S.l.: s.n.], 1989.

MOREIRA, M. I. G. Um Sistema Classificador para Imagens de Sensoriamento Re-moto baseado em Algoritmos Genéticos. UCPel/Pelotas-RS.

NUNES, F. L. S. Introdução ao Processamento de Imagens Médicas para Auxílio aoDiagnóstico - Uma Visão Prática. [S.l.: s.n.], 2005. p.73–123.

PATHOL, A. J. C. Basic Principles of Image Processing.

SANTOS, A. V. Avaliação Fuzzy de Trocas Sociais em Sistemas Muliagentes basea-dos em Personalidades. Trabalho Individual - PPGINF-UCPel, 2007.

SANTOS, J. Avaliação textural por ressonância magnética dos tumores da fossa pos-terior em crianças. 2003. Dissertação (Mestrado em Ciência da Computação) — SãoPaulo: Scielo, 2003.

EDITORA, S. S. (Ed.). Bases Físicas da Radiologia - Diagnóstico e terapia. [S.l.]: SãoPaulo, 1979.

SCHARCANSK.J. Processamento e Análise Digital de Imagens. 4a Semana Acadê-mica do Curso de Bacharelado em Informática da Universidade Federal de Pelotas.Pelotas-RS.

PHYSICS, M. (Ed.). Formal study of lateral magnification and its effect on mammo-graphic image sharpness. [S.l.]: v. 21, n. 2, p. 271-276., 1994.

SILVA, E. E. Otimizaçãoo de Estruturas de Concreto armado Utilizando AlgoritmosGenéticos. 2001. Dissertação de mestrado apresentada à escola politécnica da universi-dade de São Paulo, setor de Engenharia — USP/SP.

SILVEIRA, M. M. M. T. Teoria Fuzzy Intervalar: Uma Proposta de Integração da Ma-temática Intervalar à Teoria Fuzzy. 2002. Dissertação (Mestrado em Ciência da Compu-tação) — Universidade Federal do Rio Grande do Norte, Natal, RN, Brasil.

SOUSA, C. A. Teoria de conjuntos fuzzy e regressão logística na tomada de deci-são para realização de cintilografia das paratiróides. 2007. Dissertação Mestrado emSaúde Pública — USP.

STANDARDS, N.; PUBLICATIONS guideline. Digital Imaging and Communicationsin Medicine (DICOM). [S.l.: s.n.], 2006.

Page 67: Um estudo sobre algoritmos genéticos, lógica fuzzy e técnicas para

67

TAVARES, J. A. D. R. Geração de Configuração de Sistemas Industriais com o Re-curso a Tecnologia das Restrições e Computação Evolucionária. 2000. Tese de Dou-torado apresentado à universidade do Minho, Setor de Informática — Minho/Portugal.

LIVINGSTONE, C. (Ed.). Principles of Radiological Physics. [S.l.]: New York, 1987.

ZADEH, L. A. Fuzzy sets. Information and Control. [S.l.], v.8, p.338-353.

ZADEH, L. A. Probability mensures and fuzzy events. J Math Appl. 1968; 23:427.