34
1 FACULDADE DE ENGENHARIA DA UNIVERSIDADE DO PORTO Departamento de Engenharia Informática Roberta Barbosa Oliveira Uma Abordagem em Data Mining para Classificação de Lesões de Pele por meio de Imagens Orientador: João Manuel R. S. Tavares (FEUP) Co-orientador: Aledir Silveira Pereira (UNESP) Porto 2013

FACULDADE DE ENGENHARIA DA UNIVERSIDADE DO PORTOtavares/downloads/publications/relatorios/PI... · introduzida nessa regra, que é um dos métodos utilizados pelos dermatologistas

  • Upload
    doannhi

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

1

FACULDADE DE ENGENHARIA DA

UNIVERSIDADE DO PORTO

Departamento de Engenharia Informática

Roberta Barbosa Oliveira

Uma Abordagem em Data Mining para Classificação de

Lesões de Pele por meio de Imagens

Orientador: João Manuel R. S. Tavares (FEUP)

Co-orientador: Aledir Silveira Pereira (UNESP)

Porto

2013

2

SUMÁRIO

RESUMO . . . . . . . . . . 3

1 INTRODUÇÃO . . . . . . . . . 4

1.1 Motivação . . . . . . . . . 4

1.2 Problema na análise de lesões de pele . . . . . . 4

1.3 Hipótese de pesquisa . . . . . . . . 5

1.4 Objetivos e resultados esperados . . . . . . . 5

1.5 Estrutura do trabalho . . . . . . . . 6

2 REVISÃO DO ESTADO DA ARTE . . . . . . 7

2.1 Pré-processamento . . . . . . . . 7

2.2 Segmentação . . . . . . . . . 8

2.3 Redução de dimensionalidade . . . . . . . 12

2.3.1 Extração de características . . . . . . . 12

2.3.2 Seleção de características . . . . . . . 16

3 METODOLOGIA PROPOSTA . . . . . . . 20

3.1 Definição da base de imagens . . . . . . . 20

3.2 Suavização das imagens . . . . . . . . 21

3.3 Definição da lesão . . . . . . . . 21

3.4 Redução de dimensionalidade . . . . . . . 22

3.5 Reconhecimento da lesão . . . . . . . . 23

4 DESENVOLVIMENTO DO TRABALHO . . . . . 24

4.1 Plano de trabalho . . . . . . . . 24

4.2 Conferências e Revistas . . . . . . . 26

4.3 Pesquisadores . . . . . . . . . 26

CONSIDERAÇÕES FINAIS . . . . . . . 28

REFERÊNCIAS BIBLIOGRÁFICAS . . . . . . 29

3

RESUMO

O aumento de incidência de casos de cancro de pele vem despertando o interesse na

pesquisa de metodologias que possam auxiliar no diagnóstico de lesões de pele. O presente

trabalho almeja apresentar uma revisão das técnicas utilizadas na literatura, que são aplicadas

nas etapas de análise de imagens de lesões de pele. Para cada etapa são apresentadas as

técnicas e suas principais características, vantagens e desvantagens conforme a sua aplicação

nos trabalhos publicados. Essas etapas envolvem o pré-processamento, segmentação, extração

e seleção de características e o classificadores. Em seguida é proposta uma abordagem Data

Mining para classificação de lesões de pele. Essa abordagem se baseia na definição da base de

imagens, suavização, definição da lesão, redução de dimensionalidade e finalmente o

reconhecimento da lesão.

Palavras-chave: imagens de lesões de pele, suavização, segmentação, extração de

características, seleção de características, classificação.

4

1 INTRODUÇÃO

Nessa seção serão apresentadas as motivações da realização deste trabalho, bem

como os problemas decorrentes nos sistemas de análises de imagens de lesões de pele. A

hipótese de pesquisa também é apresentada e os objetivos e resultado esperados no

desenvolvimento da abordagem proposta.

1.1 Motivação

Atualmente há um grande interesse no desenvolvimento de sistemas computacionais

para análise de lesões de pele, que permitem auxiliar o dermatologista, na prevenção contra o

desenvolvimento de lesões malignas. O interesse decorre devido ao constante aumento nos

casos de cancro de pele. Esses sistemas possibilitam monitorar as lesões benignas, para evitar

o seu desenvolvimento, ou também diagnosticar as lesões malignas em seu estágio inicial,

para serem tratadas precocemente, período onde tem mais chances de cura. Os pacientes com

esse tipo de cancro que obtiverem diagnostico precocemente e receberem o tratamento

correto, a cura pode chegar a 69% na média mundial (BRASIL, 2009).

Para a construção desses sistemas é muito utilizado métodos de processamento de

imagens (GONZALEZ e WOODS, 2002) para definição da lesão e o processo Data Mining

(HAN e KAMBER, 2001), onde métodos inteligentes são aplicados em ordem para extrair

padrões de dados. Esses métodos são temas de diversos trabalhos para análise de lesões de

pele (ABBAS et al., 2010; ALCÓN et al., 2009; BARCELOS e PIRES, 2009; CARRARA et

al., 2005; CELEBI et al., 2007; CLAWSON et al., 2009; IYATOMI et al., 2010; JIANLI e

BAOQI, 2009; MAGLOGIANNIS e DOUKAS, 2009; RAHMAN et al., 2008;

SARRAFZADE et al., 2010; YUAN et al., 2006).

1.2 Problema na análise de lesões de pele

As imagens a serem processadas podem conter vários ruídos, tais como, reflexos,

sombras, pelos e linhas da pele que podem diminuir o desempenho da classificação das lesões

de pele. Por essa razão faz-se necessário realizar uma suavização nas imagens, para remoção

de ruídos que podem prejudicar a segmentação da imagens.

5

Outro problema é preservar a fronteira da lesão mesmo com a realização de

suavização, considerando que a fronteira é uma característica importante para a definição do

contorno da lesão. Essa definição do contorno deve ser eficiente para que se possa extrair

informações mais precisas da lesão. Neste caso é importante que técnica de segmentação

utilizada seja eficiente para o problema e assim obter bons resultados.

Devido a grande quantidade de características que podem ser extraídas das lesões de

pele, torna-se um problema definir quais características melhor as representam. Além disso a

grande quantidade de características pode tornar mais complexo o processo de classificação.

Muitas dessas características podem ser redundantes ou irrelevantes para o processo de

classificação. Uma solução para este problema seria a seleção de características para melhorar

o desempenho da classificação, visto que os classificadores dependem das características

extraídas das lesões de pele.

1.3 Hipótese de pesquisa

A definição das características podem influenciar no desempenho da classificação

das lesões de pele. Desta maneira a definição do conjunto de características que represente a

lesão é muito importante para obter melhor desempenho na classificação. As características

que são muito utilizadas na literatura para diferenciar uma lesão benigna de uma maligna é a

assimetria, borda, cor e estruturas diferenciais da regra ABCDE (Assimetria, Borda, Cor,

Estrutura diferenciais e Evolução). A Evolução (E) é uma característica mais recente

introduzida nessa regra, que é um dos métodos utilizados pelos dermatologistas para análise

de lesões de pele. Considerando esses fatores, uma hipótese de pesquisa seria extrair

características para representar a evolução da lesão, com o intuito de melhorar o desempenho

da classificação. Para extrair essa característica poderia ser utilizada técnicas de alinhamento

que permite analisar a evolução de uma lesão comparando duas imagens obtidas em períodos

diferentes.

1.4 Objetivos e resultados esperados

Os objetivos e resultados esperados com a abordagem proposta são:

6

Melhorar a revisão do estado da arte para análise de lesões de pele;

Desenvolver uma nova metodologia para extração de características de

Evolução (E) da regra ABCDE;

Definir o melhor conjunto de características para caracterização de lesões de

pele;

Propor, desenvolver e avaliar técnicas de suavização, segmentação,

descritores de características e classificadores para a classificação de lesões

de pele;

Analisar em qual tipo de base de imagens de lesões de pele a abordagem

melhor se aplica, considerando uma base de imagens fotográficas e outra de

imagens dermatoscópicas;

1.5 Estrutura do trabalho

Este trabalho está estruturado da seguinte maneira: Na segunda seção é abordado

uma revisão do estado da arte, considerando as técnica utilizadas na literatura para análise de

imagens de lesões de pele. São apresentadas as suas características, vantagens e desvantagens

em relação a suas aplicações. Na terceira seção é proposto uma metodologia para

classificação de lesões de pele. As etapas e abordagem propostas são apresentadas e

discutidas. Na quarta seção as atividades para o desenvolvimento da metodologia proposta,

tais como, plano de trabalho, conferências e revistas no âmbito do trabalho e pesquisadores da

área são apresentadas. Por fim, uma conclusão da revisão do estado da arte é feita.

7

2 REVISÃO DO ESTADO DA ARTE

Nessa seção serão abordados os principais métodos utilizados em análise de imagens

de lesões de pele. Desta forma, serão consideradas todas as etapas realizadas neste processo

de análise de imagens, que são: pré-processamento, segmentação, redução de

dimensionalidade e classificação de lesões de pele. Baseando-se nas etapas descritas será

apresentada uma revisão das principais características, vantagens e desvantagens de cada

método.

2.1 Pré-processamento

O pré-processamento das imagens é uma etapa importante no processo de análise de

imagens. As imagens das lesões de pele podem conter ruídos, tais como, pelos, reflexos,

sombra e linhas da pele, que podem diminuir a precisão no resultado de segmentação. Estes

ruídos podem ser amenizados ou até mesmo removidos com a aplicação de filtros de

suavização. A mediana (GONZALEZ e WOODS, 2002) e difusão anisotrópica (PERONA e

MALIK, 1990) são exemplos destes filtros.

O filtro mediana é um filtro não linear muito comum na literatura para aplicação em

imagens ruidosas, pois permite lidar satisfatoriamente com ruídos. Esse filtro possibilita

suavizar a imagem sem perder suas bordas e detalhes finos ao contrário dos filtros lineares,

como o filtro de média (GONZALEZ e WOODS, 2002). Por essa razão o filtro mediana é

frequentemente aplicado para suavização de imagens de lesões de pele (CELEBI et al., 2005;

CELEBI et al., 2008; CHIEM et al., 2007; LAU et al., 2009), devido a importância da eliminação

dos ruídos e preservação da borda da lesão para o processo de segmentação.

O filtro mediana é aplicado em cada pixel da imagem, substituindo o mesmo pela

mediana de sua determinada vizinhança. A vizinhança é estabelecida pelo tamanho da

máscara definida. Chiem et al. (2007) utilizou método de ensaio e erro para definir uma máscara com

dimensão 11x11 para a suavização das lesões de pele. Já Lau et al. (2009) definiu a máscara para

aplicação do filtro mediana conforme a teoria abordada por Celebi et al. (2008). A teoria considera que

o tamanho da máscara deve ser proporcional ao tamanho da imagem para obter uma suavização

eficiente. Então Celebi et al. (2008) propuseram um algoritmo onde a mudança do tamanho da

imagem reflete no tamanho da máscara proporcionalmente.

Barcelos e Pires (2009) e Pires e Barcelos (2007) optaram por utilizar o filtro de difusão

anisotrópica para suavização de lesões de pele. Em ambos os trabalhos foi utilizado o método

8

introduzido por Barcelos et al. (2003), que propuseram uma complementação no algoritmo

inicialmente apresentado por Perona e Malik (1990). O algoritmo além de permitir eliminar os

ruídos presentes na imagem, também realça a borda, que é uma característica importante para

a definição do contorno da lesão. Esse algoritmo tem por objetivo suavizar também as

imagens muito ruidosas sem eliminar a borda. O algoritmo também considera alterações

propostas por Alvarez, Lions e Morel (1992) e Nordström (1990).

A difusão anisotrópica, que também é um filtro não linear, é aplicado por meio de

iterações, no qual são definidas de acordo com a quantidade de ruídos presentes na imagem.

Desta forma, tem-se uma suavização seletiva da imagem, mas pode eliminar as bordas da

lesão quando aplicado em excesso.

A filtragem morfológica (FACON, 1996), que é baseada na teoria de conjuntos,

também pode ser utilizada nesta etapa para realçar a lesão e assim facilitar o processo de

segmentação. Desta forma, pode-se obter uma melhor definição da lesão, destacando sua

geometria sem alterar seu formato, como na abordagem apresentada por Beuren et al. (2012).

2.2 Segmentação

A segmentação é a etapa responsável pela extração da região de interesse (Region Of

Interest - ROI) na imagem. A aplicação do método de segmentação ocorre até que o objeto de

interesse, neste caso a lesão de pele, seja isolado do restante da imagem. Alguns fatores, como

os ruídos, influenciam no resultado de sua aplicação, a tornando uma tarefa muito complexa.

Por isso, as técnicas de pré-processamento podem ser utilizadas anteriormente, com objetivo

de melhor desempenho na etapa de segmentação.

Geralmente a segmentação é baseada nas propriedades de descontinuidade e

similaridade. A primeira propriedade é caracterizada pelas mudanças abruptas das

intensidades dos seus pixels, interligando-os quando estão próximos, como os detectores de

borda. Em geral, os detectores de borda, como Prewitt, Sobel, Roberts (GONZALEZ e

WOODS, 2002) e Canny (CANNY, 1986) podem apresentar problemas como: determinar

bordas em locais que não existe fronteira; não determinar bordas quando realmente existe

fronteira; ou detectar bordas duplas (SONKA et al., 1998).

Barcelos e Pires (2009) e Pires e Barcelos (2007) aplicaram o detector de borda

desenvolvido por Canny (CANNY, 1986), que tem por objetivos: 1) uma boa detecção, ou

seja, com probabilidade menor de erro; 2) permitir que os pontos da borda tenham uma boa

9

localização; e 3) determinar uma única borda para um mesmo ponto. Nos resultados

apresentados em Barcelos e Pires (2009) nota-se que a utilização do detector de borda Canny

adicionado ao filtro de suavização, difusão anisotrópica, eliminou bordas indesejáveis, mas

não permitiu detectar algumas regiões da borda da lesão. Isso ocorreu devido aos problemas

mencionados anteriormente referentes aos detectores de borda.

No caso da segunda propriedade, a segmentação ocorre conforme um critério de

similaridade como cor e textura. A propriedade de similaridade é utilizada por técnicas, tais

como, limiarização e crescimento de região.

Os algoritmos baseados em limiarização (thresholding) é utilizado em vários

trabalhos para segmentação de lesões de pele (Norton et al., 2010; Cudek et al., 2010; Beuren

et al., 2012; Yüksel e Borlu, 2009). Este algoritmo tem como resultado uma imagem binária,

onde a cor preta pode representar a lesão e a branca a pele. A sua aplicação envolve a escolha

de um limiar ou múltiplos limiares, para fazer a separação dos níveis de cinza da imagem, que

são representados em um histograma1.

Há várias técnicas utilizadas na definição do limiar para segmentação de lesões de

pele. Norton et al. (2010) e Cudek et al. (2010) aplicaram o método de Otsu (OTSU, 1979)

que se baseia no histograma normalizado para definir o valor do limiar ótimo que separa os

pixels de uma determinada imagem em duas classes homogenias com variância mínima entre

as classes. Em algumas imagens segmentadas pelo método apresentado por Cudek et al.

(2010) o limiar não foi definido satisfatoriamente. Nestes casos, os autores optaram por

definir o limiar manualmente, fazendo com que o método não seja totalmente automático.

Considerando que a técnica utilizada para definir o limiar pode desconsiderar regiões

irregulares da borda da lesão os autores também propuseram um teste SD (Small Difference)

para encontrar os pixels próximos à borda que podem ser considerados parte da mesma.

Ao observar que a borda definida pelo método de Otsu tende a ser menor do que o

tamanho correto da lesão na maioria das imagens e também pelo fato de apresentar uma borda

bastante irregular, Yüksel e Borlu (2009) apresentaram uma abordagem utilizando técnicas de

lógica fuzzy do tipo-2 (MENDEL, 2002) que determina um limiar automático para segmentar

imagens dermatoscópicas. Está técnica apresenta bom desempenho em lidar com valores

incertos para definir se um determinado nível de cinza pertence à lesão ou pertence à pele.

Beuren et al. (2012) optou por aplicar o método de entropia de Renyi (SAHOO,

1997) para definir o limiar, considerando que o processo de limiarização é mais eficiente pois

1 Representação gráfica da quantidade de pixel para cada nível de cinza da imagem.

10

evita alterar a geometria e forma da lesão. Este método utiliza duas distribuições de

probabilidade, uma para o objeto, neste caso a lesão, e a outra para o fundo, que seria a pele.

As duas distribuições são derivadas dos valores originais da imagem em níveis de cinza,

considerando o método de soma da entropia e o método de correlação entrópica.

Uma outra técnica utilizada para segmentação de lesões de pele é a segmentação por

crescimento de região (CELEBI et al., 2005). Esta técnica é um processo que agrupa pixels

vizinhos semelhantes ou sub-regiões em regiões maiores (homogenias) de acordo com um

critério de crescimento. Esse processo inicia com um conjunto de pontos, onde a cada ponto

que possui propriedades semelhantes em uma determinada região, tais como, nível de cinza,

textura ou cor são agrupados, causando o crescimento da mesma. Depois de obtida a região de

crescimento pode ser aplicado uma operação de fusão de região (merging) para obter a

imagem segmentada final. O merging permite que as regiões sejam fundidas, ou seja, é

definida a mesma intensidade para todos os pixels que possuem intensidades semelhantes de

acordo com o parâmetro de crescimento.

Celebi et al. (2008) utilizaram o algoritmo de fusão de região estatística (Statistical

Region Merging - SRM) (NOCK e NIELSEN, 2004) para a detecção de bordas em imagens

de lesões de pele. Esse algoritmo é uma técnica de segmentação de imagem colorida baseado

em agrupamento de região e merging. A imagem é tratada como uma instância teoricamente

desconhecida no qual as regiões estatísticas serão reconstruídas. Com a aplicação desse

algoritmo é dispensável a quantização da imagem ou transformação de espaço de cor. A

simplicidade, eficiência computacional e excelente desempenho são as principais vantagens

da utilização do SRM.

Uma abordagem de fusão de região estocástica iterativa foi proposta por Wong et al.

(2011) baseada no algoritmo de SRM (NOCK e NIELSEN, 2004). Cada pixel da imagem é

atribuído a uma única região, que posteriormente serão fundidas com outras regiões de uma

forma estocástica, baseando-se numa função de probabilidade de fusão de região para obter o

resultado final da segmentação. Este processo é caracterizado por passagem múltipla que

refina os resultados com o intuito de melhorar a segmentação. Além das vantagens do

algoritmo SRM, essa abordagem se mostra robusta na presença de ruídos e artefatos, quando

há várias regiões da lesão, variações estruturais, iluminação, variação de cor, identificação da

fronteira nos casos onde há pouca distinção entre a lesão e a pele.

Técnicas baseadas em aprendizagem também podem ser utilizadas na segmentação

de lesões de pele, como as Redes Neurais Artificiais (RNAs). As RNAs são sistemas paralelos

distribuídos que são compostos por unidades de processamento simples. O desempenho das

11

RNAs para a segmentação podem ser melhorado com a aplicação de Algoritmos Genético

(AG) para otimização dos pesos e limiar (JIANLI e BAOQI, 2009). O uso do AG para

otimização do limiar e dos pesos das RNAs aumenta a velocidade da segmentação e

estabelece uma borda contínua e bem definida. Nos casos em que a estrutura do tecido é

complexa e onde há baixo contraste entre a lesão e a pele os valores dos limiares usados não

são adequados para todos os tipos de imagens de lesões de pele.

Outras técnicas utilizada para segmentação de lesões de pele são os algoritmos

baseados em modelos de contorno ativo, que são os modelos deformáveis (ZHOU et al.,

2010; SILVEIRA et al., 2009). Snake tradicional (KASS et al., 1988), fluxo do vetor

gradiente (Gradient Vector Flow - GVF) (XU e PRINCE, 1997), level set (OSHER e

SETHIAN, 1998), modelo de contorno ativos sem bordas (Chan-Vese) (CHAN e VESE,

2001) são alguns exemplos destes algoritmos. Estes modelos utilizam funcionais para

minimização de energias internas e externas da imagem, fazendo com que uma curva

sobreposta a mesma se mova em direção a seus objetos. Por exemplo em Taouil et al. (2006)

o modelo snake é aplicado nas imagens resultantes do processo de morfologia para eliminação

de ruídos. Com essa combinação híbrida para segmentação de lesões de pele, obtiveram

melhores resultados do que a segmentação por meio do limiar Otsu. Zhou et al. (2010)

propuseram a combinando do modelo GVF com a estratégia mean shift. Dessa forma a

evolução do contorno não é somente dado pelo fluxo do vetor gradiente, mas também pela

energia acumulativa da região da imagem. Está combinação é versátil e flexível pois permite

que as energias local e global sejam alcançadas mesmo em imagens muito ruidosas. Já Abbas

et al. (2010) optou por aplicar o modelo de contorno ativo sem borda (Chan-Vese) devido as

suas vantagens em relação as outras técnicas de modelo de contorno ativo. O Chan-Vese, que

é baseado nas técnicas de segmentação Mumford-Shah (MUMFORD e SHAH, 1989) e o

método Level Set (OSHER e SETHIAN, 1998), possui várias vantagens em relação a

representação da curva: a posição da curva inicial pode ser definida em qualquer lugar da

imagem; Os contornos interiores são automaticamente detectados, sem a necessidade de

introduzir uma nova curva na imagem, ao contrário do Level Set; Detecção de diferentes

objetos com variadas intensidades e ainda com fronteiras borradas; Mudança topológica

automática da curva; Detecção de objetos onde o contorno não possui gradiente, devido ao

critério de parada da evolução da curva até a fronteira desejada não depender do gradiente da

imagem. Isso não é possível com a utilização do modelo tradicional; Tem-se um bom

resultado na detecção dos objetos em imagens com ruídos.

12

2.3 Redução de dimensionalidade

O conjunto de dados gerado para análise de imagens de lesões de pele pode conter

uma grande quantidade de atributos. O grande número de atributos podem tornar o processo

de classificação mais complexo. Além disso, muito dos atributos podem ser irrelevantes ou

até mesmo redundantes para o processo de classificação.

Desta forma a redução de dimensionalidade permite diminuir a quantidade de

elementos que representam as imagens, permitindo uma melhor classificação. Os principais

meios de redução de dimensionalidade são pela extração de características e seleção de

características.

2.3.1 Extração de características

As características extraídas para classificação de lesões de pele são obtidas de acordo

com os principais métodos de diagnósticos: regra ABCDE e análise de textura (CELEBI et

al., 2007; CHANG et al., 2005; MAGLOGIANNIS e DOUKAS, 2009; PIATEK e HIPPE,

2012); análise de padrão (MENDOZA et al., 2009); lista de sete pontos (LEO et al., 2009;

LEO et al., 2010). Esses métodos são aplicados pelos dermatologistas para análise das lesões

em imagens fotográficas e imagens dermatoscópicas2.

A. Regra ABCDE: são cinco sinais que contribuem para o diagnóstico clínico das

lesões de pele. Cada letra representa uma característica diferente da lesão (CUCÉ e FESTA

NETO, 2001; WOLFF et al., 2006):

1. Assimetria (A): Considera-se a maior distância entre os pontos do contorno

da lesão e traça-se uma reta sobre a mesma, para que possa ser analisada a

similaridade entre as duas partes divididas. Quando essas partes são

semelhantes, a característica de assimetria é considerada simétrica, que

geralmente representa as lesões benignas. No caso destas partes serem muito

diferentes, está característica é assimétrica, caracterizando lesões malignas.

Vários trabalhos na literatura utilizam as características de assimetria para

diferenciar uma lesão benigna de uma maligna (CELEBI et al., 2007;

2 É obtida por um instrumento dermatoscópio composto por uma lupa com iluminação, que aumenta a

proximidade a lesão em 10 a 30 vezes, permitindo uma inspeção não invasiva e mais profunda da pele.

13

CHANG et al., 2005; GARNAVI et al., 2012). Características como área,

maior e menor diâmetro e compacidade são extraídas.

2. Borda (B): A borda considerada regular representa lesões benignas e a borda

irregular geralmente definem as lesões malignas. Uma forma de medir a

irregularidade da borda é apresentada em Chang et al. (2005), onde utilizam o

comprimento do eixo menor e maior da borda da lesão, o diâmetro e a área da

lesão. Outra forma de representar a irregularidade da borda é com a aplicação

da transformada wavelet harmônica como apresentada em Clawson et al.

(2009).

3. Cor (C): As lesões benignas geralmente possuem apenas uma tonalidade e já

as malignas possuem várias tonalidades. Basicamente o modelo de cor

utilizado para extrair informações das cores das lesões de pele é o modelo

RGB (GARNAVI et al., 2012) no qual a imagem é representada por três

canais de cor Red, Green e Blue. Outros modelo também são utilizados com o

mesmo propósito, tais como, HSV (Hue, Saturation e Value) (CELEBI et al.,

2007), HVC (Hue, Value e Chroma) (RAHMAN et al., 2008) e CIE L*u*v*

(Comission Internationale de l'Éclairage) (CELEBI et al., 2007). Além das

intensidades dos pixels da lesão, informações estatísticas de cada canal

podem ser utilizadas para representar esta característica, tais como, mínimo,

máximo, média, desvio padrão e variância das intensidades da lesão. Por

exemplo Garnavi et al. (2012) utilizou além das informações estatísticas dos

canais RGB e luminância, também os raios obtidos em cada nó do algoritmo

wavelet com estrutura de árvore de quatro níveis. Celebi et al. (2007) extraiu

354 características com o intuito de serem selecionadas as que apresentarem

melhores desempenhos. Essas características foram: assimetria de cor,

distância centroide, distância de histograma LUV, média e desvio padrão

utilizando diferentes modelos de cores, tais como os citados anteriormente e

ainda o rgb normalizado, I1/2/3 (ohta espace) e l1/2/3.

4. Diâmetro ou estruturas diferenciais (D): O diâmetro das lesões benignas

são menores, até 6 mm e das malignas são iguais ou maiores que 6 mm. O

diâmetro é definido pela maior distância entre dois pontos da borda da lesão.

Essa característica, geralmente, não é utilizada devido a dificuldade em

representar a distância pela quantidade de pixels, considerando que as

imagens podem não ser capturadas de uma forma controlada. Desta forma, o

14

diâmetro depende muito da resolução da imagem (CELEBI et al., 2007). A

quantidade de estruturas que estão presentes na lesão também é possível

determinar, por exemplo, se há pontos pigmentados, glóbulos, partes da lesão

sem estrutura e estrias (MAGLOGIANNIS e DOUKAS, 2009).

5. Elevação ou evolução (E): Essa característica representa a elevação das

lesões, que na maioria das vezes está presente em sua superfície, sendo

deformada (irregular) nas lesões malignas e superfície lisa nas lesões

benignas. Há também o histórico de evolução, ou seja, ocorre alterações nas

características da lesão ao decorrer do tempo, inclusive na sua forma e

tamanho, ao contrário das lesões benignas, onde o crescimento permanece

estável. Devido essa característica ter sido adicionada recentemente na regra,

não foram encontrados trabalhos que utilizaram essa característica para

classificação de lesões de pele. Também é importante resaltar que a extração

tanto da elevação como da evolução é complexa devido a dificuldade no

processo de aquisição da imagem. Isso decorre porque é necessário capturar

imagens de forma que seja possível visualizar a altura da lesão ou que sejam

adquiridas imagens da mesma lesão em períodos diferentes, respectivamente.

Vejamos na Tabela 2.1 alguns exemplos de lesões de pele, que se diferenciam pelas

características ABCDE. Na linha 1 temos nevos, que são lesões benignas e na linha 2

melanomas, representando as lesões malignas. Na coluna Assimetria, temos na linha 1 um

nevo simétrico e na linha 2 uma melanoma assimétrico, devido suas partes serem diferentes.

Na coluna Borda, percebe-se que a lesão da linha 1, tem sua borda regular, já no caso da lesão

da linha 2, a borda está irregular. A regra C, demonstrada nas imagens da Coluna Cor, a lesão

da linha 1 tem cor uniforme, com apenas uma tonalidade, ao contrário do melanoma da linha

2 que possui mais de uma tonalidade. Na regra do Diâmetro, as lesões benignas são inferiores

a 6 mm, representada pela imagem da linha 1, as maiores são malignas, como a lesão da linha

2, que possui 3 cm. Na coluna Elevação, temos uma lesão benigna, considerando que tem uma

superfície lisa e não muito elevada e a lesão da linha 2 tem sua superfície elevada e irregular.

15

Tabela 2.1: Imagens de lesões benignas e malignas diferenciadas pela regra ABCDE.

Assimetria Borda Cor

Diâmetro ou

Estrutura

diferencial

Elevação ou

Evolução

1

2

B. Análise de textura: as características de textura das lesões de pele, como sua

suavidade ou rugosidade podem ser utilizadas para identificar os padrões de uma determinada

lesão. A matriz de co-ocorrência (HARALICK et al., 1973) é uma técnica muito utilizada para

extrair características de textura das lesões de pele (CELEBI et al., 2007; RAHMAN et al.,

2008). Essa técnica permite obter informações, tais como, energia, probabilidade máxima,

entropia, contraste e diferença inversa. Estas características são analisadas com o objetivo de

diferenciar uma lesão maligna de uma benigna. Outra técnica utilizada para analisar as

alterações da textura nas lesões de pele é o algoritmo wavelet (CHIEM et al., 2007;

GARNAVI et al., 2012).

C. Análise de padrão: é um método utilizado para analisar lesões de pele em

imagens dermatoscópicas. As lesões de pele são caracterizadas por padrões, tais como,

globular, homogênio e reticular, que podem ser identificados nas imagens dermatoscópicas

pela análise de padrão, para definir se a lesão é benigna ou maligna. O tamanho, forma e

distribuição dos padrões tornam-se desigual no interior da lesão maligna, ao contrário da lesão

benigna onde os padrões são uniformes em toda a região. Mendoza et al. (2009) aplicaram

técnicas de análise de textura para identificar o tipo de padrão, para que então possa ser

utilizada para a diferenciação em melanoma ou nevo. Extraíram características baseado-se no

histograma de intensidade, estatística diferencial, Fourier, matrix run-lenght e matrix de co-

ocorrência e utilizaram análise estatística para definir o padrão da lesão.

16

D. Lista de sete pontos: esse método também é utilizado para análise

computacional de lesões de pele em imagens dermatoscópicas (LEO et al., 2009; LEO et al.,

2010). São sete critérios estabelecidos em ordem. Os critérios maiores representam a presença

de pigmentação atípica, véu branco azulado e padrão de vascularização atípica. Os critérios

menores são compostos por estrias irregulares, pigmentação irregular, pontos ou glóbulos

irregulares e estruturas de regressão. Por exemplo em Leo et al. (2010) define um conjunto de

de características, baseadas em parâmetros de cor e textura, que descrevem a malignidade de

uma lesão. As características de cor são obtidas por análise de componente principal

(Principal Component Analysis - PCA) e análise de histograma. A textura é definida por meio

da aplicação de técnicas como filtro mediana, filtro morfológico e analise de Fourier em

imagens de nível de cinza.

A análise de imagens dermatoscópicas é utilizada pelos dermatologistas quando há a

necessidade de confirmação do diagnóstico obtido pela análise da regra ABCD, pois

disponibiliza informações mais detalhadas da lesão (WOLFF et al., 1992).

2.3.2 Seleção de características

A seleção de característica é uma etapa de pré-processamento da tarefa Data Mining

que é importante no processo de classificação de lesões de pele. Esta etapa é importante pois

permite a redução de dimensionalidade do conjunto de dados que representa as imagens.

Neste caso, as características irrelevantes e redundantes existentes no conjunto de dados são

eliminadas. Manter características irrelevantes ou eliminar características relevantes do

conjunto de dados podem prejudicar na classificação e diminuir a qualidade dos resultados,

além da possibilidade de deixar o processo de classificação mais lento (HAN e KAMBER,

2001). Desta forma vários trabalhos da literatura utilizam essa etapa para melhorar o

desempenho dos classificação de lesões de pele (CELEBI et al., 2007; CHANG et al., 2005;

GARNAVI et al., 2012; MAGLOGIANNIS e DOUKAS, 2009).

São vários os benefícios relacionados com a aplicação de técnicas de seleção de

características, tais como (CELEBI et al., 2007):

Redução do tempo de extração das características;

Diminuição da complexidade da classificação;

Melhoramento na taxa de acerto da classificação;

17

Diminuição do tempo de treinamento e teste;

Melhoramento na compreensão e visualização dos dados.

Basicamente, o processo de seleção de características possui as seguintes etapas: A)

definição de subconjunto de atributos; B) avaliação do subconjunto de atributos C) critério de

parada e D) validação do resultado (LIU e YU, 2005). As etapas realizadas no processo de

seleção de características podem ser vistas na Figura 2.1. Essas etapas consideram um

conjunto de amostras de dados , que podem ser obtidas na etapa de extração de

características, descrita anteriormente. Cada amostra é composta por atributos

(características), representados por e a classe a qual pertence . Estas informações são

utilizadas para seleção das características.

Figura 2.1: Estrutura do processo de seleção de característica.

A. Algoritmo de busca: Consiste na busca de características por meio de um

determinado processo de busca heurística. Há diferentes estratégias de busca que podem ser

utilizadas para a definição de uma subconjunto, tais como, a busca completa, sequencial ou

Algoritmo de

busca

Função de

avaliação

Critério de

parada Validação do

resultado

18

randômica (LIU e YU, 2005). Alguns tipos de algoritmos de busca são: a busca sequencial

para frente (Sequential Forward Search - SFS), a busca sequencial para traz (Sequential

Backward Search - SBS) e os algoritmos genéticos (Genetic Algorithms - GAs). O algoritmo

de busca SFS, o processo inicia-se com um conjunto de atributos vazio e conforme a

execução das outras etapas, é escolhido os melhores atributos que vão sendo adicionados no

conjunto gradativamente. No caso do algoritmo de busca SBS, inicialmente o conjunto de

atributos é composto por todas as características e a cada iteração os piores atributos vão

sendo removidos, ou seja, são removidas as características consideradas irrelevantes ou

redundantes. (GUYON e ELISSEEFF, 2003). Os GAs são métodos computacionais de busca

e otimização baseados na evolução natural e na genética, tendo por objetivo encontrar a

melhor solução para um determinado problema (HAUPT e HAUPT, 2004). Uma outra forma

de definir um subconjunto de atributos é utilizar um algoritmo de árvore de decisão, como o

ID3 ou C4.5. Possui a estrutura similar a um fluxograma onde cada nó interno (não-folha)

representa um teste de um atributo, cada ramo representa o resultado de um teste e cada nó

externo indica a predição da classe. Neste caso, os atributos que não aparecerem na árvore são

assumidos como irrelevantes (HAN e KAMBER, 2001).

B. Função de avaliação: Nesta etapa é avaliado o subconjunto definido pelo

algoritmo de busca. A função de avaliação está fortemente relacionada com o tipo de

algoritmo de busca aplicado e pode ser baseada em quatro modelos: filtragem, wrapper e

embutidos (embedded) (GUYON e ELISSEEFF, 2003). O modelo de filtragem permite

avaliar as características sem utilizar algoritmos de aprendizagem. Cada subconjunto gerado é

avaliado por filtros de análise estatística e então comparado com o melhor subconjunto

definido anteriormente. Caso o subconjunto avaliado seja melhor, se torna o melhor

subconjunto atual. Esse processo é considerado um ciclo, onde decorre até atingir o critério de

parada. Um dos métodos de filtragem são o Correlation-based Feature Selection (CFS) e a

minimal Relevance Maximal Redundance (mRMR). A avaliação dos subconjuntos baseado

no modelo wrapper é similar ao modelo de filtragem. A principal diferença entre esses dois

modelos está na utilização de algoritmos de aprendizagem para avaliar cada subconjunto de

atributos selecionados. Alguns dos classificadores utilizados na literatura para avaliar os

subconjunto e também classificar lesões de pele são: os KNNs (GONZALEZ e WOODS,

2002), Bayesianos (CONGDON, 2006) e as ANNs (HAYKIN, 1999). Os KNNs classificam

os dados considerando a distância dos k-vizinhos mais próximos. Os métodos bayesianos

assumem que as características são independentes, e tem como versão mais simples o Naive

Bayes. As Redes Neuronais Artificiais (RNAs) são sistemas paralelos distribuídos que são

19

compostos por unidades de processamento simples correspondentes aos neurônios. Dessa

forma, as RNAs, também conhecidas como redes conexionistas, têm por objetivo simular o

mais próximo possível os elementos do cérebro como os neurônios e as suas conexões,

conhecidas como sinapses. Os métodos do modelo embutido incorpora a seleção de variável

como parte do processo de treinamento. Esse modelo faz melhor o uso dos dados disponíveis

devido não precisar dividir os dados do treinamento em um conjunto de treinamento e

validação. As árvores de decisão são exemplos deste modelo.

C. Critério de parada: o critério de parada determina em que situação o processo

de seleção de característica deve parar. Alguns critérios de parada que podem ser utilizados

são: quando a busca estiver completa; definição de um número mínimo de característica;

definição de um número máximo de iterações no processo; adição ou eliminação de alguma

característica que piore o resultado do melhor subconjunto encontrado até o momento (LIU e

YU, 2005).

D. Validação do resultado: essa etapa consiste na validação dos melhores

atributos definidos nas etapas anteriores aplicados em um novo conjunto de dados por meio

de algoritmos de aprendizagem para medir o desempenho da classificação mediante as

características selecionadas.

20

3 METODOLOGIA PROPOSTA

Nesta seção apresenta-se uma abordagem proposta baseada em Data Mining para

caracterização de lesões de pele a partir de imagens, com intuito de auxiliar na prevenção

contra o cancro de pele. O desenvolvimento deste trabalho terá a parceria do Centro de

Investigação do IPO-Porto (CI-IPOP), que auxiliará na formação da base de imagens e

validação da metodologia proposta. Na Figura 3.1, temos a estrutura da metodologia proposta,

que se baseia nas principais etapas de análise de imagens médicas. A metodologia é composta

pelas seguintes etapas: definição da base de imagens, suavização das imagens, definição da

lesão, redução de dimensionalidade e reconhecimento da lesão.

Figura 3.1: Estrutura da metodologia proposta. Em (a) temos uma imagem fotográfica e (b) a

mesma lesão capturada por um dermatoscópio.

3.1 Definição da base de imagens

A primeira etapa da metodologia proposta é a definição da base de imagens que será

utilizada para a caracterização das lesões de pele. Serão utilizadas dois tipos de imagens:

(a)

(b)

21

fotográficas e dermatoscópicas. Esses tipos de imagens serão utilizados com o intuito de

analisar o desempenho da classificação das lesões de pele em diferentes tipos de base de

imagens, utilizando o mesmo conjunto de características.

Espera-se obter as imagens fotográficas das seguintes bases disponíveis na internet:

Loyola University Chicago3, YSP Dermatology Image Database

4, DermIS

5. As imagens

dermatoscópicas serão obidas em Dermoscopy Atlas6. As imagens dessas bases disponíveis

não foram capturadas de forma controlada. com o objetivo de diminuir os ruídos e obter uma

base homogenia, ou seja, imagens com diferentes dimensões, diferentes aproximações no

momento da captura, pelos sobre a lesão e má iluminação causando sombras e reflexos.

3.2 Suavização das imagens

Devido as imagens da base possuírem ruídos é proposto a aplicação de uma filtro de

suavização para eliminar ruídos como pelos, linhas da pele e minimizar os efeitos de sombra e

reflexos. O objetivo é comparar várias de suavização, tais como, as utilizadas na literatura

para suavização ou realce de lesões de pele são: filtro mediana (GONZALEZ e WOODS,

2002), difusão anisotrópica (BARCELOS et al., 2003) e filtros de morfologia (FACON, 1996).

Isso permitirá analisar qual técnica apresenta melhor desempenho quanto a remoção de ruídos

e também realce da fronteira da lesão. O resultado dessa etapa de pré-processamento da

imagem é muito importante para um bom desempenho no processo de segmentação.

3.3 Definição da lesão

A definição da lesão consiste na segmentação da imagem que tem por objetivo

extrair os objetos de interesse, neste caso as lesões. A segmentação possibilita representar e

descrever esses objetos em forma de fronteiras ou regiões, obtendo-se a saída, que são as

características da imagem de entrada, tais como os contornos.

Pretende-se nessa etapa comparar diferentes técnicas utilizados na literatura para

segmentação de lesões de pele, como técnicas baseadas em limiarização, crescimento de

3 http://www.meddean.luc.edu/lumen/meded/medicine/

4 http://homepage1.nifty.com/ysh/indexe.htm

5 http://www.dermis.net/dermisroot/en/home/index.htm

6 http://www.dermoscopyatlas.com/

22

região, aprendizagem e modelos deformáveis. Essa comparação tem por objetivo definir a

borda lesão de forma mais eficiente para que possa ser extraídas suas características e obter

uma boa representação das lesões. Espera-se também analisar algumas técnicas não utilizadas

na literatura para segmentação de lesões de pele, como modelos de contorno ativo para

imagens coloridas e também multifase (CHAN e VESE, 2002), que são modelos deformáveis

que permite criar várias curva na mesma imagem com o intuito de definir vários objetos.

Nesta etapa também será analisado se haverá necessidade de um pós-processamento

para melhorar o resultado obtido na segmentação, por meio de um novo processamento para a

obtenção ou reajuste do objeto de interesse.

3.4 Redução de dimensionalidade

A redução de dimensionalidade possibilita reduzir o tamanho do conjunto de dados

que representa as imagens de lesões de pele por meio de conceitos como extração de

características ou seleção de características. A grande quantidade de atributos da base de

dados pode tornar o processo de classificação mais complexo e diminuir a precisão. O

objetivo da redução de dimensionalidade nessa abordagem é representar a lesão com

características baseadas nos métodos utilizados pelos dermatologistas para análise de lesões

de pele e remover as características que são irrelevantes ou redundante para o processo de

classificação. Esta etapa permitirá definir o melhor conjunto de características para a

caracterização da lesões de pele.

Para a extração das característica inicialmente pretende-se utilizar conceitos da regra

ABCDE e análise de textura para extrair informações da Assimetria, Borda, Cor, Estrutura

Diferenciais, Evolução e informações de textura das lesões. Esses métodos de análise de

lesões de pele podem ser utilizado para ambos os tipos de imagem que se deseja utilizar,

imagens fotográficas e dermatoscópicas. Pretende-se aplicar várias técnicas para extrair as

características, considerando também as técnicas que não foram utilizadas na literatura para

análise de lesões de pele.

Para a definição da característica de evolução da regra ABCDE pretende-se

desenvolver uma nova metodologia baseada nos conceitos de alinhamento (ZITOVÁ e

FLUSSER, 2003). A aplicação de técnicas de alinhamento permitem analisar a evolução da

lesão de pele a partir de duas imagens da mesma lesão obtidas em período diferente ou com

diferentes condições. Desta forma é possível medir características importantes, tais como, o

23

grau de mudança da área, de assimetria e de cor para representar a evolução das lesões de

pele.

A seleção de característica será aplicada para estabelecer quais dessas características

extraídas são realmente eficientes para o problema proposto e remover as características

irrelevantes e redundantes. Pretende-se comparar as técnicas de diferentes modelos: filtragem,

wrapper, híbrido e embutido.

3.5 Reconhecimento da lesão

Nessa etapa será comparado o desempenho de diversos classificadores para

diferenciação das lesões de pele por meio do melhor conjunto de características definido na

etapa anterior. O intuito da diferenciação é determinar se lesão é benigna, maligna ou

suspeita, ou seja, que há probabilidade da referida lesão se tornar maligna.

Pretende-se também analisar o resultado da classificação em diferentes bases de

imagens de lesões de pele. Será comparado o desempenho do conjunto de características

definido em relação a base de imagens fotográficas e também das imagens dermatoscópicas

com o intuito de analisar em qual base de imagens melhor se aplicam o método de

caracterização.

Será comparado o desempenho entre os classificadores tradicionais na literatura, tais

como modelos bayesianos, árvores de decisão, redes neurais artificiais (MITCHELL, 1996),

máquina de vetor de suporte (BURGES, 1998), k-vizinhos mais próximos (GONZALEZ e

WOODS, 2002). Outra técnica que almeja-se utilizar é o aprendizado ensemble, que tem por

objetivo aumentar o desempenho da classificação utilizando a combinação de diferentes

classificadores (RAHMAN et al., 2008).

24

4 DESENVOLVIMENTO DO TRABALHO

Nesta seção serão apresentadas algumas informações importantes para o

desenvolvimento do presente trabalho. O detalhamento do plano de trabalho, informações de

importantes conferências e revistas e alguns pesquisadores da área.

4.1 Plano de trabalho

A seguir são apresentadas as descrições das tarefas a serem realizadas para a

metodologia proposta:

Atividade 1 - Estado da arte (7 meses): estudo bibliográfico sobre técnicas,

metodologias e modelos existentes relacionadas com a análise e

processamento de imagens de lesões de pele;

Atividade 2 - Construção da base de imagens (5 meses): construção da

base de imagens utilizada para a classificação das lesões de pele por meio de

imagens disponíveis na internet;

Atividade 3 - Elaboração da proposta de tese (4 meses): escrita da

proposta de tese;

Atividade 4 - Escrita de artigos: elaboração de artigos conforme o

desenvolvimento, ensaio e validação das técnicas em cada etapa da

abordagem;

Atividade 5 - Suavização e definição da lesão (4 meses): desenvolvimento,

implementação, ensaio e validação de técnicas, metodologias e modelos

computacionais para suavização e segmentação das lesões de pele;

Atividade 6 - Extração das características e análise dos dados (6 meses):

desenvolvimento, implementação, ensaio e validação de técnicas,

metodologias e modelos computacionais para extração das características das

lesões de pele e análise dos dados obtidos;

Atividade 7 - Seleção das características (4 meses): desenvolvimento,

implementação, ensaio e validação de técnicas, metodologias e modelos

computacionais para seleção de características das lesões de pele;

25

Atividade 8 - Reconhecimento da lesão (4 meses): desenvolvimento,

implementação, ensaio e validação de técnicas, metodologias e modelos

computacionais para classificação de lesões de pele;

Atividade 9 - Validação de resultados (5 meses): validação dos resultados

obtidos pela metodologia proposta;

Atividade 10 - Elaboração da tese (6 meses): escrita da tese.

Na Tabela 4.1 pode ser visto o cronograma de execução das atividades descritas

anteriormente.

Tabela 4.1: Cronograma de execução das tarefas.

Atividades 2013

Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez

1 - Estado da arte

2 - Construção da base de imagens

3 - Elaboração da proposta de tese

4 - Escrita de Artigos

Atividades 2014

Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez

5 - Suavização e Definição da lesão

6 - Extração das características e Análise dos dados

7 - Seleção das características

4 - Escrita de Artigos

Atividades 2015

Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez

8 - Reconhecimento da lesão

9 - Validação de resultados

10 - Elaboração da Tese

4 - Escrita de Artigos

26

4.2 Conferências e Revistas

Há várias conferências importantes em que o presente trabalho pode ser submetido

no âmbito de Aprendizagem de Máquina, Descoberta de Conhecimento, Visão computacional

e Inteligência Artificial, Análise de Imagens médicas, Reconhecimento de Padrão e

Processamento de Imagens, conforme estabelecido no plano de trabalho, tais como:

European Conference on Machine Learning and Principles (ECML);

Practice of Knowledge Discovery in Databases (PKDD);

IEEE Workshop on the Applications of Computer Vision (WACV);

International Conference on Artificial Intelligence (ICAI).

Algumas revistas que também aborda a área proposta neste trabalho são:

Data Mining and Knowledge Discovery;

Machine Learning;

IEEE Transactions On Pattern Analysis And Machine Intelligence;

Medical Image Analysis;

International Journal Of Computer Vision;

IEEE Transactions On Image Processing;

Pattern Recognition.

4.3 Pesquisadores

Há vários pesquisadores que trabalham com análise de lesões de pele. Um bastante

conceituado na área é o Dr. M. Emre Celebi7, professor associado da Universidade no Estado

Americano da Luisiana em Shreveport. O referido pesquisador tem interesse em diversos

temas, tais como, análise de imagens médicas, processamento de imagem colorida e

clustering. Possui diversas publicações aplicadas para imagens dermatoscópicas.

Outro pesquisador da área é o Dr. Ilias Maglogiannis8, professor assistente da

Universidade da Grécia Central. Possui várias publicações no âmbito de processamento de

dados multimédia e imagem, visão computacional, informática biomédica e comunicações

multimédia e telemedicina.

7 http://www.lsus.edu/emre-celebi

8 http://users.ucg.gr/~imaglo/

27

MIG9 é um grupo de imagem medica da Universidade de São Paulo (USP) no Brasil

que foca na pesquisa e desenvolvimento de processamento de imagem médica e metodologias

de análise para auxiliar no diagnóstico e prover a descoberta de conhecimento na área

biomédica.

9 http://escience.ime.usp.br/MIG/

28

CONSIDERAÇÕES FINAIS

Neste trabalho apresentou-se uma revisão do estado da arte para análise de lesões de

pele e também uma abordagem em data mining para classificação de lesões de pele a partir de

imagens foi proposta, com o intuito de melhorar o resultado obtido na classificação.

Apesar da importância da etapa de pré-processamento para eliminar os ruídos, que

podem prejudicar o processo de segmentação das imagens, notou-se que é pequena a

variedade de técnicas utilizadas na literatura para suavizar as imagens de lesões de pele. Já no

caso da segmentação há uma grande variedade de técnicas que são utilizadas nesta etapa. A

maioria dos trabalhos com foco na classificação de lesões de pele, fazem uma comparação dos

resultados obtidos por vários classificadores. Isso não ocorre com a segmentação, são poucos

os trabalhos que comparam técnicas diferentes para analisar qual é a melhor técnica a ser

utilizada.

Concluiu-se que há vários estudos avançados nesta área de análise de lesões de pele,

que vem se tornando interesse de muitos pesquisadores, pois permite auxiliar na prevenção

contra cancro de pele. Mas entende-se que ainda há muitas possibilidades de estudos nesta

área e de desenvolvimento de novas metodologias, devido o vasto âmbito que envolve esse

processo de análise de lesões de pele.

29

REFERÊNCIAS BIBLIOGRÁFICAS

Q. Abbas; I. Fondón; M. Rashid. Unsupervised skin lesions border detection via two-dimensional

image analysis. Computer Methods and Programs in Biomedicine, COMM-3090, p. 1-15, 2010.

J. F. Alcón; C. Ciuhu; W. T. Kate; A. Heinrich; N. Uzunbajakava. Automatic imaging system with

decision support for inspection of pigmented skin lesions and melanoma diagnosis. IEEE Journal

of Selected Topics in Signal Processing, v. 3, n. 1, p. 14-25, 2009.

L. Alvarez; P.-L. Lions; J.-M. Morel. Image Selective Smoothing and Edge Detection by

Nonlinear Diffusion. SIAM Journal on Numerical Analysis, v. 29, n. 3, p. 845-866, 1992.

C. A. Z. Barcelos; M. Boaventura; E. C. Silva Junior. A well-balanced flow equation for noise

removal and edge detection. IEEE Transactions on Image Processing, v. 12, n. 7, p. 751-763,

2003.

C. A. Z. Barcelos; V. B. Pires. An automatic based nonlinear diffusion equations scheme for skin

lesion segmentation. Applied Mathematics and Computation, v. 215, p. 251-261, 2009.

A. T. Beuren; R. Janasieivicz; G. Pinheiro; N. Grando; J. Facon. Skin melanoma segmentation by

morphological approach. Proceedings of the International Conference on Advances in Computing,

Communications and Informatics. New York, United States of American, 2012, p. 972-978.

C. J. C. Burges. A tutorial on support vector machines for pattern recognition. Data Mining and

Knowledge, v. 2, p. 121-167, 1998.

Brasil. Ministério da Saúde. Instituto Nacional de Câncer, Estimativa 2010: Incidência de câncer

no Brasil, Rio de Janeiro: INCA, 2009. 98 p.

J. Canny. A computation approach to edge detection. Transactions on pattern analysis and

machine intelligence, v. 8, n. 6, p. 679-698, 1986.

M. Carrara; S. Tomatis; A. Bono; C. Bartoli; D. Moglia; M. Lualdi; A. Colombo; M. Santinami;

R. Marchesini. Automated segmentation of pigmented skin lesions in multispectral imaging.

Physics in Medicine and Biology, v. 50, p. 345-357, 2005.

M. E. Celebi; Y. A. Aslandogan; P. R. Bergstresser. Unsupervised border detection of skin lesion

images. In: Proceedings of the International Conference on Information Technology: Coding and

Computing (ITCC'05). IEEE Computer Society. v. 2, p. 123-128, Washington, DC, USA, 2005.

30

M. E. Celebi; H. A. Kingravi; H. Iyatomi; Y. A. Aslandogan; W. V. Stoecker; R. H. Moss; J. M.

Malters; J. M. Grichnik; A. A. Marghoob; H. S. Rabinovitz; S. W. Menzies. Border detection in

dermoscopy images using Statistical Region Merging. Skin Research and Technology, v. 14, p.

347-354, 2008.

M. E. Celebi; H. A. Kingravi; B. Uddin; H. Iyatomi; Y. A. Aslandogan; W. V. Stoecker; R. H.

Moss. A methodological approach to the classification of dermoscopy images. Comput Med

Imaging Graph, 31(6), p. 362-373, 2007.

T. F. Chan; L. A. Vese. Active contours without edges. IEEE Transactions on Image Processing,

v. 10, n. 2, p. 266-277, 2001.

T. F. Chan; L. A. Vese. A multiphase Level Set framework for image segmentation using the

Mumford and Shah model. International Journal of Computer Vision, v. 50, n. 3, p. 271-293,

2002.

Y. Chang; R. J. Stanley; R. H. Moss; W. V. Stoecker. A systematic heuristic approach for feature

selection for melanoma discrimination using clinical images. Skin Res. Technol., v. 11, n. 3, p.

165-178, 2005.

A. Chiem; A. Al-Jumaily; R. N. Khushaba. A novel hybrid system for skin lesion detection. In:

International Conference on Intelligent Sensors, Sensor Networks and Information, 3th,

Melbourne, p. 567-572, 2007.

K. Clawson; P. Morrow; B. Scotney; J. Mckenna; O. Dolan. Analysis of pigmented skin lesion

border irregularity using the harmonic wavelet transform. In: International Machine Vision and

Image Processing Conference, 13th, Dublin, Ireland, 2009, p. 18-23.

P. Congdon. Bayesian Statistical Modelling. 2. ed. England: John Wiley & Sons, Ltd, 2006, 573 p.

L. C. Cucé; C. Festa Neto (Org.) et al. Manual de dermatologia. 2 ed. São Paulo: Atheneu, 2001,

660 p.

P. Cudek; J. W. Grzymala-Busse; Z. S. Hippe. Melanocytic skin lesion image classification. Part

I: Recognition of skin lesion. In: Conference on Human System Interactions (HSI). 3rd, Rzeszow,

Poland, 2010, p. 251-257.

J. Facon. Morfologia matemática: teoria e exemplos. Curitiba: Editora Universitária Champagnat

da Pontífica Universidade Católica do Paraná, 1996. 320 p.

31

R. Garnavi; M. Aldeen; J. Bailey. Computer-Aided Diagnosis of Melanoma Using Border- and

Wavelet-Based Texture Analysis. IEEE Transactions on Information Technology in Biomedicine,

v. 16, n. 6, 2012.

R. C. Gonzalez; R. E. Woods. Digital image processing. 2. ed. New Jersey: Prentice Hall, 2002.

793 p.

I. Guyon; A. Elisseeff. An Introduction to variable and feature selection. Journal of Machine

Learning Research 3, p. 1157-1182, 2003.

J. Han; M. Kamber. Data Mining: concepts and techniques. United States of American: Academic

Press, 2001. 549 p.

R. M. Haralick; K. Shanmugam; I. Dinstein. Textura features for image classification. IEEE

Transactions on Systems, Man and Cybernetics, v. SMC-3, n. 6, p. 610-621, 1973.

R. L. Haupt; S. E. Haupt. Practical genetic algorithms. 2. ed. New Jersey: John Wiley & Sons,

2004, 253 p.

S. S. Haykin. Neural Networks: a comprehensive foundation. 2. ed. Prentice Hall, 1999. 842 p.

H. Iyatomi; K.–A. Norton; M. E. Celebi; G. Schaefer; M. Tanaka; K. Ogawa. Classification of

melanocytic skin lesions from non-melanocytic lesions. In: Annual International Conference of the

IEEE EMBS, 32nd. Buenos Aires, Argentina, 2010, p. 5407-5410.

L. Jianli; Z. Baoqi. The segmentation of cancer image based on genetic neural network. In: World

Congress on Computer Science and Information Engineering (CSIE ‘09). 2009, p. 594-599.

M. Kass; A. Witkin; D. Terzopoulos. Snakes: Active contour models. International Journal of

Computer Vision, v. 1, n.4, p. 321-331, 1988.

H. T. Lau; A. Al-Jumaily. Automatically early detection of skin cancer: study based on neural

network classification. In: International Conference of Soft Computing and Pattern Recognition,

2009, Malacca, p. 375-380.

G. D. Leo; G. Fabbrocini; A. Paolillo; O. Rescigno; P. Sommella. Towards an automatic

diagnosis system for skin lesions: estimation of blue-whitish veil and regression structures. In:

International Multi-Conference on Systems, Signals and Devices. 6th, Djerba, 2009, p. 1-6.

32

G. D. Leo; A. Paolillo; P. Sommella; G. Fabbrocini. Automatic diagnosis of melanoma: a software

system based on the 7-point check-list. In: International Conference on System Sciences. 43rd,

2010, p. 1-10.

M. Silveira; J. C. Nascimento, J. S. Marques; A. R. S. Marçal; T. Mendonça; S. Yamauchi; J.

Maeda; J. Rozeira. Comparison of segmentation methods for melanoma diagnosis in dermoscopy

images. IEEE Journal of Selected Topics in Signal Processing, v. 3, n. 1, 2009.

I. Maglogiannis; C. N. Doukas. Overview of advanced computer vision systems for skin lesions

characterization. IEEE Transactions on Information Technology in Biomedicine, v. 13, n. 5, p.

721-733, 2009.

J. M. Mendel; R. I. B. John, Type-2 fuzzy sets made simple. IEEE Trans. Fuzzy Syst., v. 10, n. 2,

p. 117-127, 2002.

C. S. Mendoza; C. Serrano; B. Acha. Scale invariant descriptors in pattern analysis of

melanocytic lesions. In: IEEE International Conference on Image Processing (ICIP), 16th, 2009,

Cairo, p. 4193-4196.

T. M. Mitchell. Machine Learning. Singapore: McGraw-Hill, 1997, 414 p.

D. Mumford; J. Shah. Optimal approximations by piecewise smooth functions and associated

variational problems. Communications on Pure and Applied Mathematics, v. XLII, p. 577-685,

1989.

R. Nock; F. Nielsen. Statistical region merging. IEEE Trans. Pattern Anal. Mach. Intell., v. 26, n.

11, p. 1452-1458, 2004.

K. N. Nordström. Biased anisotropic diffusion: a unified regularization and diffusion approach to

edge detection. In: Proceedings of The First European Conference on Computer Vision, 1990,

New York. p. 18-27.

K. –A. Norton; H. Iyatomi; M. E. Celebi; G Schaefer.; M. Tanaka; K. Ogawa. Development of a

novel border detection method for melanocytic and non-melanocytic dermoscopy images. In:

Annual International Conference of the IEEE EMBS, 32nd. Buenos Aires, Argentina, 2010, p.

5403-5406.

S. Osher; J. A. Sethian. Fronts propagating with curvature dependent speed: algorithms based on

Hamilton-Jacobi formulations. Journal of Computational Physics, v. 79, p. 12-49, 1988.

33

N. Otsu. A threshold selection method from gray-level histograms. IEEE Transactions on Systems,

Man, and Cybernetics, v. SMC-9, p. 62-66, 1979.

P. Perona; J. Malik. Scale-space and edge detection using anisotropic diffusion. IEEE transactions

on pattern analysis and machine intelligence, v. 12, n. 7, p. 629-639, 1990.

V. B. Pires; C. A. Z. Barcelos. Edge Detection of Skin Lesions Using Anisotropic Diffusion. In:

Seventh International Conference on Intelligent Systems Design and Applications. Rio de Janeiro,

Brazil, 2007, p. 363-370.

L. Piatek; Z. S. Hippe. Synthesis of selected features of melanocytic skin lesion images.

Proceedings of the Conference on Image and Vision Computing. 27th IVCNZ '12, New Zealand,

p. 238-243, 2012.

M. M. Rahman; P. Bhattacharya; B. C. Desai. A multiple expert-based melanoma recognition

system for dermoscopic images of pigmented skin lesions. BioInformatics and BioEngineering,

2008. IEEE International Conference on. 8th, BIBE, p. 1-6, 2008.

P. Sahoo, C. Wilkins, and J. Yeager. Threshold selection using renyi´s entropy. Pattern

Recognition, v. 30, n. 1, p.71-84, 1997.

O. Sarrafzade; M. H. M. Baygi; P. Ghassemi. Skin lesion detection in dermoscopy images using

wavelet transform and morphology operations. In: Iranian Conference of Biomedical Engineering

(ICBME2010), 17th, Isfahan, p. 1-4, 2010.

M. Sonka; V. Hlavac; R. Boyle. Image processing, analysis, and machine vision. 2. ed. PWS,

1998, 800 p.

K. Taouil; N. Ben Romdhane; M. S. Bouhlel. A new automatic approach for edge detection of

skin lesions images. In: Information and Communication Technologies (ICTTA‘06), 2nd, 2006,

Damascus. Science & Technology of Image & Telecommunication, p. 212-220, 2006.

K. Wolff; R. A. Johnson; D. Suurmons. Dermatologia: atlas e texto. 5 ed. Rio de Janeiro:

McGraw-Hill Interamericana do Brasil, 2006, 1992 p.

A. Wong; J. Scharcanski; P. Fieguth. Automatic skin lesion segmentation via iterative stochastic

region merging. IEEE Transactions on Information Technology in Biomedicine, v. 15, n. 6, 2011.

C. Xu and J. L. Prince. Gradient vector flow: a new external force for snakes. In: Proceedings in

Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'97). San Juan,

1997, p. 66-71.

34

X. Yuan; Z. Yang; G. Zouridakis; N. Mullani. SVM-based textura classification and application to

early melanoma detection. In: IEEE EMBS Annual International Conference, 28th, New York,

USA, 2006, p. 4775-4778.

M. E. Yüksel; M. Borlu. Accurate Segmentation of Dermoscopic Images by Image Thresholding

Based on Type-2 Fuzzy Logic. IEEE Transactions on fuzzy systems, v. 17, n. 4, p. 976-982, 2009.

H. Zhou; G. Schaefer; M. E. Celebi; H. Iyatomi; K.-A. Norton; T Liu; F. Lin. Skin lesion

segmentation using an improved snake model. In: Annual International Conference of the IEEE

EMBS, Buenos Aires, Argentina, 2010, p. 1974-1977.

B. Zitová; J. Flusser. Image registration methods: a survey. Image and Vision Computing. v. 21, p.

977–1000, 2003.