DESENVOLVIMENTO DE SISTEMASpaginapessoal.utfpr.edu.br/fabricio/fabricio-martins-lopes/ensino/... · Resumo COLONHEZI, T. P.; LOPES, F. M. Caracterização de Bioimagens. Monograﬁa

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁCAMPUS CORNÉLIO PROCÓPIO

COORDENAÇÃO DE TECNOLOGIA EM ANÁLISE EDESENVOLVIMENTO DE SISTEMAS

Thiago Pereira Colonhezi

Caracterização de Bioimagens

TRABALHO DE CONCLUSÃO DE CURSO

CORNÉLIO PROCÓPIO2013

Thiago Pereira Colonhezi

Caracterização de Bioimagens

Trabalho de conclusão de curso em Tecnologiaem Análise e Desenvolvimento de Sistemas daUniversidade Tecnológica Federal do Paraná -UTFPR, como requisito parcial para a obtençãodo titulo de Tecnólogo.

Orientador:

Prof. Dr. Fabrício Martins Lopes

Co-orientador:

Prof. Dr. Pedro H. Bugatti

Cornélio Procópio - PR

04/2013

Resumo

COLONHEZI, T. P.; LOPES, F. M. Caracterização de Bioimagens. Monografia de traba-lho de conclusão de curso. Curso superior em Tecnologia em Análise e Desenvolvimento deSistemas. Universidade Tecnológica Federal do Paraná, Campus Cornélio Procópio.

Com os avanços tecnológicos nas mais diversas áreas do conhecimento, principalmente naaquisição de imagens e vídeos, a necessidade em indexar e recuperar esses conteúdos em meioa um conjunto enorme de arquivos passou a ganhar destaques na comunidade acadêmica/ci-entífica. A recuperação da imagem baseada em seu conteúdo é uma estratégia que diminuia limitação em criar tags ou rótulos do conteúdo e baseia-se na extração de característica daimagem ou fonte de entrada. No mundo biológico temos grandes necessidades de pesquisa edesenvolvimento relacionado à recuperação de imagens. Entre estas necessidades destacam-seno Brasil, e em diversas partes do mundo, a necessidade de catalogar a flora de forma que oconhecimento a respeito de cada espécie seja acessível de várias formas e locais, auxiliandopesquisadores, agrônomos e biólogos. Portanto este trabalho teve como objetivo: desenvolverum software de código livre capaz de extrair características de imagens com ênfase em tex-tura utilizando os descritores de Haralick e Histograma de Variação Quantificada; apresentaruma análise de diferentes formas de classificação para auxiliar na recuperação de folhas devárias espécies; e analisar o impacto de métodos de seleção de atributos, para reduzir o custocomputacional na faze de aprendizagem e classificação. Os resultados obtidos mostram que ascaracterísticas selecionadas podem ser utilizada para a anotação, pois em vários classificadoresfoi possível obter resultados superiores a 70%. E como resultado final, foi desenvolvido umsoftware, jImageFeature, de código livre que pode ser acessado no google code disponível em<http://code.google-.com/p/jimagefeature/>.

Palavras-chave: classificação supervisionada, recuperação de imagem, extração de caracte-rísticas, conteúdo e seleção de características.

Abstract

COLONHEZI, T. P.; LOPES, F. M. Characterization of bioimages. Monograph of Gra-duate Course. Technologist Degree in System Analysis and Development. UTFPR - FederalUniversity of Technology - Paraná, Campus Cornélio Procópio 2013.

The improvement of the technology in many areas of the knowledge, in particular on theacquisition of images and videos, led to the necessity for index and retrieve such contents froma huge set of files. Nowadays, this task has been gaining more attention from both the academiccommunity and corporate. The image retrieval based on its content is a strategy that reducesthe limitation in creating tags or labels to describe its contents, whicha is based on image fe-ature extraction. In the biological area has a great necessity for methods of image retrieval.In particular, in Brazil it is necessary to catalog the flora in order to preserve the knowledgeabout each species available. The correct cataloging will help the researches, agronomists andbiologists to preserve and retrieve information quickly and accurately. In this context, it isproposed the development of an open-source software with the following features: to extracttexture image features by using Haralick’s descriptors and Histogram Variation Quantified; toperform the analysis of some different classification methods applied in the leaf recovery of va-rious species; and to analyze the impact of feature selection methods in the computational timefor learning and classification. The obtained results show that the selected features can be usedfor annotation, given that in most classifiers was possible to obtain better results than 70%. Asa conclusion, it was developed an open source software tool, jImageFeature, freely available at<http://code.google-.com/p/jimagefeature/>.

Keywords: supervised classification, image retrieval, feature extraction, content and featureselection.

Lista de Figuras

1 Vizinhança de um pixel central e os diferentes ângulos possíveis (HARALICK;

SHANMUGAM, 1973). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2 Matriz da vizinhança de raio 1 centrado em (i,j). . . . . . . . . . . . . . . . 18

3 Árvore de decisão - Frutas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

4 Redes Neurais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

5 Quadro de verificação - Verdadeiro positivo e falso positivo. . . . . . . . . . 23

6 Curva característica de operação do receptor (Curva ROC). . . . . . . . . . . 24

7 Imagem de duas folhas digitalizadas. a) Pittosporum tobira e b) Nerium ole-

ander. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

8 Imagem de duas folhas imagem que simulam a digitalização. a) Eriobotrya

japonica e a b) Magnolia grandiflora. . . . . . . . . . . . . . . . . . . . . . 29

9 Imagem de duas folhas naturais. a) Ilex aquifolium a b) Vitex agnus-castus. . 29

10 Exemplo arquivo ARFF importado pelo Software WEKA. . . . . . . . . . . 31

11 Acertos obtidos por cada classificador nas classes disponíveis. . . . . . . . . 33

12 Curvas de acerto para o classificador Naive Bayes. . . . . . . . . . . . . . . 34

13 Curvas de acerto para o classificador Multilayer Perceptron. . . . . . . . . . 34

14 Curvas de acerto para o classificador Multi Class Classifier. . . . . . . . . . . 35

15 Curvas de acerto para o classificador Adaboos Naive Bayes. . . . . . . . . . 35

16 Curvas de acerto para o classificador Adaboos J48. . . . . . . . . . . . . . . 36

17 Curvas de acerto para o classificador Adaboos Multilayer Perceptron. . . . . 36

18 Folhas da classe Cornus Mas. . . . . . . . . . . . . . . . . . . . . . . . . . . 37

19 Folhas da classe Laurus Nobilis. . . . . . . . . . . . . . . . . . . . . . . . . 37

20 Folhas das classes: Cornus Mas, Melia Azedarach e Acer Opalus. . . . . . . 38

21 Folhas das classes: Laurus Nobilis, Acer Platanoides e Acer Campestre. . . . 38

22 Variação de forma - Quercus Ilex . . . . . . . . . . . . . . . . . . . . . . . . 39

23 Número de Lóbulos - Ficus Carica . . . . . . . . . . . . . . . . . . . . . . . 39

24 Variação de forma geral - Corylus Avellana. . . . . . . . . . . . . . . . . . . 39

25 Coloração diferente - Cotinus Coggygria. . . . . . . . . . . . . . . . . . . . 40

26 Número folhetos - Flaxinus Angustifolia. . . . . . . . . . . . . . . . . . . . 40

27 Reflexão da luz - Magnolia Grandiflora. . . . . . . . . . . . . . . . . . . . . 40

28 Curvas de acertos - Wrapper Naive Bayes x Adaboost J48 . . . . . . . . . . 44

29 Curvas de acertos - Wrapper J48 x Adaboost J48 . . . . . . . . . . . . . . . 45

30 Curvas de acertos - Wrapper NNge x Adaboost J48 . . . . . . . . . . . . . . 45

31 Curvas de acertos - Wrapper Adaboost Naive Bayes x Adaboost J48 . . . . . 46

32 Curvas de acertos - Wrapper Adaboost J48 x Adaboost J48 . . . . . . . . . . 46

33 Curvas de acertos - Wrapper Naive Bayes x Adaboost Multilayer Perceptron . 47

34 Curvas de acertos - Wrapper J48 x Adaboost Multilayer Perceptron . . . . . 47

35 Curvas de acertos - Wrapper NNge x Adaboost Multilayer Perceptron . . . . 48

36 Curvas de acertos - Wrapper Adaboost Naive Bayes x Adaboost Multilayer

Perceptron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

37 Curvas de acertos - Wrapper Adaboost J48 x Adaboost Multilayer Perceptron 49

Lista de Tabelas

1 Percentuais de acertos obtidos pelos classificadores. . . . . . . . . . . . . . . 33

2 Melhores acertos obtidos em relação às classes . . . . . . . . . . . . . . . . 38

3 Piores acertos obtidos em relação às classes. . . . . . . . . . . . . . . . . . . 38

4 Classes e seus índices de acertos durante a classificação. . . . . . . . . . . . 41

5 Desempenho médio obtido utilizando os atributos selecionados. . . . . . . . 42

6 Desempenho médio obtido utilizando os atributos selecionados. . . . . . . . 44

7 Tempo de criação do modelo para a classificação Adaboost J48 . . . . . . . . 49

8 Tempo de criação do modelo para a classificação Adaboost Multilayer Per-

ceptron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

Sumário

1 Introdução 9

1.1 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3 Organização do trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Revisão Bibliográfica 12

2.1 Imagens Digitais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2 Vizinhança . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.3 Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.4 Método de Otsu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.5 Textura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.6 Matriz de co-ocorrência . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2.7 Descritores de Haralick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.8 Histograma de alteração quantificada . . . . . . . . . . . . . . . . . . . . . . 18

2.9 Extração de características . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.10 Classificação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.11 Análise de Precisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.11.1 Verdadeiro Positivo e Falso positivo . . . . . . . . . . . . . . . . . . 23

2.11.2 Precision e Recall . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.11.3 Curvas ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2.12 Seleção de características . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.12.1 Método de Seleção . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.12.2 Método de Busca . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3 Materiais e Métodos 28

3.1 Definição de características . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.2 Descrição da Base de Imagens . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.3 Implementação dos extratores . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.4 Ferramenta WEKA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4 Resultados e Discussões 32

4.1 Resultados 1 - Classificação . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.2 Resultados 2 - Seleção e classificação . . . . . . . . . . . . . . . . . . . . . 40

5 Conclusões 51

Referências 52

9

1 Introdução

Desde o início do século XXI ocorreram avanços tecnológicos nas mais diferentes áreas do

conhecimento, entre elas a aquisição de imagens e vídeos ganhou destaque. Por meio desses

avanços é possível nos dias de hoje, um cidadão comum ter acesso a equipamentos razoavel-

mente sofisticados e com boa resolução de imagens e vídeos a preços populares. Como con-

sequência dessa popularização dos equipamentos de aquisição de imagens e vídeos, houve uma

explosão na captação e armazenamento de conteúdo multimídia (imagens e vídeos).

Devido essa grande quantidade de imagens armazenadas, indexar e recuperar imagens e

vídeos passou a ganhar destaque na comunidade acadêmica/científica e também em empresas

privadas, como por exemplo, o Google (GOOGLE PESQUISA POR IMAGEM, 2013). Essa recupe-

ração pode ocorrer de forma textual, por meio da inclusão de identificadores conhecidos como

tags apresentando a vantagem de indexar e recuperar rapidamente os conteúdos multimídia. No

entanto, nessa modalidade de recuperação é necessário que seja atribuído informação textual ao

conteúdo multimídia manualmente, podendo gerar inconsistências pois depende da percepção

humana para os detalhes das imagens que podem apresentar. Caso essa atribuição seja incorreta,

incompleta ou não aconteça, o conteúdo não será indexado corretamente, por consequência, não

será recuperado.

Logo, o uso de tags para rotular a informação exige que o domínio (informações sobre a

imagem) seja corretamente estabelecido, ou seja, a atribuição automática das tags. Esse tema

está diretamente relacionado com um dos cinco grandes desafios identificados pela Sociedade

Brasileira de Computação (SBC): gestão da informação em grandes volumes de dados multi-

mídia distribuídos (SBC, 2012). Portanto uma forma que independe de informações anexadas a

imagem/vídeo é a recuperação baseado em seu conteúdo. Essa forma é baseada na extração de

características da fonte e, a partir da análise destes dados é realizada a recuperação do conteúdo

necessário.

A recuperação de imagens baseada em conteúdo é um problema abordado nas mais diversas

aplicações em todo o mundo. Em particular, a flora brasileira é considerada uma das mais

ricas, com mais de 56.000 espécies, representando cerca de 19% da flora mundial (GIULIETTI1

et al., 2005). O Brasil também é o país com a maior diversidade biológica do planeta, com

alto índice de espécies endêmicas. Essa diversidade biológica é muito expressiva tanto em

relação às potencialidades genéticas como em relação ao número de espécies e de ecossistemas.

Considerando a biodiversidade vegetal, a Floresta Amazônica é detentora da maior reserva de

plantas medicinais do mundo. Logo existe uma grande necessidade em se conhecer a flora de

1.1 Justificativa 10

forma rápida e ágil.

O conhecimento exato de uma espécie de planta, distribuição geográfica ou a utilização, é

essencial para o desenvolvimento da agricultura. Informações a respeito de uma nova espécie

pode não ser acessado a todos os interessados, pois é necessário recorrer a grandes catálogos

de espécies o que limita o conhecimento aos profissionais, professores e cientistas específicos

da área. As plantas constituem uma dificuldade até mesmo para os agricultores e cientistas,

devido à variabilidade de sua forma, muito maior do que a biologia animal. Por isso, surge a

necessidade de métodos computacionais que auxiliem na identificação das espécies utilizando

uma imagem de recuperação.

Atualmente, diversas empresas e cientistas buscam uma forma de realizar buscas por ima-

gem, visando analisar o seu conteúdo e características por meio disso retornar um resultado

esperado. É extremamente útil para um pesquisador utilizar um celular para registrar a imagem

de uma planta e realizar buscas em um banco específico e obter resposta em tempo reduzido.

Desta forma, o pesquisador não necessitará mais de busca manual em grandes catálogos.

1.1 Justificativa

De acordo com estimativas feitas em 2006, a quantidade de informação no universo digital

era de 161 hexabytes, o que correspondia a 3 milhões de vezes a quantidade de informação

contida em todos os livros já escritos. Em 2011, estimativas mostraram que o número de da-

dos ultrapassou 1.8 zettabytes (GANTZ; REINSEL, 2011). Dentre esses dados, grande parte são

conteúdos digitais como imagens, vídeos e gráficos. Porém esses conteúdos só podem tornar-se

útil quando acessado de forma eficiente, não significando apenas acesso rápido, mas também

capacidade de encontrar informações sem ter de buscar manualmente todo esse conjunto de

dados, o que seria inviável. A partir disso, surge a necessidade da utilização de ferramentas

computacionais para recuperar e indexar esses dados.

Neste sentido, a extração de características de imagens digitais permite esta recuperação de

forma dinâmica e pode ser dividido em duas fases fundamentais, a extração e possíveis mani-

pulações destes dados e a classificação conforme a busca realizada. Um dos grandes desafios

neste processo é gerar características que realmente representam a imagem em questão e conse-

quentemente estabelecer um classificador que separe e identifique corretamente as classes que

estão sendo analisadas.

1.2 Objetivos 11

1.2 Objetivos

O objetivo geral deste trabalho foi desenvolver um software capaz de extrair as medidas

de bioimagens, mais precisamente folhas de espécies européias, pois não foi encontrado banco

semelhante no Brasil. Para extrair as medidas foi utilizado métodos de análises que podem ser

divididos três grandes categorias: morfológicas, cromáticas e texturas.

Os objetivos específicos:

• Desenvolver um software que tivesse como saída os dados extraídos de bioimagens para

a análise;

• Estudar classificadores para os dados em questão e realizar comparações dos desempe-

nhos;

• Analisar o impacto de métodos de seleção de características no desempenho dos classifi-

cadores selecionados.

1.3 Organização do trabalho

Este trabalho está organizado da seguinte maneira: o capítulo 2 apresenta os conceitos de

imagem digital, textura, histograma, classificação e seleção de características que foram neces-

sários para o desenvolvimento deste trabalho. Os métodos utilizados, softwares e a base de

dados estão descritas no capítulo 3. Os experimentos realizados neste trabalho estão descritos

no capítulo 4, no qual também são apresentados as comparações e desempenhos dos classifi-

cadores. Para finalizar, o capítulo 5 apresenta as conclusões sobre o trabalho desenvolvido, e

possibilidades de trabalhos futuros.

12

2 Revisão Bibliográfica

Antes de realizar algumas etapas deste trabalho, foi necessário um estudo específico de al-

guns conceitos sobre imagens digitais, extração e seleção de características, os quais são apre-

sentados a seguir.

2.1 Imagens Digitais

O termo imagem monocromática, ou simplesmente imagem, refere-se à função bidimensi-

onal de intensidade da luz f(x, y) onde x e y denotam as coordenadas espaciais e o valor de f

em qualquer ponto é proporcional ao brilho da imagem no ponto (GONZALEZ; WOODS, 2000).

Esses pontos são chamados de pixels (contração do inglês de picture element) e, por sua vez,

possuem um valor no sistema de cores RBG (acrônimo do inglês para red, green e blue), isto é,

o valor correspondente a cada cor do nível de intensidade, variando de 0 a 255 para imagens de

8 bits.

Outra forma de representar uma imagem digital é utilizando apenas uma matriz de inteiros.

Cada pixel pode assumir um valor de 0 a 255 representando os tons de cinza, sendo assim,

quanto mais baixo o valor inteiro, mais escuro será a sua tonalidade. Para transformar uma

imagem do sistema de cores RBG para níveis de cinza é necessário unir os canais e nesse

trabalho foi adotado a seguinte equação proposta em (HUANG; LIU, 2007): y = 0, 299R +

0, 587G+ 0, 114B, onde y é o nível de cinza resultante da união dos canais red, green e blue.

A terceira forma de representar uma imagem é atribuir apenas dois valores as intensidades

do pixel, podendo ser 0 e 255. Esta forma é chamada de imagem binária e é normalmente

utilizada para identificar objetos na imagem.

2.2 Vizinhança

O relacionamento básico entre a vizinhança dos pixels pode ocorrer ser de três formas

distintas: Conectividade 4 — onde são verificados os quatros vizinhos de um determinado

pixel central; Conectividade de 8 — onde são verificado os 8 vizinhos de um pixel central e

a Conectividade de m — onde é modificado a conectividade de 8 para conexões onde existem

diversos caminhos diferentes, é necessário contornar estes obstáculos para a identificação da

borda.

Com a conectividade é possível determinar rótulos em objetos ou regiões da imagem, para

2.3 Histograma 13

isso, é necessário percorrer toda a imagem pixel a pixel identificando características em comum,

como intensidade dos canais ou dos níveis de cinza. Após definidos os diferentes rótulos é

possível calcular distancias ou enumerar a quantidade de ítens que a imagem possui, dentre

outras utilidades.

2.3 Histograma

Outro conceito utilizado foi o histograma o qual representa o agrupamento de pixels que

possuem a mesma de intensidade. O histograma caracteriza uma imagem. Contudo contem

muitos valores e com isso pode conter redundâncias (LOPES, 2003), sendo assim para reduzir

o custo computacional e aumentar o desempenho pode-se calcular estatísticas como: média,

mediana e desvio padrão.

O histograma pode ser representado de forma gráfica onde o eixo horizontal será a escala

de tons de cinza e o eixo vertical representa frequência das intensidades contidos na imagem.

O histograma representa de forma geral a distribuição das intensidades dos pixels da imagem,

portanto não mostra informação sobre a distribuição espacial dos objetos em questão na ima-

gem. No entanto pode ser aplicado como um pré-filtro devido ao baixo custo computacional

para a obtenção do mesmo. Além disso, quando normalizado o histograma e invariante a trans-

formações geométricas.

2.4 Método de Otsu

O método de Otsu (OTSU, 1975) tem como função separar o objeto do fundo da imagem,

utilizando a maximização da variança entre as classes. Esta separação é feita pela definição de

um limiar que divide em duas classes C0 sendo o fundo e C1 o objeto, ou vice versa. Para isso

é necessário maximizar uma das funções critérios exibidas nas equações 2.1.

λ =σ2B

σ2W

, κ =σ2T

σ2W

, η =σ2B

σ2T

(2.1)

Antes disto é necessário calcular a probabilidade da distribuição dos níveis de pixels como

definido na equação 2.2.

pi =ni

N, (2.2)

onde ni é o número de pixels no level i e N é o total de pixels da imagem. Utilizando a

probabilidade dos pixels, calcula-se a média total dos níveis de cinzas e a variancia total, segue

abaixo as respectivas equações:

2.4 Método de Otsu 14

µT = µ(L) =L∑i=1

ipi (2.3)

σ2T =

L∑i=1

(i− µT )2pi (2.4)

Ambas equações descritas em (2.3) e (2.4) são calculadas sobre todos os níveis de cinza

[1,...,L]. Em relação a classes (C0 e C1) são calculadas as probabilidades da ocorrências dos

pixels (2.5) e (2.6) e a média dos níveis de cinza (2.7) e (2.8), utilizando as seguintes equações:

ω0 = Pr(C0) =k∑

i=1

pi = ω(k) (2.5)

ω1 = Pr(C1) =L∑

i=k+1

pi = 1− ω(k) (2.6)

e

µ0 =k∑

i=1

iPr(i|C0) =

∑ki=1 ipi

ω0

=µ(k)

ω(k)(2.7)

µ1 =k∑

i=1

iPr(i|C0) =L∑

i=k+1

ipi

ω1

=µT − µ(k)1− ω(k)

(2.8)

onde

ω(k) =k∑

i=1

pi (2.9)

e

µ(k) =k∑

i=1

ipi (2.10)

onde a equação 2.10 é a somatória dos momentos do histograma de [1,...,k].

Como foi descrito anteriormente, o limiar ótimo é o nível k que maximiza η, podendo

ser encontrado de forma alternativa (k∗) por uma busca sequencial de [1,...,L] utilizando a

equação 2.11:

σ2B(k) =

[µTω(k)− µ(k)]2

ω(k)[1− ω(k)](2.11)

2.5 Textura 15

portanto o limiar k∗ é definido como:

σ2B(k

∗) = max1≤k<L

σ2B(k) (2.12)

Posterior a definição do limiar é realizada a binarização realizando uma comparação entre

o valor do nível do pixel (ni) com o valor da limiar (k∗) atribuindo assim os valores desejados

para gerar uma imagem limiarizada.

2.5 Textura

Além do histograma, foi utilizada a textura que normalmente é independente de posição,

orientação, tamanho, forma e brilho da imagem. A definição de textura pode ser dita como: a

disposição ou característica dos elementos constituintes de algo, especialmente no que se refere

à aparência superficial ou à qualidade táctil (HARALICK; SHANMUGAM, 1973). Para imagens, a

textura é uma característica representativa da distribuição espacial dos elementos ou pixels de

uma imagem em uma região. Portanto características obtidas a partir de textura são valores que

representam a variação dos níveis de cinza de uma região ou imagem.

2.6 Matriz de co-ocorrência

Uma forma rápida para demonstrar o uso da textura são os descritores de Haralick. Em

1973 Haralick apresentou a matriz de co-ocorrência e descritores de texturas para classificação

de 6 tipos de rochas (HARALICK; SHANMUGAM, 1973).

A matriz de co-ocorrência, Figura 1, considera a relação entre dois pixels por vez, um cha-

mado de pixel referência e o outro de pixel vizinho. O pixel vizinho escolhido em 4 diferentes

ângulos 0o, 45o, 90o e 135o (direita, esquerda acima, abaixo ou diagonal) assim gerando 4 ma-

trizes de co-ocorrência para análise da textura. Há também a distancia em pixel entre o pixel de

referência e o vizinho.

A matriz de co-ocorrência pode ser especificada por uma matriz de frequências relativas na

qual dois elementos de textura vizinhos, separados por uma distancia d em uma orientação θ

ocorrem em uma imagem, um com uma intensidade 1 e outra com uma intensidade j. Desta

forma, a matriz representa em cada elemento o número de vezes que ocorreu uma transição do

nível de cinza de A para B considerando a distancia e a direção.

2.7 Descritores de Haralick 16

Figura 1: Vizinhança de um pixel central e os diferentes ângulos possíveis (HARALICK; SHAN-MUGAM, 1973).

2.7 Descritores de Haralick

A textura é uma importante característica utilizada para identificar objetos de interesse

em uma imagem digital (HARALICK; SHANMUGAM; DINSTEIN, 1973). Os descritores de Ha-

ralick foram propostos em 1973 e utilizam distribuição de níveis de cinza, e as matrizes de

co-ocorrência para avaliar as diferentes intensidades, podendo ser definidas como: fina, grossa,

lisa, ondulada, irregular ou linear. Os 13 descritores propostos estão relacionados abaixo de 4.1

a 4.13:

• Segundo momento angular (Angular Second Moment)

f1 =∑i

∑j

= p(i, j)2 (2.13)

• Contraste (Contrast)

f2 =

Ng−1∑n=0

n2

N∑i=1

g

N∑j=1

gp(i, j)

|i−j=N |

(2.14)

• Correlação ou Variância (Correlation)

f3 =

∑i

∑j(i, j)p(i, j)− µxµy

σxσy(2.15)

• Variância da soma (Sum of Square: Variance))

f4 =∑i

∑j

(i− µ)2p(i, j) (2.16)

2.7 Descritores de Haralick 17

• Momento Diferença Inverso (Inverse Difference Moment)

f5 =∑i

∑j

1

1 + (i− j)2p(i, j) (2.17)

• Soma das médias (Sum average)

f6 =

2Ng∑i

ipx+y(i) (2.18)

• Soma da Variância (Sum variance)

f7 =

2Ng∑i

(i− f8)2px+y(i) (2.19)

• Soma da Entropia (Sum entropy)

f8 =

2Ng∑i

px+y(i) log{px+y(i)} (2.20)

• Entropia (Entropy)

f9 = −∑i

∑j

p(x, y) log(p(x+ y)(i)) (2.21)

• Diferença da Variância (Difference variance)

f10 = varianceofpx−y (2.22)

• Diferença da Entropia (Difference Entropy)

f11 =

Ng−1∑i=0

px−i(i)log(px−y(i)) (2.23)

• Informação da Medida de correlação 1 (Information measure of correlation 1)

f12 =HXY −HXY 1

max{HX,HY }(2.24)

• Informação da Medida de correlação 2 (Information measure of correlation 2)

f13 = (1− exp[−2.0(HXY 2−HXY )])12 (2.25)

HXY = −∑i

∑j

p(i, j)log(p(i, j)) (2.26)

Deve-se atentar onde o resultado equação 4.14 é necessário para as equações 4.12 e 4.13.

2.8 Histograma de alteração quantificada 18

2.8 Histograma de alteração quantificada

Outro método para análise de textura foi proposto por Chao-Bing e Quan Lin em (HUANG;

LIU, 2007). Este método possui a idéia de verificar todas as combinações de variações do nível

de cinza de um determinado pixel entre os seus vizinhos nas quatro direções e com a diferença

da variação é são usados para a constrção de um histograma de 40 posições (bins). Por tratar da

variação das intensidades, o método é livre de variação entre rotação e translação da imagem.

Para o calculo deste histograma é tomado um pixel como referencia em uma determinada

coordenada (i,j). A partir disso é tomado um raio r formando então um conjunto Nr(i,j) con-

forme mostrado em destaque na figura 2.

Figura 2: Matriz da vizinhança de raio 1 centrado em (i,j).

Para calcular as variações é adotado uma imagem em escala de cinza onde yr e r o raio

desejado para verificar a variação. Considerando as coordenadas espaciais é possível definir as

seguintes equações:

|yr(i− r, j)− yr(i+ r, j)| = Hyr (i, j) (2.27)

É referente a variação na horizontal;

|yr(i, j − r)− yr(i, j + r)| = V yr (i, j) (2.28)

É referente a vertical;

|yr(i− r, j − r)− yr(i+ r, j + r)| = Dyr (i, j) (2.29)

É referente a diagonal; e

|yr(i+ r, j − r)− yr(i− r, j + r)| = Ayr(i, j) (2.30)

É referente a anti-diagonal. É importante ressaltar que essas medidas são obtidas em relação

a um pixel central (i, j) e se repete em todos os pixels da imagem.

Após obter os valores é calculado a média dos valores utilizando a equação 2.31:

2.9 Extração de características 19

v(i, j) = [Hyr (i, j) + V y

r (i, j) +Dyr (i, j) + Ay

r(i, j)]/4 (2.31)

Depois da média é construído o histograma não uniforme utilizando as seguintes regras:

• se v(i, j) ∈ [0;15,5], são divididos uniformemente em 16 posições (0,1,...,15);

• se v(i, j) ∈ ]15,5;35,5], são divididos uniformemente em 10 posições (16,17,...,25);

• se v(i, j) ∈ ]35,5;85,5], são divididos uniformemente em 10 posições (26,27,...,35);

• se v(i, j) ∈ ]85,5;115,5], são divididos uniformemente em 3 posições (36,37,38);

• se v(i, j) ∈ ]115,5;225], são divididos uniformemente em 1 posições (39);

Nesse trabalho, adotamos o histograma completo como característica referente a textura da

imagem.

2.9 Extração de características

Chama-se extração de características todo o conjunto de operações de processamento e

análise de imagens realizadas com a finalidade de obter valores numéricos que caracterizam

as imagens ou partes delas. Também pode ser definido como sendo a captura das informações

mais relevantes de um dado fornecido como entrada (DEVIJVER; KITTLER, 1982).

Essas características podem ser agrupadas em quatro grandes categorias: características

morfológicas, cromáticas, texturas e estruturais ou contextuais. Dentre estas adotamos as ca-

racterísticas morfológica, cromáticas e de textura.

As características morfológicas são as medidas que compõe a imagem, não levando em

conta a intensidade dos pixels podendo ser calculadas através de imagens binárias geradas de

uma imagem colorida, como exemplo: circularidade, largura, perímetro e área, dentre estas a

área foi selecionada neste trabalho.

Características cromáticas são as que descrevem a cor, ou composição espectral da radiação

emitida ou refletida pelos objetos, quantificado pela intensidade dos pixels em diferentes bandas

espectrais ou cores. Neste trabalho, como descrito anteriormente, foram utilizadas as medidas

estatísticas obtidas através do histograma da imagem. Estas medidas foram: mediana, média

e desvio padrão. Já com relação à textura, foram utilizadas características obtidas por meio da

aplicação de matrizes de co-ocorrência e dos descritores de Haralick.

2.10 Classificação 20

2.10 Classificação

A classificação é uma forma de analisar um conjunto de dados e extrair modelos que levam

a definição ou a uma categoria (classe). Dentro da classificação é possível dividir em 2 esti-

los: aprendizagem supervisionada — onde as instâncias de treinamento contém as classes para

exemplos e com isso é possível conhecer os valores desejados como saída e aprendizagem não

supervisionada — onde o conjunto de treinamento não possui indicação das classes de entradas

em que são divididos, sendo necessário a utilização de raciocínio probabilístico para o conhe-

cimento das classes (DUDA; HART; STORK, 2001). O processo de classificação supervisionado

pode ser dividido em duas fases. A primeira fase é chamada de treinamento, onde o classificador

é construído a fim de determinar o grupo ou obter a definição de classes por meio dos atributos

obtidos como entrada, que podem ser referidos como: exemplos, instâncias ou objetos (HAN;

KAMBER, 2006).

A segunda fase está verdadeiramente a classificação, onde o modelo criado na primeira fase

é utilizado para definir as classes de novas instâncias não conhecidas. Para a classificação é

possível utilizar vários métodos. Neste trabalho abordamos os seguintes classificadores: Naive

Bayes (JOHN; LANGLEY, 1995), Multi class Classifier (HEMPSTALK; FRANK, 2008), Multilayer

Perceptron (GARDNER; DORLING, 1998), Adaboost (FREUND; SCHAPIRE et al., 1996) (FREUND;

SCHAPIRE; ABE, 1999) Naive Bayes, Adaboost J48 e Adaboost Multilayer Perceptron.

• Classificação por árvore de decisão: a árvore de decisão utiliza o conceito de árvore para

classificar os dados, tomando assim um conjunto de atributos como entrada e executando

uma sequencia de testes, onde cada nó define um teste em um dos atributos; as ramifica-

ções são os possíveis resultados necessários para alcançar o próximo nó ou a folha; e as

folhas são as predições das classes finais, ou seja, a saída do classificador. Este conceito é

um dos mais simples e mais bem-sucedidas entre os algoritmos de classificação (RUSSEL;

NORVIG, 2004).

A Figura 3 exibe um exemplo para a classificação de frutas realizando testes em relação

a cor, a forma, o sabor e o tamanho. E como a saída do classificador temos as classes de

frutas.

• Classificador Bayesiano: a decisão Bayesiana é fundamental para a indução em proble-

mas de classificação de padrões. O classificador Naive Bayes supõe que os valores dos

atributos são independentes uns dos outros em relação a uma classe. Por isso também

pode ser encontrado na literatura como classificador ingênuo. Neste modelo, a classe é

a raiz e os atributos são as folhas. A classificação é feita aplicando o teorema de Bayes

para calcular a probabilidade da classe dado os atributos de entrada, sendo feita de forma


Figura 3: Árvore de decisão - Frutas.

indutiva, calculando a probabilidade condicional de cada atributo, dado a classe em ques-

tão. Abaixo na equaçao 2.32 é apresentado a regra de Bayes, onde d é o valor observado

e hi são as hipóteses.

v(hi, d) = αP (d|hi)P (hi). (2.32)

• Redes Neurais: a rede neural é um modelo que simula um neurônio e suas conexões para

realizar uma determinada classificação. Um neurônio tem como função coletar, processar

e enviar os sinais elétricos. Acredita-se que os neurônios e a rede que eles configuram de-

terminam a capacidade do processamento de informações do cérebro. Desta forma, pes-

quisadores utilizaram estas propriedades para implementar uma rede capaz de aprender

com as entradas de dados e com isso realizar classificação. Uma rede neural é constituída

por conjuntos de nós ou camadas os quais estão associados entre si por vínculos. Um

vínculo é utilizado para propagar as informações entre os nós. Quando uma condição for

verdadeira, ela se torna ativa e é realizada a propagação dos dados. O Multilayer Per-

ceptron, para diminuir as limitações do conhecimento, utiliza três recursos diferenciais:

o modelo de cada neurônio (nós) inclui uma função de ativação não linear o que o dife-

rencia. A rede possui uma ou mais camadas ocultas entre a camada de entrada e saída

aumentando o espaço de hipóteses que a rede pode representar. O terceiro diferencial,

a rede possui um alto grau de conectividade entre as camadas como pode ser visto na

Figura 4.


Figura 4: Redes Neurais.

• Adaboost: é definido como boosting todo método que tem por objetivo melhorar a acu-

rácia de um dado classificador (FREUND; SCHAPIRE et al., 1996). O método Adaboost foi

introduzido em 1995 por Freund e Schapire (FREUND; SCHAPIRE, 1995) e tem a idéia de

tomar um conjunto de entrada (x1,y1),...,(xn,yn), onde cada xi são os atributos e yi são

as classes referente aos atributos, assim na fase de treinamento busca encontrar o con-

junto mais fraco, ou seja, que terá o menor desempenho e enfatizar o treinamento desse

conjunto, diminuindo a ênfase nas classes de melhores classificação. Essa verificação é

feita utilizando um coeficiente de erro na fase de treinamento de um classificador, para

isso, cada rodada da fase de aprendizagem é dado ao classificador um subconjunto Dt

buscando a menor acurácia, atribuindo a este conjunto um peso maior aumentando a im-

portância diante todo o conjunto. Portanto na fase de treinamento terá um peso maior as

classes mais difíceis para o classificador, fazendo com que, o algoritmo "aprenda"a lidar

com os dados complexos melhorando o desempenho da classificação como um todo.

Quando se desenvolve sistemas que envolvem a detecção, diagnósticos ou previsão de re-

sultados é importante validar os seus resultados de forma a qualificar seu poder discriminativo

e identificar um método adequado ou não para os dados em questão.

2.11 Análise de Precisão 23

2.11 Análise de Precisão

Para conhecer a precisão é necessário realizar o teste em um conjunto não visto e após a

classificação comparar o resultado com a classe correta. Neste processo de teste é utilizado um

conjunto de exemplos chamado de conjunto de teste. Portanto se for realizado o treinamento

em todo o conjunto disponível é necessário a coleta de novos exemplos para que seja analisado

o desempenho do classificador.

Uma técnica empregada para utilizar somente um conjunto para aprendizagem e teste é a

validação cruzada (k-fold cross validation) que consiste em dividir a base de dados em k partes

ou folds, D1, D1, ..., Dk, de tamanhos aproximadamente iguais. O conjunto de treinamento e

de teste é executado pelo algoritmo de classificação k vezes e em cada performance é reservado

uma parteDi para conjunto de testes e o restante das partes são utilizada para o treinamento. Ao

final, a acurácia total é calculada pela média dos resultados obtidos em cada etapa, obtendo-se

assim uma estimativa da qualidade do modelo de conhecimento gerado e permitindo análises

estatísticas.

Após realizar o teste é possível obter valores estatísticos referente ao desempenho do clas-

sificador como: recall e curvas ROC (MARTINEZ; LOUZADA-NETO; PEREIRA, 2003).

2.11.1 Verdadeiro Positivo e Falso positivo

Na fase de teste uma classe é classificada e com o resultado final (classe predita) é colocado

contra a classe real obtido na entrada de dados, este resultado pode ser classificado como:

verdadeiro positivo e falso positivo.

Considerando um conjunto de dados com duas classes C1 e C2, é realizada uma classifica-

ção e o temos as classes preditas Cp1 e Cp2. Um resultado que satisfaça a condição Cp1 = C1

é dado como verdadeiro positivo. Caso o resultado seja Cp1 = C2 é dado por falso positivo. A

Figura 5 que exibe essas condições.

Figura 5: Quadro de verificação - Verdadeiro positivo e falso positivo.

2.11 Análise de Precisão 24

2.11.2 Precision e Recall

Ao utilizar precision e recall (ALMEIDA et al., 2010), o conjunto de rótulos possíveis para

uma determinada instância é dividido em dois subgrupos, um dos quais é considerado relevante

para os objetivos da métrica. Recall é então calculado como a fração de instâncias corretas

entre todas as instâncias que realmente pertencem ao subconjunto relevante. A precisão é a

fração de instâncias corretas entre aqueles que o algoritmo considera pertencer ao subconjunto

relevante. A precisão pode ser vista como medida de exatidão ou fidelidade, enquanto o recall

é uma medida de completude. As equações 2.33 e 2.34 exibem como calcular esses resultados.

Precision =V erdadeiroPositivo

V erdadeiroPositivo+ FalsoPositivo(2.33)

Recall =V erdadeiroPositivo

V erdadeiroPositivo+ FalsoNegativo(2.34)

2.11.3 Curvas ROC

A curva ROC (Figura 6) foi desenvolvida por engenheiros elétricos e engenheiros de siste-

mas de radar durante a Segunda Guerra Mundial para detectar objetos de inimigos em campo

de batalha. Desde então a análise da curva ROC tem sido utilizada em medicina, radiologia,

psicologia e outras áreas por muitas décadas e, mais recentemente, foram introduzidas a áreas

como aprendizado de máquina e mineração de dados. A curva ROC é útil em domínios nos

quais existe uma grande desproporção entre as classes ou quando se deve levar em considera-

ção diferentes custos/benefícios para os diferentes erros/acertos de classificação.

Figura 6: Curva característica de operação do receptor (Curva ROC).

2.12 Seleção de características 25

O Gráfico ROC é baseado na probabilidade de detecção, ou taxa de verdadeiros positivos

e na probabilidade de falsos alarmes ou taxa de falsos positivos. Alguns pontos no gráfico

merecem destaque. O ponto (0,0) representa a estratégia de nunca classificar um exemplo como

positivo. Modelos que correspondem a esse ponto não apresentam nenhum falso positivo, mas

também não conseguem classificar nenhum verdadeiro positivo. A estratégia inversa, de sempre

classificar um novo exemplo como positivo, é representada pelo ponto (1,1). O ponto (0,1)

representa o modelo perfeito, onde todos os exemplos positivos e negativos são corretamente

classificados. O ponto (1,0) representa o modelo que sempre faz predições erradas.

2.12 Seleção de características

A seleção de características é um problema que vem sendo estudado, sobretudo na área de

reconhecimento de padrões, desde a década de 70 (MUCCIARDI; GOSE, 1971).

Com a explosão do volume de dados, a seleção de atributos se tornou indispensável pas-

sando a um problema para pesquisas e estudos. Na área de reconhecimento de padrões a seleção

de característica tem por objetivo reduzir o volume de dados e aumentar a precisão do classi-

ficador, porém outros fatores podem ser vantajosos como o aumento da compreensibilidade do

conceito e aumento da robustez de aprendizagem.

Uma importante consideração feita em (JOHN et al., 1994) é que boa parte das pesquisas

realizadas assume como válido o princípio da monotonicidade ou seja, o aumento do conjunto

de atributos melhora a performance do classificador. No entanto, ao acrescentar mais caracte-

rísticas o erro de estimação também aumenta devido a quantidade do espaço de busca para a

construção de um modelo adequado.

Outro objetivo da seleção de características é evitar o conhecido problema de "maldição

da dimensionalidade", o qual é um fenômeno onde o número de amostras de treinamentos

requeridas par ama classificação satisfatória é dada por uma função exponencial da dimensão

do espaço de características. Temos por exemplo, se cada característica xi for dividida em M

divisões ou classe, cada uma delas associada a uma determinada classe yi, então o número total

de divisões é Md e passa a crescer exponencialmente com a dimensionalidade do espaço de

características. Considerando que cada divisão deve conter pelo menos uma amostra, então a

quantidade de amostra disponível para o treinamento também cresce exponencialmente (LOPES,

2011).

Segundo Dash e Liu (DASH; LIU, 1997) a seleção de características pode ser apresentada de

quatro maneiras diferentes:


• Idealizada: o objetivo é encontrar o menor subconjunto de atributos necessário e sufici-

ente para descrever o conceito alvo;

• Clássica: o objetivo é selecionar um subconjunto de atributos M a partir de um conjunto

de N atributos, com M < Nm de forma que M é o melhor subconjunto de acordo com

uma função de avaliação.

• Melhora a taxa de precisão: o objetivo é selecionar um subconjunto de atributos de forma

a aumentar a precisão da classificação em relação ao conjunto de todos os atributos ou,

então, reduzir o conjunto de atributos inicial sem diminuir a taxa de precisão ou então

melhorar esta taxa.

• Aproximação da distribuição original das classes: o objetivo é selecionar o menor con-

junto possível de atributos que determine a distribuição das classes sendo a mais proxima

possível de utilizar todos os atributos.

As pesquisas relacionadas à seleção de atributos tem por objetivo a melhoria de um método

de classificação ou regressão quanto a sua taxa de precisão, velocidade para a classificação,

tempo de aprendizado e compreensiblidade.

Para a redução de dimensionalidade podem ser utilizados duas abordagens: a extração de

características e métodos de seleção. Na extração de características novas medidas são obtidas

a partir do conjunto inicial por meio de analises estatísticas ou combinação de atributos. Por

outro lado, os métodos de seleção podem ser divididos em três abordagens, sendo elas: filtros,

Wrappers e Híbridas. Na abordagem dos filtros, os atributos são selecionados de maneira in-

dependente, considerando as características independentes e não possuem qualquer forma de

feedback das informações. Portanto as variáveis são avaliadas por uma medida e as que não

satisfazerem uma condição são eliminadas. Na abordagem Wrapper, o algoritmo de seleção

utiliza um classificador em conjunto como parâmetro da seleção. Na abordagem híbrida são

combinadas os filtros e wrappers para realizar a seleção de características.

2.12.1 Método de Seleção

Este modelo possui como ideia principal a utilização de um algoritmo de classificação,

como caixa preta (black box), assim cada subconjunto de dados selecionados para o teste é

analisado. A cada teste, a acurácia alcançada é utilizada como parâmetro para a seleção tendo

o objetivo a maximização da mesma. O subconjunto com a melhor acurácia é o selecionado no

final do processo e retornado como resultado (KOHAVI; JOHN, 1997).


2.12.2 Método de Busca

Um método de busca tem como objetivo encontrar soluções para os problemas gerando

sistematicamente novos estados. Dentre os diferentes métodos de busca há duas estratégias de

busca: sem informação — gera diferentes estados (subconjuntos) em busca do objetivo sem

restrições ou regras; e com informação — utiliza uma heurística para definir os estados mais

promissores (RUSSEL; NORVIG, 2004).

O método adotado por este trabalho foi o best-first, também conhecido como busca recur-

siva pelo melhor (BRPM) (RUSSEL; NORVIG, 2004; SÁNCHEZ et al., 2009). Esta busca possui o

princípio de encontrar a solução mais próxima ao objetivo, que por sua vez indiretamente levará

ao resultado mais rapidamente. Esta estrutura de busca utiliza um valor f do melhor caminho ao

objetivo. No decorrer do processo, o custo da distância do nó atual até o objetivo é comparado

ao valor de f e caso esse valor for superado, a busca reinicia partir do nó salvo em memória.

O valor de f pode ser atualizado conforme a busca trabalhe, portanto sempre terá um caminho

alternativo para chegar ao destino. Neste trabalho, o custo é identificado pela precisão do algo-

ritmo de classificação em função do método Wrappers. No software Weka essa heurística f é

chamado de Hill-Climbing (CARUANA; FREITAG, 1994).

28

3 Materiais e Métodos

O desenvolvimento deste trabalho foi dividindo nas seguintes etapas: 1) definição de ca-

racterísticas; 2) definição do banco de dados para treinamento e teste; 3) implementação dos

extratores; 4) aplicação dos métodos de classificação e seleção com o aplicativo WEKA (HALL

et al., 2009).

Neste capítulo será descrito quais foram as etapas e escolhas necessárias para o desenvol-

vimento desta pesquisa.

3.1 Definição de características

Este trabalho teve como ênfase a análise da textura, que é definido como o aspecto de

uma superfície ou objeto que permite identificar e distinguir entre outras superfícies quando

tocado ou observado, para caracterizar este padrão, foram utilizadas as seguintes teorias: os

descritores de Haralick (HARALICK; SHANMUGAM; DINSTEIN, 1973) e Histograma de alteração

quantificada ( Quantized Compound Change Histogram) (HUANG; LIU, 2007).

Além disso foram acrescentados medidas em relação a forma e cor. A característica mor-

fológica é a análise quanto ao tamanho e posição da folha e foi abordado da seguinte maneira:

perímetro, área e distância entre o centro e a borda das folhas. As características baseadas em

cores são as mais utilizadas devido ao seu baixo custo computacional. Dentre as diversas téc-

nicas, a mais utilizada é o histograma da imagem, ou seja, é a frequência de ocorrências de um

nível de pixel na imagem.

3.2 Descrição da Base de Imagens

O presente trabalho teve como entrada os dados do banco de dados do ImageClef (MÜLLER

et al., 2010) edição de 2011, no qual foram disponibilizadas pela primeira vez um banco deste

gênero descrito como identificação de plantas (Plant identification). O banco de dados possui

folhas de 71 espécies de árvores da área mediterrânea francesa. Contém aproximadamente

5436 imagens subdivididas em 3 diferentes tipos de imagens: digitalização, fotos que simulam

a digitalização e fotos naturais.

Digitalização: esta classe de imagens possui 3070 imagens, as quais foram coletadas entre

julho e setembro de 2009 e junho a outubro de 2010. Foi criado por pesquisadores, biólo-

gos e voluntários pertencentes a uma rede social chamado de Telabotanica <http://www.tela-

3.3 Implementação dos extratores 29

botanica.org/site:accueil?langue=en>. A Figura 7 exibe 2 exemplos de folhas digitalizadas.

Figura 7: Imagem de duas folhas digitalizadas. a) Pittosporum tobira e b) Nerium oleander.

Fotos como digitalização: são disponibilizadas 897 imagens para a segunda classe, as quais

são similares a uma digitalização e podem apresentar o fundo um pouco uniforme e apresentar

sombras nas folhas. A Figura 8 exibe dois exemplos de imagens desta classe.

Figura 8: Imagem de duas folhas imagem que simulam a digitalização. a) Eriobotrya japonicae a b) Magnolia grandiflora.

Fotos naturais: a terceira classe de imagens apresenta folhas em paisagens naturais e exis-

tem 1469 imagens, tiradas diretamente nas árvores. As imagens podem apresentar como fundo:

troncos, várias folhas, a terra ou o céu. A Figura 9 exibe dois exemplos dessa classe.

Figura 9: Imagem de duas folhas naturais. a) Ilex aquifolium a b) Vitex agnus-castus.

3.3 Implementação dos extratores

Após a definição das características e dos extratores foi necessário implementar um soft-

ware capaz de processar as imagens e extrair as características definidas neste capítulo. Para

3.3 Implementação dos extratores 30

isso foi utilizado a linguagem JAVA (ORACLE JAVA, 2012) que possui a vantagem da portabili-

dade entre diferentes sistemas operacionais utilizando a máquina virtual. Outra vantagem foi a

utilização da biblioteca JAI (JAVA Advanced Image) que contribui para a manipulação de ima-

gens. Como ferramenta de desenvolvimento foi utilizado o NetBeans IDE versão 7.0.1 e todas

essas ferramentas são de uso livre.

O jImageFature (JIMAGEFEATURE, 2012), foi desenvolvido durante este trabalho e se apre-

senta como um dos resultados deste trabalho, pode ser livremente encontrado no Google Code,

no seguinte link: <http://code.google-.com/p/jimagefeature/>. Com este software é possível

abrir uma imagem em questão e visualizar os descritores de Haralick, estatísticas do histo-

grama, realizar medidas entre as características desejadas entre várias imagens de uma deter-

minada pasta, bem como exportar estas características com o padrão ARFF, suportado pelo

WEKA.

O software foi organizado nos seguintes pacotes: Controle (Control), Interface gráfica

(GUI) e Útil. No pacote de Controle, ficaram as classes pertinentes aos cálculos e proces-

sos necessários para a geração das características e resultados. Estas classes são: Concorrência,

responsável pela geração das matrizes de co-ocorrência; Haralick, responsável pelos cálculos

dos descritores; Histogramas (histograms), responsável pela geração dos histogramas e cálculos

do mesmo; Forma (shape), responsável pelo cálculo da área das folhas e medidas relacionadas

a forma; Metricas (metrics) onde é possível obter medidas de distância dos vetores desejados;

Características (features), classe responsável pela comunicação com as demais classes do soft-

ware; Binarização por Otsu (OTSU, 1975) (BinarizeOtsu), responsável por realizar a binarização

da imagem utilizando o método de Nobuyuki Otsu (OTSU, 1975); Escala de cinzas (grayscale),

responsável em transformar uma imagem para escala de cinzas utilizando a média dos canais

vermelho red, azul blue e verde green (RBG); QCCH ( Quantized Compound Change Histo-

gram), responsável por realizar os cálculos do histograma de alteração quantificada definido

por, (HUANG; LIU, 2007); Opções (options), onde são controladas as opções selecionadas pelo

usuário ao gerar os dados e o último pacote, o de interface gráfica onde contém as classes

responsáveis pela interação com o software.

O último pacote, útil, possui a classe responsável pela gravação do arquivo de texto ge-

rado pelo software e a responsável por mostrar uma janela de progresso do processo que está

execução.

Para um melhor controle dos atributos gerados para a classificação, foi definido o vetor

de características que na sua forma completa apresenta a seguinte configuração: Posição [1

- 52] Haralick, [53] Mediana, [54] Média dos Pixel, [55] Desvio padrão do histograma, [56]

Área, [57] Área círculo circunscrito, [58] Área do círculo inscrito, [59] Média da distância entre

3.4 Ferramenta WEKA 31

centro e borda, [60 - 99] QCCH (Quantized Compound Change Histogram, ou seja, Histograma

de Alteração Quantificada).

Com o vetor definido, foi necessário implementar a exportação dos dados para o software

WEKA, conforme descrito abaixo na seção 3.4.

3.4 Ferramenta WEKA

A ferramenta Weka (HALL et al., 2009) resumidamente é um software do tipo open source

para a mineração e classificação de dados. Um classificador (ou modelo de classificação) é

utilizado para identificar a classe à qual pertence uma determinada observação de uma base de

dados, a partir de suas características (seus atributos).

O Weka trabalha com arquivos de entrada do tipo ARFF 10, que corresponde a um arquivo

de texto contendo um conjunto de observações, precedido por um pequeno cabeçalho. O ca-

beçalho é utilizado para fornecer informações a respeito dos campos que compõem o conjunto

de observações. Dessa forma, antes da mineração de dados, a ferramenta pode verificar alguma

inconsistência na base de dados e sinalizá-la.

O arquivo possui um cabeçalho que é definido por @relation, posteriormente terá a sequên-

cia de atributos definido por @attribute e para finalizar terá o comando @data para definir o

início das observações. Por padrão, o último atributo apresentado na relação será o atributo

classe, porém isso pode ser alterado na interface do programa.

Figura 10: Exemplo arquivo ARFF importado pelo Software WEKA.

32

4 Resultados e Discussões

Os resultados foram divididos em duas seções: resultados 1 - classificação e resultados 2 -

seleção e classificação. Nos resultados 1 foi realizado uma comparação entre os classificadores

com todo o conjunto de atributos. Já nos resultados 2 foi acrescentado a seleção de caracterís-

ticas para reduzir a quantidade de atributos e apresentar qual o impacto da redução em relação

a precisão, o peso e a velocidade de criação do modelo de aprendizagem.

4.1 Resultados 1 - Classificação

Neste primeiro caso foi utilizado todo o vetor de características conforme especificado na

seção 3.3. Como conjunto de dados foram utilizados apenas as imagens do tipo digitalização,

eliminando todas imagens do tipo natural. Assim como foi estabelecido um limiar de 20%

da classe que possui a maior quantidade de imagens. O primeiro filtro foi aplicado em con-

sequência desse trabalho não abordar o uso de um método de segmentação, que por sua vez

está definido como futuras abordagens de pesquisa. O segundo filtro foi aplicado já que clas-

ses com poucas instâncias podem não ser utilizadas no conjunto de treinamento, diminuindo o

desempenho da classificação.

Conforme citado na seção de classificação, foi analisado os classificadores Naive Bayes (Fi-

gura 12), Multilayer Perceptron (Figura 13), Multi Class Classifier (Figura 14), Adaboost-J48

(Figura 16), Adaboost Multilayer Perceptron (Figura 17) e Adaboost Naive Bayes (Figura 15).

Com os resultados obtidos foi possível observar as diferenças entre os classificadores a partir

das análises das curvas ilustradas no Figura 11, no qual o eixo das abscissas são representadas

as respectivas classes de imagens folheares e no eixo das ordenadas a média de acertos obtidos

pelos classificadores.

Considerando o desempenho dos classificadores, apenas o classificador Naive Bayes apre-

sentou média de acerto inferior a 70%, todos os demais ficaram acima desse patamar.

Para a análise dos classificadores, foi utilizado a técnica cross-validation com 10 folds. Com

os resultados obtidos, foi utilizado o percentual de acertos obtidos em cada espécie analisada.

A Tabela 1 exibe os percentuais de acertos obtidos de cada classificador.

Para comparar os classificadores (Tabela 1) é importante observar os valores de Verdadeiro

Positivo, ROC, precisão e Sensibilidade que quanto mais próximo de 1 melhor foi a classifica-

ção e para os valores de Falso Positivo, quanto mais próximo de zero, melhor a classificação,

mostrando que esta medida é complementar.

4.1 Resultados 1 - Classificação 33

Figura 11: Acertos obtidos por cada classificador nas classes disponíveis.

Tabela 1: Percentuais de acertos obtidos pelos classificadores.Classificador Verdadeiro Falso Precisão Sensibilidade ROC área

Positivo Positivo

Naive Bayes 0,449 0,010 0,485 0,449 0,931

Multilayer Perceptron 0,726 0,005 0,737 0,726 0,933

Multi Class Classifier 0,722 0,006 0,755 0,722 0,948

Adaboost Naive Bayes 0,449 0,010 0,485 0,449 0,931

Adaboost J48 0,794 0,004 0,795 0,794 0,979

Adaboost Multilayer Perceptron 0,726 0,005 0,737 0,726 0,938

As próximas figuras exibem separadamente as curvas de acertos por classe para cada clas-

sificador considerado nesse trabalho:


Figura 12: Curvas de acerto para o classificador Naive Bayes.

Figura 13: Curvas de acerto para o classificador Multilayer Perceptron.


Figura 14: Curvas de acerto para o classificador Multi Class Classifier.

Figura 15: Curvas de acerto para o classificador Adaboos Naive Bayes.


Figura 16: Curvas de acerto para o classificador Adaboos J48.

Figura 17: Curvas de acerto para o classificador Adaboos Multilayer Perceptron.

Dentre os classificadores analisados a média de acertos obtida podem organizar na seguinte

ordem de precisão: Adaboost J48 — 79,352%, Adaboost Multilayer Perceptron — 72,643%,

Multilayer Perceptron — 72,643%, Multi Class Classifier — 72,228%. Os classificadores Naive

Bayes e o Adaboost Naive Bayes obtiveram o mesmo resultado em 44,922%.


Em relação às classes, foi observado que a Cornus Mas (Figura 18), com 35 instancias foi a

classe mais simples para a classificação. O único classificador que não obteve 100% de acerto

foi o Multi Class Classifier com 97,1%.

A classe considerada mais complexa, i.e com menor taxa de acerto entre os classificadores,

foi a Laurus Nobilis (Figura 19), que obteve uma média de acertos em 32,16% em um total de 58

instâncias. O classificador com a maior precisão para esta classe foi o Adaboost J48 com 65.5%

de acerto. Em segundo lugar ficou o classificador Multi Class Classifier com 51,7% de acertos.

O classificador Multilayer perceptron e Adaboost Multilayer apresentaram um resultado de

37,9%.

Figura 18: Folhas da classe Cornus Mas.

Figura 19: Folhas da classe Laurus Nobilis.

Dentre as classes é possível visualizar diferentes níveis de dificuldades para a classificação.

A Tabela 2 e Figura 20 apresenta as três classes mais "fáceis", i.e., apresentaram maior índice

de acertos e a Tabela 3 e Figura 21 exibe as três classes mais complexas dentre as classes

analisadas.


Tabela 2: Melhores acertos obtidos em relação às classesCornus Mas Melia Azedarach Acer Opalus

Naive Bayes 1 0,976 0,926

Multilayer Perceptron 1 0,976 1

Multi Class Classifier 0,902 0,927 0,926

Adaboost Naive Bayes 1 0,976 0,926

Adaboost-J48 1 0,976 0,926

Adaboost Multilayer Perceptron 1 0,976 1

Figura 20: Folhas das classes: Cornus Mas, Melia Azedarach e Acer Opalus.

Tabela 3: Piores acertos obtidos em relação às classes.Laurus Nobilis Acer Platanoides Acer Campestre

Naive Bayes 0 0 0,09

Multilayer Perceptron 0,379 0,581 0,373

Multi Class Classifier 0,517 0,323 0,597

Adaboost Naive Bayes 0 0 0,09

Adaboost-J48 0,655 0,645 0,687

Adaboost Multilayer Perceptron 0,379 0,581 0,373

Figura 21: Folhas das classes: Laurus Nobilis, Acer Platanoides e Acer Campestre.

As dificuldades em se obter um padrão na classificação podem estar relacionadas às seguin-

tes questões:

• Variação da forma de margem da folha: uma mesma classe pode apresentar diferentes


margens dependendo da condição que foi registrado a imagem, um exemplo disto é a

classe Quercus Ilex exibida na Figura 22;

Figura 22: Variação de forma - Quercus Ilex .

• Numero de lóbulos: a mesma classe poderá apresentar diferentes números de lóbulos.

Para a classe exemplificada abaixo na Figura 23, Ficus Carica, poderá apresentar folhas

com 3, 5 ou 7 lóbulos;

Figura 23: Número de Lóbulos - Ficus Carica .

• Forma geral e as variações de espessura: a forma poderá ser diferente entre as folhas, o

mesmo acontece com a espessura. Na Figura 24 temos como exemplo folhas da classe

Corylus Avellana;

Figura 24: Variação de forma geral - Corylus Avellana.

• Coloração: A coloração poderá ser diferente, apresentando diferente níveis de cinza para

uma mesma classe. Temos na Figura 25 a classe Cotinus Coggygria;

• Número de folhetos de uma folha composta: um exemplo de uma classe seria a Flaxinus

Angustifolia mostrada na Figura 26, que pode ter folhas de 3, 5, 7, 9 ou 11 folhetos;

4.2 Resultados 2 - Seleção e classificação 40

Figura 25: Coloração diferente - Cotinus Coggygria.

Figura 26: Número folhetos - Flaxinus Angustifolia.

• Reflexão da luz (utilização de flash): para as imagens do tipo digitalização existem os

problemas em relação ao flash que poderá estar habilitado ou não, alterando assim a

intensidade da luz que incide sobre a folha (Figura 27).

Figura 27: Reflexão da luz - Magnolia Grandiflora.

Para as classes relacionadas acima, foram exibidos os resultados obtidos por cada clas-

sificador na Tabela 4. Cada classificador se comportou diferente em relação às dificuldades,

destacando os classificadores Multi Class Classifier com a média de acerto em 70,5% e o Ada-

boost Multilayer Perceptron com a média de 70%. Novamente os classificadores Naive Bayes e

Adaboost Naive Bayes apresentaram os piores resultados, apresentando uma taxa de acerto de

21%.

4.2 Resultados 2 - Seleção e classificação

Neste segundo caso foi utilizado todo o vetor de características conforme especificado na

seção 3.3 resultando um vetor de características da seguinte configuração: Posição [1 - 52] Ha-

ralick sendo que possui 13 posições para cada matriz de coocorrência (0◦, 45◦, 135◦, 180◦), [53]

Mediana, [54] Média dos Pixel, [55] Desvio padrão do histograma, [56] Área, [57] Área círculo

circunscrito, [58] Área do círculo inscrito, [59] Média da distancia entre centro e borda, [60 -


Tabela 4: Classes e seus índices de acertos durante a classificação.Quercus Ficus Corylus Cotinus Fraxinus Magnolia

Ilex Carica Avellana Coggygria Angustifolia GrandifloraNaive Bayes 0,071 0,338 0,346 0,602 0,031 0,600

Multilayer Perceptron 0,541 0,538 0,705 0,656 0,646 0,629Multi Class Classifier 0,571 0,631 0,628 0,839 0,667 0,771Adaboost Naive Bayes 0,071 0,338 0,346 0,602 0,031 0,600

Adaboost J48 0,658 0,646 0,821 0,903 0,833 0,714Adaboost Multilayer 0,541 0,538 0,705 0,656 0,646 0,629

Perceptron

99] QCCH. Em relação ao conjunto de dados foram utilizados os mesmos critérios adotados em

Resultados 1.

Como foi apresentado anteriormente, o objetivo de realizar uma seleção de atributos é eli-

minar dados redundantes ou não importantes, assim, com um conjunto menor de atributos é

possível atingir o resultado (classificação) com um menor custo computacional. Tomando o

conjunto de atributos inicial, foi aplicado o método Wrapper com os classificadores: Multi-

layer Perceptron, Multi Class Classifier, Naive Bayes, KNN (MARTIN, 1995), árvore de decisão

J48, Adaboost-J48, Adaboost Multilayer Perceptron e Adaboost Naive Bayes. Após obter o

conjunto de atributos reduzido foi levantado os desempenhos com os mesmos classificadores

apresentados em resultados 1, para ser possível analisar o impacto causado pela seleção em

cada um dos métodos de classificação.

São apresentadas a seguir os atributos selecionados por cada um dos testes realizados:

Vale a pena observar que para os classificadores Multilayer Perceptron, Multi Class Clas-

sifier e Adaboost Multilayer Perceptron não foi possível utilizar em conjunto com o método

wrapper pois o custo computacional foi elevado e o tempo de processamento foi superior a 350

horas sem retornar resultado algum. Portanto não foi possível analisar os dados referente a estes

processamentos.

A partir dos atributos apresentados nos ítens anteriores foi realizada a classificação para

cada um dos métodos, para os quais a tabela 6 exibe o comparativo da porcentagem de folhas

classificadas corretamente, utilizando todas as classes de folhas disponíveis.

Para a análise mais detalhada foi adotado apenas os classificadores Adaboost J48 e Adabo-

ost Multilayer Perceptron, exibindo a curva de desempenho dos dados reduzidos, por meio do

método Wrapper + algoritmo de classificação, em relação a curva de classificação do mesmo

método com todos os atributos. Os métodos selecionados para a análise apresentaram resulta-

dos acima de 72% conforme foi analisado anteriormente na seção 4.1 e por meio da tabela 6.


Tabela 5: Desempenho médio obtido utilizando os atributos selecionados.Naïve Bayes KNN J48 Adaboost J48 Adaboost Naïve

Bayes

Angular 2nd Moment 0 X

Contrast 0 X

Correlation 0 X

Sum Average 0 X X

Sum Variance 0 X

Entropy 0 X X

Difference Variance 0 X X X

Difference Entropy 0

Information Mesures

of Correlation 1 0 X X X

Correlation 45 X

Sum Average 45 X

Entropy 45 X

Information Mesures

of Correlation 1 45 X X

Information Mesures

of Correlation 2 45 X X

Angular 2nd Moment 90 X X

Contrast 90 X

Correlation 90 X

Sum Average 90 X X

Difference Variance 90 X X X

Contrast 135 X

Variance 135 X

Information Mesures

of Correlation 1 135 X

Information Mesures

of Correlation 2 135 X

Median X X

Pixels Average X

Standard Deviation X X X X X

area X

area circle cir X X X


Naïve Bayes KNN J48 Adaboost J48 Adaboost Naïve

Bayes

QCCH 0 X X X X

QCCH 1 X X

QCCH 2 X X

QCCH 3 X X X

QCCH 4 X X

QCCH 5 X X

QCCH 9 X X X

QCCH 10 X

QCCH 12 X X

QCCH 15 X

QCCH 16 X

QCCH 20 X

QCCH 22 X

QCCH 25 X

QCCH 27 X

QCCH 29 X X

QCCH 30 X

QCCH 31 X X

QCCH 32 X X X

QCCH 33 X X

QCCH 34 X

QCCH 36 X X X

QCCH 38 X

QCCH 39 X X X

Abaixo segue as curvas referentes as classificações Adaboost J48 x Adaboost J48 (Wrapper +

método de classificação) (Figura 28, 29, 30, 31, 32) e Adaboost Multilayer Perceptron x Ada-

boost Multilayer Perceptron(Wrapper + método de classificação) (Figura 33, 34, 35, 36, 37):


Tabela 6: Desempenho médio obtido utilizando os atributos selecionados.Classificadores Wrapper

Naive Bayes NNge J48 Adaboost J48 Adaboost

Naive Bayes

Naive Bayes 56,13% 40,23% 40,93% 49,17% 56,13%

Multilayer Perceptron 67,87% 65,98% 64,48% 70,59% 67,87%

Multiclass Classifier 58,44% 56,97% 63,00% 63,94% 58,44%

Adaboost Naive Bayes 56,13% 40,23% 40,93% 49,17% 56,13%

Adaboost J48 77,61% 75,02% 77,28% 78,78% 77,61%

Adaboost Multilayer

Perceptron 77,12% 75,85% 73,96% 78,32% 77,12%

Figura 28: Curvas de acertos - Wrapper Naive Bayes x Adaboost J48


Figura 29: Curvas de acertos - Wrapper J48 x Adaboost J48

Figura 30: Curvas de acertos - Wrapper NNge x Adaboost J48


Figura 31: Curvas de acertos - Wrapper Adaboost Naive Bayes x Adaboost J48

Figura 32: Curvas de acertos - Wrapper Adaboost J48 x Adaboost J48


Figura 33: Curvas de acertos - Wrapper Naive Bayes x Adaboost Multilayer Perceptron

Figura 34: Curvas de acertos - Wrapper J48 x Adaboost Multilayer Perceptron


Figura 35: Curvas de acertos - Wrapper NNge x Adaboost Multilayer Perceptron

Figura 36: Curvas de acertos - Wrapper Adaboost Naive Bayes x Adaboost Multilayer Percep-tron

Conforme pode ser observado nas curvas anteriores, o desempenho do algoritmo de classi-

ficação Adaboost J48 se manteve mesmo com a redução de dados, apresentando uma redução

de apenas 2,09% no resultado final de acertos e um queda de 89.88%, passando de 3 minu-

tos para 15 segundos com os dados reduzidos. Em relação ao Adaboost Multilayer Perceptron


Figura 37: Curvas de acertos - Wrapper Adaboost J48 x Adaboost Multilayer Perceptron

apresentou um aumento no desempenho de 3,83% e uma queda de 52,77% no tempo processa-

mento, passando de 1 hora e 23 minutos para 35 minutos. Estes dados pode ser verificado mais

detalhadamente na tabela 7 e 8.

Tabela 7: Tempo de criação do modelo para a classificação Adaboost J48Wrapper Tempo de criação Classificação Número de

do modelo Correta atributos

NNge 14,39 75,03% 15

Naïve Bayes 16,84 77,62% 18

Adaboost Naive Bayes 13,59 77,62% 18

, Adaboost J48 17,08 78,78% 25

J48 15,26 77,28% 20

Média 15,432 77,26% 19

Classificação sem

seleção de atributos 152,48 79,35% 100

Com os testes realizados e por meio dos resultados foi possível definir que para os dados

em questão o método Wrapper em conjunto com o Naive Bayes e Adaboost J48 apresentaram

o melhor desempenho. O método Wrapper + Naive Bayes reduziu a quantidade de atributos

em 82% e realizando a classificação com o método Adaboost J48 por meio destes atributos,

foi possível obter um resultado de 77,62%, ou seja, 2% a menos do que a melhor classificação


Tabela 8: Tempo de criação do modelo para a classificação Adaboost Multilayer PerceptronWrapper Tempo de criação Classificação Número de

do modelo Correta atributos

NNge 985,11 75,85% 15

Naïve Bayes 2429,33 77,12% 18

Adaboost Naive Bayes 2416,72 77,12% 18

Adaboost J48 2811,04 78,31% 25

J48 1866,8 73,96% 20

Média 2101,8 76,47% 19

Classificação sem

seleção de atributos 4450,21 72,64% 100

obtida na seção 4.1. Em relação ao Wrapper + Adaboost J48 foi possível alcançar o maior

resultado em conjunto com o Adaboost J48 como classificador no valor de 78.78% e a redução

do conjunto foi de 75%.

51

5 Conclusões

Este trabalho teve como objetivo o desenvolvimento de um software que tivesse como saída

dados para a análise de diferentes extratores de características, em conjunto com diversos clas-

sificadores encontrados na literatura, visando o reconhecimento de diferentes espécies folhares.

Além da classificação houve a necessidade de reduzir o conjunto de dados para que o custo com-

putacional fosse reduzido e, consequentemente, o tempo computacional para obter um resultado

satisfatório fosse menor, sendo assim possível atender as diversas necessidades. Os resultados

obtidos através de diversos testes mostram que as características selecionadas no trabalho po-

dem ser utilizadas para realizar a anotação das classes para posterior indexação, pois em diver-

sos classificadores foi possível obter resultados satisfatórios superiores a 70%, evidenciando que

tais características foram importantes para a correta representação das classes analisadas. Para

estas características foi possível selecionar dois (2) classificadores com melhor desempenho,

i.e., que apresentaram um maior número de acerto, foram: Adaboost J48, Adaboost Multilayer

Perceptron. Ambos os classificadores apresentaram desempenho acima de 72% no conjunto

total dos dados. Já os classificadores Naive Bayes não alcançaram resultados satisfatórios, não

atingindo nem 50% de precisão. Os resultados indicam que uma boa anotação das classes pode

não atingir resultados satisfatórios quando é empregado o algoritmo de classificação incorreto.

Em relação a seleção de atributos, foram selecionados os métodos Adaboost J48 e Naive Bayes,

os quais apresentam resultados superiores a 75%. Outro resultado deste trabalho foi o desen-

volvimento de um software que implementa a extração das características mencionadas e que

pode ser livremente acessado através do site: <http://code.google.com/p/jimagefeature/>.

Como sugestão para trabalhos futuros, poderá acrescentar algumas etapas para que seja

possível eliminar ruídos e partes não importantes para a classificação, aumentando o foco nas

características mais importantes de cada classe. Desta forma, conclui-se que o trabalho desen-

volvido pode ser utilizado em futuras pesquisas de classificação e busca de espécies folheares,

adicionando uma contribuição na área que está em expansão.

52

Referências

ALMEIDA, S. S. Suellen de et al. Uma implementação de um sistema de contagem de pessoasbaseado em vídeo processamento. 2010.

CARUANA, R.; FREITAG, D. Greedy attribute selection. In: CITESEER. Proceedings of theeleventh international conference on machine learning. [S.l.], 1994. p. 28–36.

DASH, M.; LIU, H. Feature selection for classification. Intelligent data analysis, ElsevierScience, v. 1, n. 1-4, p. 131–156, 1997.

DEVIJVER, P. A.; KITTLER, J. Pattern recognition: A statistical approach. [S.l.]:Prentice/Hall International, 1982.

DUDA, R.; HART, P.; STORK, D. Pattern classification. 2nd. ed. Wiley, 2001. (PatternClassification and Scene Analysis: Pattern Classification). ISBN 9780471056690. Disponívelem: <http://books.google.com.br/books?id=YoxQAAAAMAAJ>.

FREUND, Y.; SCHAPIRE, R. A desicion-theoretic generalization of on-line learning and anapplication to boosting. In: SPRINGER. Computational learning theory. [S.l.], 1995. p. 23–37.

FREUND, Y.; SCHAPIRE, R.; ABE, N. A short introduction to boosting. Journal-JapaneseSociety For Artificial Intelligence, JAPANESE SOC ARTIFICIAL INTELL, v. 14, n. 771-780,p. 1612, 1999.

FREUND, Y.; SCHAPIRE, R. E. et al. Experiments with a new boosting algorithm. In:MORGAN KAUFMANN PUBLISHERS, INC. MACHINE LEARNING-INTERNATIONALWORKSHOP THEN CONFERENCE-. [S.l.], 1996. p. 148–156.

GANTZ, J.; REINSEL, D. Extracting value from chaos. White Paper, IDC, 2011.

GARDNER, M.; DORLING, S. Artificial neural networks (the multilayer perceptron)–areview of applications in the atmospheric sciences. Atmospheric environment, Elsevier, v. 32,n. 14-15, p. 2627–2636, 1998.

GIULIETTI1, A. M. et al. Biodiversidade e conservação das plantas no brasil. 2005.

GONZALEZ, R. C.; WOODS, R. E. Processamento de imagens digitais. [S.l.]: EdgardBlucher, 2000.

GOOGLE PESQUISA POR IMAGEM. [S.l.], Março 2013. Ultimo acesso em, 11/03/2013.

HALL, M. et al. The weka data mining software: an update. ACM SIGKDD ExplorationsNewsletter, ACM, v. 11, n. 1, p. 10–18, 2009.

HAN, J.; KAMBER, M. Data mining: concepts and techniques. [S.l.]: Morgan Kaufmann,2006.

Referências 53

HARALICK, R.; SHANMUGAM, K. Computer classification of reservoir sandstones.Geoscience Electronics, IEEE Transactions on, IEEE, v. 11, n. 4, p. 171–177, 1973.

HARALICK, R. M.; SHANMUGAM, K.; DINSTEIN, I. H. Textural features for imageclassification. Systems, Man and Cybernetics, IEEE Transactions on, IEEE, n. 6, p. 610–621,1973.

HEMPSTALK, K.; FRANK, E. Discriminating against new classes: One-class versus multi-class classification. In: Proc 21set Australasian Joint Conference on Artificial Intelligence.[S.l.]: Springer, 2008. (Auckland, New Zealand), p. 325–336.

HUANG, C.-B.; LIU, Q. An orientation independent texture descriptor for image retrieval. In:IEEE. Communications, Circuits and Systems, 2007. ICCCAS 2007. International Conferenceon. [S.l.], 2007. p. 772–776.

JIMAGEFEATURE. [S.l.], Abril 2012. Ultimo acesso em, 11/03/2013.

JOHN, G. H. et al. Irrelevant features and the subset selection problem. In: SAN FRANCISCO.Proceedings of the eleventh international conference on machine learning. [S.l.], 1994. v. 129,p. 121–129.

JOHN, G. H.; LANGLEY, P. Estimating continuous distributions in bayesian classifiers. In:MORGAN KAUFMANN PUBLISHERS INC. Proceedings of the eleventh conference onuncertainty in artificial intelligence. [S.l.], 1995. p. 338–345.

KOHAVI, R.; JOHN, G. H. Wrappers for feature subset selection. Artificial intelligence,Elsevier, v. 97, n. 1, p. 273–324, 1997.

LOPES, F. M. Um modelo perceptivo de limiarizaçao de imagens digitais. UniversidadeFederal do Paraná, 2003.

LOPES, F. M. Redes complexas de expressão gênica: síntese, identificação, análise eaplicações. Biblioteca Digital de Teses e Dissertações da USP, 2011.

MARTIN, B. Instance-based learning: nearest neighbour with generalisation. Tese(Doutorado) — University of Waikato, 1995.

MARTINEZ, E. Z.; LOUZADA-NETO, F.; PEREIRA, B. A curva roc para testes diagnósticos.Cad Saúde Coletiva, v. 11, n. 1, p. 7–31, 2003.

MUCCIARDI, A. N.; GOSE, E. E. A comparison of seven techniques for choosing subsetsof pattern recognition properties. Computers, IEEE Transactions on, IEEE, v. 100, n. 9, p.1023–1031, 1971.

MÜLLER, H. et al. ImageCLEF: Experimental Evaluation in Visual Information Retrieval.[S.l.]: Springer, 2010.

ORACLE JAVA. [S.l.], Dezembro 2012. Disponível em: <www.java.com/pt_BR/>.

OTSU, N. A threshold selection method from gray-level histograms. Automatica, v. 11, n.285-296, p. 23–27, 1975.

RUSSEL, S.; NORVIG, P. Inteligência artificial. [S.l.]: Editora Campus, 2004.

SÁNCHEZ, M. R. S. et al. Mejora de algoritmos de búsqueda heurística mediante poda pordominancia. aplicación a problemas de scheduling. Universidad de Oviedo, 2009.

Referências 54

SBC. Sociedade Brasileira de Computação - Grandes desafios 2009. [S.l.], Dezembro 2012.Disponível em: <http://www.sbc.org.br/>.

Documents

DESENVOLVIMENTO DE SISTEMASpaginapessoal.utfpr.edu.br/fabricio/fabricio-martins-lopes/ensino/... · Resumo COLONHEZI, T. P.; LOPES, F. M. Caracterização de Bioimagens. Monograﬁa