7
CLASSIFICAÇÃO DE SONS PULMONARES UTILIZANDO ESTATÍSTICAS DE ORDEM SUPERIOR E ÁRVORES DE DECISÃO RAPHAEL NAVES 1 , BRUNO H. G. BARBOSA 1 , DANTON D. FERREIRA 1 1 Departamento de Engenharia Universidade Federal de Lavras Câmpus Universitário, Caixa Postal 3037, CEP 37200-000, Lavras, MG, Brasil E-mails: [email protected], [email protected], [email protected] Abstract The lung sounds auscultation is one of the most used methods to evaluate respiratory diseases. However, the tech- nique depends on the specialist experience, because if the specialist does not have proper training he/she will not be able to dis- tinguish between normal and abnormal sounds generated by the human body. In this sense, in order to detect lung diseases, many papers have described systems that process respiratory sounds, aiming at a better characterization of these sounds. This paper presents a new pattern recognition system to classify lung sounds as normal and coarse crackles. For doing so, Higher-Order Sta- tistics (HOS) are used for feature extraction, Genetic Algorithms and Linear Discriminant Analysis (LDA) are implemented for dimensionality reduction and Decision Trees are used to classify the sounds. Results show that proposed approach can classify different types of lungs sounds with good accuracy. Keywords Lung Sounds, Pattern Recognition, Higher-Order Statistics, Genetic Algorithm Resumo A ausculta pulmonar é um dos métodos mais utilizados para avaliar doenças respiratórias. No entanto, a técnica de- pende da experiência do especialista, pois se o mesmo não possuir treinamento adequado não será capaz de distinguir entre os sons normais e anormais gerados pelo corpo humano. Neste sentido, a fim de detectar doenças pulmonares, diversos trabalhos têm descrito sistemas para o processamento de sons respiratórios, visando sua melhor caracterização. Este trabalho apresenta uma técnica para reconhecimento de padrões para classificação de sons pulmonares em sons normais e estertores grossos. Para isso, são utilizadas Estatísticas de Ordem Superior (EOS) para extração de características, Algoritmos Genéticos e Análise Discrimi- nante Linear para redução da dimensionalidade e Árvores de Decisão para classificação dos sons. Resultados mostram que a abordagem proposta consegue classificar tipos diferentes de sons pulmonares com boa eficiência. Palavras-chave Sons Pulmonares, Reconhecimento de Padrões, Estatísticas de Ordem Superior, Algoritmos Genéticos 1 Introdução Desde a Antiguidade, os médicos auscultam os sons de dentro do tórax em busca de sinais de doen- ças (Lehrer, 2004). Os primeiros sons característicos de patologias respiratórias foram observados pelos gregos e até o século XIX eram detectados através do posicionamento do ouvido contra a parede torácica. Em 1816, para auscultar os sons pulmonares, René Theophile Laennec enrolou uma folha de papel como um cilindro e colocou uma extremidade no tórax da paciente e seu ouvido na outra. Laennec chamou a invenção de estetoscópio, do grego stethos, "peito" e skopein, "olhar" (Läennec, 1819). Desde sua invenção, o estetoscópio foi definiti- vamente incorporado à prática médica. Por ser um exame rápido, não invasivo e de baixo custo, é o primeiro método utilizado para avaliar doenças respi- ratórias (Lehrer, 2004). A ausculta de sons respiratórios por meio do es- tetoscópio é um dos métodos diagnósticos mais sim- ples que fornece informações sobre pulmão do paci- ente. Por outro lado este aparelho apresenta muitas limitações, pois exige que o examinador seja treinado para ouvir e distinguir os sons normais e anormais geradas pelo corpo humano. É, portanto, um proces- so considerado subjetivo e impreciso que depende da capacidade auditiva do especialista (Garcia, 2002). Essa limitação tem motivado pesquisadores a aprimorar ou desenvolver técnicas para classificar e separar sons pulmonares, visando um melhor diag- nóstico (Earis et al. 2000). Vários autores utilizam diferentes técnicas para filtragem, extração de características, separação e classificação de sons pulmonares, como Redes Neurais Artificiais (Sezgin et al. 2001; Kandaswamy et al. 2004; Hashemi et al. 2012; Serbes et al. 2013), Transformada Wavelet (Sezgin et al. 2001; Kandaswamy et al. 2004; Xiaoguang et al. 2008; Quandt et al. 2012), Análise Discriminante Linear (Linear Discriminant Analysis - LDA) (Quandt et al. 2012), k vizinhos mais próximos (k Nearest Neighbor k-NN) (Quandt et al. 2012; Serbes et al. 2013) entre outros. Neste trabalho, uma técnica de reconhecimento de padrões para classificação de sons pulmonares em sons normais e estertores grossos é proposta, utili- zando Estatísticas de Ordem Superior (EOS) (Men- del, 1991) para extração de características, Algorit- mos Genéticos (Holland, 1975) para redução da dimensionalidade e Árvores de Decisão (Breiman et al. 1984) para classificação. Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014 1196

CLASSIFICAÇÃO DE SONS PULMONARES ... - swge.inf.br · A contribuição deste trabalho foi no sentido de se utilizar um novo classificador com a finalidade de reconhecer padrões

  • Upload
    hatu

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

CLASSIFICAÇÃO DE SONS PULMONARES UTILIZANDO ESTATÍSTICAS DE ORDEM SUPERIOR

E ÁRVORES DE DECISÃO

RAPHAEL NAVES1, BRUNO H. G. BARBOSA

1, DANTON D. FERREIRA

1

1Departamento de Engenharia

Universidade Federal de Lavras

Câmpus Universitário, Caixa Postal 3037, CEP 37200-000, Lavras, MG, Brasil

E-mails: [email protected], [email protected], [email protected]

Abstract The lung sounds auscultation is one of the most used methods to evaluate respiratory diseases. However, the tech-

nique depends on the specialist experience, because if the specialist does not have proper training he/she will not be able to dis-tinguish between normal and abnormal sounds generated by the human body. In this sense, in order to detect lung diseases, many

papers have described systems that process respiratory sounds, aiming at a better characterization of these sounds. This paper

presents a new pattern recognition system to classify lung sounds as normal and coarse crackles. For doing so, Higher-Order Sta-tistics (HOS) are used for feature extraction, Genetic Algorithms and Linear Discriminant Analysis (LDA) are implemented for

dimensionality reduction and Decision Trees are used to classify the sounds. Results show that proposed approach can classify

different types of lungs sounds with good accuracy.

Keywords Lung Sounds, Pattern Recognition, Higher-Order Statistics, Genetic Algorithm

Resumo A ausculta pulmonar é um dos métodos mais utilizados para avaliar doenças respiratórias. No entanto, a técnica de-

pende da experiência do especialista, pois se o mesmo não possuir treinamento adequado não será capaz de distinguir entre os sons normais e anormais gerados pelo corpo humano. Neste sentido, a fim de detectar doenças pulmonares, diversos trabalhos

têm descrito sistemas para o processamento de sons respiratórios, visando sua melhor caracterização. Este trabalho apresenta uma

técnica para reconhecimento de padrões para classificação de sons pulmonares em sons normais e estertores grossos. Para isso,

são utilizadas Estatísticas de Ordem Superior (EOS) para extração de características, Algoritmos Genéticos e Análise Discrimi-

nante Linear para redução da dimensionalidade e Árvores de Decisão para classificação dos sons. Resultados mostram que a

abordagem proposta consegue classificar tipos diferentes de sons pulmonares com boa eficiência.

Palavras-chave Sons Pulmonares, Reconhecimento de Padrões, Estatísticas de Ordem Superior, Algoritmos Genéticos

1 Introdução

Desde a Antiguidade, os médicos auscultam os

sons de dentro do tórax em busca de sinais de doen-

ças (Lehrer, 2004). Os primeiros sons característicos

de patologias respiratórias foram observados pelos

gregos e até o século XIX eram detectados através do

posicionamento do ouvido contra a parede torácica.

Em 1816, para auscultar os sons pulmonares,

René Theophile Laennec enrolou uma folha de papel

como um cilindro e colocou uma extremidade no

tórax da paciente e seu ouvido na outra. Laennec

chamou a invenção de estetoscópio, do grego stethos,

"peito" e skopein, "olhar" (Läennec, 1819).

Desde sua invenção, o estetoscópio foi definiti-

vamente incorporado à prática médica. Por ser um

exame rápido, não invasivo e de baixo custo, é o

primeiro método utilizado para avaliar doenças respi-

ratórias (Lehrer, 2004).

A ausculta de sons respiratórios por meio do es-

tetoscópio é um dos métodos diagnósticos mais sim-

ples que fornece informações sobre pulmão do paci-

ente. Por outro lado este aparelho apresenta muitas

limitações, pois exige que o examinador seja treinado

para ouvir e distinguir os sons normais e anormais

geradas pelo corpo humano. É, portanto, um proces-

so considerado subjetivo e impreciso que depende da

capacidade auditiva do especialista (Garcia, 2002).

Essa limitação tem motivado pesquisadores a

aprimorar ou desenvolver técnicas para classificar e

separar sons pulmonares, visando um melhor diag-

nóstico (Earis et al. 2000).

Vários autores utilizam diferentes técnicas para

filtragem, extração de características, separação e

classificação de sons pulmonares, como Redes

Neurais Artificiais (Sezgin et al. 2001; Kandaswamy

et al. 2004; Hashemi et al. 2012; Serbes et al. 2013),

Transformada Wavelet (Sezgin et al. 2001;

Kandaswamy et al. 2004; Xiaoguang et al. 2008;

Quandt et al. 2012), Análise Discriminante Linear

(Linear Discriminant Analysis - LDA) (Quandt et al.

2012), k vizinhos mais próximos (k Nearest

Neighbor – k-NN) (Quandt et al. 2012; Serbes et al.

2013) entre outros.

Neste trabalho, uma técnica de reconhecimento

de padrões para classificação de sons pulmonares em

sons normais e estertores grossos é proposta, utili-

zando Estatísticas de Ordem Superior (EOS) (Men-

del, 1991) para extração de características, Algorit-

mos Genéticos (Holland, 1975) para redução da

dimensionalidade e Árvores de Decisão (Breiman et

al. 1984) para classificação.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1196

A contribuição deste trabalho foi no sentido de

se utilizar um novo classificador com a finalidade de

reconhecer padrões em sons pulmonares de forma

eficiente e de fácil implementação.

Na próxima seção será apresentada a carac-

terização do problema. Na seção 3 serão descritos os

materiais e métodos utilizados e os resultados serão

mostrados na seção 4. A seção 5 apresentará as con-

clusões.

2 Caracterização do Problema

Através das vibrações pulmonares e das vias aé-

reas se originam os sons pulmonares que são trans-

mitidos à parede torácica.

A caixa torácica é relativamente dura e hetero-

gênea por conter músculos e também ossos, o que

contribui de forma negativa para a transmissão dos

sons (Carvalho et al. 2007).

Os sons pulmonares são classificados como

normais e adventícios, e são auscultados sobre o

tórax e a traqueia. Os sons adventícios são ausculta-

dos em indivíduos que possuem algum tipo de pato-

logia respiratória ou doença pulmonar. Os sons nor-

mais são auscultados em indivíduos saudáveis.

Dentre os sons adventícios, classificam-se os

sons contínuos (sibilos e roncos) e os descontínuos

(estertores). Estes últimos ainda são classificados de

acordo com sua duração em estertores finos (Fine

Crackles), sons de curta duração, e estertores grossos

(Coarse Crackles), sons de longa duração (Mikami et

al.1987).

2.1 Trabalhos relacionados

Serbes et al. (2013) propuseram o método análi-

se tempo-frequência e análise tempo-escala para

analisar sinais pulmonares. O seu objetivo foi criar

um modelo preditivo capaz de distinguir entre os

sinais estertores e não estertores e fazer uma compa-

ração utilizando três classificadores: Máquinas de

Vetores Suporte (Support Vector Machines), k vizi-

nhos mais próximos e Perceptron Multi-Camadas

(Multilayer Perceptron). Ao analisar os resultados,

os autores concluíram que o classificador SVM foi

superior em relação ao k-NN na detecção de sinais

estertores. Já o classificador Perceptron Multi-

Camadas obteve o pior desempenho para a maioria

dos sinais analisados.

No trabalho de (Hashemi et al. 2012) foi propos-

to um método para classificar sons pulmonares em

sibilos monofônicos e polifônicos. Foram utilizados

os métodos Coeficientes Mel-Cepstrais (Mel-

Frequency Cepstral Coefficients - MFCC) para ex-

tração de características em conjunto com a Rede

Neural Perceptron Multi-Camadas para classificação.

O melhor resultado de classificação obtido pelos

autores consistiu em utilizar uma arquitetura de rede

com 10 neurônios para a camada de entrada, 30 neu-

rônios para a camada oculta e 2 neurônios para a

camada de saída.

Quandt et al. (2012) decompuseram o sinal pul-

monar utilizando Transformada Wavelet Discreta,

utilizaram LDA para redução de dimensões do vetor

de características obtido e classificaram pelo método

k-NN entre sinais pulmonares normais, estertores

finos e grossos. Os autores compararam a quantidade

total de sinais de teste com os classificados correta-

mente. O resultado alcançado nesta etapa se mostrou

aceitável e o método desenvolvido eficiente.

Bahoura (2009) propôs um método de reconhe-

cimento de padrões para classificar sons pulmonares

em normais e sibilos. Foi feita uma comparação entre

um conjunto de ferramentas de extração de caracte-

rísticas juntamente com os métodos de classificação.

Os resultados da pesquisa mostraram que a melhor

combinação consistiu em usar o método de Coefici-

entes Mel-Cepstrais para extração de características

em conjunto com o classificador Modelo de Misturas

de Gaussianas (Gaussian Mixture Model - GMM).

O trabalho de (Xiaoguang et al. 2008) apresenta

um sistema automatizado para reconhecimento de

sons pulmonares estertores. O sistema proposto sepa-

ra o sinal normal do sinal anormal (estertor) utilizan-

do o filtro Wavelet Packet. Em seguida os estertores

são detectados pelo uso da Dimensão Fractal (Frac-

tal Dimension - FD) e por último são classificados

pelo Modelo de Misturas de Gaussianas (Gaussian

Mixture Model - GMM) em estertores finos e esterto-

res grossos. Os autores concluíram que o método

proposto alcançou bom desempenho, permitindo um

melhor diagnóstico das doenças pulmonares com a

possibilidade de uma implementação em tempo real.

Os autores (Kandaswamy et al. 2004), utilizaram

Transformada Wavelet para decompor o sinal pul-

monar e classificaram 6 tipos de sons pulmonares

(normais, sibilos, estertores, grasnido, estridor e

ronco) utilizando Redes Neurais Artificiais. Após

realizar diversas simulações utilizando diferentes

arquiteturas de rede, os autores concluíram que me-

lhor arquitetura para o problema proposto consistiu

em usar 19 neurônios para a camada de entrada, 40

neurônios para a camada oculta e 6 neurônios para a

camada de saída. O algoritmo que obteve o melhor

desempenho foi o Backpropagation.

Sezgin et al. (2001) propuseram um classificador

de sons respiratórios em indivíduos saudáveis e indi-

víduos com asma e assim como (Kandaswamy et al.

2004), também utilizaram Transformada Wavelet

para decompor o sinal e Redes Neurais Artificiais

para classificá-los. Foi utilizada uma Rede Neural de

Aprendizado Construtivo (Grow and Learn - GAL)

para a classificação dos sinais. Os resultados obtidos

mostraram que a Rede Neural proposta classificou de

forma satisfatória os sinais analisados.

Esforços têm sido feitos para aperfeiçoar os sis-

temas de classificação de sons respiratórios. Pesqui-

sadores têm utilizado diversas técnicas para alcançar

este objetivo. Assim, esse é um campo de pesquisa

em aberto, com vários estudos sendo realizados que

objetivam um diagnóstico mais objetivo das enfer-

midades pulmonares.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1197

3 Material e Métodos

O reconhecimento de padrões, do inglês Pattern

Recognition, é uma ciência que trata da classificação

e descrição de objetos em certo número de classes a

partir da observação de suas características (Theodo-

ridis, 2009).

O sistema de reconhecimento de padrões desen-

volvido neste trabalho possui a sequência apresenta-

da na Figura 1. A explicação de cada bloco é apre-

sentada na sequência.

Figura 1 - Sistema de Reconhecimento de Padrões.

3.1 Dados de entrada

O conjunto de dados de entrada utilizados neste

trabalho foi obtido de (Lehrer, 2004), foram utiliza-

dos sons respiratórios normais e sons estertores gros-

sos. Os sinais foram normalizados em 8 kHz e recor-

tados em amostras de tamanho 320 segmentos. Desta

forma, foram obtidas 86 amostras de sons respirató-

rios, sendo 46 de sons estertores grossos e 40 de sons

normais. A Figura 2 ilustra os eventos de sons pul-

monares, normal e estertor grosso.

(a)

(b)

Figura 2 - Eventos de Sons Pulmonares. (a) Normal e (b) Estertor

Grosso.

Os eventos som pulmonar normal e estertor

grosso ilustrados na Figura 2 foram selecionados a

partir de duas das 86 amostras obtidas. Ambos os

eventos foram selecionados de forma aleatória.

3.2 Extração de Características

O uso de técnicas baseadas em Estatísticas de

Ordem Superior (EOS) são mais adequadas para lidar

com processos não Gaussianos e sistemas não linea-

res (Mendel, 1991). Uma grande vantagem do seu

uso é devido à imunidade ao ruído.

Este trabalho emprega EOS como ferramenta de

extração de características. Os cumulantes são medi-

das de EOS que são utilizados em técnicas de proces-

samento de sinais e podem ser definidos como um

conjunto de valores resultantes aos momentos de um

sinal (Mendel, 1991).

Seja X um processo aleatório constituído de va-

riáveis aleatórias reais de média zero, os cumulantes

de segunda e de quarta ordem são dados por (Men-

del, 1991).

( ) ( )

(1)

( ) ( ) ( )

( ) ( )

( ) ( ) ( )

sendo E o operador de esperança matemática, que é

definido como a soma das probabilidades do sinal

multiplicada pelo valor da amostra.

Supondo x(t), um processo aleatório estacionário

com média zero, os cumulantes de ordem k, denota-

dos por Ck,x(τ1, τ2,..., τ3), onde τ1,..., τk são desloca-

mentos no tempo, são definidos em termos dos sinais

x(t), x(t + τ1),..., x(t + τk). Definindo τ1 = τ2 = τ3 = τ, a

partir de (1), os cumulantes de 2ª e 4ª ordens podem

ser reescritos como,

( ) ( ) ( )

(2)

( ) ( ) ( )

( ) ( )

Para um sinal discreto [ ] pode-se aproximar

(2), de acordo com (Ribeiro et al. 2006). Desta for-

ma, obtém-se a forma circular de cálculo dos cumu-

lantes em (3).

( )

∑ [ ] [ ( )]

(3)

( )

∑ [ ] [ ( )]

∑ [ ] [ ( )] ∑ [ ]

sendo

Dados de entrada

Extração de Características

Redução da Dimensão

Classificação

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1198

(a)

(b)

(c)

(d)

Figura 3 - Extração de Características com cumulantes de 2ª e 4ª Ordem. (a) e (b) Som Normal, (c) e (d) Estertor Grosso.

A Figura 3 ilustra o processo de extração de ca-

racterísticas por meio dos cumulantes de 2ª e 4ª or-

dem. As características foram extraídas a partir dos

eventos de som pulmonar normal e estertor grosso

ilustrados na Figura 2.

3.3 Redução da Dimensionalidade

Após a aplicação das equações em (3) nos dados

de entrada, 160 cumulantes de segunda ordem e 320

cumulantes de quarta ordem foram obtidos. Ao con-

siderar a impossibilidade de usar os 480 cumulantes

para a tarefa de classificação devido a limitações

computacionais, alguns devem ser selecionados.

Uma possível solução é utilizar a Análise Dis-

criminante Linear ou também chamada de Discrimi-

nante Linear de Fisher para selecionar os cumulantes

mais importantes e distintos entre as classes, preser-

vando o máximo possível à informação (Wu et al.

2012).

A técnica consiste em determinar uma base veto-

rial que maximize a razão entre o determinante de

uma matriz inter-classe Sb com uma matriz intra-

classe Sw, ou seja,

| |

| | (4)

Essa base vetorial pode ser resolvida como pro-

blema de autovalores e autovetores e é determinada

por,

( ) (5)

sendo a matriz de autovetores e é a matriz de

autovalores de .

Assim, neste trabalho, com a finalidade de redu-

zir o custo computacional do sistema de classifica-

ção, 50 cumulantes são selecionados segundo o Cri-

tério de Fisher. A partir destes, Algoritmos Genéticos

(AG’s) são também implementados para redução da

dimensionalidade e maximização do desempenho.

Os AG’s são uma classe de algoritmos perten-

centes ao ramo dos algoritmos evolucionários e são

definidos como uma técnica de busca baseada no

processo biológico de evolução natural (Linden,

2006).

O primeiro trabalho envolvendo AG’s foi apre-

sentado por John Holland (1975), mas somente a

partir dos anos 80, é que começaram a se popularizar.

O princípio básico de funcionamento dos algo-

ritmos genéticos pode ser resumido algoritmicamente

através dos seguintes passos (Linden, 2006):

1. t:=0

2. Inicializa_População P(0)

3. Enquanto não terminar faça

4. Avalie_População P(t)

5. P':= Selecione_Pais P(t)

6. P':= Recombinação_e_Mutação P'

7. Avalie_População P'

8. P(t+1):=Selecione_sobreviventes P(t), P'

9. t:= t+1

10. Fim Enquanto

O Algoritmo Genético utilizado para redução de

dimensões para o problema proposto consiste em

minimizar o erro descrito por uma função de aptidão

que engloba o erro de classificação (em porcenta-

gem) e o número de cumulantes utilizados. A avalia-

ção de cada indivíduo é dada por:

Avaliação = Erro_de_classificação + 0,001*Número_cumulantes

(6)

sendo o valor numérico 0,001*Número_cumulantes

utilizado para reduzir o número de cumulantes sele-

cionados para o classificador.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1199

Figura 4 - Avaliação do Indivíduo.

Este valor é empregado para quando classifica-

dores obtiverem o mesmo erro de classificação, será

utilizado o que possuir menor número de cumulantes

selecionados com a finalidade de reduzir o custo

computacional. A Figura 4 ilustra o processo de

avaliação do indivíduo.

Os indivíduos são sequências binárias com 50

posições, sendo que cada posição indica o uso ou não

do cumulante respectivo. Após esta etapa, é feita a

classificação dos sinais e por último é feito o cálculo

da aptidão pela Eq. (6).

3.4 Classificação

Os sinais foram classificados utilizando Árvores

de Decisão (Breiman et al. 1984). A técnica utiliza a

estratégia de dividir e conquistar, obtendo como

resultado um subconjunto de atributos.

O modelo classifica as suas instâncias percor-

rendo a árvore a partir da raiz até alcançar o nó folha.

Cada nó é responsável em testar o valor de um único

atributo, oferecendo arestas diferentes a serem per-

corridas na árvore a partir deste nó (Breiman et al.

1984).

De acordo com (Cho et al. 2011), as Árvores de

Decisão possuem:

nós que representam suas características;

arcos ou ramos, advindos dos nós e que re-

cebem os valores possíveis para estes atribu-

tos;

nós folha, que representam os tipos diferen-

tes de classes de um conjunto de treinamen-

to.

A Árvore de Decisão foi treinada utilizando dife-

rentes cumulantes selecionados, classificando os

sinais em normais e estertores grossos, chegando a

sua decisão pela execução de uma sequência de tes-

tes.

4 Resultados

Os dados foram separados em 70% de dados de

treinamento e 30% de dados de validação. Os dados

de treinamento representam 30 padrões para esterto-

res grossos e 28 padrões para som normal, os dados

de validação representam 16 padrões para estertores

grossos e 12 padrões para som normal.

Com o objetivo de encontrar a melhor solução,

ou seja, minimizar a Eq. (6), foi observado como a

alteração dos parâmetros do AG influiu no resultado

obtido. Os tipos de seleção, cruzamento e mutação e

suas respectivas probabilidades foram escolhidos de

forma a alcançarem o melhor resultado. Utilizando

uma população com 100 indivíduos e realizando100

execuções foi obtida a seguinte configuração para o

AG:

Tipo de seleção = Estocástico Uniforme

Tipo de mutação = Uniforme

Tipo de cruzamento = Dois pontos de corte

Probabilidade de Cruzamento = 0,8

Probabilidade de Mutação = 0,25

Número de Gerações = 100

Após a execução de cada teste para determinar a

melhor configuração do AG foram calculados o erro

de classificação e o número de cumulantes utilizados.

Ao fim das 100 execuções da melhor configuração

obtida, o acerto de classificação médio encontrado

em dados de treinamento foi de 95,47% ± 1,7, o

número de cumulantes médio obtido foi de 2,13 ±

0,32. Em dados de validação o acerto foi de 91,77%

± 1,3.

Foram realizados dois testes sem o uso do AG.

Em ambos os testes foram realizadas 100 execuções.

O primeiro teste consistiu em utilizar o LDA selecio-

nando 50 cumulantes. Destes 50, os dois com melho-

res índices foram utilizados no processo de classifi-

cação. Nos resultados médios obtidos em dados de

treinamento, o acerto foi de 89,8% ± 1,2 e em dados

de validação o acerto foi de 86,4% ± 1,7.

O segundo teste consistiu em utilizar todos os

480 cumulantes sem utilizar o LDA. Nos resultados

médios obtidos em dados de treinamento, o acerto foi

de 94,2% ± 1,2 e em dados de validação o acerto foi

de 90,4% ± 1,5.

Ao analisar os resultados dos dois testes nota-se

que os valores obtidos estão relativamente próximos,

mas no segundo teste o custo computacional é bem

mais alto, pois são usados todos os cumulantes. Des-

ta forma observa-se o benefício da redução da di-

mensionalidade do LDA em conjunto com uso dos

Algoritmos Genéticos, pois os índices de acerto fo-

ram parecidos, porém, com uso de um número muito

inferior de cumulantes.

Assim, a Árvore de Decisão obtida por uma das

100 execuções dos AG’s é ilustrada na Figura 5. Os

dados de validação das duas classes, estertor grosso

com taxa de classificação de 93,84% e normal com

taxa de classificação de 91,75%, são ilustrados na

Figura 6, em que se apresentam os dois cumulantes

selecionados nesta mesma execução.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1200

Figura 5 – Árvore de decisão

A comparação dos resultados obtidos neste tra-

balho com os trabalhos dos pesquisadores citados na

subseção 2.1 torna-se uma tarefa difícil. Isto se deve

ao fato dos sons respiratórios utilizados serem classi-

ficados de formas diferentes. Em alguns dos traba-

lhos os sons são separados em classes diferentes,

(Bahoura et al. 2009); (Xiaoguang et al. 2008) ou em

maior número de classes (Quandt et al. 2012); (Kan-

daswamy et al. 2004).

Os resultados de acerto de classificação obtidos

por (Quandt et al. 2012) foram de 70% para esterto-

res grossos, 60% para estertores finos e 100% para

sons normais. Os resultados de acerto de classifica-

ção obtidos pelos autores (Bahoura et al. 2009),

(Xiaoguang et al. 2008) e (Kandaswamy et al. 2004)

foram, respectivamente, 94,2%, 91,5% e 94,56%.

O resultado de acerto de classificação de 91,77%

obtido nesse trabalho está muito próximo dos resul-

tados obtidos na literatura, mostrando assim a efici-

ência da técnica implementada no processo de classi-

ficação de sons pulmonares.

Figura 6 – Classificação dos dados de validação segundo cumulan-

tes selecionados pela Árvore de Decisão da Figura 5.

5 Conclusões

Os resultados obtidos mostram que a abordagem

proposta para reconhecimento de padrões em sons

pulmonares conseguiu classificar tipos de sons pul-

monares em sons normais e estertores grossos de

forma satisfatória alcançando índices superiores a

90% de acerto.

A função de aptidão proposta no trabalho obteve

sucesso, pois não só aumentou a porcentagem de

acerto de classificação como conseguiu encontrar

classificadores de tamanho reduzido e simples.

A configuração dos parâmetros do Algoritmo

Genético foi extremamente importante para os bons

resultados alcançados, pois uma má configuração

desses parâmetros poderia influenciar de forma nega-

tiva no resultado obtido e no tempo de execução.

Como trabalhos futuros, espera-se implementar

esta técnica de reconhecimento de padrões em sons

pulmonares em um dispositivo portátil e classificar

mais tipos de sons pulmonares adventícios.

Agradecimentos

Agradecimento à CAPES (Coordenação de Aperfei-

çoamento de Pessoal de Nível Superior) pela bolsa

de mestrado concedida e a pesquisadora Veronica

Isabela Quandt pelas amostras de sons pulmonares

fornecidas.

Referências Bibliográficas

Bahoura, M.. Pattern recognition methods ap-

plied to respiratory sounds classification into normal

and wheeze classes, Computers in Biology and Med-

icine, Volume 39, Issue 9, September 2009, Pages

824-843, ISSN 0010-4825.

Breiman, L., Friedman, J. H., Olshen, R. A.,

Stone, C. I.. Classification and regression trees. Bel-

mont, Calif.: Wadsworth, 1984.

Carvalho, V. O.. Souza, G. E. C.. O Estetoscópio

e os Sons Pulmonares: Uma Revisão da Literatura.

Rev Med (São Paulo). 2007 out.-dez; 86(4): 224-31.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1201

Cho, J. H., Kurup, P. U.. Decision tree approach

for classification and dimensionality reduction of

electronic nose data. Sensors and Actuators B:

Chemical, Volume 160, Issue 1, 15 December 2011,

Pages 542-548, ISSN 0925-4005.

Earis, J. E., Cheetham, B. M. G.. Current meth-

ods used for computerized respiratory sound analy-

sis, Eur Respir Rev, vol. 77, p. 586–590, 2000.

Garcia, E. A. C.. Biofísica, São Paulo: Editora

Sarvier, 2002.

Hashemi, A., Arabalibeik, H., Agin, K.. Classi-

fication of wheeze sounds using cepstral analysis and

neural networks. Stud Health Technol Inform. Medi-

cine Meets Virtual Reality 19. 2012;173:161-5.

Holland, J. H.. Adaptation in natural and artifi-

cial systems. The University of Michigan Press,

1975.

Kandaswamy, A., Kumar, C. S., Ramanathan, R.

P., Jayaraman, S., Malmurugan, N., (2004). Neural

classification of lung sounds using wavelet coeffi-

cients. Computer in Biology and Medicine, 34(6):

523-537.

Läennec, R. T. H.. De L´auscultation Médiate ou

Traité du Diagnostic des Maladies des Poumons et

du Coeur, Fondé Principalement sur Cenouveau

Moyen D´exploration. Brosson et Chaudé, Paris,

1819.

Lehrer, S.. Entendendo os sons pulmonares. 3ª

edição. São Paulo: Editora Roca Ltda., 2004.

Linden, R.. Algoritmos Genéticos: Uma Impor-

tante Ferramenta Da Inteligência Computacional. 2ª

edição. Rio de Janeiro: Editora Brasport, 2006.

Mendel, J. M. (1991). Tutorial on Higher-Order

Statistics (Spectra) In Signal Processing and System

Theory: Theoretical Results and Some Applications.

Proc. IEEE, Vol.79, pp. 278-305.

Mikami, R., Murao, M., Cugell, D. W., Chrétien,

J., Cole, P., Meier, J., Murphy, R. L. H., Hills, W.,

Loudon, R. G.. International symposium on lung

sounds. Synopsis of proceedings. Chest. 1987; 92(2):

342-5.

Quandt, V. I., Pacola, E. R., Arruda, L. V. R.,

Pichorim, S. F., Sovierzoski, M. A.. Reconhecimento

De Padrões Em Sons Pulmonares Utilizando Wave-

lets, LDA E k-NN. In: XXIII Congresso Brasileiro

de Engenharia Biomédica, 2012, Porto de Galinhas.

ANAIS - CBEB2012, 2012. v. 1. p. 1894-1898.

Ribeiro, M. V., Marques, C. A., Duque, C. A.,

Cerqueira, A. S., Pereira, J. L. R.. ‘Power quality

disturbances detection using HOS’. IEEE Power

Engineering Society General Meeting, 2006.

Serbes, G., Sakar, C. O., Kahya, Y. P., Aydin,

N.. Pulmonary crackle detection using time–

frequency and time–scale analysis, Digital Signal

Processing, Volume 23, Issue 3, Pages 1012-1021,

ISSN 1051-2004, 2013.

Sezgin, M. C., Dokur, Z., Ölmez, T., Korürek,

M.. Classification of Respiratory Sounds by Using an

Artificial Neural Network. In: IEEE - Engineering

in Medicine and Biology Society (EMBS) Inter-

national Conference (23rd,Turkey), 2001. Proceed-

ings. Instanbul, p.697-699.

Theodoridis, S., Koutroumbas, K.. Pattern

Recognition. USA: Academic Press, 4 edition, 2009.

Wu, W., Ahmad, M. O.. A Discriminant Model

for the Pattern Recognition of Linearly Independent

Samples. Circuits, Systems, and Signal Processing.

Journal Article. Pages 669-687. 2012.

Xiaoguang, L., Bahoura, M.. An integrated au-

tomated system for crackles extraction and classifica-

tion, Biomedical Signal Processing and Control,

Volume 3, Issue 3, July 2008, Pages 244-254, ISSN

1746-8094.

Anais do XX Congresso Brasileiro de Automática Belo Horizonte, MG, 20 a 24 de Setembro de 2014

1202