Reconhecimento de Padrões em Sinais O ECG é um potencial ... Q, R, S e T. Algumas...

Preview:

Citation preview

001

Reconhecimento de Padrões em Sinais Eletrocardiográficos com RedeNeurofuzzy e Algoritmos Genéticos

Valfredo Pilla Jr 1, Heitor Silvério Lopes 21 Departamento de Eletrônica

2Laboratório de BioinformáticaCentro Federal de Educação Tecnológica do Paraná

Av. 7 de setembro, 3165 - Curitiba, Brasilvalfredo@daeln.cefetpr.br, hslopes@cpgei.cefetpr.br

Abstract

In this work it is presented a neurofuzzy networkthat is applied to the detection of a specific wave of theelectrocardiographic signal. The network was trainedusing genetic algorithms, using a software packagepublicly available in the Internet. The trainingprocedure, its parameters and details of theapplication are presented. Results suggest that thiskind of network is suitable for the identification ofpatterns in unidimensional time-varying signals.

1. Introdução

Neste trabalho uma arquitetura de rede neurofuzzy éaplicada no reconhecimento de um padrão específicoem um sinal variante no tempo, a onda P doeletrocardiograma humano (ECG). Nós inicialmenterevisamos algumas das características do sinal de ECGe mostramos porque existe interesse no reconhecimentodestas ondas. Em seguida, a arquitetura neurofuzzy éapresentada em detalhes assim como o seu treinamento,realizado através de algoritmos genéticos. Finalmente,os resultados são apresentados e discutidos mostrando aeficácia desta abordagem.

2. O sinal eletrocardiográfico

A classe de sinal bioelétrico utilizado nestetrabalho, o ECG, é razoavelmente estruturado erelativamente bem comportado quando comparado aosoutros sinais bioelétricos. O ECG é um potencialelétrico resultante medido sobre a superfície do corpohumano, sendo relacionado às contrações rítmicas docoração. O ECG é cíclico e compreende diversas formasde onda relevantes, conhecidas como P, Q, R, S e T.Algumas vezes uma onda adicional (U) é registradaapós a ocorrência da onda T. A figura 1 apresenta umciclo típico de ECG para um paciente normal. A formado sinal de ECG é variável e dependente da técnicaempregada na coleta. Neste trabalho, todos os sinais deECG são os definidos como derivação 2.

A onda P é produzida pela despolarização atrial, ocomplexo QRS pela despolarização ventricular e a ondaT pela repolarização ventricular. Quando doençascardíacas ou deficiências estão presentes, a morfologiada forma de onda do ECG pode ser substancialmentemodificada. Ainda, a temporização entre as ondas (esua variabilidade) tem sido freqüentemente utilizadacomo um parâmetro em procedimentos de diagnóstico.Particularmente a morfologia da onda P e suatemporização são importantes no diagnóstico defibrilação atrial [2,12,13]. Para medir precisamente ointervalo de tempo entre dois eventos elétricos no ECG,é necessário identificar as partes da forma de onda. Adetecção em tempo real da onda P é um desafio devidoà sua amplitude relativamente baixa, à uma relaçãosinal/ruído baixa e a presença de outras ondasadjacentes. Trabalhos anteriores na detecção da onda Pgeralmente baseiam-se em técnicas de processamentode sinais [3,4,15] e servem ao diagnóstico de arritmiassinusais. Este trabalho apresenta um método mais geralpara detectar estruturas particulares em sinais e mostrasua aplicação em uma difícil tarefa de reconhecimentode padrões.

Figura 1: Um ciclo completo do sinal de ECG, tomadona forma da derivação 2 de um sujeito normal

002

3. Metodologia

Os sinais de ECG utilizados neste trabalho foramcoletados de três voluntários, utilizando umeletrocardiógrafo diretamente conectado à umcomputador de mesa. O ECG foi amostrado em umataxa de 240 amostras / segundo, com uma resoluçãopadrão de 8 bits. Todas as três amostras foram salvasem arquivos para serem utilizadas no treinamento eteste da rede.

Após observar-se um conjunto de sinais de ECGadquiridos e considerando a taxa de amostragem,concluiu-se empiricamente que aproximadamente 35amostras consecutivas eram suficientes para representara onda P. O critério para determinar o início e o fim daonda P foi o limite de 0,05% da máxima amplitude,referenciada à linha base.

Seja Dm x p a matriz que contém m amostras de ppontos das formas de onda P escolhidas aleatoriamente.Para eliminar o offset entre vetores amostrados, aseguinte operação é feita:

pj1 ),ij(Dm

1iminijDijD ≤≤=

−= (1)

Além desses dados, dois outros vetores, vetor média( jx ) e vetor desvio padrão (jσ ), são extraídos,

definidos como:

pj1 m

1i

,ijDm

1jx ≤≤

=⋅= ∑ (2)

p j 1 , 1 m

m

1i

2

j xijD

j ≤≤−

=

=∑

σ (3)

Os vetores definidos pelas equações 2 e 3 são usadoscomo parâmetros das funções de pertinência daprimeira camada da rede que será discutida na próximaseção.

4. A rede neurofuzzy

A arquitetura da rede neurofuzzy [1,8] é apresentadana figura 2. Nesta rede, as N entradas correspondem àjanela amostrada da forma de onda de ECG. Assim, noprocesso de localização das ondas P, as amostras desinal são seqüencialmente aplicadas à entrada, onde aprimeira entrada recebe a amostra mais recente desinal,

pnx +, enquanto que a última entrada recebe a

amostra mais antiga, nx .

Os elementos da figura 2 estão definidos na tabela 1e a inferência lógica desenvolvida pela rede neurofuzzyé:

SE (x é adequadamente conformado) ENTÃO (osinal pertence à classe P)

A primeira camada da rede realiza um mapeamentofuzzy representado como af →x: . As funções de

pertinência (ai) são definidas como curvas dedistribuição normal, como mostrado na equação 4.

Tabela 1: Elementos da rede neurofuzzy

x vetor de amostras de ECG

nx n-ésima amostra

ny n-ésimo valor de saída darede

]x,,x,x[ p21 Κ Média (equação 2)

],,,[ p21 σσσ Κ Desvio padrão (equação 3)

]a,,a,a[ p21 Κ=a saída dos conjuntos fuzzy

]w,,w,[ww p21 Κ= pesos da rede

Figura 2: A arquitetura da rede neurofuzzy

pi1 ,

2

ik

)i

xi

(x0.5

ei

a ≤≤⋅−

⋅−

=

(4)

Nestas funções de pertinência, os valores centrais deseus suportes (ix ) correspondem aos valores médios

calculados com a equação 2, para os M sinais detreinamento (Dm x p). Os valores de (iσ ) correspondem

ao desvio padrão calculado pela equação 3 para osmesmos dados de treinamento. O desvio padrão éajustado pela constante k, ajustada para 3, a fim deassegurar que todas as amostras estão incluídas noslimites do suporte das funções de pertinência. O suporte

003

as funções de pertinência são definidos pelas equações5 e 6.

A segunda transformação produzida pela rede é asoma linear dos valores de saída das funções depertinência, na forma: ya:g → , onde a saída

defuzzyficada da função é dada pela equação 7, e ospesos definem a importância relativa de cada entrada.

Deve-se notar que ∑ ==

p

1i i 1w .

pi1 ,i

kixi

sleft

≤≤⋅−= σ (5)

pi1 ,i

kixi

sright

≤≤⋅+= σ (6)

∑=

⋅=p

1ij

wj

an

y (7)

5. O treinamento da rede neurofuzzy comalgoritmos genéticos

O processo de treinamento da rede pode ser vistocomo uma busca no espaço multidimensional doconjunto de pesos. Esta busca procura pelo conjunto depesos ótimos que minimize o erro total quando daidentificação dos padrões de treinamento. Nesteproblema em particular, a busca objetiva encontrar umconjunto de pesos que obtenha a máxima discriminaçãodas ondas P com relação aos outros elementos do sinalde ECG. Apesar dos algoritmos tradicionais para otreinamento de redes neurais, o uso de AlgoritmosGenéticos (AGs) tem se mostrado prático e eficientepara o treinamento tanto da arquitetura quanto doconjunto de pesos de redes neurofuzzy [9,11]. Oconjunto de pesos da rede foram otimizados utilizandoum sistema baseado no pacote de programas GALOPPSrevisão 3.2 [6], publicamente disponível na Internet.

Um Algoritmo Genético [5] é uma técnicafortemente baseada no modelo Darwiniano da evoluçãodas espécies e é largamente aplicado em tarefas deotimização. O uso de AGs em problemas práticosenvolve duas definições principais: a codificação docromossomo e a função de fitness. Os outros parâmetroscontrolam a busca através de AG são apresentados emdetalhes na seção 5.3.

5.1 Representação do cromossomo

O número de entradas na rede neurofuzzy foidefinido em 35, como discutido na seção 3. Assim, oconjunto de pesos a ser encontrado pode serconsiderado como um vetor de 35 posições. O AGpadrão emprega representação binária em vez denúmeros reais, de forma que cada elemento do vetordeve ser convertido para binário. Este processo,

conhecido como quantização, requer que uma precisãoarbitrária seja previamente escolhida. Aqui, 8 bitsforam suficientes para representar a faixa possível decada peso: de 0 até 1-(1/256), representando 00000000até 11111111 em binário. O cromossomo é entãorepresentado com 8 x 35 = 280 bits, definindo umespaço de busca de 2280 ≈ 1.94 x 1084 pontos discretos.Este espaço de busca é tão grande que ele dificilmentepoderia ser inteiramente vasculhado em tempo aceitávelcom nossa tecnologia computacional corrente. Istoenfatiza o uso de uma técnica eficiente, AGs, paratratar deste problema.

5.2 Função de fitness

A função de fitness mensura quão bom candidatopara a solução do problema é um indivíduo. O sucessoou não de uma implementação com AG é fortementeinfluenciada pela escolha da função de fitness. Afunção de fitness é, em última análise, a função que estásendo otimizado com o uso de AG. Uma função defitness mal escolhida pode dificultar a busca da mesmaforma que uma função bem projetada pode induzir auma convergência rápida.

A função de fitness utilizada é a definida pelaequação 8, sendo calculada através da saída da rede yn

quando um dos vetores de treinamento previamenteselecionados (incluídos em Dm x p) é aplicado para asentradas. O valor de saída da rede (yn) pertence à faixa[0,1], assim deve-se esperar yn = 1 como o resultadoótimo para todos os vetores de treinamento. Em cadageração o vetor de treinamento é trocado, tomadoseqüencialmente do conjunto de exemplos detreinamento.

2

125.0

1n

y1

1n

fitness

−+

= (8)

5.3 Parâmetros do GA

Algoritmos Genéticos geralmente empregam doisoperadores principais: crossover e mutação. Areprodução não é considerado um operador, mas umprocedimento que ocorre antes da aplicação dosoperadores genéticos. O núcleo da reprodução reside naseleção de indivíduos de uma geração segundo seusfitness para formar um conjunto de soluções, ao qual osoperadores devem ser aplicados.

Entre os diversos esquemas de seleção possíveispara a reprodução, nós utilizamos o método daAmostragem Universal Estocástica (SUS - StochasticUniversal Sampling). O SUS fornece uma baixadispersão sobre a distribuição desejada dos indivíduos eé livre de polarização. Ele é consideradosuficientemente rápido para o processamento serial e

004

mais eficiente que os métodos de seleção da Roleta,Resto Estocástico e do Torneio [6,10]. Para muitosproblemas tratados com AGs, o uso de parâmetros deexecução dentro de determinadas faixas geralmenteproduz resultados satisfatórios [7]. Para este problema,nós usamos uma tamanho de população de (λ) de 70indivíduos, com comprimento (Λ) de 280 bits. O AGfoi processado para 160 gerações e a população inicial(P0) foi formada aleatoriamente. A probabilidade demutação (pm) foi definida 1/ λ, i.e., 0,014, e aprobabilidade de crossover (pc) em 0,6.

6. Resultados

Um total de três testes completos e independentesforam realizados usando os arquivos de sinaispreviamente adquiridos. Estes três arquivos possuemdiferentes tamanhos e para cada caso de teste, cincoondas P foram tomadas aleatoriamente (usando ocritério da seção 3). Cada conjunto de cinco segmentosfoi usado para treinar uma rede neurofuzzy segundo oprocedimento previamente descrito. Após otreinamento da rede, ela foi aplicada ao restante doarquivo de sinal de ECG. A tabela 2 resume osresultados obtidos.

Tabela 2: Resultados da detecção da onda P para trêsdiferentes sujeitos

Caso deteste #

Limiarde

Detec-ção

# deciclos

deECG

Ondas Pdetec-tadas

OndasP nãodetec-tadas

Falsasondas P

1 0.5 26 25 1 02 0.6 27 24 3 13 0.6 17 11 6 0

O critério adotado para a detecção positiva foi apresença de amplitudes superiores a do limiar dedetecção na saída da rede. Este limiar foi ajustadoempiricamente e de acordo com nossos experimentos,está otimamente localizado na faixa de 0,5 a 0,6. Oprocedimento de treinamento de uma rede para cadacaso de teste (sujeito) é devido principalmente àvariabilidade dos sinais biológicos, tendo sido inspiradopor [14]. Se nós utilizássemos uma rede treinada paraum sujeito em outro, os resultados tenderiam a serpiores.

Na tabela 2, “Falsas ondas P” identifica os casosem que a rede detectou um segmento de sinal de ECGcomo sendo uma onda P e de fato este não o era.Nestes casos a onda detectada foi, de fato, uma onda Texacerbada.

A figura 3 apresenta uma vista em detalhe de algunsciclos de ECG assim como da saída da rede (yn), onde épossível visualizar os pontos exatos de ocorrência dospicos. Estes pontos aproximadamente identificam o

final da onda P, ou seja, o início da onda P estálocalizado aproximadamente 35 amostras de sinal atrás.

Figura 3: Vista detalhada de um sinal de ECG real(acima) e a correspondente saída da rede yn (abaixo)

7. Discussão e conclusões

O procedimento de treinamento da rede usando AGsfoi rápido e produziu bons resultados. Isto confirma autilidade das técnicas evolucionárias para otreinamento de redes neurais e o porque da crescenteutilização de AGs nos últimos anos. Os resultadosapresentados na seção 6 mostram um decréscimo nataxa de classificação correta do caso #1 para o #3. Isto éconsistente com o fato de que a inspeção visual destestrês sinais mostrar uma aumento da distorção e ruído.Porém, a taxa média de classificações corretas, 83,2%,pode ser considerada boa, relevando-se o ruído presentenas amostras e a variabilidade biológica de indivíduopara indivíduo.

Estes resultados promissores indicam que aarquitetura de redes neurofuzzy, juntamente com oprocedimento de treinamento genético, é adequada paraa detecção de templates em sinais temporaisamostrados. Possivelmente esta conclusão pode serextrapolada para outros sinais de origem não biológica.

Uma possibilidade para pesquisa posterior poderiaser o ajuste dinâmico do limiar, bem como algum tipode treinamento adaptativo, como proposto em [14].Finalmente, trabalhos futuros deverão também incluir aaplicação de redes neurofuzzy descritas para outrosarquivos de ECG, para validar posteriormente osresultados registrados aqui.

Referências

[1] Z.Chi, H.Yan, T. Pham, Fuzzy algorithms: withapplications to image processing and pattern recognition.Singapore: World Scientific Publishing, 1996.

[2] C. Dimmer et al. Analysis of the P wave with signalaveraging to assess the risk of atrial fibrillation after

005

coronary artery bypass surgery. Cardiology, 89(1):19-24,1998.

[3] O. Fokapu, J.P. Girard, A new approach for P wavedetection using analytic signal. In Proceedings 15th IEEEEngineering in Medicine and Biology Society Conference,San Diego, part I, 400-401, 1993.

[4] K. Freeman, A. Singh, P wave detection of ambulatoryECG. In Proceedings 13th IEEE Engineering in Medicineand Biology Society Conference, Orlando, USA, part 2,647-648, 1991.

[5] D.E. Goldberg, Genetic algorithms in search, optimizationand machine learning. Reading: Addison-Wesley, 1989.

[6] E.D. Goodman, An introduction to GALOPPS. Technicalreport 96-07-01, Michigan State University, 1996.

[7] J.J. Grefenstette, Optimization of control parameters forgenetic algorithms. IEEE Transactions on Systems, Manand Cybernetics, 16(1), 122-128, 1986.

[8] S.K. Halgamuge, M. Glesner, Fuzzy neural networks:between functional equivalence and applicability.International Journal of Neural Systems, 6(2):185-196,1995.

[9] H. Ishigami, T. Fukuda, T. Shibata, F. Arai, Structureoptimization of fuzzy neural networks by geneticalgorithm. Fuzzy Sets and Systems, 71(3), 257-264, 1995.

[10] P.G. Korning, Training neural networks by means ofgenetic algorithms working on very long chromosomes.International Journal of Neural Systems, 6(3):299-316,1995.

[11] P.V. Krishnamraju, J.J. Buckley, K.D. Reilly, Y.Hayashi, Genetic learning algorithms for fuzzy neuralnets. In Proceedings 3rd IEEE International Conference onFuzzy Systems, Orlando, USA, 1969-1974, 1994.

[12] Liu Z. et al. Abnormalities of electrocardiographic Pwave morphology and their relation toelectrophysiological parameters of the atrium in patientswith sick sinus syndrome. Pacing ClinicalElectrophysiology, 21(1 pt 1):79-86, Jan. 1998.

[13] J.E.Tamis, J.S. Steinberg. Value of the signal-averaged Pwave analysis in predicting atrial fibrillation after cardiacsurgery. Journal of Electrocardiology, 30(suppl):36-43,1998.

[14] Q. Xue, Y.H. Hu, W.J. Tompkins, Neural-network-basedadaptative matched filtering for QRS detection. IEEETransactions on Biomedical Engineering, 39(4), 317-329,1992.

[15] V.R. Zurro, A.L. Stelle, J. Nadal. Detection of atrialpersistent rhythm based on P-wave recognition and RRintervals variability. In Proceedings of Computers inCardiology, Vienna, Austria, 153-162, 1995.