59
DETECÇÃO DA RESPOSTA AUDITIVA EM REGIME PERMANENTE A SONS VOCÁLICOS NATURAIS COM ANALISADOR DE FOURIER Wagner dos Santos Projeto de Graduação apresentado ao Curso de Engenharia Eletrônica e de Computação da Escola Politécnica, Universidade Federal do Rio de Janeiro, como parte dos requisitos necessários à obtenção do título de Engenheiro. Orientador: Carlos Julio Tierra Criollo Coorientador: Pablo Fernando Cevallos Larrea Rio de Janeiro Agosto de 2018

DETECÇÃO DA RESPOSTA AUDITIVA EM REGIME …monografias.poli.ufrj.br/monografias/monopoli10025246.pdf · ASSR - Resposta Auditiva em Regime Permanente, do inglês Auditory Steady

  • Upload
    lykien

  • View
    219

  • Download
    0

Embed Size (px)

Citation preview

DETECÇÃO DA RESPOSTA AUDITIVA EM REGIME

PERMANENTE A SONS VOCÁLICOS NATURAIS COM

ANALISADOR DE FOURIER

Wagner dos Santos

Projeto de Graduação apresentado ao Curso de

Engenharia Eletrônica e de Computação da Escola

Politécnica, Universidade Federal do Rio de

Janeiro, como parte dos requisitos necessários à

obtenção do título de Engenheiro.

Orientador: Carlos Julio Tierra Criollo

Coorientador: Pablo Fernando Cevallos Larrea

Rio de Janeiro

Agosto de 2018

iv

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO

Escola Politécnica – Departamento de Eletrônica e de Computação

Centro de Tecnologia, bloco H, sala H-217, Cidade Universitária

Rio de Janeiro – RJ CEP 21949-900

Este exemplar é de propriedade da Universidade Federal do Rio de Janeiro, que

poderá incluí-lo em base de dados, armazenar em computador, microfilmar ou adotar

qualquer forma de arquivamento.

É permitida a menção, reprodução parcial ou integral e a transmissão entre

bibliotecas deste trabalho, sem modificação de seu texto, em qualquer meio que esteja

ou venha a ser fixado, para pesquisa acadêmica, comentários e citações, desde que sem

finalidade comercial e que seja feita a referência bibliográfica completa.

Os conceitos expressos neste trabalho são de responsabilidade do(s) autor(es).

v

AGRADECIMENTOS

Agradeço, primeiramente, à minha família pelo apoio incondicional.

À minha namorada, porque tornou ilógica qualquer meta de minha vida que não

envolva sua presença.

Ao meu orientador Prof. Carlos Julio Tierra Criollo e ao meu coorientador Pablo

Fernando Cevallos Larrea por toda a orientação, amizade, confiança e por terem me

permitido participar deste projeto, que ficará marcado como uma experiência valiosa.

Aos meu amigos da UFRJ, pelo companheirismo, por estarem sempre presentes e

pelos momentos de descontração. Com vocês, minha jornada nesta universidade tornou-

se mais amena, proveitosa e alegre.

Aos voluntários que participaram dos experimentos e, dessa forma, contribuíram

para o desenvolvimento desta monografia.

Aos professores do DEL (Departamento de Eletrônica), pela excelência

acadêmica e por terem me permitido realizar uma graduação de qualidade.

À Banca Examinadora pelo convite aceito e pela avaliação desta monografia.

vi

RESUMO

A análise da Resposta Auditiva em Regime Permanente (ASSR) a sons

vocálicos naturais possui ampla relevância no contexto de diagnóstico audiológico.

Pode ser considerada uma alternativa aos diagnósticos subjetivos comumente utilizados

na prática médica, beneficiando tanto os pacientes quanto os profissionais da saúde

auditiva.

Foram realizadas coletas de sinais de EEG de 10 voluntários normo-ouvintes,

estimulados pelos fonemas /a/, /i/ e /u/ nas intensidades de 55 dBSPL e 70 dBSPL. Foi

utilizado o Analisador de Fourier para avaliar a amplitude da resposta na frequência

fundamental e nos 5 harmônicos seguintes. Respostas significativas foram encontradas

para todos os fonemas, principalmente para os primeiros harmônicos. Estes resultados

confirmam a utilização do Analisador de Fourier como técnica para a avaliação das

ASSR a sons vocálicos naturais.

Palavras-Chave: ASSR, Analisador de Fourier, Sons Vocálicos Naturais, Potencial

Evocado Auditivo.

vi

i

ABSTRACT

ASSR (Auditory Steady State Response) analysis of natural vowel sounds has

wide relevance in the context of audiological diagnosis: it can be considered an

alternative to the subjective diagnoses commonly used in medical practice, benefiting

both patients and hearing health professionals.

EEG signals were collected from 10 normal-hearing volunteers, stimulated by

phonemes /a/, /i/ and /u/ at the intensities of 55 dBSPL and 70 dBSPL. The Fourier

Analyzer was used to evaluate the amplitude of the fundamental frequency response and

the following 5 harmonics. Significant responses were found for all phonemes,

especially for the first harmonics. These findings support the use of the Fourier

Analyzer as an ideal technique for ASSR evaluation of natural vowel sounds.

Key-words: ASSR, Fourier Analyzer, Natural Vowel Sounds, Auditory Evoked

Potential.

vi

ii

SIGLAS

AMFR - Amplitude Modulation Following Response.

AMFV – Amplitde Média das Frequências Vizinhas.

AR – Amplitude de Referência.

ASSR - Resposta Auditiva em Regime Permanente, do inglês Auditory Steady State

Response.

DFT - Transformada Discreta de Fourier, do inglês Discrete Fourier Transform.

EFR - Envelope-Following-Response.

EEG - Eletroencefalografia.

fm - Frequência de Modulação.

ORD : Detecção Objetiva de Resposta, do inglês Objective Response Detection.

PEA - Potencial Evocado Auditivo

RMS – Raiz do Valor Quadrático Médio, do inglês Root Mean Square.

SNR - Signal-to-Noise Ratio.

TFE – Teste F Espectral

TH – Transformada de Hilbert.

ix

Sumário

1 Introdução 1

1.1 Tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Delimitação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.3 Justificativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.4 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Fundamentação Teórica 4

2.1 Fisiologia do Sistema Auditivo . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2.2 Considerações Relevantes Sobre a Fonação . . . . . . . . . . . . . . . . . . . 4

2.3 Resposta Auditiva em Regime Permanente – ASSR . . . . . . . . . . . . . . . 6

2.3.1 Análise da ASSR a Sons Vocálicos Naturais . . . . . . . . . . . . . . . . . 8

2.4 Transformada de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.5 Analisador de Fourier. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.6 Técnicas de Detecção Objetiva de Resposta . . . . . . . . . . . . . . . . . . . 15

2.6.1 Teste F Espectral Local (TFE Local) . . . . . . . . . . . . . . . . . . . . . 15

3 Materiais e Métodos 17

3.1 Sistema de Estimulação e Detecção de ASSR . . . . . . . . . . . . . . . . . 17

3.2 Voluntários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.3 Estímulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3.4 Formantes do Trato Vocal . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.5 Protocolo Experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

3.6 Análise da ASSR a Sons Vocálicos Naturais . . . . . . . . . . . . . . . . . . 27

4 Resultados e Discussão 32

4.1 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4.2 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

5 Conclusão 45

6 Bibliografia 46

x

Lista de Figuras

2.1 – Modelo Fonte Filtro 6

2.2 - Posição recomendada dos eletrodos para registro da ASSR 8

2.3 - Espectrograma do sinal Chirp. Fs = 1 Khz. 0-250Hz. t = 10 s 14

2.4 - DFT do sinal Chirp. Fs = 1 Khz. F = 0-250Hz. t = 10 s 14

3.1 - Estrutura funcional do sistema de aquisição e análise de ASSR. 18

3.2 - Fonema /a/ filtrado em passa banda FIR (10 - 4000 Hz) 21

3.3 - Fonema /i/ filtrado em passa banda FIR (10 - 4000 Hz) 21

3.4 - Fonema /u/ filtrado em passa banda FIR (10 - 4000 Hz) 22

3.5 - Orelha artificial 4153 e o analisador de frequências 2250 22

3.6 - Curvas de ponderação espectral sonora A,C e Z. 23

3.7 - Calibração para fonemas /a/, /i/ e /u/ para 70 dBSPL 24

3.8 - Modelo Espectro vocal (Picos: Formantes para Fonema /a/). 25

3.9 - Modelo Espectro vocal (Picos: Formantes para Fonema /i/). 25

3.10 - Modelo Espectro vocal (Picos: Formantes para Fonema /u/). 25

3.11 - Envelope do fonema /a/. Abaixo, DFT do envelope. 28

3.12 - Envelope do fonema /i/. Abaixo, DFT do envelope. 29

3.13 - Envelope do fonema /u/. Abaixo, DFT do envelope. 29

3.14 - Frequência instantânea do envelope filtrado do fonema /a/ 30

3.15 - Frequência instantânea do envelope filtrado do fonema /i/, 30

3.16 - Frequência instantânea do envelope filtrado do fonema /u 31

4.1 - AR e AMFV. Fonema /a/;Intensidade 70 dBSPL. 33

4.2 - AR e AMFV. Fonema /a/;Intensidade 55 dBSPL 34

4.3 - AR e AMFV. Fonema /i/;Intensidade 70 dBSPL. 35

4.4 - AR e AMFV. Fonema /i/;Intensidade 55 dBSPL. 36

4.5 - AR e AMFV. Fonema /u/;Intensidade 70 dBSPL. 37

4.6 - AR e AMFV. Fonema /u/;Intensidade 55 dBSPL. 38

4.7 - AR e AMFV. Fonema /a/ (não audível);Intensidade 70 dBSPL. 39

4.8 - AR e AMFV. Fonema /i/ (não audível);Intensidade 70 dBSPL. 40

4.9 - AR e AMFV. Fonema /u/ (não audível);Intensidade 70 dBSPL. 41

xi

Lista de Tabelas

3.1 - Calibração dos fonemas 24

4.1 - Desvio padrão de “AR” e “AMFV”. Percentual de detecção com 34

TFE local. Fonema /a/; Intensidade 70 dBSPL.

4.2 - Desvio padrão de “AR” e “AMFV”. Percentual de detecção com 34

TFE local. Fonema /a/; Intensidade 55 dBSPL.

4.3 - Desvio padrão de “AR” e “AMFV”. Percentual de detecção com 35

TFE local. Fonema /i/; Intensidade 70 dBSPL.

4.4 - Desvio padrão de “AR” e “AMFV”. Percentual de detecção com 36

TFE local. Fonema /i/; Intensidade 55 dBSPL.

4.5 - Desvio padrão de “AR” e “AMFV”. Percentual de detecção com 37

TFE local. Fonema /u/; Intensidade 70 dBSPL.

4.6 - Desvio padrão de “AR” e “AMFV”. Percentual de detecção com 38

TFE local. Fonema /u/; Intensidade 55 dBSPL.

4.7 - Desvio padrão de “AR” e “AMFV”. Percentual de detecção com 39

TFE local. Fonema /a/ (não audível); Intensidade 70 dBSPL.

4.8 - Desvio padrão de “AR” e “AMFV”. Percentual de detecção com 40

TFE local. Fonema /i/ (não audível); Intensidade 70 dBSPL.

4.9 - Desvio padrão de “AR” e “AMFV”. Percentual de detecção com 41

TFE local. Fonema /u/ (não audível); Intensidade 70 dBSPL.

1

1 Introdução

1.1 Tema

O tema deste trabalho é a análise da Resposta Auditiva em Regime Permanente

(do inglês, ASSR – Auditory Steady State Response) durante a aplicação de estímulos

auditivos de vogais. A ASSR perante estímulos vocálicos tem capacidade para apoiar o

diagnóstico objetivo da audição, podendo se tornar uma alternativa aos diagnósticos

subjetivos comumente utilizados na prática médica. Os resultados deste estudo podem

contribuir ao conhecimento e aperfeiçoamento desta nova técnica como ferramenta de

diagnóstico audiológico, podendo beneficiar tanto os profissionais da saúde auditiva

quanto os pacientes.

1.2 Delimitação

O estudo consistiu no registro de sinais de eletroencefalografia (EEG) de

sujeitos adultos com limiares auditivos normais durante a estimulação controlada de

sons vocálicos. As respostas eletrofisiológicas evocadas por esses estímulos foram

adquiridas por um equipamento de registro de sinais biológicos e detectadas por um

modelo computacional (detecção objetiva).

1.3 Justificativa

Atualemnte, 466 milhões de pessoas são afetadas por perdas auditivas, das

quais 34 milhões são crianças (WHO, 2018). Estas são particularmente prejudicadas no

desenvolvimento da linguagem, fator que diminui sua qualidade de vida (ASHA,2018).

O diagnóstico da perda auditiva e a intervenção antecipada permitem o

desenvolvimento apropriado da função auditiva, enquanto o tratamento tardio pode

comprometer o sistema auditivo de forma irreversível (JCIH, 2007).

2

Um método utilizado na prática clínica para dar suporte ao diagnóstico da

audição retrococlear é a Resposta Auditiva em Regime Permanente (ASSR). Essa

resposta provém da ativação de diversos núcleos neuronais da via auditiva decorrentes

da ação do estímulo sonoro contínuo. Os núcleos geradores da ASSR estão localizados

desde a estrutura coclear, onde as células ciliadas iniciam um processo de ativação

neural, até o córtex auditivo. A atividade destes núcleos cria um campo eletromagnético

no cérebro (fontes cerebrais), sendo que o campo elétrico pode ser estudado por meio da

eletroencefalografia (EEG).

As técnicas de detecção objetiva da ASSR baseiam-se na frequência do envelope

que modula o som aplicado em um indivíduo, identificando-o quantitativamente para

inferir seu potencia evocado auditivo. Para estímulos de sons vocálicos, essa resposta é

conhecida como EFR (Envelope-Following-Response).

Na prática clínica, a ASSR é utilizada para estimar os limiares auditivos de seres

humanos e, especialmente, de sujeitos que não respondem a testes comportamentais, por

exemplo no caso de recém-nascidos. Além disso, os resultados de um teste ASSR

podem ser utilizados para o ajuste de aparelhos de amplificação auditiva, aferidos de

acordo com os limiares diagnosticados.

As características do estímulo utilizado para evocar uma ASSR determinam

quais estruturas nervosas são ativadas para gerar a resposta, bem como os requisitos

para sua detecção. Diversos estudos têm analisado a ASSR para estimulação por tons

modulados em amplitude (JOHN et al., 2002), frequência e ruído (JOHN et al., 2003) e

tone chirp (HEKIMOGLU et al., 2001). Esses estímulos, contudo, possuem

características acústicas projetadas apenas para avaliar limiares auditivos de frequência

específica.

O uso de estímulos vocálicos tem sido o tema de muitas pesquisas científicas

recentes, uma vez que a composição complexa destes estímulos (sua estrutura

harmônica, por exemplo) permite avaliar a complexa resposta de diversas estruturas do

processamento auditivo tanto no nível periférico quanto nos níveis de processamento

auditivo superior. Uma aplicação relevante, por exemplo, é a análise das respostas

eletrofisiológicas a estímulos auditivos vocálicos, utilizada no estudo da codificação de

som no tronco encefálico em crianças com problemas de aprendizado (CUNNINGHAM

et al., 2001; KING et al.,2002) e crianças com problemas no processamento auditivo

(JOHNSON et al., 2007). O uso de sons vocálicos naturais é preferível para um

3

teste direcionado a aferir a transmissão da informação do som vocálico ao tronco

encefálico para fins de concepção e ajuste de aparelhos auditivos. Afinal, muitos desses

aparelhos são designados para amplificar especificamente sons de fala e atenuar sons

que não são de fala (SCOLLIE e SEEWALD, 2002).

Em virtude do que foi mencionado, a ASSR para estímulos vocálicos pode ser

considerada uma técnica de amplo potencial para avaliar o processo de codificação

periférica de sons de vogais, a qual está nos seus primórdios. Portanto, foi escolhida

como tema de estudo e avaliação deste projeto de graduação.

1.4 Objetivo

O objetivo deste projeto de graduação é avaliar a capacidade da ASSR por

estímulos auditivos vocálicos utilizando o Analisador de Fourier.

4

2 Fundamentação Teórica

2.1 Fisiologia do Sistema Auditivo

Os impulsos nervosos resultantes da percepção da variação de pressão das ondas

sonoras são reconhecidos no cérebro como sons. O sistema auditivo humano reconhece

esses sons na faixa de 20 a 20 kHz (BEAR et al., 2007).

O reconhecimento da onda sonora como som pelo cérebro pode ser entendido

pela seguinte dinâmica : A orelha externa capta a onda sonora no pavilhão auricular e o

meato acústico externo encaminha-a até a membrana timpânica, que se encontra no

começo da orelha média. Finalmente, as ondas sonoras atingem a membrana timpânica

e vibram-na, movimentando os ossículos (martelo, bigorna e estribo) e, por conseguinte,

a janela oval na orelha interna, onde a energia mecânica é transformada em informação

nervosa (SILVERTHORN e HILL, 2010).

Na orelha interna, a estrutura coclear recebe as vibrações provocadas pelos

ossículos através dos fluidos cocleares, vibrando a membrana basilar do órgão de Corti.

A movimentação da membrana provoca deslocamento dos estereocílios das células

ciliadas, levando à despolarização ou hiperpolarização das células, que encaminham,

pelas sinapses, os impulsos elétricos até as fibras do gânglio espiral. Assim, padrões de

vibração na orelha interna desencadeiam padrões de potenciais de ação na via auditiva

nervosa (SILVERTHORN e HILL, 2010).

Mapeamento de Frequência e Intensidade

Na membrana basilar, as frequências sonoras provocam padrões de vibração em

diferentes regiões. As frequências altas vibram a base da membrana, enquanto que as

frequências baixas vibram o ápice. (BEAR et al., 2007).

O mapeamento de frequência ocorre desde a cóclea até o córtex. Isto é, os

neurônios responsáveis pela condução dos impulsos nervosos também são mais ou

menos responsivos em determinadas frequências. O sincronismo de fase atua no

máximo até 2000 Hz (faixa na qual atuam conjuntamente a sincronia de fase e o

mapeamento de frequências) (BEAR et al., 2007).

5

Sons mais intensos provocam uma maior taxa de potencias de ação nas fibras

ganglionares, bem como um maior número de neurônios recrutados. (BEAR et al.,

2007).

2.2 Considerações Relevantes sobre a Fonação

Nos sons vocálicos, um sinal periódico é gerado pelas cordas vocais. Seus

harmônicos são continuamente modificados em intensidade, na medida que os

articuladores primários (língua, mandíbula, lábios) alteram as características de

ressonância do trato vocal. Outro fator que altera a estrutura do som vocálico é a

variação da frequência fundamental acarretada pela entonação utilizada pelo falante

(AIKEN e PICTON, 2006).

A geração do som vocálico possui como modelo a teoria fonte-filtro de

produção da fala desenvolvida por Gunnar Fant na década de 1960, segundo a qual a

energia irradiada é o produto da energia da fonte (laringe) e do ressonador (trato vocal) ,

de acordo com a equação (ZEMLIN, 2000, p. 313, apud SANTOS, 2010, p. 26):

P(f) = |U(f)| . |H(f)| . |R(f)|

A interpretação desta expressão para sons vocálicos é (Figura 2.4):

P(f) : Espectro da pressão sonora a pequena distância dos lábios.

U(f) : Espectro do som produzido pela vibração das cordas vocais, determinado pela

frequência dos ciclos glóticos na laringe.

H(f) : Espectro característico da propagação pelo trato vocal (boca, faringe e nariz)

R(f) : Espectro característico da propagação através dos lábios.

Os pulsos gerados na fonação são filtrados pelas cavidades acústicas do trato

vocal, e propagam-se pelo ar.

6

U(f) H(f) R(f) P(f)

Figura 2.1 (modificado de VIEIRA(2004), domínio público) : Modelo Fonte-Filtro. A fonte é

representada por uma série harmônica, o filtro por formantes (F1, F2, etc : picos no espectro do

trato vocal), e a irradiação pela sua característica passa-altas.

2.3 Resposta Auditiva em Regime Permanente - ASSR

A Resposta Auditiva em Regime Permanente (ASSR) é a denominação da

resposta eletrofisiológica provocada no sistema auditivo e evocada por sons

(normalmente entre 500 e 4000 Hz) modulados em amplitude (em 80, 90 Hz,

geralmente) ou uma sucessão de estímulos acústicos aplicados a uma taxa rápida o

bastante para provocar a sobreposição de respostas. (JOHN et al., 1998).

O campo elétrico gerado pela ASSR pode ser registrado por meio da aquisição

de sinais de EEG.

A ASSR possui várias designações ou aplicações: Resposta que segue a

modulação de amplitude (AMFR - amplitude modulation following response) (LEVI et

al., 1993), potencial evocado em regime permanente ou potencial evocado em estado

estável (SSEP - steady state evoked potential) (RANCE et al., 1998), ou resposta

seguindo o envelope (EFR – envelope following response) (PURCELL et al., 2004).

Geradores da ASSR

Na membrana basilar, o som modulado acarreta ativação das células ciliadas nas

regiões correspondentes à frequência do estímulo (conforme mapeamento de

frequências, estudado no capítulo 2.1). Os potenciais de ação gerados nas células

7

ciliares internas, que possuem saturação para grandes amplitudes, são encaminhados

para as células ganglionares do nervo auditivo. Nestas, esses potenciais são retificados,

uma vez que os disparos neuronais conduzem o impulso nervoso num sentido único.

(BEAR et al.,2007).

Finalmente, a ASSR é gerada em determinadas regiões de acordo com

frequência de modulação (fm) utilizada no estímulo sonoro. Sugere-se que, para fm em

torno de 20-40 Hz, tanto o tronco encefálico quanto as regiões corticais podem ser

consideradas como responsáveis pela geração da ASSR. Para fm entre 70 e 100 Hz,

considera-se o tronco encefálico como gerador principal (MAUER e DÖRING,1999).

Estimulação

Os estímulos normalmente utilizados para evocar a ASSR são : Aplicação

repetida de tons curtos (clique, burst ou chirp) numa taxa que permita sobreposição de

respostas, tons modulados em amplitude e sons vocálicos, sendo os tons modulados os

mais utilizados.

O estímulo por tons modulados, normalmente, é dado pela modulação em

amplitude de uma senóide, de frequência audível e é comumente utilizado em

avaliações clínicas (entre 500 e 4000 Hz; portadora) por um sinal de frequência menor

(modulante). Assim, a frequência da portadora estabelece a região da membrana basilar

que será estimulada, e a frequência de modulação é utilizada como um “identificador”

que, posteriormente, será detectado pela análise dos sinais de EEG.

Os sons vocálicos, foco deste estudo, possuem uma aplicação mais complexa do

que a estimulação por tons modulados em amplitude ou a aplicação repetida de tons

curtos, devido a sua variabilidade espectral e temporal. Apesar disso, ele se assemelham

aos tons modulados, uma vez que seus harmônicos são naturalmente modulados em

amplitude na frequência fundamental de abertura e fechamento da glote (AIKEN e

PICTON, 2006). Além disso, a frequência de portadora utilizada para tons modulados

(500 – 4000 Hz) está dentro da faixa dos harmônicos do som vocálico, assim como a

frequência de modulação utilizada para tons modulados (em torno dos 80 Hz) está

próxima à frequência fundamental do envelope do sinal vocálico. Assim, de forma

análoga ao estímulo por tom modulado, as frequências do envelope do som vocálico são

utilizadas como “identificador”, posteriormente detectado através da análise dos sinais

de EEG.

8

Registro multicanal ASSR

A escolha do local no couro cabeludo para gravação da ASSR influenciará na

detecção da resposta, uma vez que derivações com maior SNR (Razão Sinal Ruído)

estão associadas com melhor desempenho das técnicas estatísticas de detecção e com

uma redução do tempo necessário para detecção da ASSR (VAN DER REIJDEN,

2005).

Para o registro da ASSR, as derivações normalmente recomendadas, usando

como referência o Sistema Internacional 10-20 (Figura 2.7), para registro dos sinais de

EEG são o Mastoide Esquerdo (M1), Mastoide Direito (M2) e Inion (Oz), com eletrodo

de referência posicionado no vertex (Cz) e o eletrodo de terra normalmente posicionado

na região fronto-central (Fpz). (LINS e PICTON, 1995)

Figura 2.2 : Posição recomendada dos eletrodos para registro da ASSR. Modificado de

(RESEARCH GATE, 2014)(Domínio público).

2.3.1 Análise da ASSR a sons vocálicos naturais

Uma diferença fundamental entre as modulações tradicionalmente utilizadas

para ASSR e modulações baseadas no som de fala é que o envelope desta varia

continuamente na frequência. ASSR’s são, normalmente, transformadas no domínio da

frequência pela aplicação da Transformada Discreta de Fourier (DFT), na qual a energia

da resposta na frequência modulada (estacionária) pode ser estimada (PICTON et al.,

2003). Entretanto, a frequência fundamental e os harmônicos do som vocálico, bem

9

como as frequências de seu envelope, podem variar até 50 Hz/s (AIKEN e PICTON,

2008).

Uma forma de eliminar o problema é usar sons vocálicos sintéticos, onde a

frequência fundamental pode ser mantida constante, permitindo a aplicação da DFT sem

prejuízos (KRISHNAM, 2002). Apesar dos benefícios associados ao uso de vogais

sintéticas, o uso de sons vocálicos naturais são preferíveis para um teste direcionado a

aferir a transmissão da informação do som vocálico ao tronco encefálico para fins de

concepção e ajuste de aparelhos auditivos, uma vez que muitos desses aparelhos são

designados para amplificar especificamente sons de fala e atenuar sons que não são de

fala (SCOLLIE e SEEWALD, 2002). Além disso, o sistema auditivo não é linear e pode

responder de forma diferente para sons sintéticos do que para sons de fala naturais

(GALBRAITH et al., 2004).

Estudos focados especificamente nas amplitudes do PEA (Potencial Evocado

Auditivo) normalmente evitam o uso da DFT para análise da ASSR a estímulos

vocálicos. Se a trajetória da frequência da resposta pode ser predita antecipadamente

(e.g. se a resposta seguir o envelope do som vocálico), como ocorre com os sons

vocálicos, uma melhor alternativa é fazer o uso do Analisador de Fourier (REGAN,

1989).

Ao contrário da DFT, que analisa o sinal sob um espectro de frequências

estacionárias, o FA relaciona a resposta gravada a uma frequência de referência que

não precisa necessariamente ser estacionária. O FA pode, então, seguir as variações de

frequência que ocorrem dentro de uma janela de análise. Se a resposta segue a uma

frequência de referência, a relação entre a resposta e a referência não se altera, portanto

a amplitude da resposta não é afetada pela variação de frequência. Assim, esta técnica

proporciona uma forma de identificar respostas não estacionárias (AIKEN e PICTON,

2006).

2.4 Transformada de Hilbert

O Analisador de Fourier tem como base a Transformada de Hilbert (TH), para

extração do envelope do sinal e extração de fase instantânea.

10

A TH é uma operação linear que gera como saída uma função no mesmo

domínio e ortogonal à função de entrada. Para sinais contínuos, a TH pode ser definida

como (BENDAT e PIERSOL, 2010):

�̃�(𝑡) = ℋ[𝑥(𝑡)] = 𝑥(𝑡) ∗ 1

𝜋𝑡= ∫

𝑥(𝜏)

𝜋(𝑡−𝜏)

−∞𝑑𝜏 (Equação 2.1)

Como a integral é imprópria, é necessário calcular o valor principal de Cauchy.

Para sinais discretos esta preocupação não é necessária, já que a operação de integração

passa a ser de somatório (OPPENHEIM, 2010).

A TH também pode ser definida a partir de um sinal analítico. Um sinal analítico

é um sinal que não apresenta componentes negativos de frequência e que, por

consequência, é complexo no tempo (Figura 2.8).

É possível demonstrar a relação entre a TH e o sinal analítico.

Aplicando o teorema da convolução à equação 2.1:

ℱ{�̃�(𝑡)} = ℱ{𝑥(𝑡)}ℱ {1

𝜋𝑡}

�̃�(𝑓) = −𝑖𝑋(𝑓)𝑠𝑔𝑛(𝑓) (Equação 2.2)

Em que a função sgn é definida como :

𝑠𝑔𝑛(𝑓) = {

−1, 𝑠𝑒 𝑓 < 0 0, 𝑠𝑒 𝑓 = 01, 𝑠𝑒 𝑓 > 0

(Equação 2.3)

Substituindo a definição de sgn na equação 2.2:

�̃�(𝑓) = {

𝑖𝑋(𝑓), 𝑠𝑒 𝑓 < 0 0, 𝑠𝑒 𝑓 = 0

−𝑖𝑋(𝑓), 𝑠𝑒 𝑓 > 0 (Equação 2.4)

Logo

�̃�(𝑓) = −𝑖𝑋(𝑓+) + 𝑖𝑋(𝑓−) (Equação 2.5)

Multiplicando ambos os lados da equação 2.5 por 𝑖 :

11

𝑖�̃�(𝑓) = 𝑋(𝑓+) − 𝑋(𝑓−) (Equação 2.6)

Somando 𝑋(𝑓) em ambos os lados da equação 2.6:

𝑋(𝑓) + 𝑖�̃�(𝑓) = 𝑋(𝑓) + 𝑋(𝑓+) − 𝑋(𝑓−) (Equação 2.7)

Substituindo 𝑋(𝑓) por 𝑋(𝑓−) + 𝑋(𝑓0) + 𝑋(𝑓+) no lado direito da equação 2.7:

𝑋(𝑓) + 𝑖�̃�(𝑓) = 𝑋(𝑓0) + 2𝑋(𝑓+) (Equação 2.8)

Observa-se que o lado direito da equação 2.8 não possui componentes negativos

de frequência, o que está de acordo com a definição de sinal analítico.

Sendo:

𝑍(𝑓) = {

2𝑋(𝑓), 𝑠𝑒 𝑓 > 0 𝑋(𝑓), 𝑠𝑒 𝑓 = 0

0, 𝑠𝑒 𝑓 < 0 (Equação 2.9)

e

𝑧(𝑡) = ℱ−1[𝑍(𝑓)] (Equação 2.10)

Aplicando a definição da equação 2.9 no lado direito da equação 2.8:

𝑋(𝑓) + 𝑖�̃�(𝑓) = 𝑍(𝑓) (Equação 2.11)

e, calculando-se a Transformada Inversa de Fourier na equação 2.11:

ℱ−1[𝑋(𝑓)] + 𝑖ℱ−1[�̃�(𝑓)] = ℱ−1[𝑍(𝑓)]

𝑥(𝑡) + 𝑖�̃�(𝑡) = 𝑧(𝑡) (Equação 2.12)

Aplicando a definição da equação 2.1 na 2.12:

𝑥(𝑡) + 𝑖ℋ[𝑥(𝑡)] = 𝑧(𝑡) (Equação 2.13)

Observa-se que o sinal é complexo e que sua parte imaginária corresponde à TH

de sua parte real.

Um sinal puramente real possui transformada de Fourier simétrica. Sendo assim,

ele pode ser representado como um sinal analítico anulando-se os componentes de

frequência negativa, de acordo com a equação 2.9. Observa-se que a energia do sinal

analítico resultante é mantida, já que o valor dos componentes positivos de frequência

são multiplicados por 2.

12

A partir do sinal analítico, é possível calcular a amplitude instantânea do sinal:

𝐴(𝑡) = √𝑥2(𝑡) + �̃�2(𝑡) (Equação 2.14)

e a fase instantânea, definida por :

𝜃(𝑡) = tan−1 [�̃�(𝑡)

𝑥(𝑡)] (Equação 2.15)

Para sinais de banda-estreita, a amplitude instantânea pode ser interpretada como

o envelope do sinal.

Outro atributo que pode ser obtido a partir do sinal analítico é a frequência

instantânea, definida por:

𝜔(𝑡) =𝑑𝜃(𝑡)

𝑑𝑡 (Equação 2.16)

em radianos por segundo, ou:

𝑓(𝑡) =1

2𝜋

𝑑𝜃(𝑡)

𝑑𝑡 (Equação 2.17)

em Hertz.

2.5 Analisador de Fourier

Este subcapítulo trata da definição do Analisador de Fourier, além de prover

uma aplicação prática para servir como teste de validação. Conforme visto no capítulo

2.3, o FA relaciona a resposta gravada a uma frequência de referência que não precisa

necessariamente ser estacionária.

Definição

Uma forma simples de compreender o FA por meio de sua comparação com a

DFT.

Seja a DFT definida por :

𝑋(𝑘) = ∑ 𝑥(𝑛)𝑒−𝑖2𝜋𝑘𝑛

𝑁𝑁−1𝑛=0 = ∑ 𝑥(𝑛) [cos (

2𝜋𝑘𝑛

𝑁) − 𝑖 sin (

2𝜋𝑘𝑛

𝑁)]𝑁−1

𝑛=0 (Equação 2.18)

13

Assim, notamos que :

𝑋(𝑘) é um vetor de números complexos.

𝑋(𝑘) é a correlação cruzada da sequência de entrada x(n) com a exponencial

complexa na frequência k/N, atuando como um filtro casado para tal frequência.

Seja o FA definido por :

𝑋 = ∑ 𝑥(𝑛)𝑒−𝑖𝜃𝑁−1𝑛=0 = ∑ 𝑥(𝑛)[cos(𝜃𝑛) − 𝑖 sin(𝜃𝑛)]𝑁−1

𝑛=0 (Equação 2.19)

onde 𝜃 é a fase instantânea (obtida pela equação 2.15) de um sinal utilizado

como referência.

Assim, notamos que :

𝑋 é um número complexo.

O FA correlaciona cada amostra 𝑥(𝑛) com um fasor, cuja fase específica é

dada pela fase instantânea de um sinal de referência.

O FA pode, então, seguir as variações de frequência (do sinal de referência)

que ocorrem dentro de uma janela de análise (AIKEN e PICTON, 2006).

Seja X o valor obtido pela equação 2.19, teremos que :

A amplitude do FA é dada por :

√𝑅𝑒{𝑋}2 + 𝐼𝑚{𝑋}22 (Equação 2.20)

Sua fase é dada por :

tan−1 (𝐼𝑚{𝑋}

𝑅𝑒{𝑋}) (Equação 2.21)

Implementação no Matlab

Seja x(n) um tom chirp linear amostrado a 1 kHz, de amplitude 0.55, cuja

frequência varia linearmente para t = 0 de 0 Hz a t = 10s para 250 Hz, cujo

espectograma é dado por :

14

Figura 2.3 : Espectrograma do sinal Chirp. Fs = 1 kHz. F = 0-250Hz. t = 10 s

Sua DFT é dada por :

Figura 2.4 : DFT do sinal Chirp. Fs = 1 Khz. F = 0-250Hz. t = 10 s

.

Amplitude dada pelo FA é de : 0.5518

Logo, é notável a melhora proporcionada pelo FA na análise de sinais não

estacionários.

15

2.6 Técnicas de Detecção Objetiva de Resposta

A ASSR pode ser detectada no sinal de EEG por meio da aplicação de técnicas

detecção objetiva de resposta (ORD, do inglês Objective Response Detection). Em

geral, essas técnicas utilizam o teste de hipótese estatístico como critério de avaliação,

através da designação de uma hipótese nula H0, que representa a inexistência de

resposta no sinal de EEG. Dada a distribuição de probabilidade de um parâmetro do

sinal e um nível de significância, delimita-se um valor crítico. Este valor é confrontado

com a estimativa do parâmetro para que a hipótese nula H0 possa ser aceita ou rejeitada

(KAY, 1998).

As técnicas ORD comumente aplicadas são o Teste F Espectral (TFE), a Medida

de Sincronismo de Fase (MSF) e a Magnitude Quadrática da Coerência (MSC).

2.6.1 Teste F Espectral Local

O Teste F Espectral Local (TFE Local) é dado pela razão entre o módulo ao

quadrado do espectro do sinal 𝑦[𝑘] em uma frequência de estimulação (𝑓𝑜) e a média

dos módulos ao quadrado das 𝐿 frequências vizinhas mais próximas. Sendo que, 𝑌(𝑓𝑜) é

o valor da transformada de Fourier na frequência 𝑓𝑜 e 𝑌(𝑓𝑖) são os valores da

transformada de Fourier de cada 𝑖-ésima frequência vizinha à 𝑓𝑜 do sinal 𝑦[𝑘]

(ZUREK, 1992).

∅̂𝑦(𝑓0) =|𝑌(𝑓0)|2

1

𝐿∑ |𝑌(𝑓𝑖)|2𝑜+𝐿/2

𝑖=𝑜−𝐿/2𝑖≠𝑜

(Equação 2.22)

O TFE Local analisa se a distribuição dada por |Y (fo)|2 é estatisticamente

diferente de suas frequências adjacentes. Considerando o presente estudo, no qual a

análise em questão trata de um sinal de EEG, podemos supor que a hipótese nula (𝐻0) é

a ausência de resposta evocada, de modo que a única contribuição para o sinal de EEG é

a atividade de fundo, isto é, 𝑦[𝑘] = 𝑛[𝑘] (ruído branco gaussiano de média nula).

Sabendo que uma variável x tal que x = ∑ 𝑥𝑖2𝑣

𝑖=1 , onde 𝑥𝑖 possui distribuição gaussiana

16

de média zero e variância 𝜎, onde cada 𝑥𝑖 é considerado independente e identicamente

distribuído (IID), x possuirá uma distribuição Qui-quadrada central (KAY, 1998):

1

𝜎2∑ 𝑥𝑖

2~𝑥𝑣2𝑣

𝑖=1 (Equação 2.23)

Observe que tanto o numerador quanto o denominador da equação 2.22 possuem

distribuição Qui-quadrada independentes e com 2 e 2𝐿 graus de liberdade (parte

imaginária e real), respectivamente. Uma vez que a razão de duas distribuições Qui-

quadradas gera uma distribuição F, então �̂�𝑦(𝑓𝑜) sob 𝐻0 possui distribuição F com 2 e

2𝐿 graus de liberdade:

∅̂𝑦(𝑓0)|𝐻0~𝐹2,2𝐿 (Equação 2.24)

O limiar escolhido para aceitar ou rejeitar 𝐻0 é o valor crítico, dado em

conformidade com a distribuição estatística e o nível de significância 𝛼 (normalmente

de 0,05 ou 0,01 para aplicação de detecção de ASSR) empregado.

Enfim, a presença de resposta evocada será aceita quando o valor do TFE local

for maior que o valor crítico :

∅̂𝑦(𝑓𝑜) > 𝐹𝑐𝑟𝑖𝑡2,2𝐿,𝛼 (Equação 2.25)

17

3 Materiais e Métodos

3.1 Sistema de Estimulação e Detecção de ASSR

O sistema utilizado no presente Projeto de Graduação foi desenvolvido pelos

membros do Laboratório de Processamento de Sinais e Imagens Médicas do Programa

de Engenharia Biomédica da Universidade Federal do Rio de Janeiro

(LAPIS/PEB/UFRJ), e o Núcleo de Estudos e Pesquisa em Engenharia Biomédica

(NEPEB) da Universidade Federal de Minas Gerais (UFMG). Esta seção aborda apenas

os pontos principais do sistema (organização funcional), necessários para a

compreensão da metodologia abordada neste estudo. Para maiores detalhes, recomenda-

se ler a referência (LARREA, 2015).

As funcionalidades do sistema foram estabelecidas considerando os parâmetros

necessários para aplicações direcionadas a análise da ASSR. O sistema utilizado possui

as seguintes funções :

Estimulação auditiva múltipla binaural de tons modulados em amplitude ou

frequência;

Aquisição das respostas eletrofisiológicas ASSR por meio de múltiplas

derivações de EEG, gravadas em sincronia com o estímulo;

Apresentação em computador dos sinais de EEG adquiridos, tanto no

domínio do tempo quanto no domínio da frequência;

Processamento de sinais on-line para detecção das ASSRs;

Gravação em disco dos dados de EEG para processamento off-line.

A implementação adotou uma solução de arquitetura modular, composta de 4

elementos com componentes de hardware e software:

Módulo de interface com o usuário GUI (Graphical User Interface) (M_Gui)

- contém as interfaces de usuário necessárias para controle das funções do

estimulador auditivo, aquisição de sinais de EEG e processamento de sinais

por meio das técnicas objetivas de detecção de resposta.

18

Módulo de estimulação auditiva (M_Estim) – recebe informação digital de

áudio e gera os sinais elétricos analógicos que são convertidos em pressão

sonora pelos transdutores (fones de ouvido). Este módulo configura a saída

de áudio de acordo às especificações definidas na interface do usuário no

M_Gui.

Módulo de aquisição de EEG de múltiplas derivações (M_Aq) - encarregado

da aquisição dos sinais analógicos de EEG, e sua apresentação na tela por

meio da interface do usuário no M_Gui.

Módulo de controle e comunicação interna (M_Com) - sistema de hardware

que permite a comunicação entre os módulos.

A interface de usuário M_Gui estabelece os parâmetros do protocolo de

estimulação e da aquisição de sinais de EEG. Os dados da estimulação são enviados

através do M_Com para serem reproduzidos no M_Estim, e posteriormente ajustados

com sistema de calibração. O M_Aq adquire os sinais eletrofisiológicos de múltiplas

derivações de EEG e, por meio do M_Com, envia os dados digitais para o M_Gui no

computador, onde serão processados pela interface de Processamento (Figura 4.1).

Figura 3.1: Estrutura funcional do sistema de aquisição e análise de ASSR.

19

3.2 Voluntários

Foram registrados sinais de EEG de 10 voluntários – 8 selecionados para

elaboração dos resultados – com faixa etária entre 18 e 30 anos, sem histórico de

doenças auditivas ou neurológicas (verificadas por anamnese audiológica). Os

experimentos tiveram aprovação do comitê de ética em pesquisa local (CEP) do

Hospital Universitário Clementino Fraga Filho (HUCFF), CAAE-

40844414.3.0000.5257, e todos os voluntários assinaram um termo de consentimento

livre e esclarecido (TCLE).

Critérios de Inclusão

Os voluntários realizaram os procedimentos de: anamnese otológica e

audiometria tonal liminar no Laboratório de Análise e Processamento de Sinais e

Imagens Médicas (LAPIS) do Programa de Engenharia Biomédica (PEB) da

Universidade Federal do Rio de Janeiro (UFRJ). Esses procedimentos foram realizados

em colaboração com os alunos do curso de Fonoaudiologia, filiados ao laboratório.

A anamnese obteve informações sobre a idade, gênero e audição (antecedentes

familiares, passado otológico e uso de medicamentos ototóxicos) do voluntário. Os

voluntários considerados aptos na anamnese (todos, portanto 10 voluntários,

prosseguiram para a realização da Audiometria Tonal Liminar.

A Audiometria Tonal Liminar foi realizada em uma cabine de isolamento

acústico, com níveis de pressão sonora de acordo com os níveis exigidos pela norma

ANSI S3.-1991. O método para a determinação dos limiares tonais aéreos foi

descendente (em intensidade sonora) (FROTA, 2003) nas frequências de 250, 500,

1000, 2000, 3000, 4000, 6000 e 8000 Hz. Utilizou-se um audiômetro da marca

Interacoustic, modelo CE 10 padrão ANSI-69 e fone TDH–39.

Os limiares obtidos em dBNA por meio da audiometria tonal estão relacionados

com a escala de dBSPL de acordo com a norma ISO 389-2:1994 para fones de inserção,

com correções de +6, +0, +3 e +6 dB para as frequências de 500, 1000, 2000 e 4000 Hz,

respectivamente.

Os voluntários considerados aptos no teste de Audiometria Tonal (aqueles que

não excederam a intensidade de 20 dBNA para frequências entre 500 e 8000 Hz; 10

20

voluntários) foram encaminhados para etapa da coleta de sinais de EEG. A duração

total desses exames audiológicos foi de aproximadamente 20 minutos.

3.3 Estímulos

Para gerar uma ASSR de qualidade, é imprescindível que os estímulos utilizados

sejam adequados ao experimento. No que tange aos estímulos por sons vocálicos

naturais, a qualidade pode ser garantida através da utilização de microfones e

conversores analógico-digitais de alta qualidade e ambiente de captação do som livre de

ruído sonoro. Além dessas especificações de caráter técnico, também são necessários

cuidados com a fonação, por isso é importante garantir que a emissão vocal seja a mais

constante possível, evitando alterações de articulação e entonação ao longo da gravação

sonora.

Os sons vocálicos escolhidos para estudo neste projeto foram /a/, /i/ e /u/ (sons

vocálicos das vogais “a”, “i” e “u” do idioma Português, de acordo com o Alfabeto

Fonético Internacional), porque possuem estruturas harmônicas bem definidas,

facilitando sua identificação.

Após serem digitalizados, os fonemas são formatados no computador utilizando

os softwares Audacity e Matlab, para que possuam as características necessárias para a

estimulação.

Digitalização do Sinal

Os fonemas /a/, /i/ e /u/, produzidas naturalmente em vários trechos de

aproximadamente 5 segundos pelo autor deste projeto, foram gravados em uma cabine

de isolamento acústico. Para a gravação do sinal foram utilizados um headset modelo

“Pc 3 Chat” da marca Sennheiser e um notebook “Lenovo, modelo Yoga 510 (placa de

som Realtek HD audio)”, utilizando uma frequência de amostragem de 32 kHz e uma

resolução de 32 bits.

21

Formatação do Sinal

Para formatação do sinal digital, utilizou-se o software Audacity. Para gerar o

estímulo vocálico, é necessário selecionar um trecho do sinal que deve possuir

exatamente 1,5 segundo (48.000 amostras), poucas variações nos picos de amplitude,

possuir um número inteiro de ciclos de pitch, além de cruzamentos em zero tanto no

início quanto no fim do trecho. Dessa forma o trecho poderá ser reproduzido num loop

contínuo. Uma vez que o sinal não possui cruzamento em zero em exatamente 48.000

amostras, o sinal teve que ser reamostrado a uma taxa sutilmente diferente da taxa de

amostragem, para obter exatamente as 48.000 amostras necessárias, gerando uma

alteração desprezível no pitch da voz. Logo, os sinais foram considerados como se

tivessem sido amostrados a 32.000 kHz (AIKEN e PICTON, 2006).

Esses estímulos foram filtrados (direta e inversamente - sem defasagem) por um

filtro FIR passa-banda de frequências de corte de 10 e 4000 Hz, utilizando o software

Matlab (AIKEN e PICTON, 2006). (Figuras 4.2, 4.3 e 4.4)

Figura 3.2 : Fonema /a/ filtrado em passa banda FIR (10 - 4000 Hz)

22

Figura 3.3 : Fonema /i/ filtrado em passa banda FIR (10 - 4000 Hz)

Figura 3.4 : Fonema /u/ filtrado em passa banda FIR (10 - 4000 Hz)

Calibração do Estímulo

A calibração da intensidade sonora foi realizada para cada som vocálico

(fonemas /a/, /i/ e /u/) utilizando a orelha artificial 4153 e o analisador de frequências

2250, ambos da Brüel&Kjaer.

Figura 3.5: Orelha artificial 4153 e o analisador de frequências 2250 da BRÜEL&KJÆR.

23

A calibração utilizou como método de ponderação espectral a curva A-weighting

(figura 4.5), uma vez que esta curva representa satisfatoriamente a sensibilidade

auditiva humana, possuindo maior seletividade entre 500 Hz e 6 kHz (GRACEY &

ASSOCIATES, 2018).

Figura 3.6: Curvas de ponderação espectral sonora A,C e Z.

Foi utilizado como referência o valor LAeq (Valor RMS do nível de pressão

sonora calculado ao longo de um intervalo de tempo, utilizando a curva de ponderação

espectral “A-Weighting”) calculado ao longo de 30 segundos. A figura 4.6 e a Tabela

4.1 mostram a calibração do estímulo para 70 e 55 dBSPL.

24

Figura 3.7 : Calibração para fonemas /a/, /i/ e /u/ para 70 dBSPL

Tabela 3.1 : Calibração dos fonemas para aplicação no sistema de estimulação e aquisição de

sinais eletrofisiológicos.

Fonema Estimulador Auditivo

[dBSPL]

LAeq [dBSPL]

/a/ 80 70

/i/ 81 70

/u/ 81 70

/a/ 65 55

/i/ 66 55

/u/ 66 55

3.4 Formantes do Trato Vocal

O cálculo das formantes do trato vocal é essencial para avaliar as características

dos fonemas. Para calcular as formantes do trato vocal de cada fonema, os sinais

formatados foram reamostrados a 8 kHz. Foi selecionada uma janela de 50ms,

possuindo como início a posição temporal de 500 ms do sinal. Finalmente, foi estimado

25

o espectro do trato vocal (Figuras 4.4, 4.5 e 4.6) com LPC (linear predictive coding) de

ordem 12, tomando como base o tutorial, de domínio público, “Formant Estimation

with LPC Coefficients”, disponível no site oficial do Matlab (www.mathworks.com).

Figura 3.8 : Modelo Espectro vocal (Picos: Formantes para Fonema /a/).

Figura 3.9 : Modelo Espectro vocal (Picos: Formantes para Fonema /i/).

Figura 3.10 : Modelo Espectro vocal (Picos: Formantes para Fonema /u/).

26

3.5 Protocolo Experimental

Toda parte experimental, tanto de aquisição quanto de estimulação, foi realizada

utilizando o sistema descrito no capítulo 4.1.

A coleta foi realizada numa sala silenciosa do LAPIS. O voluntário foi

acomodado em uma cadeira confortável, de encosto reclinável, e orientado a dormir ou

permanecer tranquilo.

Aquisição de Sinais

A atividade eletroencefalográfica foi gravada com os eletrodos de prata/cloreto

de prata (Ag/AgCl) posicionado nas derivações mastoide esquerdo (M1), mastoide

direito (M2) e Inion (Oz), com eletrodo de referência posicionado no vertex (Cz) e o

eletrodo de terra posicionado na região fronto-central (Fpz), conforme elucidado no

capítulo 2.3.3 (Registro multicanal ASSR).

Como as respostas ASSR encontram-se numa faixa de tensão de baixíssima

amplitude (ordem nV), qualquer interferência elétrica pode ser significativa. Para evitar

as interferências acarretadas pelo ruído da rede elétrica, o sistema de coleta de EEG foi

alimentado por uma bateria DC e os equipamentos do laboratório foram desligados da

tomada. Além disso, os fios dos eletrodos foram trançados e posicionados a uma

distância razoável do transdutor auditivo para evitar interferência.

Para melhor condutância elétrica entre os eletrodos e a pele do voluntário, foi

feita a limpeza do local com álcool 70%, além da utilização de pasta condutora de EEG

para casamento de impedância eletrodo-pele. Também foram utilizadas fitas

microporosas hipoalergênicas para que os eletrodos não se desprendessem da cabeça do

voluntário ao longo da coleta.

Os sinais de EEG foram adquiridos com frequência de amostragem de 4000 Hz e

resolução de 24 bits. Os sinais registrados passam por um filtro de decimação passa-

baixas do conversor analógico-digital ADS1299, cuja frequência de corte corresponde a

um quarto da frequência de amostragem (1000 Hz).

Aplicação de Estímulos

27

Foram colocados fones de inserção E-A-RTONETM 3A-10Ω em ambas orelhas,

porém somente a orelha esquerda foi estimulada. Foram aplicados os estímulos sonoros

vocálicos (/a/,/i/,/u/) por 6 minutos para duas intensidades sonoras de 55 e 70 𝑑𝐵𝑠𝑝𝑙

calibrados de acordo com a tabela 4.1.

Teste de Interferência Elétrica

A possível interferência elétrica do gerador de sinais analógicos - para produzir

o som no sistema - e os condutores até os fones de estimulação de coleta foi avaliada.

Para tanto, foi necessário aferir se existe ASSR quando os estímulos são gerados, porém

o voluntário não os escuta (orelha sem estimulação).

Para tal, o seguinte procedimento foi adotado :

O fone de inserção E-A-RTONETM 3A-10Ω foi retirado da orelha esquerda do

paciente e acomodado numa região próxima ao ombro (moveu-se apenas o fio

localizado após o transdutor eletromecânico do fone, que conduz o som para o

ouvido. O fio que conduz a corrente elétrica ao transdutor permaneceu intacto).

Como a orelha direita não é estimulada neste experimento, o fone de inserção

desta orelha não foi retirado.

Foi inserido um plug EAR na orelha esquerda do voluntário e foi colocado um

ruído branco de intensidade próxima a 60 𝑑𝐵𝑠𝑝𝑙 no ambiente de coleta, através

do alto falante de um celular. Este procedimento visa garantir que o voluntário

de fato não escute o estímulo.

Foram aplicados estímulos vocálicos (/a/,/i/,/u/) por 6 minutos para a intensidade

sonora de 70 𝑑𝐵𝑠𝑝𝑙 e a atividade eletroencefalográfica foi registrada.

3.6 Análise da ASSR a Sons Vocálicos

Este subcapítulo objetiva a implementação do Analisador de Fourier para análise

da amplitude da ASSR evocada por sons vocálicos (fonemas /a/, /i/ e /u/), cujos fins e

teoria estão elucidados no subcapítulo 2.3.1 (Análise da ASSR a sons vocálicos

naturais) e 2.5 (Analisador de Fourier) respectivamente. Em seguida, é aplicado TFE

local para detecção de respostas.

28

4.6.1 Pré-processamento dos Sinais de EEG

Foi aplicada filtragem digital passa-faixa entre 30 e 950 Hz e o sinal foi

segmentado em trechos de 1,5 segundo. Foi realizada a média dos 240 trechos de 1,5s

(6 min. de coleta). Finalmente, os trechos do sinal de EEG foram sincronizados com o

estímulo auditivo.

4.6.2 Criação das Senóides de Referência

O Analisador de Fourier relaciona o sinal de EEG com um sinal de referência.

(AIKEN e PICTON, 2006). No presente estudo, foram criadas referências que seguem

a frequência fundamental do envelope da voz (𝑓0). A inspeção visual do espectro do

envelope (obtido pela equação 2.14) dos fonemas (/a/, /i/, /u/) permitiu inferir que essa

frequência está situada entre 50 e 200Hz (Figuras 4.11, 4.12 e 4.13).

Figura 3.11 : Envelope do fonema /a/. Abaixo, DFT do envelope.

29

Figura 3.12 : Envelope do fonema /i/. Abaixo, DFT do envelope.

Figura 3.13 : Envelope do fonema /u/. Abaixo, DFT do envelope.

Então, para garantir que apenas 𝑓0 esteja presente, o envelope do sinal é filtrado

com um passa-banda FIR de ordem 1000 entre 50 e 200Hz (AIKEN e PICTON, 2006).

As senóides de referência foram criadas pelo cálculo do cosseno e seno da fase

instantânea do envelope filtrado, calculada por meio da uma segunda aplicação da TH,

no envelope, e por meio da aplicação da equação 2.15. Para criar senóides de referência

para outros harmônicos (𝑓2, 𝑓3,...), basta multiplicar o argumento das senóides por 2 e 3,

respectivamente. Dada a frequência de amostragem utilizada para a aquisição dos sinais

de EEG (4 kHz), os filtros aplicados e a distribuição espectral da energia do envelope

dos fonemas, foram criadas referências para 6 harmônicos até aproximadamente 800 Hz

(𝑓0, 𝑓2...𝑓6).

30

Também foram criadas referências para 16 frequências adjacentes (espaçadas

em 2 Hz, 8 referências acima dos harmônicos e 8 referências abaixo) para cada

formante, a fim de medir a energia em frequências não estimuladas.

É possível extrair a frequência instantânea do sinal a partir da fase instantânea

do sinal com o uso da equação 2.17 (Figuras 4.14, 4.15 e 4.16). Assim, é possível

visualizar a variação da frequência de referência ao longo do tempo.

Figura 3.14 : Frequência instantânea do envelope filtrado do fonema /a/, calculado conforme

equação 2.17, para um trecho de 250ms.

Figura 3.15 : Frequência instantânea do envelope filtrado do fonema /i/, calculada conforme

equação 2.17, para um trecho de 250ms.

31

Figura 3.16 : Frequência instantânea do envelope filtrado do fonema /u/, calculado

conforme equação 2.17, para um trecho de 250ms.

Sinais no tronco encefálico devem passar primeiro pela cóclea, que introduz um

atraso que depende da frequência, afetando o envelope do sinal. Este atraso pode ser

determinado de acordo com a seguinte função (AIKEN e PICTON, 2006).

𝑑 = 3.25(𝑐 100⁄ )−0.69

onde c é a frequência central em Hz, e d é o atraso coclear, estimado em milisegundos.

Portanto, as senóides de referência foram atrasadas com base no atraso coclear (d).

Criação do Analisador de Fourier

A amplitude (𝑎) e a fase (𝜃) do Analisador de Fourier podem ser calculadas

pelas equações 2.20 e equação 2.21, respectivamente. Para tal, as senóides de referência

utilizadas são aquelas obtidas no item anterior e o sinal 𝑥(𝑛) é o sinal de EEG.

Análise

Uma vez que a resposta foi gravada, é necessário determinar o quão significativa

essa resposta é em comparação ao ruído de fundo do sinal de EEG.

Esta análise foi obtida através da comparação entre os valores de amplitude da

resposta esperada e a amplitude média das 16 frequências adjacentes.

32

Finalmente, aplicou-se o teste de hipótese TFE local, para inferir

estatisticamente sobre a existência ou não da resposta cerebral nas frequências do

envelope do fonema (fundamental e seus harmônicos), comparando a sua energia com a

energia média das 16 frequências adjacentes. Assim, o TFE local foi aplicado com

(2,32) graus de liberdade e nível de significância de 0,05, de acordo com a equação

2.22. Para este teste, considera-se o sinal de EEG como um ruído branco gaussiano de

média zero.

Estas análises foram realizada para todos os fonemas (/a/,/i/ e /u/) para as

intensidades sonoras de 55 e 70 dBSPL.

4 Resultados e Discussão

Todas os resultados obtidos no presente estudo foram baseadas na média dos

trechos de 1,5 segundo (visualmente sem artefatos), segmentados do sinal de EEG de 6

minutos. As análises foram realizadas de forma off-line. As amplitudes foram calculadas

com o uso do Analisador de Fourier. Ao todo, foram utilizados os sinais de EEG de 8

voluntários para elaboração dos resultados (2 voluntários foram excluídos devido a alta

presença de artefatos em suas coletas). Embora o experimento possua 3 derivações

ativas (M1, M2 e inion) para análise da ASSR, os resultados foram elaborados

utilizando apenas a derivação inion, para fins de comparação com estudos acadêmicos

relevantes da área.

4.1 Resultados

Amplitude e Taxa de Detecção da ASSR

Os valores mostrados nos gráficos e tabelas abaixo utilizaram o seguinte

procedimento :

Amplitude Referência (AR): Média das amplitudes do ASSR nas frequências de

referências (𝑓0, 𝑓2...𝑓6) dos 8 voluntários (n=8).

Amplitude Média das Frequências Vizinhas (AMFV): Média das amplitudes das

16 frequências adjacentes, a cada frequência de referência, dos 8 voluntários (n=8x16).

33

% TFE local : Quantidade percentual de detecção da ASSR, com o uso do TFE

local para os 8 voluntários. A aplicação do TFE local utilizou um nível de significância

de 0.05, com (2,32) graus de liberdade.

A Figura 4.1 mostra a AR do ASSR e a AMFV ao fonema /a/ de 70 dB, sendo

que na Tabela 4.1 observa-se seu desvio padrão. A AR de fo apresenta a maior

amplitude (42 nV). Todas as frequências de referência apresentam maiores amplitudes

do que as frequências adjacentes. As AR’s apresentam um formato em U, enquanto que

as AMFV’s apresentam uma tendência decrescente. A AR apresenta maior desvio

padrão do que a AMFV, por exemplo em fo, ±22,6 nV e ±4,8 nV, respectivamente.

O Teste Espectral F local ( Tabela 4.1) identificou a presença da ASSR em todos

os voluntários (100%), em fo, f3 e f4, sendo que nas outras frequências de referência,

detectou a ASSR em 7 voluntários (87,5%).

Figura 4.1: AR e AMFV. Fonema /a/;Intensidade 70 dBSPL.

Tabela 4.1 : Desvio padrão de “AR” e “AMFV”. Percentual de detecção com TFE local.

Fonema /a/; Intensidade 70 dBSPL.

f0 f2 f3 f4 f5 f6

Desvio Padrão (nV) (AR): ±22,6 ±10,0 ±4,9 ±3,9 ±9,3 ±15,4

Desvio Padrão (nV) (AMFV): ±4,8 ±3,3 ±1,3 ±0,7 ±0,4 ±0,4

% TFE local : 100 87,5 100 100 87,5 87,5

42,0

21,117,7

10,5

17,7

27,6

7,14,7 3,2 2,3 1,8 1,8

f0 f2 f3 f4 f5 f6

Am

pli

tude

(nV

)

Fonema /a/ 70 dB

AR AMFV

34

Quanto ao estímulo de 55 dB do fonema /a/, as AR’s também são maiores em

comparação às AMFV’s (Figura 4.2), porém menores do que aquelas obtidas para

70dB, (por exemplo, em fo, é de 37,2 nV). Por outro lado, as AMFV’s são similares às

obtidas com 70 dB. O TFE local (Tabela 4.2) detectou a ASSR em menor número de

voluntários, sendo que em f4 foi detectada somente em 4 voluntários (50%).

Figura 4.2: AR e AMFV. Fonema /a/;Intensidade 55 dBSPL.

Tabela 4.2 : Desvio padrão de “AR” e “AMFV”. Percentual de detecção com TFE local.

Fonema /a/; Intensidade 55 dBSPL

f0 f2 f3 f4 f5 f6

Desvio Padrão (nV) (AR) : ±22,1 ±10,0 ±5,6 ±6,2 ±4,3 ±3,4

Desvio Padrão (nV) (AMFV) : ±6,3 ±4,6 ±1,8 ±0,8 ±0,4 ±0,1

% TFE local : 75 87,5 75 50 87,5 87,5

.

37,2

21,5

12,8

7,0 7,3 7,89,16,4

4,02,5 2,0 1,6

f0 f2 f3 f4 f5 f6

Am

pli

tude

(nV

)

Fonema /a/ 55 dB

AR AMFV

35

Os resultados obtidos para a ASSR ao fonema /i/, levaram em consideração as

coletas de 7 voluntários, sendo que um foi excluído devido à alta presença de artefatos.

Para o estímulo de 70 dBSPL do fonema /i/, observa-se uma AR alta para os

primeiros harmônicos em comparação com o restante dos harmônicos, apresentando

uma tendência monotonamente decrescente (Figura 4.3). A AR de f0 foi de 69 nV,

enquanto que a AR de f3 foi de 35 nV. A AMFV também apresenta uma tendência

decrescente e possui baixa amplitude, de 5,6 nV para f0 e 3,2 nV para f3. O TFE local

deste fonema (Tabela 4.3) detectou a resposta para os 8 voluntários para os harmônicos

f0, f2, f3 e f4, havendo uma diminuição na detecção para os outros harmônicos.

Figura 4.3: AR e AMFV. Fonema /i/;Intensidade 70 dBSPL.

Tabela 4.3 : Desvio padrão de “AR” e “AMFV”. Percentual de detecção com TFE local.

Fonema /i/; Intensidade 70 dBSPL.

f0 f2 f3 f4 f5 f6

Desvio Padrão (nV) (AR): ±37,4 ±25,0 ±22,4 ±3,8 ±1,7 ±2,3

Desvio Padrão (nV) (AMFV): ±3,1 ±1,0 ±0,8 ±0,3 ±0,5 ±0,2

% TFE local : 100 100 100 100 57,1 71,4

69,0

50,2

35,0

12,75,9 4,25,6 3,6 3,2 2,5 1,9 1,2

f0 f2 f3 f4 f5 f6

Am

pli

tude

(nV

)

Fonema /i/ 70 dB

AR AMFV

36

Quanto ao estímulo de 55 dB do fonema /i/, as AR’s também são maiores em

comparação às AMFV’s (Figura 4.4), porém menores do que aquelas obtidas para 70dB

(por exemplo, em fo, é de 44,8 nV). Por outro lado, as AMFV’s são similares às obtidas

com 70 dB. O TFE local (Tabela 4.4) detectou a ASSR em menor número de

voluntários, sendo que, em f3, foi detectada somente em 6 voluntários (2 a menos do

que aquela obtida para 70 dB)

.

Figura 4.4: AR e AMFV. Fonema /i/;Intensidade 55 dBSPL.

Tabela 4.4 : Desvio padrão de “AR” e “AMFV”. Percentual de detecção com TFE local.

Fonema /i/; Intensidade 55 dBSPL.

f0 f2 f3 f4 f5 f6

Desvio Padrão (nV) (AR): ±22,47 ±8,73 ±6,71 ±2,91 ±2,61 ±1,80

Desvio Padrão (nV) (AMFV): ±1,66 ±1,47 ±0,56 ±1,35 ±0,32 ±0,12

% TFE local : 100 100 71,4 57,1 42,9 57,1

44,8

23,3

11,8

7,33,9 3,6

5,3 3,9 3,0 2,6 1,8 1,2

f0 f2 f3 f4 f5 f6

Am

pli

tude

(nV

)

Fonema /i/ 55 dB

AR AMFV

37

Para o fonema /u/ de 70 dB, observa-se uma AR alta para f3 e uma AR mediana

para f0 e f2 , em comparação com a AR dos outros harmônicos. A AR para f3 é de 44,9

nV, e de 35,7 e 33,0 nV para f0 e f2, respectivamente. A AMFV é menor que a AR e

segue uma tendência decrescente. O TFE local detectou a presença de resposta ASSR

para os 8 voluntários em f3 e f6, e de 6 voluntários para f0.

Figura 4.5: AR e AMFV. Fonema /u/;Intensidade 70 dBSPL.

Tabela 4.5 : Desvio padrão de “AR” e “AMFV”. Percentual de detecção com TFE local.

Fonema /u/; Intensidade 70 dBSPL.

f0 f2 f3 f4 f5 f6

Desvio Padrão (nV) (AR): ±21,6 ±15,6 ±30,4 ±11,5 ±3,7 ±10,2

Desvio Padrão (nV) (AMFV): ±4,5 ±2,0 ±1,3 ±0,6 ±0,3 ±0,4

% TFE local : 75,0 87,5 100 87,5 87,5 100

35,733,0

44,9

17,4

8,2

20,0

8,14,9 3,6 2,6 1,9 1,8

f0 f2 f3 f4 f5 f6

Am

pli

tud

e (n

V)

Fonema /u/ 70 dB

AR AMFV

38

Quanto ao estímulo de 55 dB do fonema /u/, as AR’s também são maiores em

comparação às AMFV’s (Figura 4.6), porém menores do que aquelas obtidas para

70dB, por exemplo em f3 é de 10,8 nV. Diferentemente do que foi notado para as AR’s

de 70 dB deste fonema, as AR’s seguem uma tendência decrescente.

As AMFV’s são similares às obtidas com 70 dB. O TFE local (Tabela 4.6)

detectou a ASSR em menor número de voluntários, sendo que em f5 foi detectada

somente em 4 voluntários.

Figura 4.6: AR e AMFV. Fonema /u/;Intensidade 55 dBSPL.

Tabela 4.6 : Desvio padrão de “AR” e “AMFV”. Percentual de detecção com TFE local.

Fonema /u/; Intensidade 55 dBSPL.

f0 f2 f3 f4 f5 f6

Desvio Padrão (nV) (AR): ±14,6 ±11,3 ±4,4 ±2,7 ±1,8 ±1,6

Desvio Padrão (nV) (AMFV): ±3,0 ±2,0 ±0,9 ±0,5 ±0,2 ±0,2

% TFE local : 75,0 87,5 62,5 100 50,0 87,5

28,6

17,9

10,89,5

3,2 4,2

9,16,4

4,02,5 2,0 1,6

f0 f2 f3 f4 f5 f6

Am

pli

tude

(nV

)

Fonema /u/ 55 dB

AR AMFV

39

Teste de Interferência Elétrica

A Figura 4.7 mostra a AR e a AMFV para o teste de interferência elétrica do

fonema /a/ de 70 dB, sendo que na Tabela 5.7 observa-se seu desvio padrão. A AR de

f0, f2, f3 e f4 é similar à AMFV. Já para f5 e f6, nota-se uma AR significativamente

maior (17,1 nV e 28,5 nV) do que a AMFV (1,9 nV e 1,8 nV). O TFE local detectou a

ASSR apenas para 1 voluntário em f0, porém detectou a ASSR para os 8 voluntários

para f6.

Figura 4.7: AR e AMFV. Fonema /a/ (não audível);Intensidade 70 dBSPL.

Tabela 4.7 : Desvio padrão de “AR” e “AMFV”. Percentual de detecção com TFE local.

Fonema /a/ (não audível); Intensidade 70 dBSPL.

f0 f2 f3 f4 f5 f6

Desvio Padrão (nV) (AR ): ±9,1 ±4,2 ±4,2 ±3,1 ±10,6 ±18,1

Desvio Padrão (nV) (AMFV): ±7,2 ±5,9 ±2,7 ±1,1 ±0,9 ±0,9

% TFE local : 12,5 37,5 37,5 25 87,5 100

11,5

7,86,6

4,4

17,1

28,5

7,96,2

4,02,3 1,9 1,8

f0 f2 f3 f4 f5 f6

Am

pli

tude

(nV

)

Fonema /a/ 70 dB (Não Audível)

AR AMFV

40

Para o teste de interferência realizado para o fonema /i/, foram analisados apenas

6 voluntários, porque o arquivo de 2 voluntários foi corrompido. A AR foi

significativamente maior do que AMFV apenas para f2 e f6. A detecção da ASSR com o

TFE local foi de apenas 1 voluntário para f0, porém de 4 voluntários para f6.

Figura 4.8: AR e AMFV. Fonema /i/ (não audível);Intensidade 70 dBSPL.

Tabela 4.8 : Desvio padrão de “AR” e “AMFV”. Percentual de detecção com TFE local.

Fonema /i/ (não audível); Intensidade 70 dBSPL.

f0 f2 f3 f4 f5 f6

Desvio Padrão (nV) (AR ): ±12,2 ±10,8 ±3,2 ±2,1 ±2,4 ±1,9

Desvio Padrão (nV) (AMFV): ±11,4 ±4,3 ±2,5 ±2,0 ±0,9 ±0,3

% TFE local : 16,7 50,0 16,7 33,3 16,7 66,7

14,7

18,0

7,8

5,2

3,3 3,9

13,0

7,3

5,03,6

2,71,4

f0 f2 f3 f4 f5 f6

Am

pli

tude

(nV

)

Fonema /i/ 70 dB (Não Audível)

AR AMFV

41

Quanto ao teste de interferência do fonema /u/, observa-se um AR significativo

para f2, f3, f4, f5 e f6 em comparação com AMFV, que segue a tendência decrescente. A

detecção da ASSR com o TFE local foi de apenas 2 voluntários para f0, porém de 7

voluntários para f3, f4, f5 e f6.

Figura 4.9: AR e AMFV. Fonema /u/ (não audível);Intensidade 70 dBSPL.

Tabela 4.9 : Desvio padrão de “AR” e “AMFV”. Percentual de detecção com TFE local.

Fonema /u/ (não audível); Intensidade 70 dBSPL.

f0 f2 f3 f4 f5 f6

Desvio Padrão (nV) (AR ) : ±6,4 ±11,8 ±13,4 ±6,4 ±1,9 ±10,0

Desvio Padrão (nV) (AMFV): ±7,8 ±4,0 ±1,9 ±0,6 ±0,3 ±0,3

% TFE local : 25,0 75,0 87,5 87,5 87,5 87,5

4.2 Discussão

Em geral, os resultados atestam a potencialidade do Analisador de Fourier para

detectar a ASSR evocada por sons vocálicos. Foram detectadas respostas significativas

para todos os fonemas para a maioria dos voluntários. Para o teste de interferência

elétrica, observou-se uma maior interferência para os harmônicos de frequência mais

11,1

25,427,4

14,6

6,2

18,4

9,8

6,04,1

2,5 2,1 1,9

f0 f2 f3 f4 f5 f6

Am

pli

tude

(nV

)

Fonema /u/ 70 dB (Não Audível)

AR AMFV

42

alta, sugerindo a presença de acoplamento capacitivo entre os fios de estimulação e os

fios utilizados para aquisição do sinal de EEG.

Abaixo, segue uma discussão mais específica, levando em consideração as

características de cada estímulo, além de comparações com os estudos de (AIKEN e

PICTON, 2006) e (AIKEN e PICTON, 2008), uma vez que possuem metodologia

similar àquela utilizada neste projeto. Pequenas discrepâncias entre os resultados

obtidos por este estudo e os resultados obtidos em estudos acadêmicos da área são

naturais, uma vez que inúmeros fatores podem influenciar na avaliação da ASSR a sons

vocálicos. Por exemplo, embora os estímulos utilizados sejam os mesmos fonemas, de

acordo com o Alfabeto Fonético Internacional, eles não são iguais, uma vez que os

fonemas utilizados neste projeto são peculiares do autor deste projeto (características do

trato voca e entonação).

As diferenças significativas entre este projeto e a referência em questão são

listadas a seguir (o restante pode ser considerado similar):

(AIKEN e PICTON, 2006) :

Duração da coleta : 10 min

Intensidade do estímulo : 66 dBSPL

Aplicação de rejeição de artefatos, através de ponderação de trechos baseada

na variância da resposta.

Quantidade de voluntários : 10.

Analisa apenas f0.

(AIKEN e PICTON, 2008) :

Duração da coleta : 5 min.

Intensidade do estímulo : 60 dBA (RMS) num acoplador de 2-cm3

Aplicação de rejeição de artefatos.

Quantidade de voluntários : 10.

Analisou apenas os fonemas /a/ e /i/.

43

Fonema /a/

O espectro do envelope do fonema /a/ possui energia bem distribuída para todos

os harmônicos analisados neste estudo (figura 4.10), sugerindo a presença de resposta

para a maioria dos harmônicos.

Aiken e Picton (2006), obtiveram uma AR de 63±22 nV e uma AMFV de 6±4

nV para f0, sendo que neste estudo foi encontrado uma AR de 45±24 nV e uma AMFV

de 8±6 nV para o estímulo de 70 dBSPL. Aiken e Picton (2008), obtiveram

aproximadamente, AR’s de 60, 30, 12, 15, 5, 2 nV e AMFV’s de 3, 2, 2, 1, 1, 1 nV para

f0, f2, f3, f4, f5 e f6, respectivamente.

Logo, é possível notar a semelhança entre as respostas obtidas neste estudo e as

referências para f0, f2, f3 e f4. Porém, a discrepância que ocorre para f5 e f6 pode ser

explicada como consequência de interferência elétrica, uma vez que essa discrepância

não ocorre de forma tão acentuada para o estímulo de 50 dBSPL, além do fato de que o

teste de interferência elétrica deste estudo diagnosticou interferências elétricas

relevantes para estes harmônicos.

Fonema /i/

O espectro do envelope do fonema /i/ possui mais energia nos harmônicos f1 e

f2 (figura 4.11), sugerindo a presença de resposta de alta amplitude para os primeiros

harmônicos.

Aiken e Picton (2006), obtiveram e uma AR de 93±32 nV e uma AMFV de 6±3

nV para f0, sendo que, neste estudo, foi encontrado uma AR de 69±37 nV e uma AMFV

de 6±3 nV para o estímulo de 70 dBSPL. Aiken e Picton (2008), obtiveram,

aproximadamente, AR’s de 90, 28, 18, 9, 2, 5 nV e AMFV’s de 2, 2, 1, 1, 1, 1 nV para

f0, f2, f3, f4, f5 e f6, respectivamente.

Sendo assim, as respostas encontradas neste estudo corroboram com a teoria

para todos os harmônicos. Porém, o teste de interferência elétrica registrou uma alta

interferência elétrica para f2, o que pode explicar, de certa forma, o valor elevado de

AR neste harmônico.

44

Fonema /u/

O espectro do envelope do fonema /u/ possui mais energia nos harmônicos f0,

f2, f3 e f4 (figura 4.12), sugerindo a presença de resposta para a maioria dos

harmônicos.

Aiken e Picton (2006), obtiveram uma AR de 62±20 nV e uma AMFV de 6±4

nV para f0, sendo que neste estudo foi encontrado uma AR de 36±22 nV e uma AMFV

de 8±4 nV para o estímulo de 70 dBSPL. Aiken e Picton (2008), não utilizaram o

fonema /u/ como estímulo, portanto não é possível realizar uma análise comparativa

para f2,f3,f4,f5,f6.

Sendo assim, a resposta encontrada neste estudo corrobora a teoria para f0. Para

f2, f3, f4, f5 e f6, é possível notar uma alta taxa de detecção, bem como uma alta

discrepância para o estímulo de 70 dBSPL e 55 dBSPL. Vale notar que o teste de

interferência elétrica registrou alta interferência para todos estes harmônicos (f2, f3, f4,

f5 e f6), o que pode explicar, de certa forma, os valores elevados de AR para o estímulo

de 70 dBSPL, porém suscita apreensão, devido ao excesso de interferência.

45

5 Conclusão

Os sons vocálicos naturais podem ser considerados como os estímulos ideais

quando o objetivo é atestar se o sistema auditivo transmitiu e processou corretamente a

informação sonora. Para tal, é considerado e aprovado com êxito o uso do Analisador de

Fourier como ferramenta de análise para ASSR a sons vocálicos naturais. No presente

estudo, vale ressaltar os resultados promissores obtidos para o harmônico fundamental

do envelope dos fonemas, dada sua alta taxa de detecção e baixa interferência elétrica.

Para avaliação dos harmônicos f5 e f6, recomenda-se cautela, dada a elevada

interferência elétrica que ocorreu para essas frequências.

Existem aspectos que podem ser melhorados para uma análise mais completa.

Como trabalhos futuros, sugere-se a implementação de algoritmos com técnicas de

rejeição de artefatos, processamento on-line e entendimento profundo sobre as causas de

interferência elétrica, bem como a implementação de técnicas para mitigá-las.

46

6 Bibliografia

AIKEN S., PICTON T: Envelope Following Responses to Natural Vowels. Audiol

Neurotol 2006;11:213–232.

AIKEN S., PICTON T: Envelope and spectral frequency-following responses to vowel

sounds. Hearing Research 245 (2008) 35–47

ASHA, American Speech-Language Hearing Association. The Prevalence and

Incidence of Hearing Loss in Children. Disponível em :

https://www.asha.org/public/hearing/Prevalence-and-Incidence-of-Hearing-Loss-in

Children/ (Acesso em 22 de Julho de 2018).

BEAR, M. F., CONNORS, B. W., PARADISO, M. A. Neuroscience. Lippincott

Williams & Wilkins, 2007. v. 2

BENDAT, J. S., PIERSOL, A. G. Random data: analysis and measurement procedures.

Hoboken, New Jersey, Wiley, 2010.

CUNNINGHAM J, NICOL T, ZECKER S, BRADLOW A, KRAUS N: Neurobiologic

responses to speech in noise in children with learning problems: deficits and strategies

for improvement. Clin Neurophysiol 2001; 112: 758–767.

DOBIE AR e WILSON JM, A comparison of t test, F test, and coherence methods of

detecting steady-state auditory-evoked potentials, distortion-product otoacoustic

emissions, or other sinusoids. 1996.

FROTA, S. Fundamentos em Fonoaudiologia-Audiologia. 2a / 2003 ed. Rio de Janeiro:

Guanabara, 2003.

GALBRAITH GC, AMAYA EM, DE RIVERA JM, DONAN NM, DUONG MT, HSU

JN, TRAN K, TSANG LP: Brain stem evoked response to forward and reversed speech

in humans. Neuroreport 2004; 15: 2057–2060.

GRACEY & ASSOCIATES: Frequency Weightings : Definitions, Terms, Units,

Measurements. Disponível em : http://www.acoustic-glossary.co.uk/frequency-

weighting.htm (Acesso em 22 de Julho de 2018).

HEKIMOGLU, Y., OZDAMAR, O., DELGADO, R. E. Chirp and click evoked

auditory steady state responses. Proceedings of the 23rd Annual International

Conference of the IEEE Engineering in Medicine and Biology Society. 2001

JCIH, Joint Committee on Infant Hearing.Year 2007 Position Statement: Principles and

Guidelines for Early Hearing Detection and Intervention Programs. Disponível em :

https://www.asha.org/policy/PS2007-00281/ (Acesso em 22 de Julho de 2018)

47

JOHN, M. S., DIMITRIJEVIC, A., PICTON, T. W. Auditory steady-state responses to

exponential modulation envelopes. Ear and hearing, v. 23, n. 2, p. 106–117, 2002.

JOHN, M. S., DIMITRIJEVIC, A., PICTON, T. W. Efficient stimuli for evoking

auditory steady-state responses: Ear and Hearing, v. 24, n. 5, p. 406–423, out. 2003.

JOHN, M. S., LINS, O. G., BOUCHER, B. L., et al. Multiple auditory steady-state

responses (MASTER): stimulus and recording parameters. International Journal of

Audiology, v. 37, n. 2, p. 59–82, 1998.

JOHNSON, K.L., NICOL, T.G., ZECKER, S.G., KRAUS, N., 2007. Auditory

brainstem correlates of perceptual timing deficits. J. Cognit. Neurosci. 19 (3), 376–385.

KAY, S. M. Fundamentals of Statistical Signal Processing, Volume 2: Detection

Theory, volume II, 199.

KING C, WARRIER CM, HAYES E, KRAUS N: Deficits in auditory brainstem

pathway encoding of speech sounds in children with learning problems. Neurosci Lett

2002; 319: 111–115.

KRISHNAN A: Human frequency following responses: representation of steady-state

synthetic vowels. Hear Res 2002; 166: 192–201.

LARREA, Pablo Fernando Cevallos: Detecção da Resposta Auditiva em Regime

Permanente a Tom com Modulante Exponencial utilizando Múltiplas Derivações de

Eletroencefalografia / Rio de Janeiro: UFRJ/COPPE, 2015.

LEVI, E. C., FOLSOM, R. C., DOBIE, R. A. Amplitude-modulation following

response (AMFR): effects of modulation rate, carrier frequency, age, and state. Hearing

Research, v. 68, n. 1, p. 42–52, jun. 1993.

LINS, O. G., PICTON, P. E., PICTON, T. W., et al. Auditory steady‐state responses to

tones amplitude‐modulated at 80–110 Hz. The Journal of the Acoustical Society of

America, v. 97, n. 5, p. 3051–3063, 1995.

MAUER, G. AND DÖRING, W.H. Generators of amplitude modulation following

response (AMFR). Paper presented at 16th meeting of the Evoked Response

Audiometry Study Group, Tromsø, Norway, June, 1999.

MELO, Thiago Marques de. Aplicação da Transformada de Hilbert e Separação em

Bandas Clínicas para Redução do Eletroencefalograma de Longa Duração/ Thiago

Marques de Melo. – Rio de Janeiro: UFRJ/COPPE, 2015.

OPPENHEIM, A. V., SCHAFER, RONALD W. Discrete-time signal processing. Upper

Saddle River, Pearson, 2010.

PICTON TW, JOHN MS, DIMITRIJEVIC A, PURCELL D: Human auditory steady-

state responses. Int J Audiol 2003; 42: 177–219.

48

PURCELL, D. W., JOHN, S. M., SCHNEIDER, B. A., et al. Human temporal auditory

acuity as assessed by envelope following responses. The Journal of the Acoustical

Society of America, v. 116, n. 6, p. 3581–3593, dez. 2004.

RANCE, G., DOWELL, R. C., RICKARDS, F. W., et al. Steady-state evoked potential

and behavioral hearing thresholds in a group of children with absent click-evoked

auditory brainstem response. Ear and hearing, v. 19, n. 1, p. 48–61, fev. 1998.

REGAN D: Human Brain Electrophysiology: Evoked Potentials and Evoked Magnetic

Fields in Science and Medicine. New York, Elsevier, 1989.

RESEARCH GATE, Sistema 10-20. https://www.researchgate.net/profile/

Alejandro_Torres16/publication/320409762/figure/download/fig1/AS:55103497285222

4@1508388383651/Figura-1-Sistema-Internacional-de-montaje-10-2014.png (Acesso

em 24 de Julho de 2018)

SANTOS J.M. : Aspectos acústicos e fisiológicos do sistema ressonantal vocal como

ferramenta para o ensinoaprendizagem do canto lírico. 2010.

SCOLLIE SD, SEEWALD RC: Evaluation of electroacoustic test signals. I.

Comparison with amplified speech. Ear Hear 2002; 23: 477–487.

SILVERTHORN, D. U., HILL, D. Human physiology: an integrated approach : student

workbook. San Francisco, Calif.; London: Benjamin Cummings ; Pearson Education,

2010.

VAN DER REIJDEN, C. S. VAN DER. Improving the signal to noise ratio of the

auditory steady-state response. 2005.

VIEIRA M. N., Uma introdução à acústica da voz cantada. I Seminário Música Ciência

Tecnologia: Acústica Musical. 2004.

WHO (WORLD HEALTH ORGANIZATION). Deafness and hearing loss. Disponível

em http://www.who.int/news-room/fact-sheets/detail/deafness-and-hearing-loss.(Acesso

em 22 de Julho de 2018)

ZEMLIN, W.R., Princípios de anatomia e fisiologia em fonoaudiologia. Porto Alegre:

Artmed, 2000.

ZUREK, P. Detectability of transient and sinusoidal otoacoustic emissions. Ear and

hearing, 13(5):307-310,1992.