30
VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Embed Size (px)

Citation preview

Page 1: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

VOCALE Um Algoritmo de

Identificação de Intervalos Vocálicos no Sinal Acústico de

Fala

Page 2: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Temos:

Queremos: (0.179 0.301) v (0.301 0.390) c (0.390 0.440) v(0.440 0.498) c(0.498 0.540) v…

Problema

Page 3: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Exemplo de segmentação

Marca

Vowel

Cons.

Vowel.

Page 4: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Conjectura das classes rítmicas Diversos linguistas conjecturaram que as línguas

naturais estavam agrupadas num número finito e pequeno de classes rítmicas ( Lloyd James 1940 , Pike 1945, Abercrombie 1967, etc).

Durante meio século não se conseguiu encontrar evidências acústicas que justificassem essa conjectura.

Essas evidências aparecem nos artigos pioneiros de Ramus, Nespor e Mehler (1999), eles utilizam estatísticas simples de amostras de sinais acústicos produzidos por falantes das diversas línguas consideradas.

Page 5: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Para um conjunto de oito línguas e 20 frases por língua, eles segmentam as frases em intervalos vocálicos e consonantais e definem:

%V = proporção de tempo passado em vogais e

Delta C = desvio padrão dos intervalos consonantais

Ramus, Nespor & Mehler (1999)

Page 6: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Ramus, Nespor & Mehler (1999)

Page 7: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Segmentação manualÉ feita baseada na seguinte

informação:

Gráfico do sinal acústico Gráfico do espectrograma Ouvindo a frase

Page 8: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Dificuldades:

Leva muito tempo Imprecisões Muito difícil de ser reproduzida

Page 9: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Sinal acústico e espectrograma

Page 10: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Espectro de Fourier

Problema: o sinal acústico de fala é não estacionário

Page 11: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Espectrograma

Page 12: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Regiões regulares

Page 13: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Identificando zonas regularesObservação: Em intervalos vocálicos, tipicamente,

pt e pt+1 são “parecidos”. Em intervalos consonantais,

tipicamente, isto não acontece.Exceções: semi-vogais, nasais...

Page 14: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Classificadores(1) Entropia relativa:

F

ft

ttt f

ffh

ppp

1

11 )(

)(log)(

Distância Euclidiana:

F

fttt ffd pp

1

2

1)()(

Page 15: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Classificadores(2) Energia total:

F

ftt fe z

1

)(

Energia na banda [Fa , Fb]:

b

a

ba

F

Fft

FFt fe z )(,

Page 16: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Entropia Relativa (japonês)

Page 17: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Entropia Relativa (Frances)

Page 18: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Energia Total

Page 19: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Energia 1000-5000Hz

Page 20: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Exemplos de Regras de Classificação do P.B.

Entropia relativa baixa Energia total alta Alta energia na banda [1000,5000] hz

alta probabilidade de vogal

Entropia relativa baixa Baixa energia na banda

[1000,5000] hzalta probabilidadede consoante

(nasal) Entropia relativa alta Alta energia na banda

[1000,5000] hzalta probabilidadede consoante

Page 21: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Segmentação: automática vs manual

Page 22: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

ResultadosTaxa de erro: Portugueis Brasileiro: 18% Ingles Britanico: 24%

Consideramos que um erro e produzido quando:

a fronteira não é detectada, ou a fronteira é colocada a uma distância

maior do que 10ms da marcação manualO algoritmo esta disponivel na rede no endereço:www.ime.usp.br/~tycho/tipal/prosody/vocale/

Page 23: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Problemas: Em alguns casos as regras dependem da

língua.

As bandas de freqüências a serem utilizadas dependem do sexo do locutor.

Há critérios linguísticos que não podem ser expressos com regras simples deste tipo. Exemplos: r retroflexo, semi-vogais, etc.

Page 24: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Exemplo: Português e Inglês

Page 25: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Função de sonoridade

Com o objetivo de evitar as ambigüidades na definição de vogal, definimos a função de sonoridade como:

S(t) é uma função com valores perto de 1 nas regiões regulares e perto de 0 nas regiões irregulares.

Page 26: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Uma versão automática de RNM

T

t

tstsT

S1

)1()(1

T

t

tsT

S1

)(1

Page 27: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Resultados com a função de sonoridade

Page 28: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Sonoridade e variação total para cada fonema

Page 29: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Um modelo para a sonoridade

Page 30: VOCALE Um Algoritmo de Identificação de Intervalos Vocálicos no Sinal Acústico de Fala

Gráfico de p(0)=P(X(t)=0)