Separação Cega de Fontes

Embed Size (px)

Citation preview

Separao Cega de Fontes (BSS) consiste em estimar uma seleo de N sinais de fontes no-observveis de P misturas observveis dessas fontes onde o parmetros de misturas so desconhecidos. Denotemos por ..... o vetor de fontes e por ....... as observaes. Ns consideramos misturas convolutivas definidas por uma seleo de filtros desconhecidos com respostas ao impulso.... onde......e......... A relao entre as fontes e as observaes pode ser expressas no domnio do tempo como:

A relao geral depois de lidos no domnio Z

Onde X(z) e S(z) so, respectivamente, a transformada Z de X(n) e S(n), e P x N matriz H(z) consiste da funo transferncia ....dos filtros de mistura.Nesse artigo, cada fonte Sj(n) assumida sendo expressa no domnio Z como:

Onde X(z) e S(z) so, respectivamente, a transformada Z de x(n) e s(n), e P x N matriz H(z) consiste da funo transferncia Hij(z) ..... dos filtros de mistura como:

Onde F(z) corresponde a um filtro, e Uj(z) a transformada z de um processo uj(n), na qual o processo de inovao de sj(n). Denotando U(z) ........ ns ento podemos expressar a mistura (2) como:

Ns podemos fazer as seguintes suposies acerca do modelo de mistura.

O processo... real-avaliado, mdia zero, independente e identicamente distribudo (i.i.d.) e espacialmente independente, isto , suas componentes uj(n) so estaticamente independentes de cada outra mas no necessariamente tem a mesma distribuio. Ns tambm assumimos que, na maioria, uma dessas componentes so Gaussianas. O filtro de matrizes F(z), H(z), e G(z) so causais, tem resposta ao impulso finita (FIR), e no singular. Note que sistemas com resposta ao impulso infinita (IIR) podem tambm ser aproximados pelo modelo FIR equivalente (alta-ordem).O objetivo da convoluo BSS tipicamente estimar a contribuio de todas as fontes em cada observao, isto , Hij(z), Sj(z).Nos mtodos baseados em deflao tais como [1], isso alcanado usando o seguinte procedimento.1. Extrair o processo de inovao uj(n) de uma fonte Sj(n) das observaes.2. Identificar P colorindo filtros e aplicando eles para uj(n) na ordem para recuperar as contribuies de Sj(n) em cada observao, isto , Hij(z), Sj(z).3. Subtraia essas contribuies de todas as observaes.4. Selecione.... volte para o passo 1) na ordem para subtrair outra fonte.

Ns aqui consideramos o mtodo BSS no domnio do tempo, na qual usa-se a no-gaussianidade como critrio para realizar o primeiro passo dos procedimentos acima e nas quais esto portanto baseados na analise de componentes independentes (ICA) [2]. Na prxima seo nos analisamos os princpios e limitaes dos mtodos existentes, e ns propomos uma aproximao para estender eles assim como para obter o mtodo de rpida convergncia curtotica atualmente faltante e mtodos negentropicos para misturas convolutivas. A performance experimental dos mtodos propostos apresentado na Seao III, e concluses so rabiscadas dessa investigao na Seao IV.

II. Analise e Extenso dos Mtodos BSS baseado na No-Gaussianidade

A. Aproximaes reportadas anteriormenteDelfosse e Loubaton [3] propuseram o primeiro mtodo curtotico BSS baseado na deflao para misturas linear instantneas, onde os filtros Hij(z) so repostos por coeficientes escalares. Esse mtodos primeiro consiste na derivao de uma verso esfrica v(n) de um vetor observao x(n), isto , a seleo de combinaes lineares dessas observaes compostas de sinais que so mutualmente descorrelacionados no tempo n e que tm varincias unitrias. O primeiro sinal de sada ento derivado como uma combinao linear ...das observaes esfricas, com um vetor coeficiente normalizado w selecionado assim como para maximizar o quadrado (ou o valor absoluto) da curtose no-normalizada de y(n) definida por .... para um sinal de media zero. Delfosse e Loubaton provaram em [3] que a mxima local desse critrio corresponde pontos de separao. Eles usaram um mtodo gradiente-like para maximizar esse critrio. Isso requer uma seleo de um ganho adequado de adaptao e rendimentos de convergncia lenta. Hyvarinen e Oja resolveram esse problema introduzindo um algoritmo de ponto fixo para otimizar o critrio acima [2]. Uma diferente aproximao foi proposta por Tugnait para misturas convolutivas [1]. Isso opera diretamente nas observaes, isto , sem esferilizar primeiros elas, mas depois usar o valor absoluto da kurtose normalizada do sinal de sada y(n), isto , .......como o critrio de separao. Tugnait provou que os pontos de separao correspondem ao mximo local desse critrio quando recombina-se as observaes duplamente infinitos filtros de extrao. Ele props utilizar esse critrio usando uma aproximao baseada em gradiente, nas quais temos novamente rendimentos de convergncia lenta. Os testes realizados pela nossa equipe [4] mostraram que, mesmo quando usamos esquema de optimizao Newtoniana, a convergncia permanece lenta, especialmente para filtros de mistura de alta-ordem.Esse artigo portanto, objetiva o preenchimento de lacunas resultantes das aproximaes acima, isto , ao introduzir mtodos curtoticos e negentrpicos de rpida convergncia para misturas convolutivas. Para finalizar, ns investigamos primeiro como estender para misturas convolutivas a aproximao baseada na esferizaao e optimizao de ponto fixo de curtoses no normalizadas que tem sido proposto para misturas instantneas.

B. Novos Mtodos para extrao de um Processo de Inovao Todos mtodos acima requerem uma normalizao, como a curtose no normalizada de y(n) tende ao infinito, quando a potencia de y(n) tende ao infinito. Na aproximao de Tugnait, o critrio por si s normalizado como o mtodo consiste na estimativa de um processos de inovao uj(n) at um fator de atraso e escala por maximizar o valor absoluto de uma curtose normalizada de uma combinao convolutiva de observaes definidas como

Onde ..... so filtros FIR no-causais na prtica. Ao invs disso, as duas aproximaes lineares instantneas mencionadas na subseo anterior usa curtose no normalizada e so baseadas na normalizao da potencia de y(n). Isso resulta da etapa de esferizaao dessas aproximaes, na qual rende .....assim que a seleo w com ||w||2 = 1 garante que ... Ns aqui estendemos esse mtodo para mistura convolutivas. Ao final, o primeiro passo da nossa aproximao realizao a esferizaao convolutiva da observao, definida como segue. Em qualquer tempo n, ns consideramos o vetor coluna....

Que contm M = (2R + 1) entradas. Ns derivamos as M-entradas do vetor coluna ....definida como.....

Onde B uma matriz MxM escolhida tal que:

Com respeito a x(n), a operao (7) pode portanto ser considerada como esferizaao convencional, o que consiste da principal analise de componentes e normalizao. Agora, com respeito a observao original xi(n), isso pode ser interpretado diferentemente. Certamente (6) e (7) mostram que os sinais ... so misturas convolutivas de xi(n). Equaao (8) ento quer dizer que o sinal ...sao criados para ter varincias unitrias e para ter descorrelaao mutua, o que pode ser visto como um branqueamento espao temporal e normalizao das observaes xi(n). Vamos denotar por y(n) o sinal extrado:

Onde w uma M-entrada vetor coluna estendido de coeficientes de extrao wm que, juntos com (7), rende uma combinao convolutiva y(n) de observaes. A potencia de y(n) l .......Restringir... assim como conhecer (8), ns temos ..... Portanto ..........

Nosso mtodo ento consiste em maximizar o valor absoluto da curtose no normalizada de y(n) definida por (9) sob o constrangimento .... O apndice mostra que esse critrio nos extrai uma estimativa de um processo de inovao de fonte atrasada e escalada...sob algumas condies.Alm disso, algoritmos poderosos para realizar uma otimizao forada de valor absoluto das curtoses de y(n) pode ser ento diretamente derivadas daquelas reportadas anteriormente para misturas lineares instantneas, porque o apndice mostra que misturas convolutivas ....estudadas nesse artigo podem ser reformuladas como misturas instantneas em determinadas condies. Especialmente, ns propomos como uma extenso de [2] o seguinte algoritmo ICA curtotico convolutive de rpido ponto-fixo baseado no nosso vetor w modificado. Inicialize w com um valor wo usando as aproximaes apropriadas abaixo. Repita os seguintes passos 1) e 2) at convergncia

O valor wo de w mencionado inicialmente acima, pode ser selecionado aleatoriamente. Uma aproximao melhorada pode ser obtida tomando vantagem da relao que existe entre nosso vetor w e os coeficientes dos filtros FIR da aproximao de Tugnait definida em (5). Certamente consideraremos as colunas de nossa matriz de esferizaao B e o ndice delas como

Baseado em (6) e (7) . Usando (7), o sinal (9) extrado no nosso mtodo l y(n).....Identificando essa expresso com o sinal de sada (5) na aproximao de Tugnait, temos

E portanto

Onde o vetor fila K consiste da resposta ao impulso dos coeficientes os filtros k1(n) e kp(n). Essa relao nos deixa inicializar nosso vetor w como no mtodo de Tugnait, isto , com filtros unitrios ....assim que y(n) a soma de todas as observaes.... Que corresponde a K=Ko definido como

..........Equaao (15) ento rende...... Essa inicializao de w proveu um melhor resultado experimental que uma aleatoriedade e usado na Seao III.

XXXXXXXXXXXXXX

Na segunda serie dos experimentos, ns testamos nosso algoritmo no caso indeterminado N=3 e P=2, quando os dois sinais observados contm fonte de rudo branca Gaussiana em adio as duas fontes acima de interesse. Ns fixamos a ordem do modelo em Q=20. Por variao da potencia da fonte de rudo e assim a taxa sinal-rudo (SNR) nas observaes, ns investigamos a robustez da estimativa da matriz mistura para rudo. Ao final, ns computamos as SIRs das duas fontes estimadas de interesse nas quais ns cancelamos as contribuies de fontes de rudo. Fig 1(b) mostra que nosso mtodo bastante robusto como SIRs permanecem mais altas que 10dB para SNRs indisponvel para 8dB. Para N=P=2, ns tambm comparamos o tempo de processamento de nosso mtodo com a verso modificada do algoritmo de Tugnait introduzido em [4], na qual j alcana-se velocidade mais alta que a aproximao de Tugnait por usar um algoritmo de Newton modificado. Ns variamos a ordem do modelo Q entre 0 e 30 para fontes contendo T=10000 amostras (T>10000 ou Q> 30 leva a inaceitvel alto tempo de processamento para 100 execuoes de aproximao de Tugnait-Newton). O resultado na Fig. (1c) representa o tempo da etapa de extrao de inovao, na qual est longe do maior tempo consumido. Isso mostra que nosso mtodo 100 vezes mais rpido que Tugnait-Newton. Em acrscimo, isso rende ligeiramente SIRs mais altas, isto , cerca de 0.5dB. A prxima serie de experimentos foi carregada com duas fontes de fala amostradas em 20kHz durante 5s. Como na primeira seleo dos experimentos, ns variamos a ordem dos filtros de mistura Hij(z), e ns novamente realizamos 100 experimentos para cada ordem de filtro. Dessa vez, ns resolvemos realizar a etapa de extrao de inovao em 20000 janela de amostras onde os sinais so quase estacionrios e para estimar as SIRs nos sinais gerais. Para esses sinais de udio, o critrio de otimizao negentropico ......revela render um melhor desempenho, provavelmente por causa da suas distribuies de cauda [5]. Os resultados na Fig. 1(d) mostram que as mdias SIRs esto entre 11 e 7 dB, na qual 4dB mais baixa que os 100.000 amostras de sinais estacionrios acima. Isso resulta de 20.000 janela de amostras, na qual rende ligeiramente desempenho mais baixo para sinais artificiais, e do processo de modelo de mdia mvel (MA), na qual somente relevante fontes de voz. De qualquer forma, isso rende significante melhora de qualidade percentual. Ns tambm testamos nosso algoritmo negentropico filtros misturados de 64-th ordem real medidos nos ouvidos de uma cabea de manequim [7] e com R=64, R=300. Ns selecionamos respostas ao impulso associadas com fontes positivas definidas por 80 e 120 graus de angulao na relao para a cabea do manequim. Usando novamente os dois sinais de fala acima, a mdia de sada SIRs foram 9.1dB para a primeira fonte e 6.9dB para a segunda fonte. Esse filtros reais portanto rendem quase o mesmo desempenho que os 64-th de ordem artificial considerados na Fig. 1(d).

APENDICE RELEVANCIA DO CRITRIO CONSIDERADO

As P observaes consideradas xi(n) so expressos com respeito a N processos de inovao uj(n) de acordo com (4). Eles so, alem disso, processos causais desses filtros de misturas de Q-th ordem. Agora considere o vetor x(n) definido em (6) e composto por observaes atrasadas. A analise provida em (8) implica que se

Onde L=(2R+1) o nmero de defasagens, ento x(n) pode tambm ser interpretado como uma seleo de misturas lineares instantneas de fontes correspondentes, na qual so verses atrasadas e fator de escala dos processos de inovao uj(n), com ao menos muitas observaes como fontes. Alm disso, se (20) conhecido, a investigao para misturas instantneas providas em (3) prova rigorosamente que, por maximizao do valor absoluto da curtose no-normalizada do sinal yn(n) definido em (9) sob constrangimento (10), ns extramos um processo de inovao atraso e com fator de escala... cuja estimativa prtica denotada... a seguir.Se (20) no conhecido, o problema BSS reformulado instantneo no determinado, isto , isso envolve menos observaes que fontes (note que especialmente o caso quando P=N). Algumas aproximaes so ento necessrias. Entretanto, quando a taxa....associada a (20) tende a 1 ( que o caso quando P=N e L largo), um processo de inovao atraso e com fator de escala pode ainda ser precisamente estimado como combinao linear de observaes disponveis cujas curtose no normalizada absoluta mxima sob constrangimento em (10).