Estimação Bayesiana de Sinais Baseada em Ôndulas Mário A. T. Figueiredo Instituto de Telecomunicações, and Departamento de Engenharia Electrotécnica e

Estimação Bayesiana de

Sinais Baseada em Ôndulas

Mário A. T. FigueiredoInstituto de Telecomunicações, and Departamento de Engenharia Electrotécnica e de Computadores Instituto Superior TécnicoLisboa, PORTUGAL

W

SinalOriginal

y

“Discrete wavelet

transform”(DWT)

W -1

DWT inversa

Sinalprocessado

Exemplos: compressão estimação (e.g., “denoising”)

1

Coeficientesobservados

Coeficientesprocessados

Regra de processamento

Processamento de sinais baseado na transformada discreta

Sinal discreto

Wx

DWT (periódica)

W x

Coeficientes

Decorrelação “mais branco” do que x

2

Ortonormal W W = I T

Esparsa é dominada por “poucos” coeficientes “grandes”

x = [x1,…xn] = [1,…,n]

Características da DWT

y = x + nRuído branco gaussiano

Sinal originalSinal ruidoso

DWT

Wy = Wx + Wn

(W é ortonormal)

3

Wy

WT^

Estimator x

x = W (Wy)T^

+ n’

Estimação baseada em ôndulas (remoção de ruído)

4

0 5000 10000 15000-6

-4

-2

0

2

4

6

0 5000 10000 1500010

-40

10-30

10-20

10-10

100

Representação dominada por “poucos” coeficientes “grandes”

0 5000 10000 1500010

-5

10-4

10-3

10-2

10-1

100

DWT

DFTSinal “vulgar”

Coeficientes da DWT: esparsos

5

0 5000 10000 15000-6

-4

-2

0

2

4

6

0 2 4 6 8 100

500

1000

1500

2000

0 20 40 60 80 1000

10

20

30

40

50

60

70

0 5000 10000 15000-10

-5

0

5

10

Sinal “vulgar”

Ruído branco gaussiano

Histograma dos valores absolutos

Histograma dos valores absolutos

~104

DWT

DWT

Coeficientes da DWT: esparsos

Sugere : - Manter os coeficientes grandes que dominam a representação - Eliminar os pequenos, “provavelmente” dominados por ruído.

6

Valores de n’Valores de

p()

Esparsa, ou“heavy tailed”

e n’ têm características estatísticas diferentes

Gaussianap(n’)

= n’ Como estimar ?

Remoção de ruído baseada na DWT

7

Objectivo: Manter os coeficientes “grandes” e eliminar os restantes.

Questões: qual ( ) ? Que limiar ?

Regras de limiar (“thresholding rules”)

“hard”“soft”

s

H

Donoho and Johnstone (1994), outros...

^ ^

Remoção de ruído baseada na DWT

8

Métodos para escolha de limiar:

- Limiar universal (VisuShrink) Donoho & Johnstone (1994).

- Limiar que depende do nível da decomposição e estimado a partir dos coeficientes observados com base no “Steins unbiased risk estimator” (SURE) (SureShrink); Donoho & Johnstone (1995).

- Validação cruzada (“cross-validation”); Weyrich & Warhola (1994) e Nason (1994).

- Métodos bayesianos; Vidakovik (1994), Chipman, Kolaczyk, & McCulloch (1995), Crouse, Nowak, & Baraniuk (1997), Figueiredo & Nowak (1998).

Remoção de ruído baseada na DW”T: técnicas propostas

9

0 1000 2000 3000 4000-10

-5

0

5

10

Sinal original

0 1000 2000 3000 4000-10

-5

0

5

10

Sinal ruidoso

0 1000 2000 3000 4000-10

-5

0

5

10

Sinal estimado“soft threshold”“Sure criterion”

Remoção de ruído baseada na DWT: Exemplo

10

= n’Modelo de observação:n’ ~ i.i.d. gaussianos média nula variância 2

Função de verosimilhança: pN

Conhecimento a priori: p

Lei de Bayes: p() = pp

p

Probabilidade (conhecimento) a posteriori

Função de custo L(’) - Custo associado com a estimativa ’ quando o verdadeiro valor é

Revisão: estimação bayesiana

11

Objectivo: regra de estimação ^

Critério: minimizar o valor expectável a posteriori do custo (“posterior expected loss”)

dpL )|()ˆ,(minarg

ˆ

|)ˆ,(minarg)(ˆ

LE

Exemplos:

L(’) = ||’ dpE )|(|)(

(média a posteriori)

L(’) = )|(maxarg)(

p

(máximo a posteriori - MAP)

'0

'1

Revisão: estimação bayesiana

12

y = x + nDWT

Wy = Wx + Wn + n’

Modelo de observação / função de verosimilhançaRelembrar...

Ruído brancogaussiano

(W é ortonormal)

p(y|x) = N(x,2I)

p() = N(,2I)

Funções de veromilhança semelhantesnos domínios do sinal e da DWT

Remoção de ruído baseada na DWT: Formulação bayesiana

13

…induz, no “domínio do sinal”,

pX(x) dx = p(Wx) d pX(x) = p(Wx)

…porque det(W)=1, dx = d

Propriedade de descorrelação da DWT. Coeficientes a priori independentes.

Ni

i...1

)(p)(p

Função densidade de probabilidade a priori, no “domínio dos coeficientes”

p) com = Wx

Formulação bayesiana

Teoria da decisão bayesianaVerosimilhança“prior”Custo L(x,x’)

14

x = (y) regra de estimaçãoóptima

^

x = WTBayes () = WT Bayes (Wy) ^

Sob certas condições (fracas) no custo L(x,x’) :

Wy

WTEstimador

Bayes(.)x = WT

Formulação bayesiana

15

Verosimilhança e probabilidade a priori exprimem independência

Estimação independente;i.e., coeficiente por coeficiente

Justifica que se considere apenas um coeficiente .

p| ~ N(,2) Função de verosimilhança simples

Pergunta: o que deve exprimir a fdp a priori, p() ?

Resposta: o carácter esparso dos coeficientes da DWT

Formulação bayesiana: escolha do “prior”

16

1)(pProposta:

)(p

Exprime total ignorância acerca da “escala” em que está representado

…no seguinte sentido:

Mudança de escala (por ex., de volt para milivolt): ’= k

'

1)'(

p Outra interpretação:

p(log(|)) = const.


17

1)(pCaracterísticas de:

)(p

Extremamente “heavy-tailed”

Tão “heavy-tailed” que é impróprio.…não é uma função densidade deprobabilidade “vulgar”.

dp )(

Limite de uma família de Student-t


18

Lei de Bayes:

d)(p)|(p

)(p)|(p

)p(

)(p)|(p)|(p

Escreva-se:K

)('p

d)(p'

)('p)(p

1d)(p' Em que p’() está não normalizada:

Obviamente:

d)(p')|(p

)(p')|(p)|(p

Conclusão: p() não depende da normalização do “prior”

Revisão: estimação bayesiana com “prior” impróprio

19

d)(p')|(p

)(p')|(p)|(p

Lei de Bayes com “prior” não normalizado

Exemplo clássico: estimador de máxima verosimilhança:

)|(pmaxargˆMV

)|(pmaxargd)|(p

)|(pmaxargˆ

MAP

A

A

…não é mais do que um estimador MAP com p’() = const.=A

Revisão: estimação bayesiana com “prior” impróprio

1)(pDificuldade: com

)(p

20

d)(p)|(p

...a própria fdp a posteriori é imprópria:

Solução: Escrita alternativa para p(): Bayes hierárquico. Aplicação de uma técnica de Bayes empírica (“empirical Bayes”)

O “prior”proposto

21

1)(pA fdp a priori

é equivalente ao seguinte modelo hierárquico:

p| =N(,2)

p| = N(,2)

p2) 2

1

22 )|,(p)|(p d

222 d)(p)|(p)(p

)|(p

1)(p

“Prior” de Jeffreys

)(p

)(p)|(p

Estimação bayesiana hierárquica

p2)

2

1

Invariante sob mudanças de escala (ignorância)

p2)

2

1

a b a b 2

22

mesma área,mesma probabilidade

)alog()blog(d1

]}ba,[Pr{ 2b

a 22

)alog()blog(d1

]}ba,[Pr{ 2b

a 22

)alog()blog(

=

Universal:não depende deescolha de escala

Estimação bayesiana: “prior” de Jeffreys

23

)|(pmaxarg 222

)(p)|(pmaxarg 222

1. Estimar 2 com base na fdp marginal:

2. Utilizar essa estimativa no critério de Bayes: = Bayes (|2)

Estimaçao bayesiana empírica

24

p|2) = N(,2 + 2)

z

z+

p| = N(,2)

...porque + n

N(,2)

N(,2)

p2) ~ “prior de Jeffreys”

2

2

2

3

p| = N(,2)

22 3

= E[| , ] =^2 + 2

Estimaçao bayesiana empírica

0

0

IdentidadeNova regra

25

22 3ˆ

23 23

23 Limiar “universal”

Nova regra de “threshold/shrinkage”

0

0

"Hard threshold""Soft threshold"Nova regra

26

Nova regra versus “hard” e “soft” “thresholding” (com o mesmo limiar)

23 23

Nova regra versus “hard” e “soft” “thresholding”

27 Comparação de desempenho: sinal “Blocks”

28 Comparação de desempenho: sinal “Bumps”

29 Comparação de desempenho: sinal “Doppler”

30 Comparação de desempenho: sinal “HeaviSine”

31

+ ruídoprocessamento

Exemplo em restauração de imagens

32

+ ruídoprocessamento

Exemplo em restauração de imagens

Documents

Estimação Bayesiana de Sinais Baseada em Ôndulas Mário A. T. Figueiredo Instituto de Telecomunicações, and Departamento de Engenharia Electrotécnica e