34
Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa); Informação quantitativa sobre a área de estudo. Cartas temáticas são cartas em que a superfície do terreno é distribuída por um número relativamente reduzido de classes. Cartas de ocupação do solo e as cartas de ocorrência de incêndios são exemplos de cartas temáticas. Em certos casos a produção de cartas temáticas pode ser feita de forma automática usando imagens de satélite e informação sobre as assinaturas espectrais das classes. Informação quantitativa é informação sobre uma característica da superfície que varia continuamente (por exemplo, quantidade de vegetação).

Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Embed Size (px)

Citation preview

Page 1: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Processamento de dados multiespectraisOs dados de detecção remota podem ser usados, em particular, para obter: • Cartas temáticas (informação qualitativa);• Informação quantitativa sobre a área de estudo.

Cartas temáticas são cartas em que a superfície do terreno é distribuída por um número relativamente reduzido de classes. Cartas de ocupação do solo e as cartas de ocorrência de incêndios são exemplos de cartas temáticas. Em certos casos a produção de cartas temáticas pode ser feita de forma automática usando imagens de satélite e informação sobre as assinaturas espectrais das classes.

Informação quantitativa é informação sobre uma característica da superfície que varia continuamente (por exemplo, quantidade de vegetação).

Page 2: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Classificação: produção de cartas temáticas

Duas principais abordagens:

Hipótese do “pixel puro”. Postula-se que cada pixel de uma imagem pode ser associado a uma única classe.

Misturas espectrais. Considera-se que a assinatura de cada pixel é uma combinação das assinaturas de várias classes.

Page 3: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Legenda da carta temática

A legenda é o conjunto de classes a considerar, escolhidas em função do objectivo do processamento e em função da informação contida na imagem de satélite e outra informação adicional usada na classificação.

As classes devem ser “suficientemente distintas”, no espaço de representação considerado (informação multiespectral, etc).

Uma legenda hierárquica permite mais facilmente definir com precisão cada classe e ajustar o conjunto de classes para que a “condição” acima seja verificada.

Page 4: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Exemplo: classes de ocupação do solo

Possível legenda (hierárquica)

• Urbano (residencial, industrial, estradas,…)• Agricultura (culturas arvenses, pomares, pastos,..)• Floresta (resinosas, folhosas, misto,...)• Baldios (herbáceo, arbustivo, …)• Água (rios, lagos, barragens, águas costeiras)• Solo descoberto

Page 5: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Num problema de classificação, em que cada pixel é

associado a uma e só uma classe, dispõe-se de• Assinaturas espectrais dos pixels (imagem de satélite) e,

eventualmente, outro tipo de informação (dados auxiliares),

• Conjunto de k classes prédefinidas (legenda),• Subconjunto de pixels para os quais é conhecida a classe

a que está associado cada pixel (amostra de treino),e pretende-se associar cada pixel da imagem a uma das

classes por forma a minimizar um certo critério de erro dependente da amostra.

Page 6: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Imagem:Banda 1Banda 2,…

Amostra

Legenda

Classificação assistida

Fotointerpretação, recolha de informação no terreno, ...

Page 7: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Assinaturas espectraisExemplo: imagem SPOT-HRV

51 37 110 51 39 10174 59 92 83 71 10983 71 11490 84 116101 89 12760 44 10453 38 9051 35 9249 33 9550 32 10849 31 12248 31 116

Pixel 1

Pixel 2...

Banda 1 Banda 2...

Page 8: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Como o número radiométrico de cada pixel em cada banda pertence a {0,1,...,2b}, em que b é a resolução radiométrica, as assinaturas espectrais são elementos do produto cartesiano {0,1,...,2b}n, se houver n bandas.

Por exemplo, as assinaturas espectrais para as 3 bandas SPOT-HRV são elementos de {0,1,...,255}3 e as as assinaturas espectrais para as 7 bandas Landsat-TM são elementos de {0,1,...,255}7 .

Assinaturas espectrais

Page 9: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Assinaturas espectrais médias de quatro classes de ocupação do solo

Imagens SPOT-HRV: 3 bandas

urbano

água

floresta

agricultura

Page 10: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Representação das classes no espaço das assinaturas espectrais

Se cada classe tivesse uma assinatura espectral única, então seria representada por um ponto em Rn. No entanto, uma classe é tipicamente composta por pixels com assinaturas distintas. Por isso, cada classe tem uma certa localização e uma certa dispersão no espaço das assinaturas espectrais.

Os indicadores de localização e de dispersão mais usados são, respectivamente, o vector média e matriz de variâncias-covariâncias.

Page 11: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Vector média e matriz de variância-covariânciaConsidere-se uma matriz Anxm

Seja xj a j-ésima coluna de A, com j=1,...,m

O vector média é um vector com n componentes, dado por µ=(x1+...+xm)/m

(xj-µ) é o vector desvio entre a j-ésima coluna de A e o vector média

A matriz de variância-covariância é uma matriz simétrica com n linhas e n colunas e define-se como

S=(1/m) Σj=1,..,m(xj-µ) (xj-µ)T

Page 12: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Regra de decisão baseada no vector média e nas matrizes de variância-covariância das classes

Dado uma assinatura espectral x, e um conjunto de classes com médias µ1,…, µk e com matrizes de variância-covariância Σ1,..., Σk, x deve ser associado à classe mais próxima.

Para definir esta regra é preciso escolher, para todo o i, uma medida de distância entre um vector x e a i-ésima classe caracterizada por (µi, Σi)

Page 13: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Algumas distâncias entre objectos e classes

Distância de x à média da i-ésima classe (é o quadrado da distância euclideana entre x e µi):

d2(x,i)=(x-µi)T (x-µi).

Distância de Mahalanobis de x à i-ésima classe:

D2(x,i) = (x-µi)T Σi-1 (x-µi).

A distância de Mahalanobis é uma generalização da distância euclideana e é preferível para classificação se as matrizes de variância-covariância das classes são conhecidas.

Page 14: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

urbano

água

floresta

agricultura

Assinatura espectral de um novo pixel a classificar: a que classe deve ser associado?

Page 15: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Um pixel com assinatura espectral (30,50) nas bandas 2 e 3 está a uma distância de Mahalanobis de 23.73 da classe “urbano” e a uma distância de 60.18 da classe “água”

urbano

água

média

média

Page 16: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Pomares: 6.4, 5.5, 13

Variâncias nas bandas: Residential: 45, 38, 70

Culturas: 23, 36, 42

Distância às médias Distância normalizada

Page 17: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Estimar médias e matrizes de variância-covariância

Dado que os parâmetros de localização e dispersão das classes não são conhecidos, é necessário estimá-los recorrendo a uma amostra (de treino). Essas estimativas são obtidas do seguinte modo:

1. Delinear um esquema de amostragem de pixels na imagem para definir amostras: subconjuntos de pixels de cada classe

2. Identificar a classe a que pertence cada pixel (usando fotografia aérea, ou trabalho de campo, etc);

3. A partir da amostra de treino, calcular estimativas do vector média e da matriz de variância-covariância para cada classe (por exemplo, usando um estimador de máxima verosimilhança).

Page 18: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Esquemas de amostragem

Esquemas mais usados:• aleatório simples: as classes menos frequentes no terreno

podem não ser bem representadas; a imprecisão localização das parcelas no terreno limita a aplicação.

• sistemático: erros podem ser introduzidos se os dados tiverem um padrão espacial correlacionado com o esquema de amostragem.

• aleatório estratificado: baseia-se numa pré-classificação da área para definir estratos, mas garante a representação de todas as classes.

• polígonos amostrais: podem ser usados nos esquemas acima. O interesse é limitado pela correlação espacial.

Page 19: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Efeito da precisão posicional na obtenção de informação amostral

realidade mapa

Deslocamento de 1 pixel na posição

Page 20: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Exemplo: produção de carta temática com dados Landsat

Imagem Landsat-TM (1996): foram usadas as bandas 1,2,3,4,5 e 7

Concelho de Castanheira-de-Pera Área: 67 Km2, Altitudes entre 400 e 1200 metrosDeclives entre 0 e 40 graus7 classes de ocupação de solo: urbano, agricultura, folhosas,

resinosas, floresta mista, ocupação arbustiva, zonas descobertas

Page 21: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Ocupação real do solo(7 classes)

Page 22: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Estimar a localização e dispersão de classes no espaço das assinaturas espectrais

Cada amostra origina uma estimativa diferente. Quanto maior for a amostra (para um delineamento amostral semelhante), mais limitado é o erro cometido.

Exemplo: distância de Mahalanobis entre uma assinatura espectral de um pixel e a classe agricultura, considerando uma amostra dessa classe entre 10 e 200 pixels

Distância máx

Distância média

Distância mínima

20 amostras com 200 pixels

Resultados para 20 amostras diferentes com 10 pixels

Page 23: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Densidades de amostragem diferentes podem conduzir a resultados diferentes.Exemplo: distância da mesma assinatura espectral a duas classes.

Dimensão da amostra

Classe “urbano”Classe “floresta”

Dimensão da amostra

Page 24: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Dimensão da amostra Número e dimensão dos polígonos amostrais

O número de pixels da amostra deve crescer com o número de variáveis (bandas espectrais,...), dado que o número de parâmetros a calcular (em particular, dimensão da matriz de variância covariância) depende do número de variáveis.

Alguns autores recomendam dimensões de amostra de pelo menos 10p, 30p, ou 100p pixels por classe, em que p é o número de variáveis.

No caso de serem usados polígonos amostrais, não é vantajoso em geral usar polígonos com um número superior a 10 ou mesmo 25 pixels (Congalton, 1998).

Page 25: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Esquema amostral aleatório com polígonos

Page 26: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Número e dimensão de polígonos: exemplo

num.poli

mea

n of

pre

cisa

o

0.55

0.56

0.57

0.58

0.59

0.60

25 50 100 150

dim.poli

124

A precisão da classificação aumenta significativamente com o número de polígonos

Page 27: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Classificação: regra de afectação baseada na distância de Mahalanobis

5 6 7 8 9 10 11

1314

1516

1718

1 1

1

1

1

1

1

1

1

1

1

1

1

1

11

1

1

1

11

1

12

2

2

2

2

2

2

2

2

2

2

2

2

2

2

2

222

2

2

2

2 2

2

2

2

2

3

33

333

33

3

3

3

3

3

33

3

3

3

3

3

3

3

33

4

4

4

4

4

4

4

444

44

4

44

4

44

4

4

4

4

4

5

5

5

5 55

5

5 5

5

5

5

5

5

5

55

55

5

5

55

5

6

6

6

6

6

6

6

6

6

6

66

6

6

66

6

6

6

6

6

6

6

6

6

6

6

66

7

7

7

7

7

7

7

7

7

7

7

7

77

7

7

77 77

7

urbanoagricultura

folhosas

resinosas

misto

arbustivo

descoberto

UrbanoAgricultura

Folhosas

Misto

Solo descobertoResinosas Arbustivo

Representação no plano discriminante principal: subespaço de R6

Page 28: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Outros classificadores: redes neuronais, árvores de classificação, vizinhos mais próximos,...

|x7<632.5

x6<30.5

x4<110.5

x7<573.5

x7<550.5

x7<490.5

x7<459.5 x4<70.5

x10<0.875

x3<45

x7<498

x7<468

x6<69.5

x6<22.5

x8<36

x7<923.5

x5<91.5

x6<33.5

5 4 4 3

5

3

2

2 1

2 1 1

7

3 4

6

6 6

7

Exemplo: árvore de classificação

Page 29: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Comparação de métodos de classificação: exemplo0.

20.

40.

60.

8

prec

isao

lda qda nnet tree knn maioria multi

metodoBaseado na distância de Mahalanobis

A variação para cada método corresponde a diferentes densidades e esquemas de amostragem

Page 30: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Métodos de classificação contextuais

Dado que a informação geográfica é espacialmente correlacionada, a classificação automática de imagens pode ser melhorada se se considerar o contexto espacial. Dessa forma, a classificação de um pixel será dependente da classificação dos pixels adjacentes.

Muitos métodos de classificação tirando partido do contexto espacial foram propostos: (1) na fase de préprocessamento; (2) integrando outras variáveis na classificação; (3) “filtrando” a imagem após a classificação.

Uma forma simples de incorporar informação contextual num método de classificação é simplesmente considerar que as variáveis que descrevem um pixel correspondem às assinaturas espectrais desse pixel e dos pixels vizinhos (janelas 3x3, 5x5,...), e proceder como anteriormente.

Page 31: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Filtros em pós-processamento

Após a classificação, a aplicação de um filtro de moda à carta temática obtida reduz a variabilidade local da classificação.

O resultado depende da dimensão do filtro (número de linhas e colunas)

Page 32: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Exemplo: aplicação de um filtro de moda 3x3

Carta não filtrada Carta filtrada

Page 33: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Avaliação da precisão de uma carta temática

Informação espectral (imagem de satélite)

Dados auxiliares: DTM, pontos de controle,...

Pré-processamento Legenda

Imagem georeferenciada e corrigida

Trabalho de campoFotografia aérea

Amostra

treino teste

Classificação

Carta temáticaAvaliação da

precisão

(Pós-processamento)

Page 34: Processamento de dados multiespectrais Os dados de detecção remota podem ser usados, em particular, para obter: Cartas temáticas (informação qualitativa);

Avaliação da precisão da classificação com uma matriz de erro

nnet primeiro nível (flor. é a classe agrupada) 5-nn segundo nível (classificação de flor.)

urb. agri. flor. desc. class. folh. resi. misto arbu. class. urb. 9.4 1.9 0.3 0.6 0.77 folh. 27 2.3 13.2 5.1 0.567 agri. 3.6 17.7 3.3 0.5 0.705 resi. 3.6 26.8 5.4 7.8 0.615 flor. 1.2 6.2 191.1 5.4 0.937 mist. 14.1 4.5 27.2 2.7 0.561 desc. 0 0 2.7 5.5 0.671 arbu. 2.6 4.4 3.2 44.6 0.814 map. 0.662 0.68 0.968 0.458 0.897 map

a 0.571 0.705 0.555 0.741 0.646

Precisão do “produtor”: proporção dos pixels da classe bem classificados

Precisão do “utilizador”: proporção dos pixels na carta temática que pertencem à classe

Precisão global