Análise Comparativa de Classificadores para Cartografia de ... · produção de cartografia de ocupação do solo, numa área confinada ao concelho de Almodôvar, Região do Baixo

Análise Comparativa de Classificadores para Cartografia de Ocupação do Solo no Alentejo, com Imagens Intra-Anuais

AWiFS

Dissertação orientada por:

Professor Doutor Mário Caetano e

Professor Doutor José António Tenedório

Dissertação apresentada para cumprimento dos requisitos necessários à

obtenção do grau de Mestre em Gestão do Território, Área de Especialização em Detecção Remota e Sistemas de Informação Geográfica

MARÇO, 2011

II

III

AGRADECIMENTOS

Ao Prof. Doutor Mário Caetano, pela orientação, disponibilidade e pelo apoio junto do

Grupo de Detecção Remota do Instituto Geográfico Português.

Ao Prof. Doutor José António Tenedório, co-orientador na Faculdade de Ciências

Sociais e Humanas, pela orientação, disponibilidade e por ter-me despertado a

curiosidade e interesse no estudo da detecção remota.

Aos colegas do Grupo de Detecção Remota, que me apoiaram na elaboração deste

trabalho, em particular: António Araújo, António Nunes, Hugo Costa e Vasco Nunes.

Agradeço ao Município de Almodôvar pela permissão da utilização de informação na

preparação deste estudo.

Também agradeço a: Bruno Esteves, Hugo Pereira, Pedro Correia e Pedro Santos, os

quais me ajudaram e incentivaram na elaboração desta dissertação.

Por fim agradeço muito especialmente à Marta Matos, pelo grande contributo, ajuda e

incentivo que deu na elaboração deste estudo.

IV

RESUMO

ANÁLISE COMPARATIVA DE CLASSIFICADORES PARA

CARTOGRAFIA DE OCUPAÇÃO DO SOLO NO ALENTEJO, COM IMAGENS

INTRA-ANUAIS AWiFS

FILIPE AUGUSTO VALENTE OLIVEIRA

PALAVRAS-CHAVE: Ocupação do solo, AWiFS, Máxima verosimilhança,

Árvores de decisão, Alentejo.

No presente estudo, explorou-se o potencial das imagens AWiFS para a produção de cartografia de ocupação do solo, numa área confinada ao concelho de Almodôvar, Região do Baixo Alentejo.

A partir de um conjunto de dados intra-anual compostos por três imagens AWiFS, definiu-se uma análise comparativa de diferentes abordagens de classificação automática assistida a nível do pixel. Foram testados dois classificadores: um paramétrico de máxima verosimilhança e um não-paramétrico de árvores de decisão. A estes classificadores associaram-se diferentes conjuntos de dados entre os quais, dados de NDVI e dados resultantes de análise de componentes principais.

A exactidão global dos mapas produzidos foi muito baixa, obtendo-se valores entre 37% e 43% para nomenclaturas de ocupação do solo de dez e cinco classes, respectivamente. Com base no conjunto de amostras de referência, verificou-se a influência destas nos valores de exactidão global dos mapas produzidos. Observou-se igualmente, com base nas amostras de referência, o desempenho das diferentes abordagens de classificação.

Os resultados obtidos indicam que as características das imagens AWiFS e da área de estudo foram decisivos nos resultados dos testes de classificação. As amostras de teste específicas de cada mapa produzido influenciaram significativamente os valores de exactidão global, inviabilizando a sua comparação. Ao nível do desempenho dos classificadores/conjunto de dados, os resultados mostram que o classificador de máxima verosimilhança obtém melhores resultados de exactidão global do que o classificador de árvores de decisão.

V

ABSTRACT

COMPARATIVE STUDY OF LANDCOVER MAPPING CLASSIFIERS

IN ALENTEJO REGION, WITH INTRA-ANNUAL AWIFS IMAGES

FILIPE AUGUSTO VALENTE OLIVEIRA

KEYWORDS: Land cover, AWiFS, maximum likelihood, Decision trees,

Alentejo.

The potential of AWiFS imagery for land cover mapping in a confined area, by the surroundings of a municipality in the region of Baixo Alentejo was tested.

From a data set of three intra-annual AWiFS images, a comparative analysis of different per pixel, supervised classification approaches was design. A parametric maximum likelihood classifier and a non-parametric decision trees were tested. A set of data set was associated to the classifiers such as NDVI and principal component analysis data.

The overall accuracy of the maps produced was very low, between 37% and 43% for classifications of ten and five land cover classes. Based on the set of reference samples, the influence of these values in the overall accuracy of the maps was observed. Based on the same reference samples, the performance of the classification approaches was observed as well.

The results point out that the AWiFS imagery and the study area features were key factors for the overall accuracy values of the classification tests. Map tests were not possible do compare due to the fact that, the reference samples of each specific map, considerably influenced their overall accuracy. In terms of classifiers/dataset performance, results shows that the maximum likelihood classifier achieves higher values of overall accuracy than decision tree classifier.

VI

LISTA DE ACRÓNIMOS

ACP – Análise de Componentes Principais

AD – Árvores de Decisão

AMBAAL – Associação de Municípios do Baixo Alentejo e Alentejo Litoral

AWiFS – Advanced Wide Field Sensor

CAD – Classificador de Árvores de Decisão

CMV - Classificador de Máxima Verosimilhança

COSMIC – Cartografia multi-escala de ocupação do solo

CP – Componentes Principais

DR – Detecção Remota

EG – Exactidão Global

EP – Exactidão do Produtor

EU – Exactidão do Utilizador

GDR – Grupo de Detecção Remota

IGP – Instituto Geográfico Português

LANDEO - User driven land cover characterization for multi-scale environmental

monitoring using multi-sensor earth observation data

NDVI – Normalized Difference Vegetation Index

SIG – Sistema de Informação Geográfica

VII

ÍNDICE

RESUMO............................................................................................................ IV

ABSTRACT .........................................................................................................V

Lista de acrónimos.............................................................................................. VI

Índice de Tabelas ................................................................................................ IX

Índice de Figuras...................................................................................................X

1 Introdução .......................................................................................................... 1

1.1 Enquadramento............................................................................................ 1

1.2 Objectivos.................................................................................................... 2

1.3 Organização da dissertação ......................................................................... 3

1.4 Detecção Remota e a classificação de imagens de satélite ......................... 3

1.5 Utilização de imagens AWiFS para cartografia de ocupação do solo ........ 7

2 Dados geográficos ............................................................................................. 9

2.1 Caracterização da área de estudo................................................................. 9

2.2 Imagens AWiFS ........................................................................................ 14

2.3 Dados Auxiliares ....................................................................................... 16

3 Metodologia..................................................................................................... 17

3.1 Pré-processamento..................................................................................... 18

3.2 Nomenclatura de ocupação do solo........................................................... 21

3.3 Amostragem de treino ............................................................................... 24

3.4 Transformação de bandas.......................................................................... 26

3.5 Classificação assistida ............................................................................... 29

3.6 Testes de Classificação.............................................................................. 32

3.7 Avaliação da exactidão temática ............................................................... 34

3.8 Cálculo da distância entre classes da amostra de treino............................ 42

VIII

3.9 Análise da influência das amostras de referência na avaliação da exactidão

..................................................................................................................................... 43

4 Resultados e discussão..................................................................................... 43

4.1 Exactidão global dos testes de classificação ............................................. 43

4.2 Matrizes de confusão dos melhores testes................................................. 50

4.3 Cálculo da distância entre classes da amostra de treino............................ 52

4.4 Análise da influência das amostras de referência...................................... 55

5 Conclusões....................................................................................................... 60

Referências bibliográficas .................................................................................. 63

Anexos ................................................................................................................ 66

Anexo I ............................................................................................................ 67

Anexo II........................................................................................................... 68

Anexo III ......................................................................................................... 71

Anexo IV ......................................................................................................... 72

IX

ÍNDICE DE TABELAS

TABELA 1 – OCUPAÇÃO DO SOLO NA ÁREA DE ESTUDO. .................................................. 12

TABELA 2 - CARACTERÍSTICAS DO SATÉLITE IRS-P6 E DO SENSOR AWIFS (NRSA, 2003).

................................................................................................................................. 14

TABELA 3 – CARACTERÍSTICAS DAS IMAGENS AWIFS UTILIZADAS. ............................... 15

TABELA 4 - NOMENCLATURA DEFINIDA PARA O MAPA DE OCUPAÇÃO DO SOLO............... 22

TABELA 5 - EXEMPLO DE CADA CLASSE DE OCUPAÇÃO DO SOLO ADOPTADA NAS

ORTOIMAGENS. ......................................................................................................... 23

TABELA 6 – NÚMERO DE OBSERVAÇÕES DA AMOSTRA DE TREINO/TESTE POR CLASSE DE

OCUPAÇÃO DO SOLO.................................................................................................. 25

TABELA 7 – VALORES DE VARIÂNCIA EXPLICADA NAS CINCO COMPONENTES E MATRIZ DE

CORRELAÇÕES........................................................................................................... 28

TABELA 8 – CARACTERÍSTICAS DOS TESTES DE CLASSIFICAÇÃO...................................... 33

TABELA 9 – NOMENCLATURA DE OCUPAÇÃO DO SOLO COM 10 E 5 CLASSES. .................. 33

TABELA 10 - RESULTADOS DOS TESTES DE CLASSIFICAÇÃO. .......................................... 49

TABELA 11 – VALORES DE EXACTIDÃO GLOBAL (%) ENTRE TODOS OS MAPAS E TODAS AS

AMOSTRAS DE REFERÊNCIA....................................................................................... 55

X

ÍNDICE DE FIGURAS

FIGURA 1 - ENQUADRAMENTO DA ÁREA DE ESTUDO (FONTE: CAOP, IGP 2010). ........... 10

FIGURA 2 – UNIDADES DE PAISAGEM NA ÁREA DE ESTUDO (FONTE: DGOTDU, 2004)... 11

FIGURA 3 - SATÉLITE IRS-P6 E SENSOR AWIFS (ISRO, 2010). ...................................... 14

FIGURA 4 - EXEMPLO DAS DIFERENTES RESPOSTAS ESPECTRAIS AO LONGO DO ANO DE

ÁREAS AGRO-FLORESTAIS. ........................................................................................ 16

FIGURA 5 – FLUXOGRAMA DE PROCEDIMENTOS. ............................................................. 18

FIGURA 6 – CONSTRUÇÃO DA MÁSCARA DE EXCLUSÃO. .................................................. 20

FIGURA 7 - AMOSTRA DE TREINO..................................................................................... 26

FIGURA 8 – NDVI DE ABRIL E JULHO. ............................................................................. 27

FIGURA 9 - MATRIZ DE CONFUSÃO COM Q CLASSES DE OCUPAÇÃO DO SOLO E ÍNDICES DE

QUALIDADE DO MAPA (FONTE: CARRÃO ET AL. 2007). .............................................. 37

FIGURA 10 – AMOSTRAS DE TESTE. ................................................................................. 39

FIGURA 11 – EXEMPLO DA METODOLOGIA DE CONSTRUÇÃO DAS MATRIZES DE CONFUSÃO

(FONTE: COSTA, 2008). ............................................................................................. 40

FIGURA 12 – EXEMPLO DE UM PIXEL COM UMA OCUPAÇÃO MISTA.................................. 41

FIGURA 13 - MAPAS PRODUZIDOS PARA O TESTE DE CLASSIFICAÇÃO 1............................ 45




FIGURA 17 – MATRIZES DE CONFUSÃO DOS MELHORES TESTES DE CLASSIFICAÇÃO ........ 50

FIGURA 18 – DENDROGRAMAS DAS ASSINATURAS .......................................................... 53

FIGURA 19 – VALORES DE EXACTIDÃO GLOBAL DOS 10 MAPAS POR CADA UMA DAS

AMOSTRAS DE TESTE. ................................................................................................ 57

1

1 INTRODUÇÃO

1.1 ENQUADRAMENTO

O estudo do solo, dos seus usos e ocupações, tem um papel importante no

contexto dos instrumentos de gestão do território (e.g. PROT - Planos Regionais de

ordenamento do Território, PMOT – Planos Municipais de Ordenamento do Território)

e no planeamento (e.g. estudos de impactes ambientais, planos estratégicos, planos de

defesa da floresta contra incêndios, entre outros).

Com o desenvolvimento e disseminação da tecnologia dos Sistemas de

Informação Geográfica (SIG), a informação geográfica tornou-se mais acessível e mais

“solicitada”, tornando-se quase indispensável, principalmente nas áreas de trabalho

relacionadas com o planeamento e o ordenamento do território. Os conceitos de uso e

ocupação de solo tornam-se fundamentais na génese de informação geográfica de base

para a análise e, posteriormente, para produção da cartografia dos instrumentos de

gestão territorial.

Paralelamente, o contínuo desenvolvimento de tecnologia e conhecimento na

área da detecção remota, bem como a crescente acessibilidade a essa tecnologia,

potencia o aumento do seu uso em matérias relacionadas com estudos ambientais e na

área do ordenamento do território. A este facto acrescenta-se a celeridade com que a

informação é solicitada e o acompanhamento da exigência no que respeita ao seu rigor e

exactidão.

A procura cada vez maior de informação, consequência do desenvolvimento

tecnológico anteriormente referido, bem como a crescente necessidade de actualização

da mesma, torna necessário o recurso a técnicas que permitam produzir informação

geográfica de uma forma expedita, rigorosa e económica.

Neste sentido, uma vez que as imagens de satélite são largamente usadas

nomeadamente em procedimentos de classificação automática para produzir este tipo de

cartografia, as técnicas utilizadas na extracção da informação são determinantes para a

definição das especificações dos mapas que originam. Por este motivo, é da maior

2

importância entender a influência que as características técnicas das imagens e as

técnicas de classificação automática exercem na produção cartográfica.

1.2 OBJECTIVOS

Este estudo segue a linha de investigação de outros estudos sobre imagens

AWiFS, no entanto este tem como principal particularidade as especificidades da área

de estudo. Com efeito, um dos objectivos deste estudo é analisar a potencialidade das

imagens AWiFS para a produção de cartografia de ocupação do solo, numa área

confinada ao concelho de Almodôvar, Região do Baixo Alentejo. O elevado

conhecimento da área de estudo e a possibilidade de obtenção de informação auxiliar de

apoio ao processo de classificação foram umas dos factores que permitiram o

desenvolvimento deste estudo.

Os objectivos desta dissertação são os seguintes:

i) Testar métodos de classificação automáticos aplicados numa área muito

confinada, correspondente à envolvente de um concelho, com as

especificidades da paisagem da Região do Baixo Alentejo;

ii) Avaliar a capacidade das imagens AWiFS para originar cartografia de

ocupação do solo numa região com uma paisagem com as características

da área de estudo;

iii) Avaliar a influência de diferentes amostras de teste sobre os resultados da

exactidão temática de todos os mapas produzidos;

iv) Por fim, o objectivo mais importante deste estudo, é que este seja um

meio para a aquisição de conhecimentos e de experiência na área da

detecção remota e processamento digital de imagens, enquadrados nos

pressupostos do curso de Mestrado em Gestão de Território, área de

especialização em Sistemas de Informação Geográficos e Detecção

Remota.

3

1.3 ORGANIZAÇÃO DA DISSERTAÇÃO

A dissertação está dividida em cinco capítulos. No primeiro é feito um breve

enquadramento da temática da detecção remota, a apresentação dos objectivos, uma

revisão de literatura sobre a classificação de imagens em detecção remota e a utilização

de imagens AWiFS.

No segundo capítulo são descritos os dados geográficos utilizados neste estudo,

compostos pela descrição da área de estudo e as imagens AWiFS.

No terceiro capítulo é descrita a metodologia utilizada para a realização dos

diferentes testes de classificação automática com recurso a classificadores assistidos,

segundo um método de extracção da informação ao nível do pixel.

No quarto capítulo são apresentados e analisados os resultados obtidos, com o

objectivo de determinar qual a abordagem de classificação automática que produz os

melhores resultados ao nível da exactidão temática.

Por fim, o quinto capítulo apresenta as conclusões finais dando respostas aos

objectivos propostos, sobre os desempenhos das diferentes abordagens de classificação

automática aplicadas a dados provenientes do sensor AWIFS, e sobre a capacidade da

metodologia utilizada em classificar dados com as especificidades das imagens AWiFS

e da área de estudo.

1.4 DETECÇÃO REMOTA E A CLASSIFICAÇÃO DE IMAGENS DE

SATÉLITE

A aplicação da detecção remota na classificação de imagens tem sido alvo de

pesquisa por parte da comunidade científica, porque os seus resultados são a base de

muitos estudos ambientais e socioeconómicos (Lu e Weng, 2007). De facto, a

cartografia de ocupação do solo é um instrumento fundamental em estudos ambientais,

na tomada de decisão em ordenamento e planeamento do território, e na definição de

políticas de gestão de recursos naturais (Caetano et al., 2002).

Existe um grande esforço por parte da comunidade científica para desenvolver

novas abordagens e técnicas de classificação de dados de detecção remota, com o

objectivo de melhorar a exactidão dos mapas de ocupação e uso do solo resultantes (Pal

4

e Mather, 2003 e Lu e Weng, 2007). No entanto, a classificação de dados de detecção

remota continua a constituir um desafio, devido aos muitos factores envolvidos no

processo, tais como a complexidade da paisagem da área de estudo, as características

dos dados de detecção remota e as abordagens de processamento digital de imagem e

classificação (Lu e Weng, 2007).

O pressuposto da classificação em processamento digital de imagem reside no

princípio de conservação de energia, no qual os fenómenos de reflexão, absorção e

transmissão, dependem, de entre outras, das características físicas, geoquímicas,

biológicas do objecto. Desta forma, torna-se possível discriminar objectos com base na

radiação electromagnética por eles reflectida.

O valor de reflectância de energia num determinado comprimento de onda é

traduzido por número de níveis digitais numa matriz, o que permite observar o

comportamento dos objectos nos diferentes comprimentos de onda que o sensor

consegue medir. A resolução espectral de um sensor é tanto maior quanto maior for o

número de bandas e respectiva largura do comprimento de onda que ele consegue

separar. É esta particularidade que permite discriminar objectos que, embora

tematicamente sejam diferentes, tenham comportamentos espectrais semelhantes, como

são exemplos alguns tipos de alcatrão, lodo e pinheiro bravo.

Por outro lado, quanto maior for a sensibilidade de um sensor relativamente às

diferenças na intensidade da radiação por si captada, maior será a sua capacidade de

discriminar os vários níveis de energia de reflectância. Estes níveis de energia

traduzem-se numa maior quantidade de números digitais observáveis, maior quantidade

de informação em bits, isto é, uma maior resolução radiométrica.

A resolução espacial poderá contornar o problema da discriminação de classes,

pois quanto maior for a resolução espacial, maior será a capacidade do sensor

discriminar objectos próximos. No entanto, existe um compromisso técnico entre

resoluções espacial e espectral porque um grande aumento da resolução espacial

condiciona a resolução espectral. Isto acontece porque com a tecnologia actual, a área

reduzida de cada pixel é insuficiente para reflectir energia passível de ser captada pelos

sensores. Quanto à resolução radiométrica, as capacidades de transmissão de

informação proveniente dos satélites, bem como a capacidade de processamento ao

5

nível de hardware e software, condicionam a utilização de elevadas quantidades de

informação.

Considerando os problemas descritos anteriormente, o conhecimento das

características das imagens e do tipo de informação que se pode extrair delas, é

fundamental para se atingir os objectivos propostos pela classificação adoptada.

Como exemplo, podemos comparar dois tipos de imagens com características

distintas: Quickbird e Landsat 7 ETM+. Enquanto a primeira é superior ao nível da

resolução espacial e radiométrica, a segunda tem maior resolução espectral. Trata-se

pois de conseguir o melhor compromisso entre os objectivos a atingir, as características

das imagens disponíveis, as abordagens da classificação consideradas e, não menos

importante, o tempo e recursos disponíveis.

Existem várias abordagens para a classificação de imagens de satélite, que

podem ser automáticas ou por interpretação visual de imagem. A vantagem da

classificação automática face ao método de análise visual de imagem é a eliminação de

parte ou da totalidade da subjectividade inerente ao processo de análise visual

introduzido pelo foto-intérprete e a automatização de processos, de forma a tornar a

tarefa mais expedita. As técnicas de classificação automática podem ser agrupadas nas

seguintes classificações: supervisionadas ou não supervisionadas; paramétricas ou não

paramétricas; rígidas ou fuzzy; ao nível do pixel ou sub-pixel; orientada a objecto ou

com base no contexto espacial (Lu e Weng, 2007).

A classificação pixel a pixel pode ser supervisionada ou não, sendo que na

primeira são definidas as assinaturas espectrais com base numa amostragem com as

quais o algoritmo de classificação irá calcular a classificação. Existem vários algoritmos

de classificação pixel a pixel, estes são paramétricos ou não paramétricos e a sua escolha

depende das características estatísticas dos dados matriciais que resultam, por exemplo,

da complexidade da paisagem da área de estudo. Um classificador paramétrico muito

utilizado quando os dados seguem uma distribuição normal, com resultados

satisfatórios, é o classificador paramétrico da máxima verosimilhança. Alguns

classificadores não-paramétricos mais utilizados são as redes neuronais e as árvores de

decisão.

6

A abordagem sub-pixel considera a heterogeneidade da paisagem e é útil para

resoluções espaciais de imagem inferiores. Esta assume que o valor de um pixel resulta

da mistura de vários materiais “puros”, determinando-se o contributo de cada elemento

puro no valor final da reflectância do pixel. Existem classificadores como por exemplo:

fuzzy imagine e fuzzy (Huguenin et al., 1997 in Lu e Weng, 2007).

A classificação por objecto é um processo de segmentação de imagem onde se

fundem os pixels em objectos e na qual a classificação é aplicada aos mesmos. O

classificador utilizado é o ecognition. Este método depende de uma grande variedade de

parâmetros (e.g. textura e forma) para segmentação dos objectos, o que torna o processo

complexo.

A abordagem pelo contexto espacial caracteriza-se por utilizar dados auxiliares

de contexto que permitem orientar a classificação para além dos dados espectrais. Esta

técnica utiliza os matriciais e vectoriais através de um SIG.

Embora hajam grandes avanços tecnológicos na área da detecção remota, com o

lançamento de satélites com sensores de maiores resoluções e melhoramento de

algoritmos de extracção de informação, não se atingiu um patamar técnico que permita a

generalização da utilização de técnicas de classificação automática de imagens. De um

modo geral, existe um elevado número de variáveis envolvidas neste processo, o que o

torna muito complexo e muito dependente de supervisão.

O sucesso na obtenção de resultados que atinjam os objectivos pretendidos

depende de um grande conjunto de decisões, que percorrem toda a cadeia de produção

do processo de classificação, que vão desde a escolha da classificação (nomenclatura)

até ao processo de determinação de rigor temático.

7

1.5 UTILIZAÇÃO DE IMAGENS AWIFS PARA CARTOGRAFIA DE

OCUPAÇÃO DO SOLO

No âmbito do programa Natural Resource Census (NR-Census) inserido no

National Natural Resources Management System, o Departamento do Espaço do

governo indiano, desde 2004, tem desenvolvido e implementado métodos automáticos

para produzir anualmente cartografia de ocupação do solo à escala 1:250.000 (NRSA,

2005 in Costa, 2008).

Foram produzidas cartografia para os anos de 2004/2005, 2005/2006 e

2006/2007. Para cada data, foram usadas, respectivamente, 680, 762 e 802 quadrantes

de imagens AWiFS, adquiridas durante 10 meses para cada época de produção agrícola

na Índia: kharif (Agosto-Outubro), Rabi (Janeiro-Março) e Zaid (Abril-Maio). Para a

classificação automática dos dados multitemporais AWiFS, utilizaram o classificador de

árvores de decisão. A cartografia produzida para os três momentos temporais alcançou

elevadas percentagens de exactidão global. A cartografia de 2004/2005 apresenta 83% a

87% de exactidão global, dependendo do estado. A cartografia de 2005/2006 atingiu

86% a 95% e a cartografia de 2006/2007 atingiu 83% a 95% (Costa, 2008).

O Instituto Geográfico Português (IGP), através do Grupo de Detecção Remota

(GDR), tem vindo utilizar e a explorar as imagens AWIFS. No âmbito do projecto Carta

de Ocupação do Solo para Portugal Continental (COS’2007), utilizaram duas coberturas

nacionais de imagens de satélite AWIFS, adquiridas em diferentes estações como

informação auxiliar. Esse projecto teve por objectivo a actualização da edição anterior

(COS’90), introduzindo uma série de alterações significativas ao nível das

especificações gerais, nomenclatura e regras de generalização, e incluindo uma

avaliação da qualidade temática e geométrica (Caetano et al., 2008).

Costa (2008) explorou um conjunto de dados intra-anual composto por três

imagens AWiFS (Abril, Julho e Outubro de 2006). O estudo enquadrou-se no âmbito do

projecto COSMIC (Cartografia multi-escala de ocupação do solo, projecto financiado

pelo PIDDAC, DGR/IGP, 2006-2009), e teve por objectivo avaliar as imagens e

métodos automáticos de produção que possam derivar cartografia de ocupação do solo

de Portugal Continental. Foram testados dois classificadores: um classificador

8

paramétrico (classificador da máxima verosimilhança) e um classificador não

paramétrico (árvores de decisão). A exactidão global dos mapas produzidos variou entre

os 60% e 72% com uma nomenclatura de, respectivamente, 15 e 10 classes de ocupação

do solo, respectivamente. Segundo este autor, os resultados obtidos sugerem que as

imagens AWiFS apresentam algumas limitações para derivar cartografia de ocupação

do solo de Portugal Continental. Ao nível da metodologia, os resultados revelam que as

árvores de decisão são um classificador vantajoso relativamente ao classificador da

máxima verosimilhança porque permite uma fase de treino mais rápida e com um menor

esforço de amostragem sem perdas de exactidão temática. O autor igualmente concluiu

que os resultados da exactidão temática dos mapas deveu-se mais aos dados contidos

nas imagens AWiFS do que propriamente devido à desadequação das abordagens da

classificação ou da amostra de treino.

Noutro estudo, Costa et al. (2008) analisaram a influência da resolução espacial,

espectral e temporal das imagens de satélite na produção automática de cartografia de

ocupação do solo. Utilizaram imagens MERIS e AWiFS para produzir e comparar

diversos mapas de ocupação do solo. Esses mapas foram produzidos por métodos

automáticos com base em diferentes abordagens, onde fizeram variar o número de datas,

o número de bandas e o classificador. Os resultados por eles obtidos sugerem que a

resolução espacial não é determinante na exactidão global do mapa de ocupação do solo

produzido. A sua influência é principalmente sentida no que respeita ao treino da

classificação assistida, para o qual é necessário um maior esforço de amostragem à

medida que a resolução espacial aumenta. Por outro lado, os resultados demonstraram

que a maior disponibilidade de informação temporal e, principalmente, de informação

espectral, é bastante valiosa para a melhoria da exactidão da classificação. A exactidão

global dos mapas produzidos com mapas AWiFS variou entre os 52% e os 64%,

enquanto que para as imagens MERIS variou entre 46,8% e 73%.

Costa e Caetano (2009), exploram a produção de mapas de ocupação do solo

através de uma abordagem combinada pixel/objecto. Esta foi uma combinação da

classificação por parcelas e da análise orientada por objectos, na medida em que a

unidade de classificação consistiu em objectos derivados da segmentação das imagens

AWiFS e a sua classificação baseou-se na classificação ao nível do pixel. Segundo estes

autores, a classificação automática ao nível do pixel, mesmo recorrendo a

9

classificadores recentes que permitem ultrapassar algumas limitações dos

classificadores paramétricos, pode não ser suficiente para extrair toda a informação

registada em imagens de satélite. Para além da informação espectral ao nível do pixel

fornecida pelas imagens AWiFS, a sua segmentação e a integração de objectos na

classificação permitiu acrescentar relações espaciais ao nível da paisagem e aumentar a

exactidão temática da cartografia. A exactidão global do mapa produzido com esta

técnica foi de 66,9%.

2 DADOS GEOGRÁFICOS

Este capítulo descreve a área de estudo na qual incidem os testes de classificação

de cartografia de ocupação do solo, procurando-se caracterizá-la numa perspectiva de

preparação para o processo de classificação, nomeadamente ao nível da caracterização

da paisagem e da ocupação do solo. Neste capítulo são ainda descritos os dados de base

utilizados, constituídos por imagens do sensor AWiFS, bem como os dados auxiliares

usados.

2.1 CARACTERIZAÇÃO DA ÁREA DE ESTUDO

A área de estudo localiza-se, na sua maior parte, no concelho de Almodôvar,

estendendo-se aos concelhos envolventes, numa área total de 119.231,28 hectares

(Figura 1). Deste modo, em termos administrativos enquadra-se em duas sub-regiões:

Baixo Alentejo e Algarve; pertencendo a maior parte do território ao distrito de Beja

(sub-região do Baixo Alentejo).

10

Figura 1 - Enquadramento da área de estudo (fonte: CAOP, IGP 2010).

A paisagem constitui um sistema complexo e dinâmico, onde os diferentes

factores naturais e culturais se influenciam mutuamente e evoluem em conjunto ao

longo do tempo, determinando e sendo determinados pela estrutura global (Forman e

Godron, 1986; Naveh e Lieberman, 1994; Zonneveld, 1990 in Pinto-Correia et al.,

2001). Existe uma variedade de factores como a litologia, o relevo, a hidrografia, o

clima, os solos, a flora e a fauna, a estrutura ecológica, o uso do solo, todas as outras

expressões da actividade humana ao longo do tempo, bem como a sua interacção, que

permitem compreender a paisagem (Pinto-Correia et al., 2001).

A ocupação do solo é um factor que se reflecte na paisagem e que resulta da

interacção dos factores acima enunciados. A caracterização da paisagem irá fornecer

informação sobre as classes de ocupação do solo a considerar, as dinâmicas que lhes

estão associadas e a sua complexidade.

O estudo Contributos para a Identificação e Caracterização da Paisagem em

Portugal Continental (DGOTDU 2004) identificou 128 unidades de paisagem para

Portugal Continental. Estas unidades foram agrupadas em 22 grupos, associando

unidades com características físicas semelhantes mas também com traços comuns

quanto à ocupação humana. Nesse estudo foram considerados a litologia, a morfologia,

11

a hidrografia, os solos, o uso do solo, a estrutura da propriedade e outras variáveis como

o clima e a proximidade dos oceanos (Pinto-Correia et al., 2001).

Segundo DGOTDU (2004), a área de estudo é composta por duas unidades de

paisagem: 115 – Campos de Ourique/Almodôvar/Mértola e 122 – Serra do Caldeirão.

Estas duas unidades pertencem a diferentes a grupos de unidades: S- Baixo Alentejo e U

– Serras do Algarve e do Litoral Alentejano, o que indica que as unidades identificadas

têm um grau de diferenciação importante (Error! Reference source not found.).

Grupos de Unidade de Paisagem

A – Entre Douro e Minho B – Montes Entre Larouco e Marão C – Trás-os-Montes D – Área Metropolitana do Porto E - DouroF – Beira Alta G – Beira InteriorH – Beira Litoral I – Maciço CentralJ – Pinhal do Centro K – Maciços Calcários da Estremadura L – Estremadura - Oeste M - Área Metropolitana de Lisboa - Norte N – Área Metropolitana de Lisboa - Sul O - Ribatejo P – Alto Alentejo Q – Terras do Sado R - Alentejo Central S – Baixo Alentejo T – Costa Alentejana Sudoeste Vicentino U – Serras do Algarve e do Litoral AlentejanoV - Algarve

Figura 2 – Unidades de Paisagem na área de estudo (Fonte: DGOTDU, 2004).

Da caracterização detalhada de cada unidade (DGOTDU, 2004), destaca-se o

seguinte:

115 - Campos de Ourique/Almodôvar/Mértola: esta unidade apresenta

variações no padrão da paisagem, baseadas na presença de manchas de montado de

azinho mais ou menos denso alternadas com superfícies de campos abertos ou com

escassa presença de árvores, tais variações justificam a delimitação de três sub-

unidades de paisagem: Sub-Unidade de paisagem 115a - Campos do Guadiana: Áreas

de montado de azinho e de sobro com cereal; Paisagem levemente ondulada, com

12

relativa aridez; Sub-Unidade de paisagem 115b: Campos de Mértola: presença de

alguns relevos residuais cobertos por matos, que sobressaem das áreas aplanadas de

estevais; Sub-unidade de paisagem 115c: Campos de Ourique e Almodôvar, Montados

de azinho e de sobro num relevo muito ondulado; Zona a nascente mais aplanada com

predomínio das culturas arvenses e de pousios.

122 – Serras do Caldeirão: a serra separa a peneplanície alentejana da

plataforma litoral algarvia; na serra a vegetação é mais densa com domínio de matos,

montados e áreas florestais (essencialmente eucalipto e pinheiro, sobretudo nos

povoamentos mais recentes); No interior desta unidade verificam-se algumas

especificidades que justificam três sub-unidades: A oeste, sub-unidade 122a: áreas

florestais contínuas de pinhais e eucaliptais; presença das linhas de água afluentes do

Rio Mira, a montante da albufeira de Santa Clara, presença de galerias ripícolas

bastante bem constituídas. No centro, sub-unidade 122b – que inclui parte da Serra do

Caldeirão, presença de sobreiro quase sempre com matos a revestir o solo, no entanto

aqui também o eucaliptal ocupa extensas superfícies onde antes existiam matos e

sobreiros; para Norte, na proximidade de Almodôvar verifica-se a substituição do

sobreiro pela azinheira. Apenas nos vales mais encaixados se encontram vestígios de

vegetação natural. A leste, a sub-unidade 122c: no prolongamento da Serra do

Caldeirão até o Vale do Guadiana: solos actualmente cobertos por pastagens pobres e

estevais ou saragaçais.

Em termos de ocupação do solo, segundo a informação da carta CORINE Land

Cover 2006 (IGP, 2010), 36,8% da área de estudo é composta por áreas agrícolas

heterogéneas (Tabela 1). Isto é, verifica-se que a maior parte da área é constituída por

classes de ocupação do solo associadas a sistemas de uso múltiplo, como são por

exemplo, os agro-florestais e silvopastoris, dos quais o montado é o uso do solo mais

característico na região onde se insere a área de estudo.

Tabela 1 – Ocupação do solo na área de estudo.

Nível 2 da Nomenclatura CORINE Área (ha) % de Ocupação

13

11 - Tecido urbano 228 0.2 12 - Indústria, comércio e transportes 137 0.1 21 - Culturas anuais 17063 14.3 22 - Culturas permanentes 145 0.1 23 - Pastagens 270 0.2 24 - Áreas agrícolas heterogéneas 43883 36.8 31 - Florestas 23542 19.7 32 - Vegetação arbustiva e herbácea 33782 28.3 51 - Águas interiores 182 0.2

Os montados são paisagens do tipo agro-silvo-pastoril, estes são caracterizados

por uma dispersão de espécies arbóreas do género Quercus (Stanners e Bourdeau,

1995), são povoamentos mais ou menos abertos e monoespecíficos que obrigam, como

sistemas humanizados que são, a intervenções periódicas para que não se degradem por

evolução natural (Silva, 1992). Os montados são sistemas de exploração com valores de

diversidade elevados. A riqueza específica, que é o índice mais simples para medir a

diversidade biológica de um sistema (Begon et al., 1996 in Diaz, 1997), tende a ser

maior nos montados do que em outros tipos de habitats, tanto naturais como explorados

pelo Homem.

Em suma, o uso com maior expressão espacial é o montado que se traduz em

áreas agrícolas heterogéneas. Este uso apresenta um carácter híbrido em termos de

utilização do solo e de transição entre as florestas fechadas e os campos abertos, cujo

sistema de maneio origina dinâmicas de ocupação do solo geralmente intra-anuais.

As unidades de paisagem indicam uma forte diferenciação entre o Norte e o Sul

da área de estudo, pelo facto desta ser composta por duas unidades de paisagem, que são

de grupos de unidades diferentes. Existe também uma diversidade considerável dentro

das unidades de paisagem justificada pela delimitação de três sub-unidades em cada

uma delas.

14

2.2 IMAGENS AWIFS

O sensor AWiFS (Advanced Wilde Field Sensor) foi lançado a 17 de Outubro de

2003 pelo Indian Space Research Organization (ISRO), a bordo do satélite IRS-P6

também conhecido por ResourceSat-1 (Figura 3). Os principais objectivos deste satélite

são de fornecer dados de detecção remota para aplicação na gestão de recursos naturais,

estudos relacionados com monitorização de culturas ao nível da produção e de pragas e

doenças, monitorização de catástrofes naturais e planeamento urbano (NRSA, 2003).

Para além do sensor AWiFS, o satélite tem a bordo mais dois instrumentos de

observação da terra: o Linear Imaging Self Scanner-4 (LISS-4) e o multi-spectral

Linear Imaging Self Scanner-3 (LISS-3) (NRSA, 2003).

Figura 3 - Satélite IRS-P6 e sensor AWiFS (ISRO, 2010).

O sensor AWiFS dispõe de uma resolução espectral de quatro bandas e uma

resolução espacial de 56 m. A largura de imagem (swath) é de 740 km, que resulta da

combinação dos dois módulos electro-ópticos (AWiFS A e AWiFS B) que o compõe e

que cujos swath é de 370 km (NRSA, 2003). As principais características do satélite

IRS-P6 e do sensor AWiFS resumem-se na Tabela 2.

Tabela 2 - Características do satélite IRS-P6 e do sensor AWiFS (NRSA, 2003).

15

Características técnicas do Satélite IRS-P6 Lançamento 17 de Outubro de 2003 Órbita: Circular quase polar, hélio-síncrona Altitude da órbita: 817 km Inclinação da órbita: 98.7 graus Periodicidade da órbita: 101.35 minutos Repetitividade: 341 órbitas/ciclos em 24 dias Horário solar de passagem no equador: 10:30 Capacidade de revisita 5 dias Características técnicas do sensor AWiFS Swath 740 Km Resolução espacial 56 metros (no Nadir) - 70 metros Resolução radiométrica (bits) 10 bits Especificações das bandas espectrais do sensor AWiFS Bandas Zona do espectro

electromagnético Intervalo de comprimento de onda (μm)

1 Verde 0.52 - 0.59 2 Vermelho 0.62 - 0.68 3 Infravermelho próximo 0.77 - 0.86 4 Infravermelho médio 1.55 - 1.70

Os dados AWiFS utilizados nesta dissertação foram cedidos pelo IGP através do

Grupo de Detecção Remota (Tabela 3). Estes encontravam-se corrigidos

geometricamente e georeferenciados ao datum WGS84 e projectados na projecção

Cónica Conforme de Lambert. Os dados foram ortorectificados pelo GDR para o

sistema PT-TM06-ETRS89, com recurso a um Modelo Digital de Elevação de 50 m de

resolução espacial.

Tabela 3 – Características das imagens AWiFS utilizadas.

Parâmetros de aquisição das imagens AWiFS Imagem Data de aquisição Elevação solar Azimute solar

Resolução espacial

Primavera 27/04/2006 63.0º 149.6º Verão 28/07/2006 64.0º 133.0º

Outono 13/10/2006 42.1º 160.3º 60m

A utilização de dados intra-anuais tem como propósito a obtenção de informação

adicional no que concerne à distinção sobre os diferentes estados espectrais da paisagem

(Figura 4). Esta abordagem justifica-se pelo que foi descrito no capítulo 2.1,

16

relativamente à caracterização da paisagem e da ocupação do solo. Deste modo,

pretende-se aumentar a capacidade de discriminação das classes de ocupação do solo.

Abril

Julho

Outubro

Figura 4 - Exemplo das diferentes respostas espectrais ao longo do ano de áreas agro-florestais.

2.3 DADOS AUXILIARES

Foram utilizados como dados auxiliares ortoimagens adquiridas em Julho de

2006, da propriedade do IGP e da Associação de Municípios do Baixo Alentejo e

Alentejo Litoral (AMBAAL), do concelho de Almodôvar e da sua área envolvente.

Estes dados têm uma resolução espacial de 0,4 m.

17

3 METODOLOGIA

Apesar da considerável quantidade de projectos de cartografia de ocupação do

solo desenvolvidos, não existe uma metodologia padrão para a produção automática ou

semi-automática de cartografia com base em dados de satélite (Caetano et al., 2002). De

facto, o processo de classificação de dados de detecção remota é complexo. Contudo, de

um modo geral, as principais etapas da classificação de imagens passam por (Jensen,

1996, Lillesand et al., 2004):

• Pré-processamento dos dados;

• Transformação de bandas;

• Extracção da informação temática;

• Integração de informação auxiliar;

• Avaliação da exactidão temática.

Este estudo teve como referência a metodologia utilizada no projecto COSMIC,

amplamente utilizada em estudos de produção de cartografia de ocupação do solo

derivada de imagens de satélite. Por sua vez, os testes de classificação adoptados nesta

dissertação e apresentados detalhadamente no capítulo 3.6 Testes de Classificação

seguiram a linha de investigação desenvolvida e apresentada em Costa (2008).

Deste modo, embora o processo seja sequencial, as diferentes fases interagem de

forma progressiva e retroactiva, conforme se pode observar no fluxograma de

procedimentos ilustrado na Figura 5.

18

Figura 5 – Fluxograma de procedimentos.

3.1 PRÉ-PROCESSAMENTO

Como foi descrito no capítulo 2.2 Imagens AWiFS, ao nível do pré-

processamento, os dados AWiFS utilizados foram previamente ortorectificados pelo

GDR/IGP. No entanto, foram identificadas áreas encobertas por nuvens e respectivas

sombras na imagem datada de Outubro. Estas áreas foram excluídas da análise por não

permitirem fornecer informação relativa à ocupação do solo naquela data.

O procedimento adoptado foi o da criação de uma máscara de exclusão, criada

com base na identificação prévia das áreas de nuvens e respectivas sombras através da

técnica de classificação não assistida com o classificador K-means.

A técnica com classificador K-means permite ao operador definir um número de

clusters para organizar os dados. O algoritmo localiza o centro desses clusters no

espaço de mensuração multidimensional. A cada pixel da imagem é então designado um

cluster cujo vector médio calculado é o mais próximo. Após todos os pixels terem sido

classificados dessa forma, são recalculados vectores médios para cada um dos clusters.

19

Estes últimos vectores são então usados como base para reclassificar a imagem. Este

procedimento continua até que não haja diferenças significativas na localização dos

vectores médios de cada classe entre cada iteração sucessiva do algoritmo (Lillesand et

al., 2004).

Para o presente estudo executou-se a referida classificação não assistida com 15

clusters. Do total destes 15 clusters observaram-se e seleccionaram-se aqueles que

integram dados correspondentes a nuvens e sombras. Posteriormente, através de

inquirição, seleccionaram-se as classes anteriormente identificadas, isolando-as e

seleccionando-se igualmente os pixels em redor recorrendo a um buffer de 20 m, de

forma a garantir a selecção de pixels de sombras e nuvens. Editaram-se manualmente

algumas áreas (nuvens e sombras não isoladas anteriormente) e removeram-se as áreas

seleccionadas como sombras, mas que representavam planos de água, bem como áreas

de elevado brilho, como solo nu e solo urbano, confundido com nuvens. Este

procedimento foi realizado recorrendo à comparação das imagens de Outubro e Abril, o

que permitiu diferenciar as sombras dos planos de água, nuvens de solo nu ou solo

impermeabilizado (urbano) (Figura 6). Feita a identificação e isolamento das áreas

referidas, procedeu-se à criação de uma máscara de exclusão.

Verificou-se que a imagem de Outubro tem cerca de 16% da área encoberta por

nuvens e sombras. Esta não reúne condições para ser utilizada nas análises subsequentes

porque a área ocupada por nuvens e sombras implicaria a rejeição de 76 amostras de

treino o que, considerando o tamanho da área de estudo, iria condicionar drasticamente

a qualidade das amostras de treino.

20

Imagem AWiFs Outubro I

magem AWiFS Abril

Sobre ortoimagem Imagem de Outubro após extracção de áreas de nuvens e sombras.

Figura 6 – Construção da máscara de exclusão.

A classificação não assistida com o classificador K-means foi realizada com

recurso ao software IDRISI The Andes Edition®. O processo de identificação,

isolamento, edição manual e criação da máscara de nuvens foi elaborado com recurso ao

software ArcGIS 9.3®.

21

3.2 NOMENCLATURA DE OCUPAÇÃO DO SOLO

A nomenclatura adoptada teve por base a nomenclatura LANDEO. O projecto

LANDEO (User Driven Land Cover Characterization for multi-scale environmental

Monitoring Using multi-Sensor Earth Observation Data) foi conduzido pelo Grupo de

Detecção Remota do IGP, entre 2004 e 2007, e teve como principal objectivo a

produção anual de cartografia de ocupação de solo para Portugal Continental.

No âmbito desse projecto, foi desenvolvida uma nomenclatura para ser aplicada

na produção de cartografia de ocupação do solo através de metodologias de

classificação automática a diferentes escalas de análise. Esta nomenclatura foi

igualmente desenvolvida com o objectivo de contribuir para a normalização de

nomenclatura de ocupação do solo, permitindo uma comparação entre cartografias

produzidas com diferentes nomenclaturas (e.g. IGBP – International Geosphere-

Biosphere Programme, CLC – Corine Land Cover e GLC – Global Land Cover).

A nomenclatura LANDEO foi produzida a partir do Land Cover Classification

System (LCCS) da Food and Agriculture Organization (FAO) (Araújo e Caetano,

2006). Esta está estruturada hierarquicamente em cinco níveis, podendo classificar

ocupações observadas a diferentes escalas. Quando aplicada com o maior detalhe

possível, a nomenclatura LANDEO classifica a ocupação do solo em 37 classes. No

nível 1, divide-se em sete tipos principais de ocupação de solo (áreas artificiais, áreas

agrícolas, áreas de vegetação natural e semi-natural, mosaicos, zonas húmidas, zonas de

solo nu e corpos de água). Os restantes níveis dividem cada classe do nível anterior em

classes cada vez mais detalhadas, num total de 37 classes no quinto nível (Anexo II).

A nomenclatura acima apresentada serviu de base para definição da

nomenclatura adoptada, ou seja, foi sendo desenvolvida ao longo de um processo

interactivo entre as diferentes fases do procedimento, nomeadamente entre os processos

de amostragem de treino e os resultados preliminares de testes de exactidão temática. A

nomenclatura de ocupação do solo foi definida considerando as características da área a

cartografar, a abordagem de classificação que é pixel a pixel, a resolução espacial das

imagens. Das 37 classes originais, seleccionaram-se e adaptaram-se 10 classes (Tabela

4).

22

Tabela 4 - Nomenclatura definida para o mapa de ocupação do solo.

Código Classe de ocupação do solo 1 Corpos de água 2 Área urbana contínua 3 Área urbana descontínua 4 Vegetação herbácea natural e sequeiros 5 Matos 6 Vegetação esparsa 7 Culturas permanentes perenifólias (pomares, olivais) 8 Novas plantações/arborizações 9 Floresta fechada de folhosas

10 Floresta aberta de folhosas

A classe 4 engloba duas classes LANDEO que são Culturas de sequeiro e

Vegetação herbácea natural, isto porque o tipo e fenologia de vegetação são muito

semelhantes. Com efeito, estas são compostas na sua grande parte por espécies anuais

que dependem directamente da precipitação. Essas semelhanças poderiam resultar em

confusão ao nível da classificação dessas duas classes, como corroboram os resultados

de Costa e Caetano (2009). Desta forma associaram-se essas duas classes, obtendo então

a classe Vegetação herbácea natural e sequeiros. A classe 6 - vegetação esparsa foi

considerada nas situações em que essa caracteristica se manteve de uma forma

permanente, pelo menos ao longo do periodo temporal de estudo (Abril-Julho-Outubro).

Consequentemente, os pixels deveriam apresentar um elevado brilho nas imagens das

três épocas, corroborado pelas ortoimagens. Desta forma, evita-se se a confusão entre

áreas de vegetação esparsa com áreas temporariamente despidas de vegetação devido às

dinámicas resultantes do maneio do solo, como é no caso das culturas anuais.

O Anexo III apresenta a correspondência entre as classes adoptadas e a

nomemclatura LANDEO. A Tabela 5 apresenta exemplos de amostras recolhidas de

cada classe.

23

Tabela 5 - Exemplo de cada classe de ocupação do solo adoptada nas ortoimagens.

1 - Corpos de água 2 – Áreas urbanas contínuas 3 - Áreas urbanas descontínuas

4 - Vegetação herbácea natural e sequeiros (sobre ortoimagem)

4 - Vegetação herbácea natural e sequeiros (mesmo pixel sobre

imagem de Abril)

4 - Vegetação herbácea natural e sequeiros (mesmo pixel sobre

imagem de Julho)

5 - Matos 6 - Vegetação esparsa (sobre ortoimagem)

6 - Vegetação esparsa (mesmo pixel sobre imagem de Abril)

6 - Vegetação esparsa (mesmo pixel sobre imagem de Julho)

7 - Culturas permanentes perenifólias (pomares, olivais)

8 - Novas plantações/arborizações

24

9 - Floresta fechada de folhosas 10 - Floresta aberta de folhosas

3.3 AMOSTRAGEM DE TREINO

Num processo de classificação assistida é necessário recorrer a um conjunto de

dados que servem para treinar o classificador a identificar, na área de estudo, as classes

de ocupação do solo definidas.

A representatividade das amostras de treino é um factor crítico no processo de

classificação de imagens (Hubert-Moy et al., 2001, Chen e Stow, 2002; Landgrebe,

2003 e Mather, 2004 in Lu e Weng, 2007). Assim, pretende-se com a amostragem de

treino reunir um conjunto de dados estatísticos que descrevam o padrão da resposta

espectral de cada classe de ocupação do solo a determinar numa imagem (Lillesand et

al., 2004).

A amostragem de treino consistiu na selecção determinística de pixels isolados

na área de estudo, procurando-se reduzir dessa forma efeitos de auto-correlação. A

recolha de amostras isoladas, comparativamente a outras estratégias de amostragem (por

exemplo, amostragem em blocos de pixels), mostra melhores resultados na classificação

assistida de imagens de satélite. Com efeito, a recolha de pixels isolados distribuídos

pela área de estudo é mais representativa da área a classificar, pois esta abrange mais

eficazmente a variabilidade espectral de cada classe de ocupação do solo (Campell,

1981e Labovitz, 1986 in Costa, 2008).

O processo de amostragem de treino baseou-se na análise das imagens AWiFS,

através fotointerpretação das ortoimagens AMBAAL/IGP da área de estudo, com

resolução de 40 cm, obtidas num voo de 2006, o mesmo ano de recolha dos dados de

AWiFS Também o conhecimento da área de estudo e confirmações no terreno

auxiliaram o processo de identificação amostragem.

O número mínimo de observações recolhidas, por classe da amostra de treino,

foi de 35. Este valor corresponde a uma regra empírica, segundo a qual, para que seja

possível estimar os parâmetros de uma população com uma distribuição normal

multivariada, são necessários que n e n-p sejam maiores ou igual a 25/30, com n =

dimensão da amostra e p = número de variáveis (Johnson e Wichern, 1998 in Araújo,

2008). Neste caso, para um total de 10 classes de uso do solo consideradas, temos

25

n=p+25/30; n=35/40. O número total de amostras de treino recolhido por classe de

ocupação do solo pode ser observado na Tabela 6.

Tabela 6 – Número de observações da amostra de treino/teste por classe de ocupação do solo.

Classe N.º amostras 1 Corpos de água 41 2 Área urbana contínua 42 3 Área urbana descontínua 42 4 Vegetação herbácea natural e sequeiros 40 5 Matos 47 6 Vegetação esparsa 35 7 Culturas permanentes perenifólias (pomares, olivais) 43 8 Novas plantações/arborizações 41 9 Floresta fechada de folhosas 42 10 Floresta aberta de folhosas 42

A base de dados de treino foi construída através de uma amostragem

determinística onde os pixels foram recolhidos de forma dispersa para evitar efeitos de

auto-correlação espacial, aumentando assim a probabilidade de que a amostra seja

representativa de todas as variações que as diferentes classes apresentam na imagem.

Foram recolhidas 415 unidade de amostras de treino na área de estudo, procurando-se

recolher amostras de treino de pixels puros de cada classe de ocupação do solo (Figura

7). A amostra de treino foi comum em todos os testes de classificação, reduzindo-se

deste modo a variabilidade introduzida pela amostra, na comparação dos mapas das

diferentes abordagens de classificação.

Este processo foi realizado recorrendo ao software ArcGIS 9.3®.

26

Figura 7 - Amostra de treino.

3.4 TRANSFORMAÇÃO DE BANDAS

A selecção de variáveis ajustadas é uma etapa importante para o sucesso da

classificação dos dados de satélite (Lu e Weng, 2007). Em muitos estudos, a melhoria

da extracção da informação é feita com recurso à transformação de bandas, como por

exemplo, a análise de componentes principais e os índices de vegetação (Caetano et al,

2002). O objectivo é diminuir a redundância inerente aos dados de detecção remota ou

ainda extrair uma informação específica da ocupação do solo (Lu e Weng, 2007).

Os índices de vegetação resultam de combinações matemáticas de duas ou mais

ou mais bandas e, de uma forma geral, são concebidos com o objectivo de estimar a

abundância de vegetação em cada pixel (Huete, 1989 in Caetano et al., 2002). Apesar de

existir uma grande variedade de índices, o mais utilizado é o Normalized Difference

Vegetation Index (NDVI) desenvolvido por Rouse et al., (1973) e Jensen (1996). O

NDVI é baseado nas bandas Infra-Vermelho Próximo (IVP) e o Vermelho (V), e é

calculado pela seguinte expressão:

27

O NDVI tem uma forte correlação positiva com acumulação de biomassa, com

actividade clorofilina, com o índice de área foliar e com a actividade fotossintética.

Tratando-se de um índice normalizado, os valores deste variam entre 1 e -1. As áreas

com vegetação têm elevados valores do índice, enquanto que as nuvens, água e neve

terão valores negativos. Quanto ao solo nu e áreas rochosas corresponde a um valor

próximo de 0 (Lillesand et al., 2004). O índice de vegetação normalizado atenua as

variações das condições de iluminação resultante de relevos acidentados (Holben e

Justice, 1981 in Caetano et al., 2002; Lillesand et al., 2004). Para além deste aspecto, os

índices de vegetação realçam o contraste da vegetação relativamente aos outros

elementos que compõe a ocupação do solo, como por exemplo, as áreas artificializadas

e água (Figura 8).

Figura 8 – NDVI de abril e Julho.

A análise de componentes principais (ACP) é utilizada para comprimir a

informação de um determinado número de bandas de imagens, por exemplo, de sete

bandas espectrais para duas ou três componentes principais (CP) da mesma imagem

(Jensen, 1996).

As imagens geradas por dados provenientes de vários comprimentos de onda,

apresentam, muitas vezes, a mesma informação. A transformação de dados com ACP

foi criada para reduzir essa redundância dos dados multi-espectrais (Lilesand et al.,

2004). O resultado da ACP traduz-se num novo espaço multivariado, no qual o primeiro

componente principal tem a maior variância, o segundo tem a segunda maior variância

28

não descrita no primeiro, e assim sucessivamente até à última componente definida.

Geralmente, os três a quatro primeiros componentes descrevem mais de 95% da

variância. Os restantes componentes tendem a ser dominados pela presença de ‘ruído’.

Ao rejeitar os restantes componentes, a quantidade de dados é reduzida com uma perda

de informação pouco significativa. Desta forma é possível usar a ACP para remover o

‘ruído’ (Eastman, 2006). Essa transformação geralmente aumenta a eficiência

computacional do processo de classificação, porque pode resultar na redução da

dimensionalidade dos dados originais (Lillesand et al., 2004).

Pretendeu-se avaliar a exactidão da classificação obtida com a redução da

dimensionalidade das variáveis de input. Neste sentido, procedeu-se ao cálculo das

componentes principais reduzindo as oito bandas contidas nas imagens de Julho e Abril

para cinco componentes. A Tabela 7 apresenta os valores de variância explicada nas

cinco componentes e apresenta a matriz de correlações entre as bandas e as

componentes.

A criação de inputs de NDVI e da ACP foram realizadas recorrendo ao software

IDRISI The Andes Edition®.

Tabela 7 – Valores de variância explicada nas cinco componentes e matriz de correlações.

COMPONENTE C 1 C 2 C 3 C 4 C 5

% variância 75.5 11.6 6.2 4.1 1.6

% variância acumulada 75.5 87.1 93.3 - -

Coeficientes de correlação

awifsabril1 0.542748 0.161346 -0.552579 0.179508 -0.300226

awifsabril2 0.456526 0.401053 -0.576526 0.16249 -0.310201

awifsabril3 0.744070 -0.591704 -0.20918 0.227287 -0.002267

awifsabril4 0.487968 0.589022 -0.624655 0.015805 0.125744

awifsjulho1 0.842567 0.363147 0.139612 0.146148 -0.260044

awifsjulho2 0.890758 0.287500 0.146930 0.136619 -0.263518

awifsjulho3 0.633944 0.398090 0.348379 0.516215 0.218857

awifsjulho4 0.988390 -0.008668 -0.576526 0.16249 0.033449

29

3.5 CLASSIFICAÇÃO ASSISTIDA

A classificação assistida é uma das principais etapas deste estudo. Esta fase é

muito importante porque a comparação das diferentes abordagens de classificação

utilizadas neste estudo, são o fundamento dos testes cujos resultados serão apresentados

e discutidos posteriormente no capítulo 4.

Conforme se pode observar no fluxograma de procedimentos (Figura 5), devido

à interactividade entre as diferentes etapas do processo de classificação de imagens, a

classificação assistida orientou directamente várias fases do processo. Com efeito, os

resultados de testes preliminares com classificações conduziram os outros

procedimentos tais como: a definição da nomenclatura de ocupação do solo, a

amostragem de treino e a definição dos testes de classificação.

A classificação assistida é um processo no qual as classes de ocupação do solo

previamente definidas são identificadas na imagem, atribuindo-lhes os correspondentes

pixels. Esses pixels, pelas suas características, nomeadamente ao nível das respostas

espectrais nos diferentes comprimentos de onda das bandas da imagem, apresentam uma

assinatura espectral que caracteriza a respectiva classe de ocupação do solo (Pal e

Mather, 2001). Esse processo de identificação é realizado através do reconhecimento,

com base nos dados auxiliares, criando-se assim as amostras de treino. Estas áreas,

como o próprio nome indica, servem para treinar o algoritmo de classificação de forma

a este identificar todos os pixels da imagem classificando-a automaticamente. Porém, a

assinatura resulta da contribuição de todos os constituintes da ocupação do solo,

ignorando o impacto dessas misturas dentro dos pixels (Lu e Weng, 2007).

Neste estudo foram utilizados dois classificadores: um paramétrico, o

classificador de máxima verosimilhança (CMV), e um não paramétrico, o classificador

de árvores de decisão (CAD).

O CMV é dos classificadores paramétricos mais utilizados (Pal e Mather, 2003,

Caetano et al., 2002, Lu e Weng, 2007), principalmente devido à sua robustez e à sua

disponibilidade em grande parte do software de processamento digital de imagem (Pal e

Mather, 2003).

30

O CMV é baseado na teoria probabilística Bayesiana e calcula a probabilidade

dos pixels a classificar pertencerem às classes consideradas, tendo por base a

informação das amostras de treino. Este classificador usa a média, a variância e a co-

variância dos dados das assinaturas para estimar a probabilidade de um pixel pertencer a

uma classe. O CMV considera a correlação entre bandas, incorporando a informação

relativa à co-variância entre as bandas e a sua correspondente variância. Este

classificador produz o que pode ser designado como uma área elíptica de caracterização

da assinatura espectral. Assim, o CMV calcula a probabilidade de pertença em cada

classe, onde a maior probabilidade se localiza na posição média da classe e diminui num

padrão elíptico à medida que se afasta da média (Eastman, 2006). As funções de

densidade probabilísticas são utilizadas para classificar pixels, através do cálculo da

probabilidade do valor de pertença do pixel em cada classe. Depois de estimar a

probabilidade em cada classe, a classe mais provável é atribuída ao pixel (Lillesand,

2004).

Os classificadores paramétricos assumem que os dados de treino, para cada

classe em cada banda, têm uma distribuição normal (Blaisdell, 1993 in Jensen, 1996).

No entanto, esse pressuposto é frequentemente desvirtuado, especialmente em paisagens

complexas (Lu e Weng, 2007). De facto, os dados com histogramas bi ou tri-modais

numa banda não são ajustados, porque nesses casos cada moda pode representar uma

classe que deve ser treinada e classificada separadamente (Jensen, 1996). Outro

problema, referido por Lillesand et al. (2004), é o facto de este classificador ser

exigente ao nível do processamento. Segundo estes autores, um modo de optimizar o

processamento consiste na redução da dimensionalidade dos dados através da

transformação de bandas com recurso à transformação em componentes principais.

Assim sendo, pelo que foi descrito no capítulo anterior (3.4), a transformação de bandas

espectrais em CP poderá optimizar o processo de classificação com o CMV.

Para ultrapassar os problemas acima descritos, têm sido utilizadas técnicas de

classificação não-paramétrica pois estes não têm assunções sobre a distribuição dos

dados, mostrando-se superiores em termos de exactidão (Friedl e Brodley, 1997; Pal e

Mather, 2003; Borak e Strahler, 1999 in Versluis e Rogan, 2009). Assim, é possível

processar dados que não seguem uma distribuição normal, dados não homogéneos com

31

‘ruído’, bem como dados com relações não lineares intra e inter classes (Quinlan, 1993

in Pal e Mather, 2001). Os classificadores não paramétricos também suportam melhor a

inclusão de dados não espectrais no processo de classificação (Lu e Weng, 2007), como

por exemplo, bandas espectrais de baixas resoluções, índices de vegetação, dados

topográficos e seleccionar automaticamente aqueles que melhor se adaptam à

classificação (Lawrence et al., 2004 in Loureiro, 2008). Tais dados de inputs melhoram

a capacidade de discriminação das classes de ocupação, bem como aumentam a

exactidão temática, porque consideram características da paisagem que podem afectar a

distribuição de tipos de vegetação (Franklin 1995 in Versluis et al., 2009).

As árvores de decisão (CAD) são um desses classificadores não paramétrico

que, para além das vantagens anteriormente descritas inerentes a este tipo de

classificador, tem vantagens relacionadas com a sua estrutura, pois esta é simples,

explícita e intuitiva (Friedl e Brodley, 1997) e permite uma maior rapidez na fase de

treino e no cálculo computacional (Pal e Mather, 2003). Ao invés dos classificadores

comuns que usam os dados de treino para classificar numa só etapa, as árvores de

decisão assentam o seu funcionamento numa estrutura multi-etápica e hierárquica, ou

seja, uma estrutura em árvore. O resultado traduz-se numa estrutura hierárquica de

regras de decisão que podem ser usadas para predição ou classificação (Rogan e Chen,

2004 in Versluis e Rogan, 2009), conforme se considerem dados contínuos ou dados

discretos.

A finalidade das árvores de decisão é de criar grupos o mais homogéneos

possível, com base num conjunto de dados. A criação desses grupos obedece a regras de

decisão, que resultam de testes aplicados a uma ou mais variáveis dependentes, de uma

forma sucessiva e hierárquica.

A CAD é um procedimento analítico que considera classes conhecidas (amostra

de treino) para processar a sua estrutura com base nos dados da reflectância em cada

banda (Clark Lab, 2008).

A árvore é composta por um nó inicial que contem todos os dados, um conjunto

de nós internos (decisões) e nós terminais (folhas). Cada nó interno representa um teste

sobre uma ou mais variáveis dependentes. Estes provêm apenas de um nó de nível

superior, originando ou não dois nós no nível seguinte. Cada ramo da estrutura

32

representa o resultado dos testes e as folhas representam os grupos de dados mais

homogéneos ou classes de dados.

O algoritmo de construção de árvores de decisão inicia o seu processo, tentando

encontrar o teste que produz a melhor partição de dados nas classes definidas. A decisão

da aplicação de um teste de partição em detrimento de outro recai naquele que reduz a

variabilidade dentro do grupo, maximizando o contraste entre os grupos. Em cada nível

seguinte, os subgrupos criados no nível anterior são eles próprios separados, e assim

sucessivamente com base no teste que maximize a homogeneidade dos subgrupos

resultantes. A continuidade do processo depende da melhoria em termos de pureza do

nó de nível superior face aos dois nós de nível inferior (Bação, 2004).

Existem vários algoritmos para construção da árvore, os mais conhecidos são o

CART (Classification and Regression Trees), CHAID (Chi Square Automatic

Interaction Detection), C4.5 e o ID3 (Xu et al., 2002 in Costa, 2008 e Friedl e Brodley,

1997). Estes algoritmos de construção das árvores de decisão iniciam o seu

funcionamento tentando encontrar o teste que produz a melhor partição nas categorias

pretendidas. Os testes de partição estão normalmente associados aos algoritmos de

construção da árvore de decisão (Bação, 2004). Neste estudo, o algoritmo de construção

disponibilizado pelo software utilizado é o algoritmo C4.5 e o teste de partição

associado é o critério de redução de entropia.

Uma outra vantagem das árvores de decisão é a possibilidade de usar técnicas

como o pruning que, como o nome indica, destina-se a “podar” as árvores de decisão,

permitindo reduzir as consequências do overfitting. O overfitting traduz-se num ajuste

excessivo da árvore às amostras de treino, reduzido o seu desempenho na classificação.

Por sua vez, o pruning consiste na redução do tamanho da árvore, através da eliminação

de nós terminais ou folhas.

3.6 TESTES DE CLASSIFICAÇÃO

No âmbito dos objectivos definidos, foram realizados vários testes na área de

estudo para avaliar duas questões: (1) A melhor abordagem de classificação, consistindo

na avaliação dos dois classificadores (classificador da máxima verosimilhança e árvores

de decisão); avaliação do melhor conjunto de dados (variáveis de input: datas, NDVI e

33

componentes principais); nomenclaturas de ocupação do solo (com 10 classes ou 6

classes); (2) A capacidade das imagens AWiFS para originar cartografia de ocupação do

solo numa região com uma paisagem com as características da área de estudo, que se

localiza, essencialmente, na região do Baixo Alentejo.

Para concretizar os objectivos acima descritos, foram realizados quatro testes de

classificação (Tabela 8) onde foram testadas as diferentes variáveis.

Tabela 8 – Características dos testes de classificação.

Teste Classificador Classes de treino Classes de mapa Dados de input 1 CMV& AD 10 10 Abril e Julho

2 CMV& AD 10 10 Abril, Julho e NDVI de Abril e Julho

3 CMV& AD 10 10 CP Abril e Julho 4 CMV & AD 10 6 Abril e Julho

Os testes 1 a 3 avaliam a abordagem de classificação relativamente ao algoritmo

de classificação e aos dados de inputs. Pretendeu-se verificar a mais-valia de acrescentar

o índice de vegetação NDVI à informação espectral disponível, bem como o efeito da

redução da redundância de dados na classificação recorrendo à Analise de Componentes

Principais (ACP).

O teste 4 avalia o potencial melhoramento da exactidão temática da classificação

ao usar uma nomenclatura menos detalhada. Desta forma, utilizou-se uma nomenclatura

de cinco classes, resultantes do agrupamento baseado no nível superior da classificação

da nomenclatura LANDEO (Tabela 9).

Tabela 9 – Nomenclatura de ocupação do solo com 10 e 5 classes.

Classe Nomenclatura com 10 classes Classe Nomenclatura com 5 classes 1 Corpos de água 1 Corpos de água 2 Área urbana contínua 2 Áreas urbanas 3 Área urbana descontínua 3 Floresta 4 Vegetação herbácea natural e sequeiros 4 Áreas agrícolas 5 Matos 5 Vegetação esparsa 6 Vegetação esparsa 7 Culturas permanentes perenifólias

(pomares, olivais)

8 Novas plantações/arborizações 9 Floresta fechada de folhosas 10 Floresta aberta de folhosas

34

Assim, a nomenclatura de cinco classes resulta da aglomeração em SIG das

classes mais detalhadas da nomenclatura de 10 classes. A classe 3-Floresta da

nomenclatura de cinco classes resulta da aglomeração das classes 5,8,9 e 10 da

nomenclatura de 10 classes; a classe 4 – Agricultura resulta da aglomeração das classes

4 e 7; a classe 2 – Urbano das classes 2 e 3.

As classificações foram realizadas recorrendo ao software IDRISI The Andes

Edition©. As classificações com árvores de decisão (CAD) foram parametrizadas

utilizando o algoritmo C4.5. O software utilizado disponibiliza uma opção de “auto-

pruning”. Esta opção elimina as folhas com uma contagem de pixels iguais ou inferiores

ao definido na proporção de classes (Clark Lab, 2008). A função de auto-pruning foi

parametrizada a 6% e o algoritmo de partição é o de entropy (critério de redução de

entropia). O auto-prunning de 6% poderá corresponder a 2 a 3 pixels, considerando um

número total de 415 pixels para amostra de treino.

O processo de aglomeração das amostras de 10 para cinco classes foi feito

através do software ArcGIS 9.3©.

3.7 AVALIAÇÃO DA EXACTIDÃO TEMÁTICA

A avaliação da exactidão temática de um mapa é um processo que resulta do

confronto entre o mapa produzido com dados de referência, que se assume que

representem a realidade (Stehman e Czaplewski, 1998 in Stheman et al., 2000). O

objectivo deste processo é a produção de uma matriz de erro ou matriz de confusão, a

partir da qual se podem derivar índices de exactidão global e temáticos (Jensen, 1996 e

Caetano et al., 2006).

Os dados de referência são geralmente obtidos através de interpretação visual de

imagens com maior resolução que os dados utilizados na produção do mapa tais como:

imagens aéreas, imagens de satélite e verificações no terreno (Biging et al., 1998;

Congalton & Biging, 1992 in Caetano et al., 2006).

Para proceder à avaliação da exactidão temática devem considerar-se três

processos: (1) amostragem dos dados de referência, (2) identificação de áreas

35

amostradas e (3) índices de avaliação da exactidão (Stehman e Czaplewski, 1998 in

Stheman et al., 2000).

A definição da estratégia de amostragem é uma etapa fundamental no processo

de avaliação da exactidão temática (Congalton, 1991 in Lu e Weng, 2007). Na definição

do processo de amostragem devem considerar-se a unidade de amostragem, o esquema

de amostragem e a dimensão da amostra (Congalton e Green, 1999 e Muller et al., 1998

in Lu e Weng, 2007).

A unidade de amostragem é a unidade de base da avaliação que é confrontada

com a correspondente unidade pertencente ao mapa produzido. Geralmente, a unidade

de amostragem é o pixel ou o polígono (Congalton, 1998 in Caetano et al., 2006).

O esquema de amostragem consiste no método de selecção das unidades da

amostra de referência, o qual tem de garantir uma robustez estatística que só é atingida

se o processo for probabilístico. A amostragem aleatória simples é considerada

adequada para estimativas sobre a população, pois reduz o efeito de autocorrelação de

pixels vizinhos (Richards e Jia, 2006). Porém, a amostragem aleatória simples levanta

um problema, pois esta é ponderada pela área. Ou seja, esta poderá amostrar por defeito

classes que sejam pouco representativas na área total do mapa, a não ser que o tamanho

da amostra seja suficientemente grande para abranger todas as classes. Por essa razão, a

amostragem aleatória estratificada, na qual é definido um número de amostras a

seleccionar em cada estrato ou classe de uso do solo, para além de reduzir o efeito de

autocorrelação espacial, garante que cada classe seja amostrada (Congalton, 1988 in

Jensen, 1996; Stehman, 2001; Congalton e Green, 1999 e Richards e Jia, 2006).

O número de pixels a ser recolhido para utilizar no processo de avaliação da

exactidão da classificação é muitas vezes difícil de determinar. Isto deve-se

principalmente ao facto das técnicas “clássicas” para a determinação de número de

amostras, que consiste na equação baseada na distribuição binomial, não terem sido

concebidas para serem aplicadas na avaliação da exactidão temática de classificações.

Este método é adequado para seleccionar o número total de pixels para a amostra, mas

este não foi criado para seleccionar o tamanho de uma amostra para preencher uma

matriz de confusão (Congalton, 1991 in Jensen, 1996). Devido ao elevado número de

pixels envolvidos nos dados de detecção remota, os métodos de amostragem

tradicionais não são aplicáveis. Deverá ser feito um balanço entre o que é estaticamente

36

correcto e o que é realmente exequível. Congalton (1991) in Jensen (1996) sugerem

uma regra empírica que consiste em recolher 50 amostras para cada classe de ocupação

do solo da matriz de confusão a considerar. Se a área for particularmente grande

(superior a 500.000 hectares), ou se considerarem um grande número de classes de

ocupação do solo (mais de 12 classes), o número mínimo de amostras de teste aumenta

para 75 ou 100 por classe. Este autor também recomenda que deve se aumentar o

esforço de amostragem em classes que mostram maior variabilidade espectral, em

detrimento de outras que não mostram essa característica.

Após a selecção das unidades de amostra de validação, segue-se um processo de

identificação da ocupação do solo real nas unidades de amostra, geralmente com

recurso à dados com melhor qualidade que as imagens de satélite utilizadas para

produzir o mapa (e.g. interpretação visual de orto-imagens e confirmação no campo).

Posteriormente, os pixels identificados são confrontados com os dados correspondentes

do mapa resultante da classificação. Esta confrontação é feita através de uma matriz de

erro também chamada matriz de confusão.

A matriz de confusão é a técnica mais utilizada para proceder à avaliação da

exactidão temática (Foody, 2002 in Lu e Weng, 2007). A matriz consiste numa

tabulação cruzada entre as classes de ocupação do solo do mapa e da informação de

referência. Os valores listados na tabela representam o número de pixels de teste (classe

verdadeira) para cada classe, correcta e incorrectamente classificados. A partir da

matriz de confusão podem ser calculadas os índices de exactidão global, índice de

exactidão do produtor, erros de omissão, índice de exactidão do utilizador e erros de

comissão (Tabela 10), onde:

EG – Exactidão global

EU – Exactidão do utilizador

EP – Exactidão do produtor

37

nii - Número de observações da amostra de validação classificada na classe i do mapa e que

corresponde à classe i na informação de referência;

ni+ - Total de observações da amostra de validação classificadas no mapa com a classe i;

n+i – Total de observações da amostra de validação pertencentes à classe i;

Informação de referência

1 2 … q Total

1 n11 n12 … n1q n1+

2 n21 n22 … n2q n2+

…

…

…

…

… Map

a

q nq1 nq2 … nqq nq+

Total n+1 n+2 … n+q n

Figura 9 - Matriz de confusão com q classes de ocupação do solo e índices de qualidade do mapa (Fonte: Carrão et al. 2007).

A exactidão global da amostra é a soma dos dados da diagonal da matriz de

confusão, divididos pelo número total de pixels da amostra.

O índice de exactidão do produtor (IEP) da classe (i) traduz a probabilidade de

um pixel verdadeiro da classe (i) estar realmente representado na cartografia por (i).

Este resulta do quociente entre o número de elementos correctamente classificados em

cada classe e o número de pixels de treino utilizado nessa classe (total na coluna). O

complementar do IEP traduz os erros de omissão. O índice de exactidão do utilizador

38

(IEU) da classe (i) é a probabilidade de um pixel etiquetado como classe (i) ser

realmente classe (i). A exactidão no utilizador é obtida dividindo o número de pixels

correctamente classificados pelo número total de pixels que foram classificados nessa

classe (total na linha). O seu complementar representa os erros de comissão.

Os erros de omissão da classe (i) correspondem aos pixels pertencentes à classe

(i) não identificados como tal pelo classificador, enquanto os erros de comissão da

classe (i) correspondem aos pixels de outra classe que foram identificados como sendo

da classe (i). O primeiro observa-se na coluna da matriz de confusão, enquanto o

segundo observa-se ao longo da linha da matriz (Richards e Jia, 2006).

É comum calcular a média das percentagens de classificações correctas e

assumi-la como sendo a exactidão global. Porém, um índice mais correcto deveria

ponderar a média segundo as áreas ocupadas por cada classe do mapa (Richards e Jia,

2006).

A avaliação da exactidão temática recorrendo à matriz de confusão só é ajustada

para classificações ‘rígidas’, assumindo que as classes do mapa são exclusivas e que

cada unidade da classificação pertence a uma só classe do mapa. Essa condição nem

sempre é respeitada, principalmente se considerarmos imagens de menor resolução

espacial (Lu e Weng, 2007).

O processo de validação consistiu na construção de um conjunto de uma amostra

de referência para cada um dos testes realizados. A informação de referência utilizada

foi um conjunto de ortoimagens de muito grande resolução espacial (40 cm), que

cobrem a área de estudo, obtidas em 2006.

Para proceder à recolha das amostras, criou-se uma grelha de área total igual à

área de estudo, composta por unidades com 60 por 60 m (3600 m2) de área,

espacialmente coincidente com os pixels das imagens AWiFS. A selecção das amostras

de teste foi realizada através de uma amostragem aleatória estratificada, com 30

amostras por classe. Seria indicado uma recolha de 100 amostras por classe visto que,

segundo Stehman (2001), este número de observações por estrato ou classes garante que

a estimativa da exactidão global do mapa e específica das classes tenha uma precisão

absoluta nunca superior a 10%, para um nível de significância de 0,05. No entanto, a

estratégia de validação adoptada implicou a realização de uma amostragem de validação

39

para cada classificação realizada, de forma a igualar os valores de precisão absoluta da

estimativa dos índices de qualidade de todos os resultados.

Deste modo, adoptou-se o modelo ideal e teórico de validação, que não é

geralmente utilizado pela maior parte dos autores, visto que este implica um alto

conhecimento da área a classificar o que consequentemente aumenta a morosidade do

processo. De facto na maior parte dos estudos, é utilizada a mesma amostra de

referência para comparar os vários mapas.

Considerou-se que seria necessário realizar um compromisso entre a precisão da

estimativa e a exequibilidade do processo, optando-se por recolher 30 observações por

classe, o que garante uma precisão absoluta não superior a 18,26%. No total foram

recolhidas 2100 amostras (Figura 10).

Figura 10 – Amostras de teste.

De forma a garantir a aleatoriedade da selecção das amostras de teste e evitar o

enviusamento de resultados, na amostragem aleatória estratificada considerou-se a

localização das amostras de treino. Esta operação foi realizada recorrendo a funções de

40

inquirição de dados em SIG, evitando que as amostras de teste coincidissem com a

localização das amostras de treino. Com isso, pretendeu-se reduzir o efeito do

conhecimento à priori do terreno, da localização de certas classes de uso do solo

existente na área de estudo. Embora esse conhecimento seja muito importante de um

ponto de vista de produção, este poderá influenciar os resultados. Por causa desta

influência, a avaliação da exactidão da classificação dos pixels localizados nas áreas de

treino é geralmente mais elevada que os restantes (Jensen, 1996).

As ortoimagens não cobriam a totalidade da área de estudo. Do mesmo modo,

através de uma função de inquirição em SIG, identificaram-se e removeram-se as

células que se localizavam fora da cobertura da grelha criada. Embora esta situação

poderá por em causa o princípio de igualdade de probabilidade, superior a zero, de cada

ponto do mapa de ser seleccionada para unidade amostral, esta é uma condicionante do

trabalho que tem ser assumida. Porém verifica-se que as unidades amostrais aparentam

estar bem espalhadas pela área de estudo.

Após a aplicação da selecção das amostras, as classes da informação de

referência foram interpretadas visualmente. A cada observação foram atribuídos dois

códigos, um principal e outro alternativo. Cada observação da amostra de teste foi

considerada bem classificada se um dos dois códigos era igual à classe produzida pelo

classificador. Caso nenhum dos códigos correspondesse à classe do mapa, o código

principal foi adoptado (Figura 11).

Referência ID Classe Classe 1 Classe 2 Classe final 1 11 11 12 11 2 11 12 11 11

Mapa

3 11 12 6 12

ID – Número sequencial de identificação do pixel

Classe 1 – classe mais provável no conjunto de amostras de referência

Classe 2 – segunda classe mais provável

Classe Final – classe de referência que entrará no processo de comparação Figura 11 – Exemplo da metodologia de construção das matrizes de confusão (fonte: Costa, 2008).

41

Nesse exemplo, para o pixel número 1 foram identificadas duas classes

prováveis (classes 11 e 12), o mapa confrontado apresenta uma classe igual ao da

primeira classe mais provável, a classe final adoptada é então a classe 11. No pixel

número 2, a segunda classe mais provável é que é concordante com a classe do mapa,

sendo então esta adoptada para classe final (classe 11). Finalmente, no pixel número 3,

nenhuma das classes mais prováveis é concordante a classe do mapa, neste caso como

classe final é sempre adoptada a primeira classe mais provável (classe 12).

O recurso a dois códigos de identificação das classes deve-se à incerteza e

subjectividade inerente ao processo de interpretação visual de imagem, que foi uma

situação frequente neste estudo. Esta incerteza deve-se às situações onde a classe de

ocupação não está claramente definida, pela existência de mais do que uma ocupação do

solo na unidade de amostra, conforme se pode observar no exemplo ilustrado na Figura

12.

Figura 12 – Exemplo de um Pixel com uma ocupação mista.

Deste modo, pretendeu-se diminuir a incerteza e subjectividade do processo de

interpretação visual. O processo de selecção e identificação das amostras de teste foi

feito em ambiente SIG, com recurso ao software ArcGIS 9.3®.

Depois de identificadas as amostras de validação para cada um dos mapas

produzidos, foram construídas as respectivas matrizes de confusão, estimando-se os

índices de exactidão global e específica de cada classe.

42

3.8 CÁLCULO DA DISTÂNCIA ENTRE CLASSES DA AMOSTRA DE

TREINO

O propósito desta análise é de verificar se a separação espectral das classes tem a

sua correspondência na semântica das classes de ocupação do solo, o que poderá

fornecer explicações sobre possíveis confusões entre classes no processo de

classificação. Foram elaborados três dendrogramas, resultantes de uma análise Cluster

(com distância Euclideana) aplicada às amostras de treino com as oito bandas AWiFS

(Abril e Julho), CP de Abril e Julho, bandas de Abril e Julho mais NDVI de Abril e

Julho.

A análise cluster é caracterizada como sendo uma classificação hierárquica,

aglomerativa e politéctica (van Tongeren, 1996; Kent e Coker, 1994; Gauch jr., 1982).

• Hierárquica: refere-se ao facto do resultado da análise poder ser

apresentado sob forma de um dendrograma, mostrando diferentes níveis

de semelhança;

• Aglomerativa: a classificação começa por cada unidade ou indivíduo

(neste caso, cada unidade de amostra de treino), juntando-os em vários

grupos. Posteriormente, esses grupos são reunidos em outros maiores até

que todas as unidades estejam abrangidas num único grupo;

• Politéctica, porque utiliza vários dados para realizar a classificação e não

apenas um parâmetro (Kent e Coker, 1994; Sneath e Sokal, 1973 in

Gauch jr., 1982).

Esta análise permite determinar se as classes (clusters) estão efectivamente

separadas no espaço mutidimensional das várias bandas espectrais de cada imagem. Um

bom cluster deverá ter pouca sobreposição sobre outros clusters no espaço

multivariado. O dendrograma caracteriza graficamente a separabilidade dos vários

clusters (ESRI, 2008), estes representam as 10 classes da nomenclatura de ocupação do

solo definida. Os dendrogramas foram produzidos com recurso ao software ArcGis

9.3®.

43

3.9 ANÁLISE DA INFLUÊNCIA DAS AMOSTRAS DE REFERÊNCIA NA

AVALIAÇÃO DA EXACTIDÃO

Considerando que para cada mapa produzido foi criada uma amostra de teste

(Capítulo 3.7), é relevante analisar a influência das amostras de referência sobre os

resultados, no que concerne à selecção do classificador e do conjunto de dados que

produzem os melhores resultados na classificação. Através desta análise, poder-se-á

verificar a existência de uma tendência nos resultados obtidos na globalidade do

conjunto de amostras de teste. Assim, independentemente dos resultados obtidos nas

classificações, pretende-se avaliar qual o classificador/conjunto de dados que obteve o

melhor desempenho na classificação da área de estudo.

Para verificar a influência das amostras de teste sobre a avaliação da exactidão

dos mapas gerados, consideraram-se os seis mapas realizados com a nomenclatura de 10

classes (Tabela 8). Para complementar a análise efectuaram-se quatro classificações

adicionais: CMV e CAD com imagem de Abril e imagem de Julho, obtendo-se um

conjunto de 10 mapas para análise.

Realizaram-se operações de geoprocessamento entre cada amostra de teste e os

10 mapas analisados. Foram consideradas para as 60 operações de validação de

exactidão temática, os dois códigos de classe (principal e alternativo) passíveis de ser

ponderadas na amostra de treino quando confrontadas com cada mapa.

As operações de geoprocessamento foram realizadas com recurso ao software

ArcGis 9.3®, a edição de base de dados em com recurso a Microsoft Access.

4 RESULTADOS E DISCUSSÃO

Nos próximos capítulos são apresentados e discutidos os resultados da exactidão

global de cada teste de classificação (4.1), a partir do qual são estruturados os capítulos

seguintes: análise das matrizes de confusão dos testes (4.2), avaliação das amostras de

treino (4.3) e a análise da influência das amostras de referência na classificação (4.4).

4.1 EXACTIDÃO GLOBAL DOS TESTES DE CLASSIFICAÇÃO

44

A partir dos vários mapas produzidos (Figura 13, 14, 15 e 16) construíram-se as

respectivas matrizes de confusão (Anexo IV) e calcularam-se os valores da exactidão

global para os vários testes de classificação, cujos resultados se apresentam na Tabela

10.

45

CMV/Abril+Julho

CAD/Abril+Julho Figura 13 - Mapas produzidos para o teste de classificação 1.

46

CMV/NDVI

CAD/NDVI Figura 14 - Mapas produzidos para o teste de classificação 2.

47

CMV/CP

CAD/CP Figura 15 - Mapas produzidos para o teste de classificação 3.

48

CMV/Abril+Julho, 5 classes.

CAD Abril+Julho, 5 classes Figura 16 - Mapas produzidos para o teste de classificação 4.

49

Tabela 10 - Resultados dos Testes de Classificação.

Exactidão global (%) Teste CMV CAD Classes de

treino Classes do

mapa Variáveis de input

1 29 37 10 10 Abril e Julho

2 28 32 10 10 Abril, Julho e NDVI Abril e Julho

3 36 25 10 10 CP Abril e Julho

4 43 39 10 5 Abril e Julho

Os resultados obtidos mostram que os valores de exactidão global são muito

baixos em todos os testes. Tais resultados direccionam a discussão dos mesmos para as

causas que terão influenciado estes valores da exactidão global. Os testes 1 a 3, que

teriam como propósito avaliar a influência dos dados de input na classificação,

mostraram resultados pouco conclusivos, com valores de exactidão global muito baixos,

a variar entre os 25% e 37%.

O teste 4 é aquele que apresenta os valores de exactidão global mais elevados.

Como seria espectável, os resultados dos testes de classificação com ambos os

classificadores, foram mais elevados com uma nomenclatura de solo menos detalhada.

No entanto, obtiveram-se ainda valores de exactidão global muito baixos (Tabela 10).

Estes resultados indiciam a existência de uma confusão entre classes de ocupação do

solo pouco semelhantes na sua semântica.

Os valores da exactidão temática condicionam a comparação dos testes. Porém,

uma análise das matrizes de erro poderá permitir observar as classes que originam maior

confusão para o classificador/conjunto de dados em análise, quantificando essa

confusão através dos valores dos índices de exactidão específica (EP e EU).

Uma observação mais detalhada da amostra de treino e das assinaturas dos

diferentes conjuntos de dados utilizados, no que concerne à sua consonância com a

semântica das classes de ocupação do solo definidas na nomenclatura, poderá

caracterizar a robustez da amostra de treino.

50

4.2 MATRIZES DE CONFUSÃO DOS MELHORES TESTES

É evidente que com valores de exactidão global tão baixos, estes por si só

indiciam que haverá muita confusão entre as classes. No entanto, para o demonstrar,

apresentam-se os valores da exactidão específicas das matrizes de confusão que

apresentam os melhores resultados de exactidão global. Estes produziram melhores

resultados na avaliação da influência dos dados de input (CAD/Abril+Julho), com uma

exactidão global de 37%, e na avaliação da influência da nomenclatura menos detalhada

(CMV/Abril+Julho), com 43% de exactidão global (Figura 17).

1 2 3 4 5 6 7 8 9 10 Total EU1 9 0 0 2 12 0 0 0 2 3 28 32%2 0 3 0 16 4 0 0 5 0 3 31 10%3 0 2 3 14 5 1 0 4 0 0 29 10%4 0 0 0 20 2 0 0 3 3 2 30 67%5 0 0 0 0 21 0 0 0 2 4 27 78%6 0 1 0 12 2 8 0 3 0 9 35 23%7 0 0 0 16 5 0 1 2 0 6 30 3%8 0 1 2 8 6 0 0 12 0 2 31 39%9 0 0 0 1 7 0 0 0 16 4 28 57%

10 0 0 0 3 7 1 0 1 2 17 31 55%Total 9 7 5 92 71 10 1 30 25 50 300

EP 100% 43% 60% 22% 30% 80% 100% 40% 64% 34%

INFORMAÇÃO DE REFERÊNCIA

MA

PA C

AD

/ABR

IL+J

ULH

O

1 2 3 4 5 Total EU

1 8 1 14 7 0 30 27%

2 0 3 14 13 0 30 10%

3 1 0 20 9 0 30 67%

4 0 0 6 24 0 30 80%

5 0 2 14 4 10 30 33%

Total 9 6 68 57 10 150

EP 89% 50% 29% 42% 100%

MA

PA C

MV

/ABR

IL+J

ULH

O INFORMAÇÃO DE REFERÊNCIA

EP – Exactidão do Produtor; EU – Exactidão do Utilizador

Figura 17 – Matrizes de confusão dos melhores testes de classificação

Quanto ao mapa produzido através CAD/Abril+Julho, relativamente à exactidão

do produtor (EP), apenas três classes, têm valores superiores a 80%. Estas são: corpos

de água (1), vegetação esparsa (6), culturas permanentes perenifólias (7). Por sua vez,

51

a classe com menor valor de EP é a classe 4 (culturas agrícolas de sequeiro +

vegetação herbácea natural), com 22%. No que diz respeito à exactidão do utilizador

(EU), as classes menos problemáticas são as classe 4 (culturas agrícolas de sequeiro +

vegetação herbácea natural), com 67%, e a classe 5 (matos), com 78% de EU. A classe

com menor valor de EU é a classe 7 (culturas permanentes perenifólias) com um valor

de EU de 3%.

A confusão entre as restantes classes é indiferenciada, isto é, esta ocorre tanto

em classes espectralmente próximas como em classes afastadas. O exemplo de uma

confusão entre classes espectralmente próximas é a existente entre a classe 4 (culturas

agrícolas de sequeiro + vegetação herbácea natural) e a classe 7 (culturas permanentes

perenifólias). Esta confusão é devido à influência do subcoberto herbáceo que é comum

em ambas as classes, o que acaba por confundir classes diferentes do ponto de vista da

ocupação (devido à presença ou ausência do estrato arbóreo), mas que espectralmente

revelam-se semelhantes.

Outro exemplo de confusão é a que se observa entre a classe 3 (Áreas urbanas

descontínuas) e a classe 4 (culturas agrícolas de sequeiro + vegetação herbácea

natural). Esta confusão está relacionada com a heterogeneidade da classe 3 que engloba

construção dispersa com áreas de subcoberto ou ocupação dominada por estrato

herbáceo, dificultando a sua identificação ao nível do pixel. Por outro lado, poderá ser

relevante o facto da maior parte da área urbana existente na área de estudo, ser pequena

e dispersa, o que aumenta a probabilidade de heterogeneidade dos pixels, aumentando a

probabilidade de confusão com os pixels adjacentes.

Um exemplo de confusão entre classes espectralmente diferentes é a que ocorre

entre a classe 5 (matos) e a classe 1 (corpos de água). Este facto é revelador de grandes

dificuldades na classificação, porque esta confusão não é explicável nem por

semelhanças espectrais, nem pela semântica das classes envolvidas. Este tipo de

confusão poderá dever-se à qualidade ou pureza das amostras de treino.

Outra razão que poderá explicar esta confusão na classificação é o facto da

metade Sul da área de estudo se localizar na Serra do Caldeirão, numa área com um

relevo acidentado e de encostas declivosas. Talvez haja um efeito do ensombramento

das encostas viradas a Norte nessas áreas que são de facto ocupadas na sua maioria por

vegetação arbustiva.

52

Os valores de exactidão global mostram, e os índices específicos assim o

confirmam, que existe elevada confusão entre a maior parte das classes. Estes não

permitem tirar elações mais profundas quanto à confusão entre elas.

Os resultados do teste 4 também indicam que existe confusão entre classes

semanticamente muito diferentes A confusão é muito elevada, considerando que o mapa

produzido tem apenas cinco classes bem distintas. Observa-se que existe confusão entre

as classes floresta (3), áreas urbanas (2) e água (1). Isto indica que as classes são muito

heterogéneas, o que poderá confirmar o que foi verificado pela análise da matriz de

confusão anterior, ou seja, que existe confusão entre classes teoricamente distintas

espectralmente.

Nas duas matrizes de confusão apresentadas, os valores de exactidão específica

mostram confusão na classificação entre a maior parte das classes. Este facto verifica-se

tanto em classes espectralmente próximas como em classes espectralmente afastadas.

Isto pode indicar que as classes das amostras de treino são muito heterogéneas e pouco

discriminatórias.

4.3 CÁLCULO DA DISTÂNCIA ENTRE CLASSES DA AMOSTRA DE

TREINO

Para avaliar a distância entre as classes de ocupação do solo das amostras de

treino, produziram-se três dendrogramas (Figura 18). Nestes, o eixo das abcissas indica

a distância entre os centros do espaço dimensional característico de cada classe. Quanto

maior for esse valor, maior será a distância entre as classes de ocupação do solo. Por

outro lado, conforme a distância (valor na abcissa) observam-se quais as classes que

espectralmente têm uma resposta mais semelhante.

53

Bandas: Abril e Julho

Bandas: Abril, Julho e NDVI de Abril e Julho

Bandas: Componentes Principais de Abril e Julho

Figura 18 – Dendrogramas das assinaturas

54

Analisando os dois primeiros dendrogramas (Figura 18), estes são muito

semelhantes e verifica-se que nas maiores distâncias há uma separação nítida de três

agrupamentos: planos de agua (1), classes sem ou pouca vegetação e classes com

vegetação. As classes de vegetação esparsa (6) com áreas urbanas contínuas (2)

encontram-se muito próximas. São áreas praticamente sem vegetação ao longo do

tempo (primavera - verão), daí advêm as suas semelhanças espectrais. A classe novas

plantações/arborizações (8) e a classe vegetação herbácea natural e sequeiros (4)

formam um agrupamento. Esta situação estará relacionada com o efeito da presença do

subcoberto herbáceo. Este agrupamento ainda se aglomera, mas a uma maior distância,

à classe de áreas urbanas descontínuas (3) que também, devido à presença do mesmo

subcoberto, assemelha-se espectralmente às duas anteriores. As classes floresta aberta

de folhosas (10) e culturas permanentes perenifólias (pomares, olivais) (7) encontram-

se muito próximas, provavelmente devido a estruturas semelhantes ao nível das

proporções de ocupação por parte dos estratos arbóreos e herbáceos. A classe floresta

fechada folhosas (9) e matos (5) também estão muito próximas, o que seria espectável,

considerando que se tratam de folhosas e vegetação perenifólias e que na ocupação não

existe dominância ou presença do estrato herbáceo.

O dendrograma resultante da análise cluster aplicada às assinaturas espectrais,

obtidas a partir da análise de componentes principais com as imagens de Abril e Julho,

mostrou um resultado que difere ligeiramente dos dois anteriormente apresentados.

Neste caso, a classe novas plantações/arborizações (8) está muito próxima da

classe floresta aberta de folhosas (10), o que semanticamente está correcto,

considerando que ambas são classes de ocupação florestal. A classe culturas

permanentes perenifólias (pomares, olivais) (7) está numa distância que coloca esta

assinatura numa posição de transição entre dois agrupamentos de classes claramente

distintos. Por um lado, existe um agrupamento composto por duas classes com alguma

dominância do estrato herbáceo: vegetação herbácea natural e sequeiros (4) e a classe

de áreas urbanas descontínuas (3); por outro lado, o agrupamento anteriormente

descrito, é composto pelas classes novas plantações/arborizações (8) e floresta aberta

de folhosas (10).

Pela análise dos dendrogramas das assinaturas espectrais, todos os clusters

podem ser explicados, porém as assinaturas resultantes da análise de componente

55

principais parecem estar espectralmente mais em consonância com a semântica das

classes definidas de ocupação do solo. Estes resultados são um indicador de robustez da

amostra de treino quanto à separação das classes. Por outro lado, embora o tamanho da

área de estudo e a complexidade da paisagem condicionassem fortemente essa recolha,

o número de unidades amostrais é superior ou igual ao mínimo estatisticamente definido

(Capitulo 3.3) em todas as classes da nomenclatura, o que reforça a robustez da amostra

de treino e das assinaturas resultantes dos diferentes conjuntos de dados utilizados.

Face aos resultados obtidos na avaliação da exactidão temática dos mapas, os

resultados da análise da amostra de treino parecem indicar que os baixos valores de

exactidão temática obtidos devem-se aos conjuntos classificadores/dados utilizados.

4.4 ANÁLISE DA INFLUÊNCIA DAS AMOSTRAS DE REFERÊNCIA

Construíram-se 60 matrizes de confusão (Anexo IV), com as quais se calcularam

os 60 valores de exactidão global e a partir destes se estimaram as respectivas médias e

desvio-padrão (Tabela 11).

Tabela 11 – Valores de exactidão global (%) entre todos os mapas e todas as amostras de referência

Mapas

Amostras teste

CMV Abril

CMV Julho

CMV 8bd

CMV NDVI

CMVCP

CAD Abril

CAD Julho

CAD8bd

CAD NDVI

CADCP Média (%) Desvio

Padrão (%)

CMV 8bd 26 32 30 37 38 24 26 32 33 24 30 4.99 CMV ndvi 25 31 30 28 33 25 30 28 30 24 28 3.09 CMV cp 35 38 43 43 36 27 27 35 35 26 35 6.13 CAD 8bd 30 38 43 44 46 28 39 37 38 28 37 6.62 CAD ndvi 30 34 35 36 39 20 24 30 32 24 30 5.96 CAD cp 23 26 29 32 30 24 20 29 26 25 26 3.65 Media (%) 28 33 35 37 37 25 28 32 32 25

Desvio Padrão (%) 4,48 4,60 6,35 6,42 5,58 2,75 6,49 3,68 4,1 1,42

CMV - Classificador de Máxima Verosimilhança CAD - Classificador de Arvores de Decisão

As linhas da tabela apresentam os valores de exactidão global de todos os mapas

por cada amostra de referência, observando-se assim o desempenho do conjunto de

classificações na amostra de referência considerada. As colunas mostram os valores da

56

exactidão global de cada mapa em cada amostra de referência, permitindo avaliar o

efeito de cada uma das amostras de teste sobre os valores de exactidão global de cada

um dos mapas produzidos pelos diferentes classificadores/conjunto de dados.

Analisando os valores de exactidão global por coluna, os valores das médias

calculadas por mapa variam entre 25% (CAD/Abril e CAD/CP) e 37% (CMV/NDVI e

CMV/CP). Os valores de desvio padrão indicam uma variação em torno da média entre

1,42 e 6,49%. Observa-se que as médias mais elevadas de exactidão global

correspondem aos valores mais elevados de desvio-padrão (CMV/NDVI e CMV/CP).

Por outro lado, os mapas que apresentam média mais baixa (CAD/Abril e CAD/CP)

apresentam os valores mais baixos de desvio-padrão. Isto poderá indicar que o CAD é

menos sensível às diferentes amostras de referência do que o CMV.

Os valores de desvio-padrão por mapa indicam variações de exactidão temática

significativas que podem ultrapassar os 6%. Observando as amplitudes, por exemplo, do

mapa CMV/Abril, verifica-se que a diferença entre o valore mínimo e o valor máximo

de exactidão global é de 12%.

Os valores das exactidões globais mostram uma variação assinalável com as

amostras de referência. Esta situação talvez se deva ao facto destas terem sido

construídas com base numa amostragem aleatória, estratificada pelas classes dos mapas

que lhe deram origem. Essa situação determina uma desigualdade na amostragem por

cada classe dos outros mapas, podendo mesmo ocorrer classes que não sejam

amostradas de todo, conforme se pode verificar nas matrizes de confusão (Anexo IV).

Esta situação poderá ter gerado diferenças tais entre as amostras de referência, que terão

levado às diferenças observadas.

Examinando os resultados da Tabela 11 por linha, observamos o desempenho de

cada classificador/conjunto de dados por cada amostra de teste. Assim, é possível

verificar se o ranking dos conjuntos classificador/conjunto de dados varia em cada

amostra.

Analisando os valores de exactidão global dos mapas em cada amostra de teste,

verifica-se que globalmente os mapas produzidos com o Classificador de Máxima

Verosimilhança (CMV) obtiveram valores de exactidão global superiores aos do

Classificador de Árvores de Decisão (CAD) - Figura 19.

57

0.00%

5.00%

10.00%

15.00%

20.00%

25.00%

30.00%

35.00%

40.00%

45.00%

50.00%

CMV/Abril

CMV/Julho

CMV/Abril+Julho

CMV/NDVI

CMV/CP

CAD/Abril

CAD/ulho

CAD/Abril+Julho

CAD/NDVI

CAD/CP

Figura 19 – Valores de exactidão global dos 10 mapas por cada uma das amostras de teste.

Verificando os resultados pelo conjunto de dados, através de uma comparação

dos mapas resultantes da assinatura espectral da imagem de Abril e dos mapas

produzidos com base na imagem de Julho, independentemente do classificador, estes

últimos têm globalmente melhores resultados. Provavelmente a imagem de Julho

discrimina melhor a ocupação do solo do que a dos dados provenientes da imagem de

Abril.

Analisando os resultados do CAD, o conjunto de dados produzidos com base nas

imagens de Abril e Julho mais o NDVI de Abril e Julho e o conjunto de dados composto

por imagens de Abril e Julho, produziram, na maior parte das amostras de teste, os

melhores resultados.

Relativamente ao CMV, os valores de exactidão global dos mapas criados pelos

conjuntos de dados CP e NDVI são os que se destacam na maior parte das amostras de

teste. Estes resultados indiciam que um aumento nos dados de input, acrescentando

mais bandas (Abril+Julho), o índice de vegetação NDVI à informação espectral

disponível, bem como o efeito da redução da redundância de dados na classificação

recorrendo aos Componentes Principais (CP), pode melhorar a classificação.

58

Embora outros estudos indicam que os classificadores não-paramétricos possam

produzir melhores resultados do que os paramétricos em paisagens complexas (Paola e

Schowengerdt 1995, Foody 2002b in Lu e Weng, 2007). No caso específico do presente

estudo, os resultados obtidos apontam que, com os dados utilizados, o Classificador de

Máxima Verosimilhança tende a produzir melhores resultados na exactidão global do

que o Classificador de Árvores de Decisão. Estes resultados são corroborados pelo

estudo de Costa (2008), no qual, o desempenho do Classificador de Árvores de Decisão

não superou o Classificador de Máxima Verosimilhança, no que concerne aos valores

de exactidão global.

No estudo desenvolvido por Costa et al. (2009) obtiveram-se valores de

exactidão temática total baixos, num teste em imagens AWiFS com os classificadores

de Máxima Verosimilhança (CMV) e Árvores de Decisão (CAD). Segundo estes

autores, nem o uso de três datas diferentes (primavera, verão e outono), nem o NDVI e

nem as componentes principais melhoraram consideravelmente os resultados. Ainda de

acordo com estes autores, isto mostra que apenas duas imagens AWIFS de primavera e

verão são suficientes para classificar a paisagem de Portugal Continental.

Em suma, verifica-se que as amostras de referência parecem influenciar os

valores da exactidão global dos mapas produzidos nos testes de classificação.

Consequentemente, poderá pôr-se em causa a robustez da análise dos testes elaborados,

que consistem na comparação de diferentes métodos de classificação, cuja avaliação da

exactidão temática se baseia em amostras de referência específicas para cada mapa.

Por outro lado, os baixos valores de exactidão global podem ser explicados pela

complexidade da paisagem e pela informação contida nas imagens AWiFS. Quanto às

características da paisagem, conforme o que foi descrito no capítulo 2.1, o uso do solo

com maior expressão espacial é o montado, que se traduz em áreas heterogéneas e com

diferentes graus de misturas de ocupação do solo. Este uso apresenta um carácter

híbrido em termos de utilização do solo e de transição entre as florestas fechadas e os

campos agrícolas abertos, cujo sistema de maneio origina dinâmicas de ocupação do

solo geralmente intra-anuais.

As unidades de paisagem indicam uma forte diferenciação entre o Norte e o Sul

da área de estudo, pelo facto desta ser composta por duas unidades de paisagem que são

de grupos de unidades diferentes, caracterizando uma área de planície e uma área

59

serrana. A estes contrastes paisagísticos junta-se a diversidade no interior de cada

unidade de paisagem, justificada pela delimitação de três sub-unidades em cada uma

delas. Por sua vez, a dimensão da área de estudo também condicionou o processo de

classificação, em particular na construção da amostra de treino, no sentido em que

limita a procura de unidades amostrais.

Relativamente às características das imagens AWiFS, outros estudos mostram

que estas imagens não fornecem informação espectral suficiente para uma classificação

ao nível do pixel (Costa, 2008 e Costa et al., 2008). Segundo Costa et al. (2008), os

resultados obtidos num estudo comparativo do desempenho de classificações entre

imagens AWiFS e MERIS, demonstraram que os menores valores de exactidão obtidos

na classificação de imagens AWiFS podem ser explicados pela sua menor resolução

espectral. Segundo esse estudo, a informação espectral desempenha um papel mais

decisivo do que a informação temporal na melhoria da exactidão temática. Pelo

contrário, a resolução espacial não influencia a exactidão temática da cartografia quando

esta é derivada a partir de bases de dados construídas especificamente para as imagens a

classificar. A sua influência é principalmente sentida no que respeita ao treino da

classificação assistida, para o qual é necessário um maior esforço de amostragem à

medida que a resolução espacial aumenta.

Relativamente à informação temporal, o uso de apenas duas datas em detrimento

da rejeição da imagem de Outubro, por este conter uma área elevada de cobertura

nebulosa, não é determinante para os desempenhos da classificação. De facto, as

imagens de primavera, verão e outono foram seleccionadas com o objectivo de adquirir

as maiores diferenças espectrais que as classes apresentam ao longo do ano. O objectivo

seria recolher a informação espectral associada às das dinâmicas de ocupação do solo de

algumas classes, tentando assim aumentar a capacidade de descriminação e melhorar a

classificação. No entanto, em Costa (2008), num estudo com imagens AWiFS de Abril,

Julho e Outubro, a imagem de Outubro não melhorou significativamente os resultados

da exactidão global.

.

60

5 CONCLUSÕES

A exactidão global dos mapas produzidos com diferentes abordagens de

classificação automática, com base nas imagens AWiFS, foi muito baixa. A

metodologia de trabalho assentou num grande esforço de amostragem de treino e de

teste e apoiou-se no conhecimento da área de estudo e familiarização com os dados

auxiliares, bem como o recurso a identificação no campo. Estes factos reduzem as

probabilidades de erro metodológico ao nível da subjectividade inerente aos processos

de interpretação visual de imagem, nos processos de construção da amostra de treino e

das amostras de referência.

A metodologia utilizada neste trabalho é semelhante a de outros estudos que

demonstraram que esta não influencia negativamente os desempenhos dos

classificadores. Estes factos reforçam a ideia de que, no presente estudo, os resultados

dos valores de exactidão global, devem-se às características dos dados.

As características das imagens AWiFS e da área de estudo são os factores que

explicam os baixos valores de exactidão global das classificações. No processo de

classificação, a complexidade da paisagem associada à resolução espectral das imagens

AWiFS, contribuíram para os valores de exactidão global obtidos em todas as

abordagens de classificação.

De facto, estes dois factores contribuem fortemente para a heterogeneidade do

pixel, elevando a probabilidade da reflectância deste ser resultante das misturas de

várias classes de ocupação do solo. Durante o processo de classificação, em particular

nas fases de definição da nomenclatura e na construção das amostras de treino e de

teste, verificou-se com evidência a complexidade da paisagem e da ocupação do solo da

área de estudo. Na região do Baixo Alentejo, onde se localiza maioritariamente a área

de estudo, os resultados e a análise do processo de classificação apontam que estas

paisagens são difíceis de classificar por métodos automáticos com imagens AWiFS.

Relativamente às características das imagens AWiFS, outros estudos

comprovam que a sua resolução espectral é um factor condicionante na classificação das

mesmas. Estes demonstram que em condições semelhantes, as de imagens de menor

61

resolução espacial mas de resolução espectral superior obtêm melhores desempenhos na

classificação.

Aos dois factores acima descritos acrescenta-se um outro, este é a dimensão da

área de estudo. Este factor condicionou fortemente a construção da amostra de treino,

não permitindo uma selecção mais alargada de unidades amostrais por classe. É

provável que esta situação tenha tido influência na representatividade das amostras por

cada classe de ocupação considerada.

O recurso a amostras de teste específicas para cada mapa na sua avaliação da

exactidão temática, não permitiu a comparação dos resultados entre os diferentes mapas.

Isto sucede porque a avaliação da exactidão temática, baseou-se em amostras de

referência estratificados por classe, específicos para cada mapa. Consequente, existirão

classes com um número insuficiente ou mesmo inexistente de unidades amostrais, o que

influencia fortemente os índices específicos de exactidão das classes de ocupação do

solo. Este trabalho revela, face aos dados utilizados, que as amostras de referência

poderão ter influenciado significativamente os valores de exactidão temática dos mapas.

Para poder realizar este tipo de análise, deverá ser feita uma amostragem

aleatória, estratificada sobre um mapa de referência. As unidades amostrais resultantes

desse mapa de referência seriam comuns no processo de avaliação da exactidão temática

de todos os mapas. O mapa de referência deverá ter características semelhantes aos

mapas dos testes, principalmente no que toca à nomenclatura das classes de ocupação

do solo e a unidade mínima cartográfica.

No entanto, através das amostras de teste foi possível avaliar o desempenho

entre as diferentes abordagens de classificação (classificador/ conjunto de dados), onde

os resultados obtidos determinam que o Classificador de Máxima Verosimilhança

(CMV) supera o Classificador de Árvores de Decisão (CAD) quanto à exactidão global

dos mapas. Por outro lado, observou-se que os conjuntos de dados que mais

beneficiaram as classificações com CMV foram aqueles constituídos por imagens de

Abril e Julho com dados de NDVI de Abril e Julho e os dados resultantes da Análise de

Componentes Principais (ACP) de Abril e Julho. Quanto ao CAD os conjuntos de dados

que mais favoreceram os resultados foram os conjuntos constituídos por imagens de

Abril e Julho e os dados resultantes da ACP.

62

Outras abordagens poderiam ser testadas, para melhorar os resultados relativos à

exactidão temática dos mapas. Nomeadamente ao nível do pré-processamento, através

da aplicação de correcções radiométricas de forma a eliminar o efeito da topografia que

se observa na metade Sul da área de estudo. A inclusão de dados não espectrais, em

particular com o classificador de árvores de decisão, poderia também melhorar os

valores de exactidão temática dos mapas produzidos. Outras técnicas de classificação

como a classificação ao nível do sub-pixel, poderão demonstrar um desempenho

superior, considerando a questão da resolução espacial e espectral das imagens AWiFS

que se traduz num baixo poder resolvente das mesmas, nesta área de estudo.

Por fim, considera-se que o principal objectivo para o qual este estudo foi

desenvolvido foi plenamente atingido. Este foi a aprendizagem e a aplicação de técnicas

de processamento digital de imagem e de classificação automática de imagens de

satélite, para produção de cartografia de ocupação do solo.

63

REFERÊNCIAS BIBLIOGRÁFICAS

ARAÚJO, A. e CAETANO, M., 2006. Nomenclatura de ocupação do solo LANDEO. (Lisboa: Instituto Geográfico Português)

ARAÚJO, ANTÓNIO MANUEL SAFARA., 2008, Análise de padrões espectrais e temporais de imagens MERIS para a caracterização da ocupação do solo em Portugal, Tese de Mestrado, IST-Lisboa

BAÇÃO, F. L., 2004, Apontamentos da disciplina de Data Mining Geo-Espacial, ISEGI- Lisboa

CAETANO, M., SANTOS, T., E GONÇALVES, L., 2002, Cartografia de Ocupação do Solo com Imagens de Satélite: Estado da Arte, [CD-ROM]. in Actas do VII Encontro de Utilizadores de Informação Geográfica (Oeiras: USIG)

CAETANO, M., F. MATA E S. FREIRE, 2006, Acuracy assessment of the Portuguese CORINE Land Cover map, Global Developments in Environmental Earth Observation from Space (A. Marçal, editor), (Rotterdam:Millpress), pp.459-467

CAETANO, M., V. NUNES, E A. ARAÚJO, 2008, Concepção e desenvolvimento das especificações técnicas da nova Carta de Ocupação do Solo de Portugal Continental, Actas do X Encontro de Utilizadores de Informação Geográfica, (Oeiras: USIG), suporte digital sem paginação

CARRÃO, H., CAETANO, M. E COELHO, P., 2007, Sample Design and Analysis for Thematic Map Accuracy Assessment: An Approach Based on Domain Estimation for the Validation of Land Cover Products, [CD-ROM]. in Proceedings of the 32nd International Symposium on Remote Sensing of Environment (San Jose, Costa Rica)

CLARK LAB, 2008, IDRISI focus paper - Classification Tree Analysis URL (http://www.clarklabs.org/applications/upload/Classification-Tree-Analysis-IDRISI-Focus-Paper.pdf)

CONGALTON, R. E GREEN, K., 1999, Assessing the accuracy of remotely sensed data: principles and practices. (Boca Raton, Florida: Lewis Publishers)

COSTA, HUGO ALEXANDRE GOMES DA., 2008, Estratégia multi-temporal para produção automática de cartografia de ocupação do solo. Tese de Mestrado, ISEGI-UNL, Lisboa

COSTA, H., ARAÚJO, A., CARRÃO, H. E CAETANO, M., 2008, Influência das características técnicas das imagens de satélite na produção de cartografia de ocupação do solo: estudo baseado em imagens MERIS e AWiFS, Actas do X Encontro de Utilizadores de Informação Geográfica (Oeiras:USIG), in press

COSTA, H., E CAETANO, M., 2009, Classificação de imagens AWiFS com uma abordagem combinada pixel/objecto, Anais do XIV Simpósio Brasileiro de Sensoriamento Remoto, (Natal, Brasil), pp.7781-7789, in press

64

COSTA, H., CARRÃO, BAÇÃO, F E CAETANO, M., 2009, Land cover classification in Portugal with multitemporal AWIFS images: a comparative study. Remote Sensing for a Changing Europe, (IOS Press, Amsterdam), pp.239-246

DGOTDU, 2004, Contributos para a Identificação e Caracterização da Paisagem em Portugal Continental. Volumes I a V, (Lisboa: Direcção-Geral do Ordenamento do Território e Desenvolvimento Urbano)

DÍAZ, M., 1997, Manejo forestal y diversidad biológica de las dehesas. Curso sobre ecologia, explotacíon y conservacion del arbolado em dehesas y montados Ibéricos. Torrejón el Rubio, Espanha

EASTMAN, J. R., 2006. IDRISI Andes, Guide to GIS and image processing, (Clark University, Worcester, EUA)

ESRI, 2008, ArcGis Desktop (Software). (California: Environmental Systems Research Institute: Redlands)

FRIEDL, M.A. E BRODLEY, C.E., 1997, Decision tree classification of land cover from remotely sensed data. Remote Sensing of Environment, 61, pp. 399–409

GAUCH, H. G., JR. 1982, Multivariate Analysis in Community Structure, (University

Press, Cambridge) KENT E COKER, 1994, Vegetation description and analysis: a practical approach, (West

Sussex, England: JohnWiley and Sons)

IGP – Instituto Geográfico Português, 2010. Carta Administrativa Oficial de Portugal. URL: (http://www.igeo.pt/produtos/cadastro/caop/inicial.htm, consulta 4/09/2010)

IGP – Instituto Geográfico Português, 2010. CORINE Landcover 2006. (URL:http://www.igeo.pt/produtos/CEGIG/Corine.htm, ultima consulta:2/09/2010)

ISRO - Indian Space Research Organization, 2010, URL (http://www.isro.org/satellites/irs-p6resourcesat-1.aspx, última consulta 5/06/2010)

JENSEN, R., 1996. Introductory digital image processing: a remote sensing perspective. 2nd edition, (Prentice-Hall: New Jersey)

LILLESAND, T., KIEFER, R., CHIPMAN, J., 2004, Remote sensing and image interpretation. 5th edition, (New York: John Wiley & Sons, Inc)

LOUREIRO, MARTA LUÍSA DOLORES., 2008, Exploração das características espectrais de imagens ikonos para caracterização da ocupação do solo: comparação de classificadores. Tese de Mestrado, IST - Lisboa

LU, D. E WENG, Q., 2007, A survey of image classification methods and techniques for improving classification performance, International Journal of Remote Sensing, 28:5, pp.823 – 870

NRSA-National Remote Sensing Agency, 2003, IRS-P6 Data User´s Handbook. URL (http://www.euromap.de/download/P6_data_user_handbook.pdf, última consulta 5/06/2010)

65

PAL M. E MATHER, P., 2001. Decision tree based classification of remotely sensed data. in 22nd Asian Conference on Remote Sensing, 5-9 November, Singapore in press

PAL, M. E MATHER, P., 2003, An assessment of the effectiveness of decision tree methods for land cover classification. Remote Sensing of Environment, Volume 86, issue 4, pp 554-565

PINTO-CORREIA, T., CANCELA D´ABREU, A. E OLIVEIRA, R., 2001, Identificação de unidades de paisagem: metodologia aplicada a Portugal Continental, Finisterra, XXXVI, 72, pp 195-206

RICHARDS, J. A. E JIA, X., 2006, Remote sensing digital image analysis: an introduction, 4ª edição, (Germany: Springer)

SILVA, I.C.C (1992). Contribuição para o Estudo dos Montados de Sobro e Azinho. Trabalho de fim de Curso de Engenharia Agrícola. Universidade de Évora-Evora

STANNERS, D. E BOURDEAU, P. (Eds.), 1995, Europe’s environment, The dobřiš assessment, (Copenhagen Europe´s Environment Agency)

STEHMAN, S., CZAPLEWSKI, R., NUSSER, S., YANG, L. E ZHU, Z., 2000, Combining accuracy assessment of land-cover maps with environmental monitoring programs. Environmental monitoring and assessment 64, pp.115–126

STEHMAN, S., 2001. Statistical rigor and practical utility in thematic map accuracy, Photogrammetric Engineering & Remote Sensing, 67, pp. 727-734

VAN TONGEREN, O. F. R., 1996. Cluster analysis. In R.H.G. Jongman, C. J. F. ter Braak , & O. F. R. van Tongeren (eds). Data analysis in community and landscape ecology (New York: Cambridge Unversity press), pp.174-221

VERSLUIS, ANNA E ROGAN, JOHN, 2009, Mapping land-cover change in a Haitian watershed using a combined spectral mixture analysis and classification tree procedure, Geocarto International

WENG, Q., 2010. Remote Sensing and GIS Integration - Theories, Methods and Applications. (McGraw-Hill, New York)

66

ANEXOS

67

ANEXO I

COMPOSIÇÕES COLORIDAS DAS IMAGENS AWIFS (342)

68

ANEXO II

NOMENCLATURA LANDEO

LEVEL 1 LEVEL 2 LEVEL 3 LEVEL 4 LEVEL 5

1.1 Continuous Artificial Areas

1.1.0. 1.1.0.0. 1.1.0.0

1. Artificial Areas

1.2 Descontinuous Artificial Areas

1.2.0. 1.2.0.0. 1.2.0.0.

2.1. Rainfed Herbaceous Crops

2.1.0. 2.1.0.0. 2.1.0.0.

2.2. Irrigated Herbaceous Crops

2.2.0. 2.2.0.0. 2.2.0.0.

2.3. Rice Crops 2.3.0. 2.3.0.0. 2.3.0.0.

2.4.1.1. Permanent Evergreen Crops (Trees or Shrubs) without understory agricultural systems

2.4.1.1 2.4.1. Permanent Evergreen Crops (Trees or Shrubs)

2.4.1.2. Permanent Evergreen Crops (Trees or Shrubs) with understory agricultural systems

2.4.1.2

2.4.2.1. Permanent Deciduous Crops (Trees or Shrubs) without understory agricultural systems

2.4.2.1

2.4. Permanent Crops (Trees or Shrubs)

2.4.2. Permanent Deciduous Crops (Trees or Shrubs)

2.4.2.2. Permanent Deciduous Crops (Trees or Shrubs) with understory agricultural systems

2.4.2.2

2. Croplands

2.5. Mosaic Cultivated and managed lands

2.5.0.. 2.5.0.0. 2.5.0.0

3. Natural And Semi-Natural Terrestrial Vegetation

3.1. Broadleaved Closed to Open Trees

3.1.1. Broadleaved Closed Trees

3.1.1.1 Broadleaved Evergreen Closed Trees

3.1.1.1.1 Broadleaved Evergreen Closed Trees without understory agricultural systems

3.1.1.1.2 Broadleaved Evergreen Closed Trees with understory agricultural systems

69


3.1.1.2 Broadleaved Deciduous Closed Trees

3.1.1.2.1 Broadleaved deciduous Closed Trees without understory agricultural systems

3.1.1.2.2 Broadleaved deciduous Closed Trees with understory agricultural systems

3.1.2.2 Broadleaved Deciduous Open Trees

3.1.2.2.1 Broadleaved Deciduous Open Trees without understory agricultural systems

3.1.2. Broadleaved Open Trees

3.1.2.1 Broadleaved Evergreen Open Trees

3.1.2.1.1 Broadleaved Evergreen Open Trees without understory agricultural systems

3.1.2.2 Broadleaved Deciduous Open Trees

3.1.2.2.1 Broadleaved Deciduous Open Trees without understory agricultural systems

3.1.2.2.1 Broadleaved Deciduous Open Trees with understory agricultural systems

3.2.1. Needleleaved Closed Trees

3.2.1.0. 3.2.1.0 3.2. Needleleaved Closed to Open Trees

3.2.2. Needleleaved Open Trees

3.2.2.0. 3.2.2.0

3.3.1. Mixed Closed Trees

3.3.1.0. 3.3.1.0 3.3. Mixed Closed to Open Trees

3.3.2. Mixed Open Trees

3.3.2.0. 3.3.2.0.

3.4.1. Closed Shrubland

3.4.1.0. 3.4.1.0. 3.4. Closed to Open Shrubland

3.4.2. Open Shrubland 3.4.2.0. 3.4.2.0.

3.5.1 Closed Herbaceous Vegetation

3.5.1.0. 3.5.1.0. 3.5. Closed to Open Herbaceous Vegetation

3.5.2 Open Herbaceous Vegetation

3.5.2.0. 3.5.2.0.

3.6.1 Sparse Trees 3.6.1.0. 3.6.1.0.

3.6. Sparse Vegetation

3.6.2 Sparse Shrubs 3.6.2.0. 3.6.2.0.

70


3.6.3 Sparse Herbaceous

3.6.3.0. 3.6.3.0.

3.7. Mosaic Trees/Shrubs/Herbaceous

3.7.0. 3.7.0.0. 3.7.0.0.

3.8. Recently Burnt (Trees or Shrubs)

3.8.0 3.8.0.0. 3.8.0.0.

3.9. Clear-cutts 3.9.0 3.9.0.0. 3.9.0.0.

3.10. New plantations

3.10.0 3.10.0.0. 3.10.0.0.

4. Mosaics 4.1. Mosaic Cultivated and managed lands/Natural and Semi-natural areas/Artificial areas

4.1.0 4.1.0.0. 4.1.0.0.

5. Permanent Wetlands

5.0 5.0.0 5.0.0.0. 5.0.0.0.

6. Barren 6.0 6.0.0 6.0.0.0. 6.0.0.0.

7. Water Bodies 7.0 7.0.0 7.0.0.0. 7.0.0.0.

71

ANEXO III

CLASSES ADOPTADAS E CORRESPONDÊNCIA COM A

NOMENCLATURA LANDEO.

Código Classe de ocupação do solo Descrição/ caracterização

7 (1) Water Bodies (Corpos de água)

A ocupação do solo consiste em corpos de água naturais ou artificiais de água doce ou salgada

11 (2) Continuous Artificial Areas (Área urbana contínua)

A ocupação do solo consiste em áreas artificiais (e.g., edificações, estradas). Pelo menos 80% da área total deverá ser impermeável

12 (3) Descontinuous Artificial (Área urbana descontínua)

A ocupação do solo consiste em áreas artificiais (e.g., edificações, estradas). Entre 30-80% da área total deverá ser impermeável.

21+35 (4)

Rainfed Herbaceous Crops + Closed to Open Herbaceous Vegetation (Culturas agrícolas de sequeiro + vegetação herbácea natural)

A ocupação do solo consiste em culturas herbáceas de sequeiro. As culturas são colhidas anualmente e seguidas por um período de solo nu; A ocupação do solo consiste em vegetação herbácea que cobre mais que 15% do solo. A cobertura arbórea e arbustiva é inferior a 15%.

34 (5) Shrubland (Matos)

A ocupação do solo consiste em vegetação lenhosa (arbustos) que cobre mais que 15% do solo e tem menos de 5m de altura. A cobertura arbórea é inferior a 15%.

36 (6) Sparse Vegetation (Vegetação esparsa)

A ocupação do solo consiste m área naturais com vegetação com uma cobertura do solo entre 4-15%;

241 (7) Permanent Evergreen Crops (Culturas permanentes perenifólias)

A ocupação do solo consiste em culturas permanente perenifolias. e.g. pomares, olival

310 (8) New plantations (Novas plantações/arborizações)

A ocupação do solo consiste em árvores jovens, com altura inferior a 5 m. Geralmente as árvores estão dispostas em linhas de plantação.

311 (9) Broadleaved Closed Trees (Floresta fechada de folhosas)

A ocupação do solo consiste em árvores de espécies de folhosas com pelo menos 5m de altura e com uma cobertura do solo superior a 40%.

312 (10) Broadleaved Open Trees (Floresta aberta de folhosas)

A ocupação do solo consiste em árvores de espécies de folhosas com pelo menos 5m de altura e com uma cobertura do solo entre 15-40%.

72

ANEXO IV

MATRIZES DE CONFUSÃO DOS MAPAS POR AMOSTRA DE REFERÊNCIA – CMV/ABRIL+JULHO

73

1 2 3 4 5 6 7 8 9 10 Total1 10 0 0 0 0 0 0 0 0 0 102 0 6 2 1 0 0 0 0 0 0 93 0 1 2 0 0 0 1 0 1 0 54 0 7 13 21 4 13 10 13 4 3 885 6 4 5 2 17 1 5 11 20 7 786 0 3 1 2 0 5 3 4 1 1 207 0 0 2 1 0 0 1 0 0 0 48 0 3 7 2 1 5 1 5 0 2 269 0 0 0 0 3 0 1 1 6 2 13

10 0 2 1 8 6 3 6 11 6 4 47Total 16 26 33 37 31 27 28 45 38 19 300

26%

1 2 3 4 5 6 7 8 9 10 Total1 5 1 0 0 0 0 0 0 2 0 82 0 6 3 0 0 0 0 0 0 0 93 0 1 0 2 1 0 0 1 0 0 54 0 5 12 17 3 11 8 16 9 5 865 0 1 3 6 23 1 3 20 27 0 846 0 1 0 2 1 5 3 6 2 0 207 0 0 2 0 1 0 0 0 0 1 48 0 5 8 1 1 4 0 5 2 0 269 0 0 0 0 2 0 1 1 10 0 14

10 0 1 1 4 6 5 6 10 10 1 44Total 5 21 29 32 38 26 21 59 62 7 300

24%

MA

PA C

MV

/AB

RIL

MA

PA C

AD

/AB

RIL

Exactidão Global

Exactidão Global



1 2 3 4 5 6 7 8 9 10 Total1 6 0 1 0 1 0 0 0 0 0 82 1 4 2 0 0 1 0 1 0 0 93 0 1 2 0 0 0 0 2 0 0 54 1 4 6 16 1 12 27 16 0 4 875 3 2 12 2 29 0 14 9 6 5 826 0 1 2 2 2 5 3 3 0 2 207 0 0 1 0 0 1 1 1 0 0 48 2 3 1 2 0 4 3 11 0 0 269 0 0 0 0 1 0 0 0 11 2 14

10 1 0 2 1 5 4 12 2 7 11 45Total 14 15 29 23 39 27 60 45 24 24 300

32%

1 2 3 4 5 6 7 8 9 10 Total1 6 0 0 0 0 0 2 0 0 0 82 1 2 2 1 0 2 0 1 0 0 93 0 2 1 0 0 0 0 1 1 0 54 0 9 13 20 0 11 11 18 1 5 885 0 1 5 3 19 0 6 12 8 28 826 0 2 5 0 0 3 5 2 0 3 207 0 0 2 1 0 0 0 1 0 0 48 0 2 7 2 0 5 2 7 0 1 269 0 0 0 0 1 0 1 0 10 2 14

10 0 0 2 2 2 4 9 6 8 11 44Total 7 18 37 29 22 25 36 48 28 50 300

26%

MA

PA C

AD

/JU

LH

OM

APA

CM

V/J

UL

HO


Exactidão Global


Exactidão Global

74

1 2 3 4 5 6 7 8 9 10 Total1 10 0 0 0 0 0 0 0 0 0 102 2 5 1 0 0 0 0 1 0 0 93 0 1 3 0 0 0 0 0 0 0 44 2 11 11 19 1 14 12 7 0 12 895 12 4 9 3 20 1 5 11 7 6 786 0 2 0 2 1 7 4 0 1 3 207 0 1 1 1 0 0 1 0 0 0 48 2 5 3 3 0 6 1 6 0 0 269 0 0 0 0 0 0 1 0 11 2 14

10 2 1 2 3 5 4 7 4 9 9 46Total 30 30 30 31 27 32 31 29 28 32 300

30%

1 2 3 4 5 6 7 8 9 10 Total1 6 0 0 0 0 0 0 0 2 0 82 1 4 2 1 0 0 0 1 0 0 93 0 1 2 0 0 0 0 2 0 0 54 0 4 11 24 0 13 15 12 1 7 875 3 0 4 4 27 1 3 9 13 15 796 0 2 0 3 0 8 2 4 1 2 227 0 1 2 1 0 0 0 0 0 0 48 0 4 3 3 0 4 2 9 0 1 269 0 0 0 0 2 0 0 1 11 0 14

10 1 1 0 1 6 4 9 7 11 6 46Total 11 17 24 37 35 30 31 45 39 31 300

32%



Exactidão Global

Exactidão Global

MA

PA C

MV

/AB

RIL

+ J

UL

HO

MA

PA C

AD

/AB

RIL

+ J

UL

HO

1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 1 82 2 4 1 0 0 1 0 1 0 0 93 0 1 2 1 0 0 1 0 0 0 54 1 5 16 38 0 11 7 6 0 5 895 4 1 7 4 24 1 6 8 9 14 786 0 1 2 2 1 6 3 2 0 3 207 0 0 2 0 0 0 2 0 0 0 48 1 3 5 6 0 4 2 5 0 0 269 0 0 0 0 1 0 0 0 9 4 14

10 0 1 1 5 2 4 8 4 8 14 47Total 15 16 36 56 28 27 29 26 26 41 300

Exactidão Global 37%

1 2 3 4 5 6 7 8 9 10 Total1 6 0 1 0 1 0 0 0 0 0 82 1 5 1 1 0 0 0 1 0 0 93 0 1 0 1 0 0 2 0 0 1 54 2 15 6 24 1 8 14 8 0 10 885 0 1 5 4 28 1 3 5 9 26 826 0 2 0 1 0 6 2 4 2 3 207 0 0 1 1 0 0 1 0 0 1 48 0 9 4 2 0 2 2 5 0 2 269 0 0 0 0 3 0 0 1 10 0 14

10 0 1 1 1 5 4 6 3 10 13 44Total 9 34 19 35 38 21 30 27 31 56 300


MA

PA C

MV

/ND

VI

MA

PA C

MV

/ND

VI



75

1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 1 0 0 0 0 0 82 1 6 1 0 0 0 0 1 0 0 93 0 1 1 1 0 0 1 1 0 0 54 1 9 5 26 2 9 11 21 0 4 885 3 1 2 4 36 2 2 11 4 16 816 0 3 1 0 1 4 4 5 1 1 207 0 0 0 2 0 0 1 1 0 0 48 0 6 3 2 0 3 1 10 0 1 269 0 0 0 0 1 0 0 0 12 1 14

10 0 2 0 0 6 3 8 6 10 10 45Total 12 28 13 35 47 21 28 56 27 33 300


1 2 3 4 5 6 7 8 9 10 Total1 9 0 0 0 0 0 0 0 0 1 102 0 3 2 1 0 1 0 2 0 0 93 0 1 0 3 0 0 0 1 0 0 54 2 5 19 22 0 7 15 8 5 7 905 4 1 1 3 14 1 6 4 24 18 766 0 3 3 3 0 4 2 2 3 1 217 0 0 1 1 0 0 0 1 0 1 48 0 1 3 9 0 5 4 2 0 1 259 0 0 0 0 3 0 1 0 6 3 13

10 0 1 2 1 5 4 6 3 12 13 47Total 15 15 31 43 22 22 34 23 50 45 300


MA

PA C

MV

/CP

MA

PA C

AD

/CP



MATRIZES DE CONFUSÃO DOS MAPAS POR AMOSTRA DE

REFERÊNCIA – CMV/NDVI

1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 1 0 0 0 0 82 0 7 0 0 0 1 0 0 0 0 83 0 0 1 0 1 0 0 0 0 0 24 1 8 13 17 3 9 3 5 4 4 675 6 3 5 8 21 1 1 5 15 3 686 0 2 11 6 4 6 4 6 6 3 487 1 0 1 0 0 0 0 0 1 0 38 2 7 4 3 1 3 0 9 1 3 339 1 0 1 0 4 0 0 1 5 1 13

10 1 2 5 5 15 3 1 5 11 2 50Total 19 29 41 39 49 24 9 31 43 16 300

25%

1 2 3 4 5 6 7 8 9 10 Total1 8 0 0 0 0 0 0 0 0 0 82 0 7 1 0 0 0 0 0 0 0 83 0 0 1 0 0 0 0 0 0 1 24 0 5 16 7 9 7 4 12 3 4 675 1 2 2 2 23 0 2 14 19 4 696 0 2 2 3 8 7 6 13 4 3 487 0 0 1 0 0 0 0 1 1 0 38 0 8 6 2 1 1 0 12 2 1 339 0 0 0 0 1 0 0 3 8 0 12

10 0 5 1 4 9 1 2 12 15 1 50Total 9 29 30 18 51 16 14 67 52 14 300

25%

MA

PA C

MV

/AB

RIL

MA

PA C

AD

/AB

RIL



Exactidão Global

Exactidão Global

76

1 2 3 4 5 6 7 8 9 10 Total1 7 0 1 0 0 0 0 0 0 0 82 0 6 1 0 0 0 0 1 0 0 83 0 1 1 0 0 0 0 0 0 0 24 1 0 2 13 7 9 18 9 1 6 665 7 2 8 1 30 1 4 4 5 7 696 1 0 2 1 8 5 13 11 1 7 497 0 0 0 0 0 0 0 1 1 0 28 0 2 3 5 0 5 2 15 0 1 339 0 0 1 0 3 0 0 0 6 2 12

10 0 3 2 2 6 2 14 2 10 10 51Total 16 14 21 22 54 22 51 43 24 33 300

31%

1 2 3 4 5 6 7 8 9 10 Total1 5 0 1 0 0 0 1 0 0 1 82 0 3 5 0 0 0 0 0 0 0 83 0 0 2 0 0 0 0 0 0 0 24 1 2 6 21 0 6 19 10 1 2 685 2 0 4 2 17 1 7 1 9 22 656 1 0 12 2 2 2 13 5 1 8 467 0 0 0 0 0 0 0 1 0 2 38 0 1 11 1 0 2 3 15 0 0 339 0 0 0 0 2 0 0 0 5 5 12

10 0 1 4 1 2 3 6 7 10 21 55Total 9 7 45 27 23 14 49 39 26 61 300

30%



Exactidão Global

Exactidão Global

MA

PA C

MV

/JU

LH

OM

APA

CA

D/J

UL

HO

1 2 3 4 5 6 7 8 9 10 Total1 8 0 0 0 0 0 0 0 0 0 82 0 7 1 0 0 0 0 0 0 0 83 0 0 2 0 0 0 0 0 0 0 24 2 6 9 19 1 11 6 4 0 9 675 11 1 9 3 20 1 3 3 11 6 686 1 2 10 1 5 6 7 6 1 9 487 1 1 0 0 0 0 0 0 1 0 38 2 4 5 2 0 6 1 11 0 2 339 0 0 1 0 2 0 1 0 8 1 13

10 1 4 3 3 7 4 5 4 10 9 50Total 26 25 40 28 35 28 23 28 31 36 300

30%

1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 1 82 0 7 0 0 0 0 0 1 0 0 83 0 0 1 0 0 0 1 0 0 0 24 0 7 10 15 3 11 6 7 0 8 675 2 0 2 1 19 2 4 8 16 15 696 1 0 6 3 5 6 5 15 1 6 487 1 0 1 0 1 0 0 0 0 0 38 0 7 5 1 0 4 0 13 1 2 339 1 0 0 0 4 0 0 0 5 2 12

10 0 1 2 0 9 5 8 4 11 10 50Total 12 22 27 20 41 28 24 48 34 44 300

28%



MA

PA C

MV

/AB

RIL

+JU

LH

OM

APA

CA

D/A

BR

IL+J

UL

HO

Exactidão Global

Exactidão Global

77

1 2 3 4 5 6 7 8 9 10 Total1 8 0 0 0 0 0 0 0 0 0 82 1 6 1 0 0 0 0 0 0 0 83 0 1 1 0 0 0 0 0 0 0 24 3 8 10 19 1 12 10 2 0 3 685 9 2 5 3 17 2 6 7 9 7 676 2 2 9 4 5 6 6 6 2 5 477 1 1 0 0 0 0 0 0 1 0 38 3 5 4 2 0 6 1 10 0 2 339 2 0 0 0 3 0 1 0 5 2 13

10 1 5 0 2 4 4 6 5 13 11 51Total 30 30 30 30 30 30 30 30 30 30 300

28%

1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 1 0 0 0 82 0 6 1 0 0 0 0 1 0 0 83 0 0 1 0 0 0 0 0 0 1 24 2 15 6 14 1 7 8 8 0 6 675 2 2 0 2 24 1 3 8 10 14 666 0 1 5 4 5 5 6 10 0 12 487 0 0 1 0 0 0 0 0 0 2 38 0 7 6 2 0 4 2 11 1 0 339 0 0 0 0 4 0 0 1 5 2 12

10 0 2 2 1 6 4 3 6 11 18 53Total 11 33 22 23 40 21 23 45 27 55 300

30%



Exactidão Global

MA

PA C

MV

/ND

VI

MA

PA C

AD

/ND

VI

Exactidão Global

1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 1 0 0 0 0 0 82 0 7 1 0 0 0 0 0 0 0 83 0 1 0 0 1 0 0 0 0 0 24 2 12 3 17 4 6 8 13 0 3 685 8 2 3 4 31 1 1 4 6 10 706 1 0 2 3 8 6 6 12 1 8 477 1 0 0 0 0 0 0 1 0 1 38 1 7 2 3 0 4 0 13 0 3 339 1 0 0 0 4 0 0 0 6 1 12

10 0 3 0 4 6 3 4 5 13 11 49Total 21 32 11 31 55 20 19 48 26 37 300

33%

1 2 3 4 5 6 7 8 9 10 Total1 8 0 0 0 0 0 0 0 0 0 82 0 4 1 1 0 2 0 0 0 0 83 0 0 0 0 0 1 1 0 0 0 24 2 7 10 14 0 8 10 7 2 9 695 4 0 3 3 18 1 3 0 27 10 696 0 0 1 6 3 5 5 7 10 8 457 1 0 0 1 0 0 0 0 1 0 38 1 2 6 9 0 3 1 7 0 4 339 1 0 0 0 4 0 0 0 6 2 13

10 0 2 0 2 6 6 3 4 18 9 50Total 17 15 21 36 31 26 23 25 64 42 300

24%Exactidão Global



MA

PA C

AD

/CP

MA

PA C

MV

/CP

Exactidão Global

78

MATRIZES DE CONFUSÃO DOS MAPAS POR AMOSTRA DE REFERÊNCIA – CMV/CP

1 2 3 4 5 6 7 8 9 10 Total1 5 1 0 0 0 0 0 0 1 0 72 1 6 0 0 0 1 0 0 0 0 83 0 0 1 0 0 0 0 1 0 0 24 0 7 13 39 10 7 14 11 1 0 1025 4 2 5 4 23 1 1 9 20 9 786 1 1 2 2 0 8 2 4 1 2 237 0 0 0 1 0 0 0 0 0 0 18 1 0 4 3 0 3 1 13 0 1 269 0 0 0 0 3 0 0 0 7 2 12

10 0 0 5 7 9 4 2 4 6 4 41Total 12 17 30 56 45 24 20 42 36 18 300

35%

1 2 3 4 5 6 7 8 9 10 Total1 4 1 0 0 1 0 0 1 0 0 72 0 5 1 1 0 1 0 0 0 0 83 0 0 2 0 0 0 0 0 0 0 24 0 7 18 22 6 5 14 14 7 9 1025 1 2 1 2 16 1 2 23 28 1 776 0 3 1 0 2 8 1 6 2 0 237 0 0 0 0 0 0 0 0 0 1 18 0 2 8 1 1 4 0 9 0 2 279 0 0 0 0 0 0 0 0 11 0 11

10 0 3 3 1 3 1 3 14 9 5 42Total 5 23 34 27 29 20 20 67 57 18 300

27%

Exactidão Global

Exactidão Global

MA

PA C

AD

/AB

RIL

MA

PA C

MV

/AB

RIL



1 2 3 4 5 6 7 8 9 10 Total1 6 0 0 0 0 0 0 1 0 0 72 1 4 0 0 0 3 0 0 0 0 83 0 0 4 0 0 0 0 1 0 0 54 3 4 1 23 3 11 33 12 0 7 975 4 0 9 1 32 1 2 2 6 18 756 0 1 0 2 2 7 6 2 1 1 227 0 0 0 0 0 0 1 0 0 0 18 0 0 1 5 0 4 1 13 0 3 279 0 0 0 0 2 0 0 0 7 3 12

10 0 0 1 1 1 0 10 6 11 16 46Total 14 9 16 32 40 26 53 37 25 48 300

38%

1 2 3 4 5 6 7 8 9 10 Total1 6 0 1 0 0 0 0 0 0 0 72 1 2 3 0 0 1 0 1 0 0 83 0 1 3 0 0 0 0 0 0 0 44 1 5 13 16 1 11 26 14 3 7 975 1 0 5 0 14 1 16 2 7 28 746 0 0 4 0 0 3 8 4 0 3 227 0 0 0 1 0 0 0 1 0 0 28 0 0 5 1 0 3 3 12 1 2 279 0 0 0 0 1 0 1 0 7 2 11

10 0 0 5 0 0 1 9 4 11 18 48Total 9 8 39 18 16 20 63 38 29 60 300

27%



Exactidão Global

Exactidão Global

MA

PA C

AD

/JU

LH

OM

APA

CM

V/J

UL

HO

79

1 2 3 4 5 6 7 8 9 10 Total1 6 0 0 0 0 0 0 1 0 0 72 1 5 0 0 0 2 0 0 0 0 83 0 0 2 0 0 0 0 1 0 0 34 1 7 6 36 2 6 13 12 1 14 985 5 3 5 2 29 0 0 7 7 16 746 0 0 1 2 1 11 2 2 0 3 227 0 0 0 1 0 0 0 0 0 0 18 0 0 1 2 1 4 2 16 0 2 289 0 0 0 0 1 0 0 0 8 2 11

10 0 1 3 4 2 4 2 5 12 15 48Total 13 16 18 47 36 27 19 44 28 52 300

43%

1 2 3 4 5 6 7 8 9 10 Total1 5 0 0 0 1 0 0 1 0 0 72 1 4 0 0 0 2 0 1 0 0 83 0 0 1 0 0 0 0 1 0 0 24 0 5 11 23 2 12 21 13 1 10 985 3 1 0 2 35 0 3 12 10 13 796 1 0 0 1 1 9 3 7 0 2 247 0 0 0 1 0 0 0 0 0 0 18 0 5 7 1 0 3 0 6 0 4 269 0 0 0 0 3 0 0 0 7 0 10

10 1 1 3 1 1 2 3 6 11 16 45Total 11 16 22 29 43 28 30 47 29 45 300

35%

MA

PA C

AD

/AB

RIL

+JU

LH

OM

APA

CM

V/A

BR

IL+J

UL

HO



Exactidão Global

Exactidão Global

1 2 3 4 5 6 7 8 9 10 Total1 6 0 0 0 0 0 0 1 0 0 72 1 3 2 0 0 2 0 0 0 0 83 0 0 3 0 0 0 0 1 0 0 44 1 6 8 45 1 7 13 8 1 8 985 5 1 4 4 29 0 3 9 5 13 736 1 0 0 3 1 9 2 3 2 2 237 0 0 0 1 0 0 0 0 0 0 18 0 2 3 7 0 2 0 10 1 3 289 0 0 0 0 1 0 0 0 10 1 12

10 0 1 1 3 4 2 4 7 10 14 46Total 14 13 21 63 36 22 22 39 29 41 300

43%

1 2 3 4 5 6 7 8 9 10 Total1 6 0 0 0 0 0 1 0 0 0 72 1 4 0 0 0 2 0 1 0 0 83 0 0 3 0 0 0 0 0 0 0 34 1 19 10 27 2 3 19 8 1 8 985 1 1 3 1 26 0 2 11 7 26 786 0 0 0 0 1 9 3 7 0 3 237 0 0 0 1 0 0 0 0 0 0 18 0 7 5 3 0 2 0 6 0 4 279 0 0 0 0 1 0 0 0 7 2 10

10 0 1 3 0 3 2 3 6 9 18 45Total 9 32 24 32 33 18 28 39 24 61 300




MA

PA C

MV

/ND

VI

MA

PA C

AD

/ND

VI

Exactidão Global

80

1 2 3 4 5 6 7 8 9 10 Total1 6 0 0 0 0 0 0 1 0 0 72 1 5 0 0 0 2 0 0 0 0 83 0 0 1 1 0 0 0 0 0 0 24 2 16 17 25 3 5 20 9 0 2 995 17 1 6 1 24 4 0 5 9 9 766 2 0 0 0 1 12 3 5 0 0 237 0 0 0 1 0 0 0 0 0 0 18 1 7 6 2 0 3 0 6 0 2 279 0 0 0 0 0 0 0 0 12 0 12

10 1 1 0 0 2 4 7 4 9 17 45Total 30 30 30 30 30 30 30 30 30 30 300

36%

1 2 3 4 5 6 7 8 9 10 Total1 6 0 0 0 0 0 0 0 1 0 72 1 2 1 1 0 3 0 0 0 0 83 0 0 0 1 0 0 0 1 0 0 24 2 5 19 22 0 8 21 8 1 16 1025 1 1 0 4 25 1 4 6 18 16 766 1 0 2 3 0 6 1 2 3 3 217 0 0 1 1 0 0 0 0 0 0 28 0 0 6 8 0 2 2 5 2 3 289 0 0 0 0 7 0 0 0 3 0 10

10 0 0 3 4 4 3 7 2 13 8 44Total 11 8 32 44 36 23 35 24 41 46 300



Exactidão Global

MA

PA C

MV

/CP

MA

PA C

AD

/CP


MATRIZES DE CONFUSÃO DOS MAPAS POR AMOSTRA DE REFERÊNCIA – CAD/ABRIL+JULHO

1 2 3 4 5 6 7 8 9 10 Total1 8 0 0 0 0 0 0 0 0 1 92 0 7 0 0 0 0 0 0 0 0 73 0 0 3 1 0 0 0 1 0 0 54 0 8 24 25 5 4 11 12 4 2 955 2 0 9 7 22 1 4 7 22 2 766 0 1 0 1 0 4 0 1 0 1 87 0 0 0 0 0 0 0 0 0 0 08 0 4 6 5 2 1 2 8 1 1 309 0 0 1 1 7 0 0 1 11 0 21

10 0 0 5 7 8 6 5 6 9 3 49Total 10 20 48 47 44 16 22 36 47 10 300

30%

1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 1 1 0 92 0 5 1 0 0 1 0 0 0 0 73 0 1 1 1 0 0 0 1 0 0 44 0 13 25 18 8 3 7 12 1 7 945 6 2 5 4 24 1 3 12 18 3 786 0 1 0 1 0 5 0 0 1 0 87 0 0 0 0 0 0 0 0 0 0 08 0 1 5 0 2 5 2 11 4 1 319 2 0 0 0 5 0 0 2 8 3 20

10 1 2 6 2 6 4 4 10 9 5 49Total 16 25 43 26 45 19 16 49 42 19 300

28%


Exactidão Global


MA

PA C

MV

/AB

RIL

Exactidão Global

MA

PA C

AD

/AB

RIL

81

1 2 3 4 5 6 7 8 9 10 Total1 8 0 1 0 0 0 0 0 0 0 92 0 3 1 0 0 2 0 1 0 0 73 0 1 1 0 0 0 1 1 0 1 54 1 3 2 15 4 16 31 13 0 6 915 1 0 8 7 38 1 5 2 5 7 746 0 0 0 0 0 5 1 2 0 1 97 0 0 0 0 0 0 0 0 0 0 08 0 2 7 4 0 0 6 12 0 0 319 0 0 0 0 1 0 2 1 17 3 24

10 1 2 1 2 9 1 11 4 4 15 50Total 11 11 21 28 52 25 57 36 26 33 300

38%

1 2 3 4 5 6 7 8 9 10 Total1 5 0 0 0 1 0 1 0 1 1 92 0 3 2 0 0 2 0 0 0 0 73 0 1 1 1 0 0 2 0 0 0 54 0 10 8 25 0 5 16 20 2 6 925 1 2 5 3 26 0 12 4 6 13 726 0 1 0 0 0 6 1 1 0 1 107 0 0 0 0 0 0 0 0 0 0 08 0 0 9 2 0 1 4 13 1 0 309 0 0 0 0 1 0 4 1 15 2 23

10 0 1 1 2 1 3 10 8 4 22 52Total 6 18 26 33 29 17 50 47 29 45 300

39%



Exactidão Global

Exactidão Global

MA

PA C

MV

/JU

LH

OM

APA

CA

D/J

UL

HO

1 2 3 4 5 6 7 8 9 10 Total1 9 0 0 0 0 0 0 0 0 0 92 0 5 2 0 0 0 0 0 0 0 73 0 0 3 0 0 0 0 1 0 1 54 3 5 14 33 1 4 13 7 1 11 925 3 1 8 5 30 1 9 4 10 3 746 0 0 2 0 0 5 0 1 0 1 97 0 0 0 0 0 0 0 0 0 0 08 0 0 5 4 0 3 2 12 0 5 319 0 0 1 1 1 0 1 1 17 2 24

10 1 1 1 3 7 5 8 1 7 15 49Total 16 12 36 46 39 18 33 27 35 38 300

43%

1 2 3 4 5 6 7 8 9 10 Total1 9 0 0 0 0 0 0 0 0 0 92 0 3 2 0 0 1 0 1 0 0 73 0 0 3 0 0 0 0 2 0 0 54 2 16 14 20 0 12 16 8 1 3 925 12 4 5 2 21 2 5 6 7 7 716 0 0 1 0 0 8 0 0 0 1 107 0 0 0 0 0 0 1 0 0 0 18 0 5 4 3 0 3 2 12 0 1 309 2 0 0 3 2 0 0 0 16 2 25

10 3 3 0 2 4 9 6 2 4 17 50Total 28 31 29 30 27 35 30 31 28 31 300

37%


Exactidão Global


MA

PA C

MV

/AB

RIL

+JU

LH

O

Exactidão Global

MA

PA C

AD

/AB

RIL

+JU

LH

O

82

1 2 3 4 5 6 7 8 9 10 Total1 9 0 0 0 0 0 0 0 0 0 92 0 2 3 0 0 2 0 0 0 0 73 0 0 3 0 0 0 0 1 0 1 54 2 2 13 39 1 5 17 8 1 6 945 2 1 6 6 34 1 10 3 7 3 736 0 0 2 0 0 5 0 1 0 1 97 0 0 0 0 0 0 0 0 0 0 08 0 0 7 5 0 4 2 10 0 2 309 0 0 0 2 1 0 2 0 17 2 24

10 1 1 2 4 5 5 6 2 9 14 49Total 14 6 36 56 41 22 37 25 34 29 300

44%

1 2 3 4 5 6 7 8 9 10 Total1 8 0 0 0 0 0 0 0 1 0 92 0 3 3 0 0 0 0 1 0 0 73 0 0 1 4 0 0 0 0 0 0 54 1 26 10 23 1 3 13 5 0 13 955 6 3 4 4 29 1 7 5 5 10 746 0 0 0 0 1 6 0 0 0 1 87 0 0 0 0 0 0 0 0 0 0 08 0 4 7 9 0 2 2 4 0 1 299 0 0 0 1 3 0 0 1 17 1 23

10 1 4 2 0 2 6 3 3 6 23 50Total 16 40 27 41 36 18 25 19 29 49 300

38%


Exactidão Global


MA

PA C

AD

/ND

VI

Exactidão Global

MA

PA C

MV

/ND

VI

1 2 3 4 5 6 7 8 9 10 Total1 8 0 0 0 1 0 0 0 0 0 92 0 2 3 0 0 2 0 0 0 0 73 0 0 3 2 0 0 0 0 0 0 54 2 12 9 33 4 5 11 12 0 4 925 2 1 3 7 37 1 5 6 6 5 736 0 1 0 1 0 5 0 0 0 1 87 0 0 0 0 0 0 1 0 0 0 18 0 1 1 3 0 3 3 20 0 0 319 0 0 0 0 2 0 1 2 18 2 25

10 1 1 1 4 8 3 8 5 6 12 49Total 13 18 20 50 52 19 29 45 30 24 300

46%

1 2 3 4 5 6 7 8 9 10 Total1 9 0 0 0 0 0 0 0 0 0 92 0 2 2 1 0 2 0 0 0 0 73 0 1 1 3 0 0 0 0 0 0 54 0 4 21 20 0 12 10 11 4 13 955 0 0 3 8 20 1 7 4 21 14 786 0 1 2 0 1 4 0 0 0 0 87 0 0 0 0 0 0 0 0 0 0 08 0 3 5 6 0 2 4 6 1 2 299 0 0 0 2 5 0 0 0 10 3 20

10 0 1 3 5 3 5 5 2 14 11 49Total 9 12 37 45 29 26 26 23 50 43 300



Exactidão Global

MA

PA C

AD

/CP

MA

PA C

MV

/CP


83

MATRIZES DE CONFUSÃO DOS MAPAS POR AMOSTRA DE REFERÊNCIA – CAD/NDVI

1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 0 72 0 3 0 0 0 0 0 0 1 0 43 0 0 0 0 0 0 0 0 0 0 04 0 3 11 25 1 5 15 6 2 2 705 4 1 8 9 22 4 4 10 9 10 816 0 1 1 1 0 7 3 4 1 0 187 0 0 0 3 1 0 1 1 1 0 78 0 2 7 3 1 7 0 11 1 0 329 2 0 0 2 7 1 0 3 7 1 23

10 0 0 0 8 11 5 1 14 13 6 58Total 13 10 27 51 43 29 24 49 35 19 300


1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 0 72 0 3 0 0 0 0 0 0 1 0 43 0 0 0 0 0 0 0 0 0 0 04 0 7 23 9 3 2 9 8 4 6 715 3 4 4 6 15 3 3 23 17 3 816 0 1 2 1 1 8 3 2 0 0 187 0 0 1 1 0 0 0 1 3 1 78 0 4 5 3 1 9 1 6 2 1 329 2 1 0 1 5 1 0 4 7 2 23

10 0 0 6 2 7 5 3 17 11 6 57Total 12 20 41 23 32 28 19 61 45 19 300




MA

PA C

AD

/AB

RIL

MA

PA C

MV

/AB

RIL

1 2 3 4 5 6 7 8 9 10 Total1 6 0 0 0 0 1 0 0 0 0 72 0 3 0 0 0 0 0 0 1 0 43 0 0 0 0 0 0 0 0 0 0 04 3 2 1 12 6 10 22 13 0 2 715 3 1 8 2 30 3 6 8 5 13 796 0 0 1 1 2 4 3 6 0 1 187 0 0 0 0 0 0 5 1 0 1 78 0 3 3 3 0 9 1 11 0 2 329 0 0 3 0 5 1 0 1 10 3 23

10 1 2 1 1 9 4 7 7 7 20 59Total 13 11 17 19 52 32 44 47 23 42 300


1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 0 72 0 1 1 0 0 1 0 0 0 1 43 0 0 0 0 0 0 0 0 0 0 04 2 4 7 9 0 6 19 17 0 7 715 0 2 5 4 11 0 15 6 9 28 806 0 1 3 1 0 3 2 4 2 2 187 0 0 0 1 0 0 3 2 0 1 78 0 5 7 1 0 5 2 10 2 0 329 0 0 3 0 3 0 0 1 13 3 23

10 1 1 8 0 5 0 16 4 9 14 58Total 10 14 34 16 19 15 57 44 35 56 300


MA

PA C

MV

/JU

LH

OM

APA

CA

D/J

UL

HO



84

1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 0 72 0 3 0 0 1 0 0 0 0 0 43 0 0 1 0 0 0 0 0 0 0 14 0 4 6 23 3 4 20 5 0 6 715 3 0 8 5 27 3 9 8 5 11 796 0 0 1 1 1 7 3 4 0 1 187 0 0 0 3 0 0 2 1 0 1 78 0 2 3 4 0 10 2 9 1 1 329 0 0 1 2 4 0 3 1 10 2 23

10 1 0 3 7 7 2 5 6 11 16 58Total 11 9 23 45 43 26 44 34 27 38 300


1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 0 72 0 3 0 0 1 0 0 0 0 0 43 0 0 0 0 0 0 0 0 0 0 04 0 4 10 18 6 8 13 6 0 6 715 3 1 4 4 18 4 7 11 9 20 816 0 0 0 2 0 10 2 2 0 2 187 0 0 1 1 0 0 3 1 0 1 78 0 3 5 2 0 10 2 8 1 1 329 2 0 0 1 2 2 1 2 12 1 23

10 0 0 4 6 8 4 6 11 8 10 57Total 12 11 24 34 35 38 34 41 30 41 300


MA

PA C

MV

/AB

RIL

+JU

LH

OM

APA

CA

D/A

BR

IL+J

UL

HO



1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 0 72 0 3 0 0 1 0 0 0 0 0 43 0 0 1 0 0 0 0 0 0 0 14 0 1 6 35 2 6 15 3 0 3 715 2 0 8 8 20 3 5 10 9 14 796 0 0 0 2 1 8 2 4 0 1 187 0 0 0 4 0 0 1 1 0 1 78 0 5 2 6 0 8 2 7 1 1 329 1 0 0 2 5 0 0 2 9 4 23

10 0 0 0 11 6 2 6 6 11 16 58Total 10 9 17 68 35 27 31 33 30 40 300


1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 0 72 0 3 0 0 1 0 0 0 0 0 43 0 0 1 0 0 0 0 0 0 0 14 7 15 5 22 2 3 11 2 0 3 705 11 3 11 3 18 3 3 8 9 12 816 1 1 2 0 0 9 2 1 0 2 187 0 0 0 1 0 0 5 1 0 0 78 0 6 7 2 0 9 1 6 1 0 329 2 0 1 0 2 2 2 1 12 1 23

10 2 2 3 2 7 4 6 11 8 12 57Total 30 30 30 30 30 30 30 30 30 30 300




MA

PA C

MV

/ND

VI

MA

PA C

AD

/ND

VI

85

1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 0 72 0 3 0 0 0 0 0 0 1 0 43 0 0 0 0 0 0 0 0 0 0 04 0 10 6 31 7 0 9 7 0 1 715 4 2 5 1 34 0 3 16 6 9 806 0 1 0 2 1 8 1 5 0 0 187 0 0 0 2 0 0 2 1 0 2 78 0 7 1 3 0 8 0 10 0 3 329 0 0 0 0 5 0 1 4 9 4 23

10 0 1 0 4 10 2 5 14 9 13 58Total 11 24 12 43 57 18 21 57 25 32 300


1 2 3 4 5 6 7 8 9 10 Total1 7 0 0 0 0 0 0 0 0 0 72 0 3 0 0 0 0 0 0 0 1 43 0 0 0 0 0 0 0 0 0 0 04 1 3 13 14 0 6 14 8 1 11 715 2 1 7 8 11 0 6 4 23 19 816 0 0 1 3 0 6 3 1 1 3 187 0 0 1 1 0 0 3 2 0 0 78 0 1 6 5 0 9 3 3 4 1 329 1 0 1 0 5 1 2 1 8 4 23

10 2 0 6 1 5 3 2 8 12 18 57Total 13 8 35 32 21 25 33 27 49 57 300


MA

PA C

MV

/CP


MA

PA C

AD

/CP


MATRIZES DE CONFUSÃO DOS MAPAS POR AMOSTRA DE

REFERÊNCIA – CAD/CP

1 2 3 4 5 6 7 8 9 10 Total1 4 2 0 0 0 0 0 0 0 0 62 2 2 0 0 0 0 0 0 0 0 43 0 1 0 2 0 0 0 0 0 0 34 1 8 9 15 4 1 9 10 5 1 635 1 1 10 10 18 3 2 6 16 2 696 1 5 3 7 2 11 4 5 3 0 417 0 1 2 0 3 0 1 0 0 0 78 2 3 7 8 4 3 1 11 4 0 439 0 0 0 3 6 0 0 1 5 0 15

10 1 6 7 11 6 4 0 7 4 3 49Total 12 29 38 56 43 22 17 40 37 6 300


MA

PA C

MV

/AB

RIL


act dão G oba 23%

1 2 3 4 5 6 7 8 9 10 Total1 4 1 0 0 0 1 0 0 0 0 62 1 2 0 0 0 0 0 0 1 0 43 0 1 0 2 0 0 0 0 0 0 34 1 4 15 9 7 2 8 11 6 1 645 1 3 5 4 17 3 2 15 12 2 646 1 3 3 3 5 13 4 5 3 2 427 0 0 1 1 1 0 2 2 0 0 78 1 6 4 2 3 3 1 17 5 2 449 0 0 0 0 7 1 1 1 2 3 15

10 0 5 2 6 6 4 2 12 8 6 51Total 9 25 30 27 46 27 20 63 37 16 300


MA

PA C

AD

/AB

RIL


86

1 2 3 4 5 6 7 8 9 10 Total1 4 1 0 0 0 0 1 0 0 0 62 1 2 0 0 0 0 0 1 0 0 43 0 0 0 0 0 0 1 1 0 1 34 2 10 2 12 1 3 17 14 0 1 625 0 0 3 1 28 2 10 8 7 10 696 0 0 3 7 6 6 10 7 0 2 417 0 1 0 0 1 0 2 3 0 0 78 0 2 3 6 3 5 4 16 1 3 439 0 1 0 0 5 0 4 0 3 2 15

10 1 0 6 3 7 3 16 7 3 4 50Total 8 17 17 29 51 19 65 57 14 23 300


1 2 3 4 5 6 7 8 9 10 Total1 3 1 0 0 0 0 0 0 1 1 62 1 1 1 0 0 0 1 0 0 0 43 0 0 0 0 0 0 1 2 0 0 34 0 5 9 14 0 5 12 13 0 4 625 0 0 8 2 14 0 8 5 10 19 666 0 3 5 5 1 6 10 8 0 3 417 0 1 1 1 0 1 0 2 0 1 78 0 2 9 5 0 0 4 11 7 7 459 0 0 0 0 2 0 4 2 3 4 15

10 0 0 7 3 1 4 13 9 7 7 51Total 4 13 40 30 18 16 53 52 28 46 300


MA

PA C

MV

/JU

LH

OM

APA

CA

D/J

UL

HO



1 2 3 4 5 6 7 8 9 10 Total1 4 1 1 0 0 0 0 0 0 0 62 2 2 0 0 0 0 0 0 0 0 43 0 1 0 0 0 0 1 0 0 1 34 3 3 6 23 1 1 13 5 0 7 625 3 1 4 5 20 1 7 8 7 13 696 1 1 6 1 4 13 6 5 0 4 417 0 1 2 2 1 0 1 0 0 0 78 1 1 9 7 4 4 2 11 1 3 439 0 0 0 3 6 0 2 0 3 1 15

10 1 2 10 6 8 4 5 1 2 11 50Total 15 13 38 47 44 23 37 30 13 40 300


1 2 3 4 5 6 7 8 9 10 Total1 3 0 0 0 1 1 0 0 1 0 62 1 2 0 0 0 0 0 0 0 1 43 0 1 2 0 0 0 0 0 0 0 34 0 4 8 16 0 3 9 10 0 12 625 1 1 2 4 25 1 3 10 10 10 676 1 4 4 3 1 12 7 3 0 6 417 0 1 1 2 0 0 3 0 0 1 88 0 5 4 3 0 4 4 10 3 11 449 0 1 1 2 5 0 0 0 4 2 15

10 0 1 3 5 5 5 5 12 5 9 50Total 6 20 25 35 37 26 31 45 23 52 300




MA

PA C

MV

/AB

RIL

+JU

LH

OM

APA

CA

D/A

BR

IL+J

UL

HO

87

1 2 3 4 5 6 7 8 9 10 Total1 4 1 1 0 0 0 0 0 0 0 62 2 2 0 0 0 0 0 0 0 0 43 0 1 0 0 0 0 1 0 0 1 34 2 3 6 29 1 1 14 4 0 3 635 2 1 0 8 19 1 9 6 9 12 676 1 1 6 6 3 13 3 5 0 4 427 0 0 3 2 1 0 2 0 0 0 88 1 1 8 10 2 4 1 11 2 3 439 0 0 0 2 7 0 1 1 3 1 15

10 1 3 5 7 5 3 7 5 1 12 49Total 13 13 29 64 38 22 38 32 15 36 300


1 2 3 4 5 6 7 8 9 10 Total1 3 0 1 0 1 1 0 0 0 0 62 1 2 0 0 0 0 1 0 0 0 43 0 1 0 0 0 0 0 0 0 2 34 0 9 6 21 2 2 13 9 0 3 655 1 2 2 2 18 1 1 12 10 16 656 0 7 1 3 2 10 5 6 1 7 427 0 0 1 1 0 0 3 1 0 1 78 1 8 6 5 1 2 4 10 2 4 439 0 0 1 0 4 0 2 1 3 4 15

10 0 3 3 6 4 3 5 14 4 8 50Total 6 32 21 38 32 19 34 53 20 45 300




MA

PA C

MV

/ND

VI

MA

PA C

AD

/ND

VI

1 2 3 4 5 6 7 8 9 10 Total1 4 1 1 0 0 0 0 0 0 0 62 1 1 1 0 0 0 0 1 0 0 43 0 1 0 1 0 0 1 0 0 0 34 1 4 8 25 2 1 10 11 0 0 625 2 1 1 5 26 2 4 12 6 10 696 0 5 3 5 5 9 5 7 1 1 417 0 0 1 2 1 0 2 2 0 0 88 1 4 4 5 2 3 1 15 3 5 439 0 0 0 1 5 0 3 3 3 0 15

10 1 4 3 7 6 3 4 14 1 6 49Total 10 21 22 51 47 18 30 65 14 22 300


1 2 3 4 5 6 7 8 9 10 Total1 4 1 0 0 0 1 0 0 0 0 62 2 2 0 0 0 0 0 0 0 0 43 0 0 2 0 0 1 0 0 0 0 34 8 10 9 14 0 3 10 7 2 2 655 4 2 3 6 17 2 3 6 12 9 646 2 4 2 1 1 15 8 2 4 4 437 2 2 0 1 1 0 1 0 0 0 78 2 1 8 4 1 6 3 7 7 5 449 1 0 1 1 8 0 1 0 3 0 15

10 5 8 5 3 2 2 4 8 2 10 49Total 30 30 30 30 30 30 30 30 30 30 300


MA

PA C

MV

/CP

MA

PA C

AD

/CP



88

Documents

Análise Comparativa de Classificadores para Cartografia de ... · produção de cartografia de ocupação do solo, numa área confinada ao concelho de Almodôvar, Região do Baixo