14
¹Mestre em Ciências Ambientais, Universidade do Estado do Pará (UEPA), Belém, PA, Brasil. ([email protected]) ²Doutor em Engenharia Elétrica, Programa de Pós Graduação em Ciências Ambientais, Universidade do Estado do Pará (UEPA), Belém, Pará, Brasil. ([email protected]) ³Doutora em Engenharia Elétrica, Programa de Pós Graduação em Ciências Ambientais, Universidade do Estado do Pará (UEPA), Belém, Pará, Brasil. ([email protected]) APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS Wanderson Gonçalves e Gonçalves 1 José Alberto Silva de Sá 2 Hebe Morganne Campos Ribeiro 3 As degradações ambientais provenientes das ações antrópicas são uma ameaça para o equilíbrio e conservação da floresta Amazônica. Portanto os serviços de monitoramento ambiental assumem importante papel quanto à preservação e manutenção deste ambiente. O presente estudo avaliou a eficiência de um classificador automático para duas tipologias florestais, Floresta Ombrófila Densa de Terras Baixas e Dossel Emergente (Dbe) e Floresta Ombrófila Densa de Terras Baixas e Dossel Emergente mais Aberta com Palmeiras (Dbe + Abp), pertencentes ao Conjunto de Glebas Mamuru- Arapiuns, localizadas entre os municípios de Santarém, Juruti e Aveiro, no estado do Pará-Brasil, abrangendo uma área aproximadamente igual a 600.000 hectares. A classificação automática foi baseada em uma metodologia integrada por uma técnica de aprendizado de máquina denominada Máquina de Vetores de Suporte (Support Vector Machine), dados de inventário florestal, fornecido pelo Instituto de Desenvolvimento Florestal e da Biodiversidade do Estado do Pará (IDEFLOR- BIO) e imagens correspondentes das bandas 3, 4 e 5 do sensor do satélite LandSat 5 TM. As imagens de satélite foram mosaicadas e compostas no software livre Quantum GIS (QGIS) 2.8 Wien e os pontos centrais de cada amostra do inventário florestal foram vinculados às imagens. Posteriormente foram extraídos os Digital Numbers (DN) dos pixels, compondo o banco de dados que alimentou o processo de treinamento e teste do classificador. O classificador foi compilado no software Orange Data Mining 3.3. Os resultados do classificador foram considerados satisfatórios, sendo obtidos os valores avaliativos de Acurácia Global igual a 86%, Índice F1 igual a 0,863, e Coeficiente Kappa igual a 72%, todos indicando uma qualidade de classificação considerada muito boa. Avaliou-se, também, a eficiência do classificador pelo gráfico ROC (características do receptor operacional), obtendo-se proximidades consideráveis aos classificadores ideais, demonstrando a eficiência desta metodologia no diagnóstico e auxílio na tomada de decisões de áreas de grandes extensões na região Amazônica. Palavras Chave: classificação automática, máquina de vetores de suporte, sensoriamento remoto, inventário florestal, região Amazônica

APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

Embed Size (px)

Citation preview

Page 1: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

¹Mestre em Ciências Ambientais, Universidade do Estado do Pará (UEPA), Belém, PA, Brasil.

([email protected])

²Doutor em Engenharia Elétrica, Programa de Pós Graduação em Ciências Ambientais,

Universidade do Estado do Pará (UEPA), Belém, Pará, Brasil. ([email protected])

³Doutora em Engenharia Elétrica, Programa de Pós Graduação em Ciências Ambientais,

Universidade do Estado do Pará (UEPA), Belém, Pará, Brasil. ([email protected])

APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA

CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

Wanderson Gonçalves e Gonçalves1

José Alberto Silva de Sá2

Hebe Morganne Campos Ribeiro

3

As degradações ambientais provenientes das ações antrópicas são uma ameaça para o equilíbrio e

conservação da floresta Amazônica. Portanto os serviços de monitoramento ambiental assumem

importante papel quanto à preservação e manutenção deste ambiente. O presente estudo avaliou a

eficiência de um classificador automático para duas tipologias florestais, Floresta Ombrófila Densa

de Terras Baixas e Dossel Emergente (Dbe) e Floresta Ombrófila Densa de Terras Baixas e Dossel

Emergente mais Aberta com Palmeiras (Dbe + Abp), pertencentes ao Conjunto de Glebas Mamuru-

Arapiuns, localizadas entre os municípios de Santarém, Juruti e Aveiro, no estado do Pará-Brasil,

abrangendo uma área aproximadamente igual a 600.000 hectares. A classificação automática foi

baseada em uma metodologia integrada por uma técnica de aprendizado de máquina denominada

Máquina de Vetores de Suporte (Support Vector Machine), dados de inventário florestal, fornecido

pelo Instituto de Desenvolvimento Florestal e da Biodiversidade do Estado do Pará (IDEFLOR-

BIO) e imagens correspondentes das bandas 3, 4 e 5 do sensor do satélite LandSat 5 TM. As

imagens de satélite foram mosaicadas e compostas no software livre Quantum GIS (QGIS) 2.8 Wien

e os pontos centrais de cada amostra do inventário florestal foram vinculados às imagens.

Posteriormente foram extraídos os Digital Numbers (DN) dos pixels, compondo o banco de dados

que alimentou o processo de treinamento e teste do classificador. O classificador foi compilado no

software Orange Data Mining 3.3. Os resultados do classificador foram considerados satisfatórios,

sendo obtidos os valores avaliativos de Acurácia Global igual a 86%, Índice F1 igual a 0,863, e

Coeficiente Kappa igual a 72%, todos indicando uma qualidade de classificação considerada muito

boa. Avaliou-se, também, a eficiência do classificador pelo gráfico ROC (características do receptor

operacional), obtendo-se proximidades consideráveis aos classificadores ideais, demonstrando a

eficiência desta metodologia no diagnóstico e auxílio na tomada de decisões de áreas de grandes

extensões na região Amazônica.

Palavras Chave: classificação automática, máquina de vetores de suporte, sensoriamento remoto,

inventário florestal, região Amazônica

Page 2: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

INTRODUÇÃO

A região Amazônica possui enorme influência quanto aos serviços ambientais e de

manutenção dos ciclos naturais que afetam diretamente o ambiente. As degradações ambientais

provenientes das ações antrópicas são uma ameaça para o equilíbrio e conservação da floresta, logo,

estudos voltados à região amazônica promovem a obtenção de conhecimentos ambientais para o

auxílio da tomada de decisão quanto ao desenvolvimento regional (Couto et al., 2004).

A obtenção de dados provenientes do mapeamento da cobertura da terra é fundamental para os

estudos em gestão ambiental, na análise da biodiversidade e como ferramenta de apoio à aplicação

de políticas públicas (Sousa et al., 2010).

Os estudos sobre classificação florestal, porém, abordam muito mais os fatores econômicos,

valorizando espécies arbóreas valorizadas comercialmente, do que fatores ecológicos, limitando os

estudos das diversas tipologias florestais, que poderiam influenciar em decisões acerca da

recuperação de áreas de preservação (Socher et al., 2008; Silveira et al., 2008).

A variação espacial dentro e entre as vegetações são exigência nas metodologias de inventário

florestal, porém, atualmente, os dados para avaliar esta variação são bastante limitados bem como os

fatores ecológicos que podem influenciar estas variações (Perring et al., 2015).

Atualmente, com o crescente desenvolvimento e evolução dos aparatos tecnológicos

relacionados a imagens de sensoriamento remoto e de processamento de imagens, alcançou-se um

melhor conhecimento das características estruturais das florestas (Watzlawick et al., 2009).

Desta maneira, faz-se necessário a utilização de técnicas de classificação adequadas ao

estudo pretendido. As Máquinas de Vetores de Suporte (SVM) têm sido usadas com sucesso em

diferentes áreas da conhecimento, com a associação de dados de sensoriamento remoto (Sousa et al.,

2010; Frate e Solimini, 2003; Haykin, 2001).

Na área de conhecimento nomeada de inteligência computacional (IA), está inserido o

aprendizado de máquina que têm por objetivo o desenvolvimento de máquinas inteligentes para a

realização dos mais variados tipos de tarefas através da criação e aprimoramento de métodos,

técnicas e ferramentas. (Sousa et al., 2010).

Máquinas de vetores de suporte (SVM) têm se mostrado como uma alternativa interessante

para a modelagem matemática de sistemas complexos. São técnicas simples em sua base conceitual

e com capacidade de resolução de problemas reais extremamente complexos (Cordeiro et al., 2015).

Page 3: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

Sousa et al. (2010), utilizaram algoritmos baseados em aprendizado de máquina (Multi

Layer Perceptron (MLP) e o Support Vector Machine (SVM)) e do método da Máxima

Verossimilhança, associados a imagens do satélite LandSat 5 TM com o objetivo de classificação do

uso e cobertura da terra no bioma caatinga, os resultados dos classificadores baseados em

aprendizado de máquina apresentaram maior acurácia quando comparados ao classificador

tradicional da Máxima Verossimilhança. Cordeiro et al., (2015) compararam as metodologias de

aplicação de redes neurais artificiais e máquina de vetores de suporte às estimativas volumétricas de

Acacia mangium, concluindo que as metodologias de RNA e SVM, que diferem da tradicional,

apresentaram resultados estatisticamente superiores.

Várias pesquisas utilizam Máquina de Vetores de Suporte para classificação de diversas

classes de informação. O presente trabalho classificou dois estratos florestais, através de inventário

florestal, cedido pelo Instituto de Desenvolvimento Florestal e da Biodiversidade do Estado do Pará

(IDEFLOR-BIO), e à imagens do Satélite LandSat 5TM, por meio de SVM.

Objetivou-se avaliar o desempenho desta técnica de inteligência computacional na

classificação de dois estratos florestais, Floresta Ombrófila Densa de Terras baixas Dossel

emergente (Dbe) e Floresta Ombrófila Densa Terras baixas Dossel emergente + Aberta com

palmeiras (Dbe + Abp), no conjunto de glebas estaduais Mamuru-Arapiuns – Pará, com uma

metodologia integrada envolvendo conhecimentos de inventário florestal, sensoriamento remoto e

inteligência computacional com a finalidade de encontrar padrões entre os dados de refletância e os

dados reais do levantamento de campo, afim de contribuir para a tomada de decisões e o

desenvolvimento regional.

MATERIAL E MÉTODOS

Área de estudo

As informações acerca da área de estudo foi disponibilizada pelo Instituto de

Desenvolvimento e Biodiversidade Florestal do Estado do Pará (IDEFLOR-BIO). A região de

estudo localiza-se no Estado do Pará, entre os municípios de Santarém, Juruti e Aveiro, no Conjunto

Page 4: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

de Glebas Estaduais Mamuru-Arapiuns, com uma área de aproximadamente 600.000 hectares

(Figura 1).

Figura 1. Mapa de Localização do Conjunto de Glebas Mamuru-Arapiuns.

Fonte: Silva et al. (2014).

Material

Neste estudo, foram usadas as bandas 3, 4 e 5 do satélite LandSat 5TM (Thematic Mapper),

obtidas no site USGS (earthexplorer.usgs.gov, espa.cr.usgs.gov), de órbita/ponto 228/62 e 228/63,

com a data de 23/10/2009, com resolução espacial de 30 x 30 m. As imagens selecionadas foram

escolhidas seguindo o critério de compatibilidade entre a data de aquisição da imagem pelo satélite e

a data de execução do inventário florestal, com o objetivo de minimizar as variações temporais nas

tipologias florestais. Logo, tanto o inventário florestal, quanto as imagens são do ano de 2009.

Fizeram-se necessárias a utilização de duas cenas, devido haver pontos distribuídos ao logo das

mesmas.

Page 5: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

Inventário Florestal

A amostragem seguiu o definido pelo Serviço Florestal Brasileiro. As amostragens foram do

tipo Amostragem Estratificada (Figura 2). A Amostragem Estratificada foi adotada para as

tipologias florestais predominantes, Floresta Ombrófila Densa Terras baixas Dossel emergente

(Dbe) e Floresta Ombrófila Densa Terras baixas Dossel emergente + Aberta com palmeiras (Dbe +

Abp), onde foram distribuídos aleatoriamente 30 conglomerados (15 unidades para cada estrato),

sendo que cada unidade é constituída de 8 subunidades de 20 x 200 m cada.

Figura 2. A) Representação da amostragem estratificada e B) Representação da subunidade da

amostragem.

Fonte: Adaptado de Seat Terraplanagem (2010).

Metodologia no QGis

A montagem do mosaico e a composição das cenas do LandSat 5 TM foram realizadas pelo

software QGIS 2.8 Wien (2015). Os alvos centrais das subunidades e dos conglomerados foram

plotados nas cenas de satélite, no Sistema de coordenadas de referência (SRC) WGS 84, em seguida

foram extraídos os Digital Number (DN) de cada pixel constituintes das subunidades de cada estrato

florestal, referentes às bandas 3, 4 e 5 e o Normalized Difference Vegetation Index (NDVI)

compondo a massa de dados.

Page 6: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

O NDVI foi calculado de acordo com Rouse et al. (1973), usando-se a banda 4 (B4) e a banda

3 (B3), segundo a equação1:

𝑁𝐷𝑉𝐼 =(𝐵4 − 𝐵3)

(𝐵4 + 𝐵3)

(1)

Os Digital Numbers (DN) foram obtidos com a seguinte metodologia: As dimensões das

subunidades de cada conglomerado são de 20 x 200 m, porém, como as dimensões dos pixels do

satélite LandSat 5 TM são de 30 x 30 m, optou-se por selecionar sete pixels a partir do ponto central

para cobrir toda a área de cada subunidade amostral, totalizando 210 m por subunidade. Desta

maneira as planilhas de dados foram formadas pelas colunas contendo as coordenadas da região, os

valores de DN das bandas 3, 4 e 5, e o NDVI.

Posteriormente os dados foram normalizados com o propósito de reduzir as discrepâncias

entre os valores de entrada, utilizando-se a normalização min-max, que transformou os valores

originais das variáveis de entrada em valores normalizados no intervalo [0, 1].

Foram selecionados de maneira aleatória dois conjuntos de amostras independentes, um para

treinamento e outro para teste do classificador SVM. O número de amostras para o treinamento foi

igual a 400, sendo 200 amostras para cada classe e o número de amostras para o teste foi igual a

100, sendo 50 amostras para cada classe, portanto as massas de treinamento e teste foram

balanceadas.

Máquina de Vetores de Suporte

A máquina de vetores de suporte (SVM, Support Vector Machine) é uma máquina de

aprendizagem que pode ser usada nos problemas de regressão ou classificação. Ela utiliza um

procedimento construtivo universal de aprendizagem baseado na teoria de aprendizado estatístico

(Nunes et al., 2011; Cortes & Vapnik, 1995).

As SVMs podem implementar um mapeamento não-linear dos dados de entrada para um

espaço de características de maior dimensão, determinando hiperplanos ótimos neste espaço. Este

Page 7: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

mapeamento leva então à separação não-linear dos dados no espaço de entradas em duas ou mais

classes e pode ser feito mediante funções denominadas kernels.

Os kernels mais utilizados na prática são os polinomiais, os de função de base radial (RBF,

radial basis function) e os sigmoidais. A escolha do kernel afeta o desempenho do classificador

obtido, pois eles definem a fronteira de decisão do classificador, entretanto conforme exposto por

Hsu et al. (2003) uma boa escolha inicial é empregar o kernel RBF, uma vez que o kernel

polinomial pode ser considerado um caso especial de função RBF (Keerthi e Lin, 2003) e o kernel

sigmoidal pode ter comportamento semelhante ao kernel RBF (Lin e Lin, 2003).

Neste trabalho a máquina de vetores de suporte foi treinada utilizando-se quatro parâmetros de

entrada (B3, B4, B5 e NDVI), gerando como saída uma classificação para pertencente ou não a

determinado estrato florestal. Utilizou constante C (Cost) = 1,0 e um kernel RBF com os parâmetros

standards do Software Orange Data Mining 3.3.

Avaliação do classificador

A avaliação da eficiência da classificação de cada tipologia florestal foi determinada pela de

matriz de confusão ou matriz de erro (Figura 3), Acurácia Global, Índice F1, coeficiente Kappa

(Congalton e Green, 2009) e da análise do gráfico ROC.

Figura 3. Modelo de matriz de confusão

Page 8: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

A Acurácia Global (AG) foi calculada pela soma dos valores que correspondem a diagonal

principal (𝑛𝑖𝑖= número classificações corretamente), pelo (𝑁 = número total de amostras),

convertidos em percentagem, como mostra a equação 2:

𝐴𝐺 =∑ 𝑛𝑖𝑖

𝑚𝑖=1

𝑁

(2)

Onde 𝑚, representa o número de classes presentes na matriz.

O índice F1 foi calculado de acordo com a equação 3:

𝐹1 = 𝑡𝑝

𝑡𝑝 + 𝑓𝑝

𝑡𝑝

𝑃

(3)

Onde: 𝑡𝑝 representa os verdadeiros positivos, 𝑓𝑝 é o número de falsos positivos e 𝑃 é o

numero total de amostras positivas.

O Indice F1 é uma técnica simples que mede a distinção entre duas classes com valores reais.

Neste método, os valores F de cada recurso no conjunto de dados são calculados de acordo com a

equação 3 e, em seguida, a fim de selecionar os recursos de conjunto de dados inteiro, valor limite é

obtido calculando o valor médio de F-dezenas de todos os recursos. Se o valor F de qualquer

característica é maior do que o valor limiar, esse recurso é adicionado ao recurso espaço. Caso

contrário, esse recurso é removido do espaço de características (Chen e Lin, 2006; Polat e Güneş,

2009).

O coeficiente Kappa foi calculado de acordo com a equação 4:

�̂� =𝑁 ∑ 𝑥𝑖𝑖

𝑟𝑖=1 − ∑ (𝑥𝑖 +𝑟

𝑖=1 𝑥+𝑖)

𝑁² − ∑ (𝑥𝑖 +𝑟𝑖=1 𝑥+𝑖)

(4)

Page 9: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

Onde: K ̂ representa o estimador do coeficiente Kappa, 𝑟 é o número de linhas da matriz

quadrada, 𝑥𝑖𝑖 é o número de observações na linha i e da coluna i (diagonal principal) e 𝑁 representa

o número total de observações.

O uso do coeficiente Kappa (K) é satisfatório para avaliar a precisão de uma classificação,

devido principalmente por levar em consideração todos os elementos da matriz de confusão,

diferentemente da Acurácia Global que utiliza somente a diagonal principal. (Congalton e Green,

2009).

O coeficiente Kappa neste estudo é comparado aos índices apresentados na Tabela 1.

Tabela 1. Qualidade de classificação a partir dos valores do coeficiente Kappa

Valor de Kappa Qualidade

< 0,00 Péssima

0,00 – 0,20 Ruim

0,20 – 0,40 Razoável

0,40 – 0,60 Boa

0,60 – 0,80 Muito boa

0,80 – 1,00 Excelente

Fonte: Adaptada de Landis e Koch (1977)

Outro modelo eficiente que está em enfoque no aprendizado de máquina, devido à eficiência

em analisar classificadores é o gráfico de características do receptor operacional (ROC), baseado na

taxa de verdadeiros positivos tpr, e na taxa de falsos positivos fpr. O gráfico ROC é formado pela

fpr no eixo dos ordenadas, e tpr no eixo das abscissas (Prati et al., 2008). As taxas de verdadeiros

positivos e falsos positivos são obtidas a partir do valor de verdadeiros positivos dividido pelo total

positivos (P) e o valor de falsos positivos dividido pelo total de negativos (N), como demonstrado

pela equação 5:

𝑡𝑝 𝑟𝑎𝑡𝑒 =𝑡𝑝

𝑃 𝑓𝑝 𝑟𝑎𝑡𝑒 =

𝑓𝑝

𝑁

(5)

RESULTADOS E DISCUSSÃO

O resultado do classificador SVM para a massa de teste (100 amostras, sendo 50 para cada

classe) apresentam-se na matriz de confusão (Figura 4).

Page 10: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

Figura 4. Matriz de confusão com os resultados do classificador SVM.

O resultado da Acurácia Global do classificador foi de 86%, resultado próximo ao alcançado

por Sousa et al. (2010), que avaliaram o desempenho de dois algoritmos baseados em aprendizado

de máquina (Multi Layer Perceptron (MLP) e o Support Vector Machine (SVM)) e do método da

Máxima Verossimilhança na classificação do uso e cobertura da terra no bioma Caatinga, obtendo

valores de Acurácia Global de 86,03% (SVM), 82,14% (MLP) e 81,02% para máxima

verossimilhança, demonstrando o melhor desempenho dos métodos de aprendizagem de máquina.

Devido a Acurácia Global levar em consideração somente o resultado da diagonal principal,

optou-se por calcular coeficiente “Kappa”, cujo resultado foi de 72%, sendo considerado, de acordo

com Landis e Koch (1977), como um classificador muito bom.

Os resultados de Acurácia Global e Coeficiente kappa foram similares aos encontrados por

Gonçalves et al. (2016), que utilizaram uma rede neural artificial probabilística com função de base

radial (RBF) para discriminar dois tipos florestais na mesma área de estudo deste trabalho, obtendo-

se valores de Acurácia Global de 88% e kappa de 76%, reforçando os bons resultados de métodos

de aprendizagem de máquina em problemas de classificação.

O índice F1 calculado foi de 0,863, o que demonstra a boa discriminação entre as classes, uma

vez que, quanto maior o indice F1, maior a discriminância entre as classes (Chen e Lin, 2006; Polat

e Güneş, 2009).

Foram classificados incorretamente como pertencentes ao estrato 2 (Dbe+Abp), enquanto que

pertenciam ao estrato 1(Dbe), 16% dos pixels do Estrato 1(Dbe) e como pertencentes ao estrato

Page 11: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

1(Dbe), enquanto pertencentes ao estrato 2 (Dbe+Abp), 12% dos pixels do Estrato 2 (Dbe + Abp).

Sendo que 84% do total de pixels do estrato 1 (Dbe) foram classificados corretamente para o estrato

1 (Dbe), e 88% do total de pixels do estrato 2 (Dbe+Abp) foram classificados corretamente como

estrato 2 (Dbe+Abp).

A Máquina de Vetores de Suporte forneceu na saída os valores correspondentes a pertencer ou

não a determinada classe, caracterizando-a como um classificador discreto. Deste modo torna-se

possível a construção do gráfico ROC (Prati et al., 2008).

Observa-se que o classificador apresenta uma característica conservativa para a rotulagem do

estrato 1 (Dbe), quando comparado ao estrato 2 (Dbe+Abp), ou seja, ele apresenta tpr e fpr menores

quando comparado as mesmas taxas para a classificação do estrato 2 (Dbe+Abp). Por conseguinte o

classificador apresenta uma característica liberal para rotulagem do estrato 2 (Dbe+Abp), quando

comparado ao estrato 1 (Dbe), isto é, apresenta tpr e fpr maiores quando comparado às respectivas

taxas de classificação do estrato 1 (Dbe).

O gráfico ROC construído é apresentado na figura 5.

Figura 5. Gráfico ROC com dados do classificador SVM.

Page 12: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

Os pontos correspondentes ao estrato 1 (Dbe) e ao estrato 2 (Dbe + Abp) apresentam-se

próximos ao canto superior esquerdo, configurando o classificador como muito bom, pois quanto

mais a noroeste do gráfico [0,1], melhor o desempenho do classificador (Fawcett, 2006; Prati et al.,

2008; Gonçalves et al., 2016; Sá et al., 2012). Observa-se também uma aproximação entre os pontos

dos estratos, ou seja, o classificador apresenta um grau de classificação similar para ambos os

estratos.

CONCLUSÃO

A classificação de duas tipologias florestais, provenientes de um inventário florestal,

associados às bandas 3, 4 e 5 do Satélite LandSat 5TM, por meio da Máquina de Vetores de Suporte

(SVM), apresentou resultados satisfatórios para o presente estudo, obtendo-se resultados de

Acurácia Global de 86%, coeficiente kappa igual a 72% e índice F1 de 0,863, todos indicando uma

qualidade de classificação muito boa.

A análise do gráfico ROC demonstrou visualmente a eficiência do classificador, uma vez que

os pontos encontram-se a noroeste do gráfico e longe da linha diagonal, o que significaria uma

classificação aleatória.

É importante ressaltar que a tipologia florestal Floresta Ombrófila Densa Terras baixas Dossel

emergente + Aberta com palmeiras é um estrato de transição e, portanto, esperava-se uma confusão

do classificador, uma vez que há certa similaridade entre as tipologias. Todavia, o classificador

obteve resultados aceitáveis.

REFERÊNCIAS

CHEN, Yi-Wei; LIN, Chih-Jen. Combining SVMs with various feature selection strategies. In:

Feature extraction. Springer Berlin Heidelberg, p. 315-324, 2006.

CONGALTON, R.; GREEN, K. 2009. Assessing the accuracy of remotely sensed data:

principles and practices. Boca Raton: CRC Press; Taylor & Francis Group, 183 p. 2008.

COUTO, L. C.; COUTO, L.; WATZLAWICK, L. F.; CÂMARA, D. Vias de valorização energética

da biomassa. Biomassa & Energia, v. 1, n. 1, p. 71-92, 2004.

CORDEIRO, M. A.; PEREIRA, N. N. J.; BINOTI, D. H. B.; BINOTI, M. L. M. S.; LEITE, H. G.

Estimativa do volume de Acacia mangium utilizando técnicas de redes neurais artificiais e máquinas

vetor de suporte. Pesqui. Florest. Bras, v. 35, n. 83, p. 255-261, 2015.

Page 13: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

CORTES, Corinna; VAPNIK, Vladimir. Support-vector networks. Machine learning, v. 20, n. 3, p.

273-297, 1995.

FAWCETT, Tom. An introduction to ROC analysis. Pattern recognition letters, v. 27, n. 8, p. 861-

874, 2006.

FRATE, Fabio Del; SOLIMINI, Domenico. On the retrieval of forest biomass from SAR data by

neural networks. In: Geoscience and Remote Sensing Symposium, 2003. IGARSS'03.

Proceedings. 2003 IEEE International. IEEE, p. 1637-1638, 2003.

GONÇALVES, W. G.; RIBEIRO, H. M. C.; SÁ; J. A. S.; MORALES, G. P.; FERREIRA FILHO,

H. R.; ALMEIDA, A. C. 2016. Classificação de estratos florestais utilizando redes neurais artificiais

e dados de sensoriamento remoto/Classification of forest types using artificial neural networks and

remote sensing data. Revista Ambiente & Água, v. 11, n. 3, p. 612, 2016.

HAYKIN, Simon S. Redes neurais. Bookman, 2001.

HSU, C. W.; CHANG, C. C.; LIN, C. J. A practical guide to support vector classification. Relatório

técnico. Department of Computer Science, National Taiwan University. 2003.

KEERTHI, S. Sathiya; LIN, Chih-Jen. Asymptotic behaviors of support vector machines with

Gaussian kernel. Neural computation, v. 15, n. 7, p. 1667-1689, 2003.

LANDIS, J. Richard; KOCH, Gary G. An application of hierarchical kappa-type statistics in the

assessment of majority agreement among multiple observers. Biometrics, p. 363-374, 1977.

LIN, Hsuan-Tien; LIN, Chih-Jen. A study on sigmoid kernels for SVM and the training of non-PSD

kernels by SMO-type methods. submitted to Neural Computation, p. 1-32, 2003.

NUNES, C. A.; LIMA, C. F.; BARBOSA, L. C. A.; COLODETTE, J. L.; FIDÊNCIO, P. H.

Determinação de constituintes químicos em madeira de eucalipto por Pi-CG/EM e calibração

multivariada: Comparação entre redes neurais artificiais e máquinas de vetor suporte. Quim. Nova,

v. 34, n. 2, p. 279-283, 2011.

PERRING, M. P.; JONSON, J.; FREUDENBERGER, D.; CAMPBELL, R.; ROONEY, M.;

HOBBS, R. J.; STANDISH, R. Soil-vegetation type, stem density and species richness influence

biomass of restored woodland in south-western Australia. Forest Ecology and Management, v.

344, p. 53-62, 2015.

PRATI, R. C.; BATISTA, G. E. A. P. A.; MONARD, M. C. Curvas ROC para avaliação de

classificadores. Revista IEEE América Latina, v. 6, n. 2, p. 215-222, 2008.

POLAT, K.; GÜNEŞ, S. A new feature selection method on classification of medical datasets:

Kernel F-score feature selection. Expert Systems with Applications, v. 36, n. 7, p. 10367-10373,

2009.

Page 14: APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA .... APLICAÇÃO DE... · APLICAÇÃO DE MÁQUINAS DE VETORES DE SUPORTE NA CLASSIFICAÇÃO AUTÓMATICA DE TIPOLOGIAS FLORESTAIS

ROUSE, J. W.; HAAS, R. H.; SCHELL, J. A.; DEERING, D. W. Monitoring vegetation systems in

the great plains with ERTS. In: Symposium of Signifi cant Results Obtained with ERTS-1, 3,

1973. Greenbelt, Maryland. Proceedings... Washington: NASA SP-351. p.309-317. 1973.

SÁ, J. A. S.; ROCHA, B. R. P.; ALMEIDA, A. C.; SOUZA J. R. Recurrent Neural Networks and

Solf Computing, p. 151-175. 2012

SEAT TERRAPLANAGEM LTDA (Elab.). Inventário florestal diagnóstico do conjunto de

glebas estaduais Mamuru-Arapiuns. Santarém. 2010.

SILVA, E. S.; OLIVEIRA, F. A.; PENA, H. W. A. Uso e comercialização de produtos florestais não

madeireiros da área de concessão florestal Mamuru-Arapiuns, estado do Pará-Amazônia-Brasil.

Observatorio de la Economía Latinoamericana, n. 201, 2014.

SILVEIRA, P.; KOEHLER, H. S.; SANQUETTA, C. R.; ARCE, J. E. O estado da arte na

estimativa de biomassa e carbono em formações florestais. Floresta, v. 38, n. 1, 2008.

SOCHER, Luis Gustavo; RODERJAN, Carlos Vellozo; GALVÃO, Franklin. 2008. Biomassa aérea

de uma floresta ombrófila mista aluvial no município de Araucária (PR). Floresta, v. 38, n. 2, 2008.

SOUSA, B. F. S.; TEIXEIRA, A. D. S.; SILVA, F. D. A. T. F.; ANDRADE, E. M. D.; BRAGA, A.

P. D. S. Avaliação de classificadores baseados em aprendizado de máquina para a classificação do

uso e cobertura da terra no bioma Caatinga. Revista Brasileira de Cartografia. n 62, Edição

especial, 2010.

WATZLAWICK, Luciano Farinha; KIRCHNER, Flávio Felipe; SANQUETTA, Carlos Roberto.

Estimativa de biomassa e carbono em floresta com araucária utilizando imagens do satélite

IKONOS II. Ciência Florestal, Santa Maria, v. 19, n. 2, p. 169-181, 2009.