View
572
Download
0
Category
Preview:
Citation preview
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 1/115
PREDIÇÃO DE ESCORREGAMENTOS DAS ENCOSTAS DO MUNICÍPIO DORIO DE JANEIRO ATRAVÉS DE TÉCNICAS DE MINERAÇÃO DE DADOS
Fábio Teodoro de Souza
TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS
PROGRAMAS DE PÓS-GRADUAÇÃO DE ENGENHARIA DA UNIVERSIDADE
FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS
NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE DOUTOR EM CIÊNCIAS
EM ENGENHARIA CIVIL.
Aprovada por:
_______________________________________________________ Prof. Nelson Francisco Favilla Ebecken, D.Sc.
_______________________________________________________ Prof. Alexandre Gonçalves Evsukoff, Dr.
_______________________________________________________ Prof. Luiz Landau, D.Sc
_______________________________________________________
Prof.a Beatriz de Souza Leite Pires de Lima, D.Sc.
_______________________________________________________ Prof. Alceu Gomes de Andrade Filho, D.Sc
RIO DE JANEIRO, RJ – BRASIL
JUNHO DE 2004
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 2/115
ii
SOUZA, FÁBIO TEODORO DE
Predição de Escorregamentos das
Encostas do Município do Rio de Janeiro
através de Técnicas de Mineração de Dados
[Rio de Janeiro] 2004.
VII, 108 p. 29,7 cm (COPPE/UFRJ,
D. Sc., Engenharia Civil, 2004)
Tese - Universidade Federal do Rio de
Janeiro, COPPE
1. Mineração de Dados
2. Sistemas de Informações Geográficas
3. Escorregamentos
I. COPPE/UFRJ II. Título (série)
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 3/115
iii
AGRADECIMENTOS
À Fundação Carlos Chagas Filho de Amparo à Pesquisa do Estado do Rio deJaneiro - FAPERJ que foi responsável pelo financiamento deste projeto de pesquisa.
Às instituições que forneceram os dados necessários para a realização desta
tese:
• Fundação Instituto de Geotécnica do Município do Rio de Janeiro - GEORIO;
• Secretaria Municipal de Meio Ambiente – SMAC ;
• Diretoria de Hidrografia e Navegação – DHN (Marinha do Brasil);
• Fundação Superintendência Estadual de Rios e Lagoas – SERLA;
• Instituto Nacional de Meteorologia – INMET ;
• Universidade do Estado do Rio de Janeiro – UERJ ;
• Universidade Federal do Rio de Janeiro - UFRJ ;
• Wyoming University - Department of Atmospheric Science;
• Departamento de Controle do Espaço Aéreo - DECEA;
• Serviço Geológico do Brasil - CPRM .
Ao Professor Nelson pela orientação e incentivo às atividades necessárias para
o desenvolvimento desta tese.
Aos membros da banca examinadora pela participação e pela contribuição de
conhecimento para o enriquecimento deste trabalho.
À equipe técnico-administrativa do Núcleo de Transferência de Tecnologia,
UFRJ , amigos e colegas que contribuíram direta ou indiretamente.
Aos meus pais e à minha família que sempre incentivaram meus estudos.
Ao Laboratório de Energia dos Ventos da Uff pela parcela de colaboração.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 4/115
iv
Resumo da Tese apresentada à COPPE/UFRJ como parte dos requisitos necessários
para a obtenção do grau de Doutor em Ciências (D. Sc.)
PREDIÇÃO DE ESCORREGAMENTOS DAS ENCOSTAS DO MUNICÍPIO DO
RIO DE JANEIRO ATRAVÉS DE TÉCNICAS DE MINERAÇÃO DE DADOS
Fábio Teodoro de Souza
Junho/2004
Orientador: Nelson Francisco Favilla Ebecken
Programa: Engenharia Civil
Os efeitos causados pelas chuvas intensas são de grande proporção nas áreas
sujeitas à ocorrência de escorregamentos, e estes desastres acontecem principalmente
devido às agressões ambientais. O estudo deste problema na cidade do Rio de Janeiro
tem sido estudado por técnicas de Mineração de Dados e Sistemas de Informações
Geográficas. A base deste trabalho é o banco de dados relacionado aos registros de
escorregamentos entre 1998 e 2001, incluindo parâmetros do solo e meteorológicos.
Os padrões de chuvas acumuladas relacionadas aos escorregamentos dependem
da substituição dos dados ausentes, que foram analisados por várias técnicas, incluindo
análises estatísticas e de agrupamento de dados. A análise espacial da chuva selecionouos pluviômetros e Redes Neurais foram usadas para substituir os valores ausentes de
chuva, mostrando boa performance. A variável volume do escorregamento também
apresentava valores ausentes e a substituição foi realizada pelo método KNN
considerando as características dos escorregamentos. Devido às incertezas na
metodologia de medição do volume escorregado (inspeção visual) o erro calculado foi
considerado excelente. Depois da preparação dos dados, foram construídos alguns
modelos para predizer estes acidentes, e auxiliar o sistema de alerta existente. Algunsresultados ilustram a precisão dos modelos.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 5/115
v
Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the
requirements for the degree of Doctor of Science (D. Sc.)
RIO DE JANEIRO’S LANDSLIDES PREDICTION BY
A DATA MINING APPROACH
Fábio Teodoro de Souza
June/2004
Advisor: Nelson Francisco Favilla Ebecken
Department: Civil Engineering
The effects caused by rainfall are wide in the locations subject to landslides
occurrences and these disasters happen mainly due to environmental aggressions. Thestudy of Rio de Janeiro’s city landslides problem has been performed by a Data Mining
approach and Geographical Information Systems. The basis of this work is the dataset
related to the landslides registers between 1998 and 2001, including meteorological and
soil parameters.
The cumulative rain patterns related to the landslides depend on the missing
data replacement, which was analyzed by several methods, including Clustering and
Statistical Analysis. The rain spatial analysis selected the rain gauges to be input on Neural Networks, which were used to replace the rain missing values, with a good
performance. The landslides volume variable also presents missing values and the
completing has been performed by KNN method considering the characteristics of the
landslides. Due to uncertainties in the measurement methodology of the volume slipped
(visual inspection) the calculated error was considered excellent.
After data preparation, some models were built to predict these accidents, and
possibly aiding the existing alert system. Some results illustrate the resulting model precision.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 6/115
vi
ÍNDICE
Resumo ............................................................................................................................iv
Abstract .............................................................................................................................v
CAPÍTULO 1 INTRODUÇÃO........................................................................................ 1
1.1 Objetivo. ................................................................................................................. 11.2 Relevância. ............................................................................................................. 2
1.3 Contribuição. .......................................................................................................... 31.4 Organização da Dissertação da Tese. ..................................................................... 3
CAPÍTULO 2 REVISÃO BIBLIOGRÁFICA ................................................................. 4
2.1 Estudos de Escorregamentos Realizados................................................................ 42.2 Abordagens de Classificação de Acidentes Geotécnicos. ...................................... 72.3 Sistemas de Informações Geográficas (SIG). ......................................................... 92.4 Mineração de Dados. ............................................................................................ 10
2.4.1 Auto-correlação. ............................................................................................ 102.4.2 Análise de Componente Principal (ACP)...................................................... 10
2.4.3 Agrupamento de Dados. ................................................................................ 112.4.4 Redes Neurais Artificiais............................................................................... 122.4.5 Método dos Vizinhos Mais Próximos (KNN )................................................ 142.4.6 Regras de Associação de Dados.................................................................... 152.4.7 Análise de regras interessantes. ..................................................................... 162.4.8 Regras de Classificação de Dados. ................................................................ 20
CAPÍTULO 3 VIABILIDADE ...................................................................................... 23
3.1 Descrição do Problema......................................................................................... 23
3.2 Banco de Dados.................................................................................................... 233.2.1 Dados de Escorregamentos............................................................................ 243.2.2 Dados Meteorológicos................................................................................... 243.2.3 Dados de Parâmetros do Solo........................................................................ 293.2.4 Topografia. .................................................................................................... 31
CAPÍTULO 4 METODOLOGIA................................................................................... 33
4.1 Estudo de Aproveitamento dos Dados. ................................................................ 334.1.1 Análise dos Dados de Pluviometria............................................................... 334.1.2 Análise dos Dados de Parâmetros Meteorológicos. ...................................... 34
4.1.3 Análise dos Dados de Parâmetros do Solo. ................................................... 354.2 Preparação dos Dados........................................................................................... 35
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 7/115
vii
4.2.1 Preparação das Variáveis de Escorregamento............................................... 374.2.2 Regionalização dos Dados de Chuva, Substituição dos Valores Ausentes eCálculo dos Índices Acumulados de Chuva. .......................................................... 394.2.3 Cálculo das Taxas dos Parâmetros do Solo................................................... 404.2.4 Substituição dos Valores Ausentes de Volume de Escorregamento. ............ 41
4.2.5 Discretização das Variáveis para Extração de Regras................................... 434.3 Modelagem........................................................................................................... 444.3.1 Montagem da Matriz dos Dados de Escorregamentos. ................................. 454.3.2 Classificação com Redes Neurais.................................................................. 464.3.3 Geração de Regras de Associação e Análise das Regras Interessantes. ........ 474.3.4 Regras de Classificação................................................................................. 484.3.5 Predição de Chuvas Intensas. ........................................................................ 48
CAPÍTULO 5 RESULTADOS E DISCUSSÃO............................................................ 49
5.1 Estudo da Distribuição da Velocidade e Direção do Vento. ................................ 505.2 Regionalização das Chuvas. ................................................................................. 545.3 Predição do Valor Ausente de Chuva................................................................... 585.4 Predição do Valor Ausente de Volume ................................................................ 615.5 Classificação com RNA’s..................................................................................... 635.6 Extração de Regras de Associação Interessantes. ................................................ 715.7 Classificação com Regras de Associação............................................................. 745.8 Predição de Chuvas Intensas. ............................................................................... 785.9 Desempenho de Classificadores. .......................................................................... 80
5.9.1 Custos de Classificação. ................................................................................ 805.9.2 Melhorando a Acurácia de um Classificador. ............................................... 81
5.9.3 Sensibilidade, Singularidade e Precisão – Medindo a Acurácia. .................. 825.9.4 Melhorando a Acurácia do Classificador de Escorregamentos..................... 83
CAPÍTULO 6 CONCLUSÕES E RECOMENDAÇÕES .............................................. 85
REFERÊNCIAS BIBLIOGRÁFICAS........................................................................... 88
ANEXO I – Glossário das classes de Uso das Terras e Cobertura Vegetal....................95
ANEXO II – Glossário das classes de Aptidão para Reflorestamentoe Olericultura..................................................................................................................97
ANEXO III – Glossário das classes de Qualidade Ambiental das Terras.....................100
ANEXO IV – Glossário das classes de Vulnerabilidade Ambiental das Terras...........102
ANEXO V – Glossário das classes de Pedologia..........................................................104
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 8/115
1
CAPÍTULO 1INTRODUÇÃO
Durante o processo de crescimento das grandes cidades, muitas áreas próximas
às encostas são ocupadas pela população, devido à urbanização. A ocupação
desordenada dos morros altera as características físicas do ambiente natural, provocando
a diminuição das áreas de vegetação, o acúmulo de lixo em locais impróprios, a
obstrução das obras de drenagem, além de outras modificações agressivas ao meio.
A alteração do ambiente natural promove novas configurações dos terrenos
íngremes, que se tornam suscetíveis a ocorrências de acidentes geotécnicos
(deslizamentos ou escorregamentos) durante as chuvas intensas. Estudos têm sido
mostrados, MENEZES et al. [1], que a cidade do Rio de Janeiro possui características
físicas (posição geográfica e topografia) e padrões atmosféricos favoráveis ao
desenvolvimento de fenômenos meteorológicos causadores de chuvas intensas.
O conhecimento dos padrões existentes entre os diversos fenômenos
relacionados aos escorregamentos, permite o estabelecimento de critérios determinantes
para a emissão dos alertas e a conseqüente mobilização das instituições responsáveis
para o auxílio à população habitante das regiões das encostas.
1.1 Objetivo.
Recentemente diversos algoritmos baseados em métodos estatísticos e
paradigmas da inteligência artificial tem sido aplicados a sistemas complexos com
muitas variáveis e inter-relações fortemente não-lineares. Pretende-se com este trabalho
aplicar as ferramentas de data mining ou de mineração de dados sobre o banco de dados
de parâmetros geotécnicos e meteorológicos, coletados na cidade do Rio de Janeiro, e
devidamente operado por Sistemas de Informações Geográficas (SIG).
Os resultados destas análises podem servir para o entendimento dos padrões
existentes entre as diversas taxonomias inter-relacionadas (escorregamentos, chuva, uso
do solo, etc.) e para a implementação de um modelo de gerenciamento ambiental,contribuindo com informação auxiliar para o sistema de alerta existente.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 9/115
2
1.2 Relevância.
Em meados dos anos 60, chuvas intensas castigaram toda a cidade do Rio de
Janeiro, causando diversos escorregamentos danosos a população. A Figura 1 ilustra umescorregamento ocorrido no mês de Fevereiro de 1967, próximo à Rua das Laranjeiras,
no bairro de Laranjeiras.
Figura 1 – Escorregamento ocorrido no mês de Fevereiro de 1967, próximo à Rua das
Laranjeiras (bairro de Laranjeiras no Município do Rio de Janeiro).
Nessa época então foi criada a Fundação Geo-Rio, com o principal objetivo de
elaborar e organizar o plano de proteção das encostas. Mais recentemente, em 1996, a
Geo-Rio criou o Sistema de Alerta de Chuvas Intensas e de Deslizamentos em Encostas
da Cidade do Rio de Janeiro, ou simplesmente ALERTA-RIO [2], com o objetivo de
emitir boletins de alerta à população (via estações de rádio e TV) sempre que houver
previsão de chuvas intensas e que possam gerar escorregamentos nas encostas.
O sistema de alerta utiliza informações, em tempo real, de várias estações
pluviométricas automáticas instaladas no município, imagens de radar meteorológico,
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 10/115
3
detector de raios, dados de estações meteorológicas, imagens de satélite, etc. Os dados
são analisados por geotécnicos e meteorologistas, em esquema de plantão 24 horas por
dia, numa estação computadorizada situada na sede da Geo-Rio.
Dentro desta perspectiva, o presente trabalho pretende construir um modelo
computacional que seja capaz de predizer a ocorrência desses acidentes, alimentado
pelas informações disponíveis e podendo auxiliar o sistema de alerta existente.
1.3 Contribuição.
A previsão destas catástrofes é de grande importância para a mobilização das
instituições responsáveis em prestar auxílio à população habitante das regiões das
encostas. A implementação dos modelos propostos, construídos com técnicas de
mineração de dados, deveria manipular os dados relacionados aos acidentes geotécnicos
de forma automática, gerando relatórios de análise em tempo real e contribuindo com
informações úteis para o processo de tomada de decisão.
1.4 Organização da Dissertação da Tese.
O Capítulo 1 introduz o problema de escorregamentos nas encostas das grandes
cidades, descrevendo o objetivo, a relevância e a contribuição deste trabalho. O
Capítulo 2 levanta o estado da arte na área de escorregamentos, considera algumas
abordagens de classificação de acidentes geotécnicos, e discorre sobre os SIG’s e
mineração de dados. O Capítulo 3 descreve o problema de escorregamentos no Rio de
Janeiro e detalha o banco de dados obtido para a realização desta tese. No Capítulo 4 é
apresentada a metodologia adotada, relata as atividades envolvidas para a escolha das
escalas temporal e espacial, de preparação dos dados e de modelagem. O Capítulo 5
apresenta os resultados obtidos deste estudo, assim como discute tais resultados. No
Capítulo 6 são apresentadas algumas conclusões sobre o trabalho, e também são
apontadas algumas recomendações para trabalhos futuros.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 11/115
4
CAPÍTULO 2REVISÃO BIBLIOGRÁFICA
O presente Capítulo levanta o estado da arte na área de escorregamentos em
encostas, considera algumas abordagens de classificação de acidentes geotécnicos e
relata sobre os SIG’s e mineração de dados.
2.1 Estudos de Escorregamentos Realizados.
Os escorregamentos são fenômenos que envolvem diversos parâmetros inter-
relacionados, sejam de origem naturais (chuva, topografia, litologia, características do
solo, etc.) ou relacionados às atividades humanas (ocupação e uso do solo).
O trabalho de KAIBORI et al. [3] mostrou que a ocorrência dos
escorregamentos não depende somente das chuvas intensas, mas também das condições
geológicas e/ou geográficas e hidrológicas do local.
Os escorregamentos induzidos pelas chuvas intensas são os mais perigosos
para as vidas humanas ENOKI [4], porque eles acontecem com movimentos rápidos e o
material deslizado pode atacar severamente as residências e habitantes das encostas.
Vários tipos de materiais podem ser deslizados, tais como solos, rocha, lixo, entulho,
etc.
O mecanismo dos escorregamentos de alguns materiais induzidos pela chuva
tem sido explicado por alguns pesquisadores. A infiltração vertical das águas da chuva
satura a camada superficial do solo, e consequentemente a poro-pressão positiva da
água induzida na camada do solo promove a instabilidade da encosta (ABOSHI et al.
[5], HARUYAMA [6], KITAMURA [7], e YAGHI et al. [8]). A infiltração causa a
redução da sucção dentro da superfície do solo, e promove a conseqüente redução da
coesão, além do aumento do peso próprio, tornando a encosta instável (SASAKI et al.
[9]).
O lixo presente nas encostas tem predominância de sacos plásticos, que
absorvem água com mais facilidade e rapidez do que o solo durante as chuvas intensas
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 12/115
5
REIS e ARRAIS [10]. O plástico do lixo forma uma camada deslizante em alguns
pontos tornando-se suscetível ao escorregamento.
A energia do escoamento da chuva é capaz de causar a ruptura de aterros e ou
de estruturas de contenção (normalmente associadas às obras de contenção realizadas
por leigos e sem critérios técnicos), FEIJÓ et al. [11].
O processo de escorregamentos de rochas induzido pela chuva é de difícil
cálculo e previsão ZÁRUBA e MENEL [12]. Os blocos de rocha acham-se geralmente
envolvidos por matriz terrosa, proveniente do mesmo processo de acumulação ou
gerada pelo processo de alteração dos próprios blocos, e qualquer tentativa de modelar o
comportamento de tais massas envolve uma enorme complexidade [12].
KITAMURA et al. [13] desenvolveram medições da sucção no solo e de
pluviometria durante as chuvas intensas em Kagoshima (Japão). A região estudada
apresenta material solo arenoso denominado Shirasu. Este material é de pequena
densidade, e tem perda acelerada da sucção em função da temperatura ambiente.
KITAMURA & SAKO [14] desenvolveram um modelo para previsão de falhas deste
material, altamente suscetível aos escorregamentos. O modelo foi validado
comparando-se os resultados obtidos com os dados experimentais.
IKEYA & KONDO [15] estudaram os acidentes causados por chuvas intensas
nas cidades de Hiroshima e Kure no Japão. Nestas regiões, foi observado que ações
mecânicas das intempéries formavam juntas nos granitos e a água da chuva infiltrara
essas juntas promovendo reações químicas. Os escorregamentos ocorriam nas regiões
bastante expostas à ação dessas reações químicas. Um programa de prevenção desses
desastres foi proposto.
Durante a construção de obras hidráulicas na China, ocorreram deslizamentos
provocados por chuvas intensas, causando mortes. O material escorregado é composto
por uma massa rochosa de ardósia e arenito. CHEN [16] avaliou as características
desses acidentes e propôs medidas preventivas considerando informações relacionadas
aos fatores geológicos, topográficos e aos mecanismos de escorregamentos causados
pelas chuvas intensas.
Em 1996, um furacão devastou Taiwan, trazendo chuvas intensas
principalmente na parte central da ilha. As chuvas intensas provocaram mais de 1300
escorregamentos. LIN & JENG [17] apresentaram análises detalhadas dos fatores de
risco associados à engenharia, geologia e geomorfologia. Nestes estudos também foramidentificadas as áreas mais suscetíveis à ocorrência dos desastres.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 13/115
6
Enquanto existe um forte esforço para implementar várias medidas preventivas
e para estabilizar as encostas suscetíveis a ocorrência desses fenômenos, também é
necessário se ter um sistema para avisar a população sobre o risco de escorregamentos
durante as chuvas intensas, CHEUNG and LAI [18]. SASAKI et al. [19] propuseram
ações de prevenção e de notificação aos moradores das encostas no município de
Hirohima (Japão). Essas ações contemplam basicamente três medidas: (1) restrição de
áreas suscetíveis aos escorregamentos – mapeamento dos riscos; (2) instalação de
barragens para contenção e proteção de algumas áreas nas encostas e (3) um sistema de
alerta para a população habitante das encostas.
O Observatório de Hong Kong na China dispõe de um sistema de alerta ao
público se chuvas intensas caem ou são esperadas sobre a cidade, emitindo três níveis
de advertência: âmbar, vermelho e preto, correspondendo às precipitações horárias de
30, 50 e 70 milímetros, respectivamente. Para os riscos de escorregamentos em
particular, os critérios de advertência são baseados essencialmente nos índices
acumulados de chuva nas últimas 24 horas [18]. Foram determinadas [18] algumas
práticas operacionais para a predição de eventos de chuvas intensas, principalmente
baseadas em sistemas numéricos de predição do tempo e em recomendações derivadas
de observações de radar. O sistema de alerta da cidade do Rio de Janeiro [2] também é
composto por duas configurações diferentes de advertência, para as condições das
chuvas e para a probabilidade de escorregamentos, conforme ilustram as Tabelas 1 e 2.
Tabela 1 – Condições de Chuvas no Município do Rio de Janeiro.
Nível Descrição Vigilância Ausência de chuva ou chuva leve nas próximas 6 horasAtenção Possibilidade de chuva moderada, ocasionalmente forte, nas próximas
horas
Alerta Chuva forte nas próximas horas podendo causar escorregamentosisoladosAlertaMáximo
Chuva muito forte nas próximas horas podendo causar escorregamentosgeneralizados
Tabela 2 – Probabilidade de Escorregamentos no Município do Rio de Janeiro.
Nível Descrição Baixo Possibilidade de ocorrências de escorregamentos circunstanciaisMédio Possibilidade de ocorrências de escorregamentos ocasionaisAlto Ocorrências de escorregamentos esparsosMuito Alto Ocorrências de escorregamentos generalizados
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 14/115
7
O detalhamento das descrições de escorregamentos é mostrado na Tabela 3.
Tabela 3 – Detalhamento das descrições de escorregamentos no Rio de Janeiro.
Escorregamentos Detalhamento Circunstanciais movimentos de massa não deflagrados diretamente pela ação
das chuvas, tendo como agente de maior importância umacircunstância localizada relacionada a efeitos naturais ouantrópicos, como por exemplo, rompimento de tubulações,dilatações térmicas, vibrações, etc.
Ocasionais movimentos de massa deflagrados pelas chuvas, predominantemente em taludes artificiais (corte e/ou aterro),com distribuição pouco expressiva.
Esparsos movimentos de massa deflagrados pelas chuvas em taludesnaturais e artificiais, com moderada a grande distribuição.
Generalizados movimentos de massa deflagrados pelas chuvas em taludesnaturais e artificiais, com distribuição muito grande,especialmente nas vias que cortam os maciços montanhosos.
Pode-se notar uma grande variedade de fatores envolvidos no estudo de
escorregamentos, sejam os fatores de origem natural ou relacionados às atividades
humanas, e a classificação desses fenômenos tem sido proposta por vários autores.
2.2 Abordagens de Classificação de Acidentes Geotécnicos.
Os fenômenos de acidentes geotécnicos envolvem uma variedade de processos
e fatores que dispõem possibilidades ilimitadas de classificação, [12]. O termo
escorregamento é utilizado no sentido de abranger todo e qualquer movimento coletivo
de materiais terrosos e /ou rochosos, GUIDICINI & NIEBLE [20], independentementeda diversidade de processos, causas, velocidades, formas e demais características.
Freire [21] classifica os movimentos coletivos em três principais grupos:
escorregamentos, escoamentos e subsidências.
Os escorregamentos são movimentos rápidos nos quais uma porção do maciço
desliza em relação ao restante, ao longo de uma superfície de deslizamento bem
definida. Esses fenômenos podem mobilizar solo, solo e rocha ou somente rocha.
Os escoamentos são deformações sem superfície definida de movimentação e
de movimento contínuo. As corridas são escoamentos que, devido à elevada densidade
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 15/115
8
do material e a rapidez do movimento, possuem alto poder destrutivo. As subsidências
são movimentos descendentes verticais, de componente horizontal nula ou
insignificante. As subsidências não interessam ao presente estudo.
No Rio de Janeiro, o lixo tem uma relação tão direta com o risco de
escorregamento, que passou a ser registrado nos laudos de acidentes da FUNDAÇÃO
GEORIO [22], [23], [24] e [25]. Nestes laudos também são classificadas as ocorrências
de rupturas de estruturas de contenção (normalmente associadas às obras de contenção
sem critérios técnicos).
A Tabela 4 ilustra três diferentes metodologias de classificação de acidentes
geotécnicos em encostas: FREIRE [21], OHUMA et al. [26] e FUNDAÇÃO GEORIO
[22], [23], [24] e [25].
Tabela 4 – Sistemática de classificação através de três metodologias diferentes.
Magalhães Freire Ohuma et al. Fundação GEORIOEsc. de Solo taludes (ES/tc)
soloEsc. de Solo encosta (ES/en)Esc. de Rocha talude (ER/tc)
rocha Esc. de Rocha encosta(ER/en)
Solo/Rocha talude (ES/R/tc)
Translacionais
solo e rocha
Escorregamentos(Translacionais)
Solo/Rocha encosta(ES/R/en)
RotacionaisEscorregamentos
(Rotacionais)Esc. de Tálus (ET)
Esc. de Lixo/Entulho (EL/E)
Escorregamentos
Queda de Blocos / Dendritos Quedas eRolamentos
Queda/Rolamento de Blocosou Lascas Rochosos (Q/R)
Rastejos RastejosTerra
Areia ou
silteLamaEscoamentos Corridas
Avalanchede dendritos
Corridas deMassa Corrida (C)
Movimentos complexos de massaErosão laminar,sulcos, ravinas e
voçorocas
Processos Erosivos/Assoreamento (PE/A)
Ruptura de Aterro (RA)Ruptura de Estrutura de
Contenção (REC)
A caracterização da distribuição espacial das variáveis ambientais associadas
aos escorregamentos pode ser feita por Sistemas de Informações Geográficas (SIG’s).
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 16/115
9
2.3 Sistemas de Informações Geográficas (SIG ).
Os Sistema de Informações Geográficas (SIG’s) consistem de sistemas
computacionais usados para capturar, armazenar, integrar, manipular, analisar e mostrar informações geograficamente referenciadas, identificando os dados de acordo com a
posição geográfica na Terra, HEIMILLER and HAYMES [27]. Estes sistemas são
usados para manusear mapas, representados em várias camadas, onde cada camada
possui dados sobre uma particular taxonomia, e cada taxonomia está relacionada a uma
posição da imagem gráfica de um mapa. As taxonomias podem ser organizadas através
de análises estatísticas.
Os SIG’s possibilitam relacionar informações diferentes num contexto espacial
e alcançar uma conclusão sobre estas relações. Muitas das informações que existem no
mundo contêm uma referência de local, estabelecendo que a informação está em algum
ponto do globo: latitude, longitude e elevação.
Os SIG’s são sistemas que facilitam a realização de análises complexas, através
da integração dos dados georreferenciados FELGUEIRAS [28]. As ferramentas de
geoprocessamento são bastante úteis para a identificação das áreas mais atingidas pelos
acidentes geotécnicos, e conseqüentemente, das áreas com fatores geológicos e
morfológicos associados à instabilidade do talude.
As forças resistivas dos taludes diminuem com o processo de urbanização, que
altera as condições hidrológicas naturais das encostas. A vegetação influencia
diretamente na estabilidade do talude, podendo aumentar em até 20 % o valor da coesão
do solo BABU & MUKESH [29]. A presença das árvores também ajuda a diminuir o
impacto da gota da chuva sobre o solo. Além disso, as raízes auxiliam na retenção da
água das chuvas, diminuindo a probabilidade de erosão.
Além do conhecimento da distribuição espacial das variáveis ambientais,
também é necessário conhecer de forma qualitativa e quantitativa, as relações e padrões
associados aos fenômenos de escorregamentos. É preciso extrair conhecimento do
mecanismo físico como um todo, sua interconectividade entre os atributos, as relações
das variações temporal e espacial. As ferramentas baseadas em mineração dos dados
permitem a extração desse conhecimento.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 17/115
10
2.4 Mineração de Dados.
A Mineração de Dados ou Data Mining é uma atividade multidisciplinar que
envolve diversas áreas, EBECKEN e EVSUKOFF [30]. A Mineração de Dados é umcampo de pesquisa multidisciplinar que envolve estatística, aprendizado de máquina,
banco de dados, sistemas especialistas, técnicas de visualização de dados e computação
de alto desempenho. A interação destas disciplinas é componente fundamental para o
processo de descoberta de conhecimento em banco de dados.
A seguir são descritas algumas técnicas usadas em Mineração de Dados e que
foram usadas neste trabalho.
2.4.1 Auto-correlação.
As medidas de correlação extraídas da Matriz de Auto-Correlação expressam
uma medida da relação entre duas ou mais variável, PEARSON [31]. Os coeficientes de
correlação podem variar de -1 a +1. Os valores -1, +1 e 0 representam uma correlação
negativa perfeita, positiva perfeita, e ausência de correlação, respectivamente.
Essas medidas de correlação foram usadas neste trabalho principalmente naregionalização dos dados de chuva. A análise espacial da chuva permite a identificação
dos padrões regionais da chuva, e a seleção espacial de pluviômetros pelos valores de
correlação associados.
2.4.2 Análise de Componente Principal (ACP).
A Análise de Componente Principal ( ACP) pode ser vista como um método de
redução de dados, a partir da associação de duas ou mais variáveis correlacionadas
dentro de um fator. Por exemplo, pode-se considerar um gráfico em que cada variável é
representada por um ponto. Neste gráfico podem-se girar os eixos em qualquer direção
sem mudar as posições relativas dos pontos uns aos outros, porém, com mudança das
coordenadas atuais dos pontos; ou seja, a simples rotação dos eixos mudaria
naturalmente a carga dos fatores.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 18/115
11
O objetivo da estratégia de rotação, elaborada e popularizada em discussões
detalhadas por WHERRY [32], é o de obter um padrão de interpretação mais fácil e
claro, através da associação de fatores com altas cargas para algumas variáveis e com
baixas cargas para outras.
As ACP`s foram usadas neste trabalho principalmente na análise espacial da
chuva. A seleção espacial dos pluviômetros foi realizada de acordo as cargas associadas
aos fatores regionais.
2.4.3 Agrupamento de Dados.
Os agrupamentos de dados ou clustering são atividades em mineração de
dados, que consistem em agrupar os dados dentro de classes ou ‘clusters’ tal que os
objetos dentro de uma classe tenham alta similaridade em comparação com um outro
objeto dessa classe, HAN [33], mas têm baixa similaridade a objetos de outras classes.
A árvore de agrupamento (ou árvore hierárquica) usa as dissimilaridades ou
distâncias entre os objetos para formar as classes. O cálculo das distâncias Euclidianas éo método mais direto de calcular as distâncias entre os objetos num espaço
multidimensional, [33].
Se os dados contêm uma clara “estrutura” em termos de classes de objetos
(similares uns aos outros), então esta estrutura muitas vezes é refletida na árvore
hierárquica como “galhos” distintos.
Outro método de agrupamento descrito [33] é o algoritmo K-means, que divide
um conjunto de n objetos dentro de k classes, e, baseado na atualização do valor médiodos objetos de cada classe, o algoritmo re-classifica cada objeto para a classe da qual o
objeto é mais similar, num processo iterativo.
As análises de agrupamento de dados foram usadas neste trabalho
principalmente na análise espacial da chuva. A seleção espacial dos pluviômetros foi
realizada de acordo a distribuição espacial das classes.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 19/115
12
2.4.4 Redes Neurais Artificiais.
As Redes Neurais Artificiais ( RNA’s) são modelos conexionistas capazes de
tratar problemas complexos. As RNA’s podem aprender através de exemplos; possuem
tolerância a erros, pois elas são habilitadas para manusear ruídos e dados incompletos;
são capazes de proceder com problemas não lineares; e, uma vez treinadas, podem
realizar predições e generalizações com alta precisão. As RNA’s têm sido usadas em
diversas aplicações em controle, robótica, reconhecimento de padrões, previsões,
medicina, sistemas de energia, manufatura, otimização, processamento de sinais e
ciências sociais/psicológicas. As RNA’s são particularmente úteis em sistemas de
modelagem tais como na implementação de mapeamentos complexos e na identificação
de sistemas.
Os Perceptrons de Múltiplas Camadas (PMC’s) são as arquiteturas de RNA`s
mais populares em uso, RUMELHART and McCLELLAND [34], BISHOP [35]. Os
PMC’s usam uma função linear (que realizam a soma ponderada das suas entradas) e,
usualmente, uma função de ativação não-linear. São arquiteturas que podem possuir
diversas camadas, entretanto, o uso de três ou quatro camadas é adequado para as
aplicações. A função de ativação muito utilizada para os PMC’s é a função logística, ou
a função sigmóide.Os PMC’s basicamente consistem de um conjunto de unidades sensoriais, ou
nós de input que constituem a camada de entrada, uma ou mais camadas oculta (de nós
computacionais) e uma camada de saída (de nós computacionais), HAIKIN [36]. O sinal
de entrada se propaga para frente através da rede, camada por camada. Os PMC’s
representam uma generalização do perceptron de camada única, ROSENBLATT, [37].
O treinamento dos PMC’s pode ser realizado de forma supervisionada com o
algoritmo de retro-propagação do erro (algoritmo de treinamento mais conhecido emredes neurais). Este algoritmo é baseado na regra de aprendizagem por correção do erro
e desenvolve-se em dois passos através das diferentes camadas da rede: um passo para
frente, a propagação, e um passo para trás, a retro-propagação. Durante a propagação,
um padrão de atividade (vetor de entrada) é aplicado aos nós sensoriais da rede e seu
efeito se propaga através da rede, camada por camada. Finalmente, um conjunto de
saídas é produzido como a resposta real da rede [36].
No passo de propagação, os pesos sinápticos são todos fixos. Durante a retro- propagação, os pesos sinápticos são todos ajustados de acordo com uma regra de
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 20/115
13
correção de erro. Especificamente, a resposta real da rede é subtraída de uma resposta
desejada (alvo) para produzir um sinal de erro, que é então propagado para trás através
da rede, contra a direção das conexões sinápticas. Os pesos sinápticos são ajustados para
fazer com que a resposta real da rede se mova para mais perto da resposta desejada, em
um sentido estatístico.
As RNA’s são capazes de conduzir uma análise de sensibilidade às entradas da
rede, podendo indicar quais variáveis são consideradas mais importantes para uma rede
particular. A análise de sensibilidade pode contribuir com um ganho de conhecimento
na identificação de quais variáveis podem ser seguramente ignoradas em análises
subseqüentes, e quais variáveis devem ser mantidas. A análise de sensibilidade é uma
técnica usada para avaliar a contribuição relativa das variáveis de entrada à performance
de uma rede neural, pelo teste sucessivo das redes neurais com cada variável de entrada
“indisponível” (usando a técnica de substituição do valor ausente naquela variável) [36].
Nesta análise de sensibilidade, as variáveis são avaliadas de acordo com a
deteriorização da performance na modelagem. Fazendo isso, adota-se um simples valor
de avaliação para cada variável. Considerando, por exemplo, o caso em que duas
variáveis de entrada codificam a mesma informação (elas podem ser cópias da mesma
variável, como por exemplo, data de nascimento e idade). Um modelo particular
poderia depender totalmente de uma, totalmente de outra, ou de alguma combinação
arbitrária de ambas. A análise de sensibilidade produz uma sensibilidade arbitrária
relativa para ambas. Além disso, se alguma variável for eliminada, o modelo pode
compensar adequadamente porque a outra ainda alimenta a informação chave [36]. O
modelo pode então avaliar as variáveis como de baixa sensibilidade, sempre que elas
podem codificar a informação chave. Similarmente, uma variável que codifica
informações relativamente não importantes, pode ter altas sensibilidades.
É através da habilidade de aprender através do treinamento, que as RNA’s têm
sido aplicado com sucesso para resolver diversos problemas difíceis, e também podem
ser usados em problemas ambientais. Neste trabalho, as RNA`s foram usadas para o
preenchimento dos dados ausentes de chuva durante a preparação dos dados, e na
modelagem para previsão de escorregamentos.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 21/115
14
2.4.5 Método dos Vizinhos Mais Próximos ( KNN ).
O método KNN considera que os valores ausentes podem ser substituídos pelo
valor do atributo correspondente do objeto completo mais similar no conjunto de dados,
MITCHELL [38]. A Figura 2 ilustra os passos do algoritmo descritos por KENNEDY et
al. [39]:
Figura 2 – Fluxograma do Algoritmo KNN .
Este método foi aplicado neste estudo usando duas diferentes definições de
distâncias métricas (Euclidiana e Manhattan). Considerando dois objetos i e j, ambos
descritos por um conjunto de atributos contínuos { x1, x2, …, x N }. A distância entre o
objeto i e o objeto j pode ser chamada d (i, j), HRUSCHKA et al. [40]. Supondo que o
k-ésimo valor do atributo (1 ≤ k ≤ N) do objeto m está ausente. Deste modo, o método
KNN calcula as distâncias d (m, i). para todo i ≠ m, de acordo com a distância Euclidiana
ou Manhattan, respectivamente:
Armazena todos os pares entrada saída no conjuntode treinamento
Treinamento
Para cada padrão do conjunto de testeTeste
Busca pelos padrões do K mais próximo relativo ao padrão de entrada usando uma medida de distância
Para Classificação, calcula a confiança para cada
classe sendo C i / k , onde C i é o número de padrõesentre os padrões de K mais próximos pertencentes aclasse i. A classificação para o padrão de entrada é aclasse com a confiança mais alta.Para Imputação, o valor de saída ou resposta é
baseado numa combinação ponderada dos valores dosadrões de K mais róximos
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 22/115
15
d (m,i)E =22
112
112
11 )(...)()(...)( i N
m N
ik
mk
ik
mk
im x x x x x x x x −++−+−++− ++−− (1)
d (m,i)M =i
N m
N ik
mk
ik
mk
im x x x x x x x x −++−+−++− ++−− ...... 111111 (2)
Nestas expressões, como atributo xk está vazio, então ele não é considerado no
cálculo. Depois de calcular todas as distâncias, a menor delas é escolhida, a qual se
refere ao objeto mais similar relativo a m. Este objeto é chamado s, que é o vizinho mais
próximo. Nesta maneira, pode-se ter que d (m, s) para todo i ≠ m, e xk m é substituído por
xk s.
Neste trabalho, o método de KNN foi usado para o preenchimento dos dados
ausentes de volume de escorregamento durante a preparação dos dados,
2.4.6 Regras de Associação de Dados.
As regras de associação buscam por relações interessantes entre os itens num
dado conjunto de dados. A descoberta dessas relações de associações entre enormes
quantidades de registros pode ajudar em muitos processos de decisões.
Uma variável Booleana representa a presença ou ausência de um item. Cada
registro pode ser representado por um vetor Booleano de valores atribuídos para essas
variáveis, LIU et al. [41]. Os vetores booleanos podem ser usados para identificar
padrões que refletem os itens que são freqüentemente associados. Esses padrões podem
ser representados na forma de regras de associação. Uma regra é basicamente composta
por partes, antecedente ( A) e conseqüente (C ). Por exemplo, a informação que um
determinado índice pluviométrico acumulado ( X ) seja atingido, também tende a
deflagrar escorregamentos (Y ) durante as chuvas intensas, é representado na Regra de
Associação abaixo:
Rule n:" X ) "-> " Y
(S% C% s s’) (3)
Explicando os índices da regra acima:
s% - é o valor suporte da regra [P (X U Y))].
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 23/115
16
c% - é a confiança da regra [P (Y|X)].
s - é o valor suporte da regra expresso em número de vezes que ocorre X ou Y .
s´ – é o número de vezes em que os dois itens X e Y ocorrem simultaneamente.
Suporte e confiança das regras são duas medidas de regras interessantes que
refletem respectivamente a utilidade e certeza das regras descobertas. Um suporte de
25,5 % para a Regra de Associação (3) significa que 25,5 % de todos registros que um
determinado índice pluviométrico acumulado ( A) tenha sido atingido, também tendem a
deflagrar escorregamentos (C ). Uma confiança de 92% significa que 92% dos registros
de deflagração dos escorregamentos (C), ocorreram dado que um determinado índice
pluviométrico acumulado ( A) também tenha sido atingido. Tipicamente regras de
associação são consideradas interessantes se elas satisfazem ambos um limiar de
suporte mínimo e um limiar de confiança mínimo. Tais limiares podem ser agrupados
por usuários ou domínios especialistas [40].
O algoritmo Apriori desenvolvido por AGRAWAL and SRIKANT [42] é
eficiente como regra de associação de mineração e explora as propriedades de um nível
discreto de mineração Apriori: todos subconjuntos não vazios de um frequent itemset devem também ser freqüente. A k -ésima iteração (para k>1) forma freqüente (k+1)-
itemset candidatos baseados nos freqüentes k -itemsets, e varre a base de dados uma vez
para encontrar o conjunto completo de freqüentes (k+1)-itemsets, Lk+1.
As variações envolvendo redução de misturas e transações podem ser usadas
para fazer o procedimento mais eficiente. Outras variações incluem particionar os dados
(minerando cada partição e então combinando os resultados), e amostrando os dados
(minerando em um subconjunto dos dados). Essas variações podem reduzir o número deiterações requeridas para um pequeno número, tal como dois ou um [42].
2.4.7 Análise de regras interessantes.
Enquanto as Regras de Associação têm provado serem muito úteis em
aplicações práticas, os algoritmos de regra de associação em mineração tendem a
produzir grandes números de regras, muitas das quais não são interessantes. Usuários
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 24/115
17
têm considerável dificuldade manual de analisar tantas regras para identificar algumas
verdadeiramente interessantes. Para resolver tal problema, tem sido desenvolvida [41]
uma aproximação para ajudá-los a encontrar regras interessantes (em particular, regras
inesperadas) de um conjunto de regras de associação descoberto. A Análise de
Interessabilidade alavanca o conhecimento do domínio existente para analisar
associações descobertas e então classificar as regras descobertas de acordo com os
vários critérios de Interessabilidade, tal como conformidade e vários tipos de
inesperados.
O procedimento de Interessabilidade refere-se a encontrar regras que são
interessantes e úteis aos usuários, não somente qualquer regra possível. Pesquisas em
Mineração de Dados tem mostrado que podemos medir a Interessabilidade de uma
regra usando ambas medidas: objetivas e subjetivas.
Medidas objetivas envolvem analisar a estrutura das regras, a performance
preditiva, e a significância estatística. Em regras de associação, tais medidas incluem
suporte e confiança. Entretanto, medidas objetivas são insuficientes para determinar a
Interessabilidade de uma regra descoberta, sendo necessárias medidas subjetivas.
As duas principais medidas subjetivas de Interessabilidade são:
• Inesperabilidade: As regras são interessantes se elas são desconhecidas dousuário ou contradizem ao existente conhecimento do usuário (ou esperado);
• Acionabilidade: As regras são interessantes se os usuários podem acionar
alguma atividade que produza benefício.
As regras interessantes podem ser classificadas dentro de três categorias:
• Regras que são ambas inesperadas e acionáveis;
• Regras que são inesperadas, mas não são acionáveis, e
• Regras que são acionáveis, mas esperadas.
O foco deste trabalho é para o inesperado. A acionabilidade é parcialmente
manuseada diretamente com o inesperado, porque as regras acionáveis são ou esperadas
ou inesperadas.
Regras esperadas são também chamadas de regras conformes porque elas
correspondem conhecimentos existentes ou expectativas dos usuários. Este modelo de
regra é mais geral que o modelo original que AGRAWAL et al. [43] desenvolveram.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 25/115
18
Define-se regra de associação (generalizada) em mineração como segue:
Seja I = {i1, . . ., iw} um conjunto de itens. Seja G uma representação acíclica
direcionada dos itens. Uma extremidade em G representa uma iso - relação. Então, G é
um conjunto de taxonomias. A Figura 3 ilustra um exemplo de taxonomias.
Figura 3 – Exemplo de Taxonomias.
A Análise de Interessabilidade é uma técnica interativa e iterativa. Em cada
iteração, deve-se especificar os conhecimentos existentes sobre o domínio. Então o uso
deste conhecimento analisa as regras descobertas de acordo com algum critério de
Interessabilidade, e através de tal análise identifica aquelas regras potencialmente
interessantes. Basicamente o algoritmo trabalha como segue:
Repete até que o usuário decida parar:
• o usuário especifica algum conhecimento existente ou modifica o
conhecimento especificado previamente;
• o sistema analisa as regras descobertas de acordo com suas conformidade e
inesperabilidade;
• o usuário inspeciona os resultados da análise através do sistema de
visualização, salva as regras interessantes, e remove as regras não
interessantes.
A linguagem de especificação é bastante simples e permite aos usuários
expressarem seus conhecimentos existentes. A linguagem permite três tipos
especificações, cada conhecimento representando um grau diferente de precisão:
• impressões gerais ( IG),
• conceitos precisos razoáveis ( RPC ), e• conhecimento preciso (PK ).
Volume Danos
Escorregamentos
Tipologia
Solo Rocha Pequeno Médio Grande Pequenos Graves
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 26/115
19
Os dois primeiros tipos de conhecimento representam o sentimento vago do
usuário, e o último tipo representa o conhecimento preciso. Esta divisão é importante
porque o conhecimento humano tem granularidades. Alguns aspectos de nosso
conhecimento sobre o domínio são em geral completamente vago, enquanto outros são
muito precisos.
É crucial permitir diferentes tipos de conhecimento para serem especificados.
Isto não somente determina como podemos fazer uso do conhecimento, mas também
podemos fazer uso de todos possíveis conhecimentos do usuário. Por exemplo, se um
sistema pode somente manusear conhecimento preciso, o usuário o qual tem somente
vagas impressões não pode usar o sistema.
A linguagem de especificação também faz uso da idéia da clássica hierarquia(ou taxonomia), que é a mesma como usada em regras de associação generalizadas.
Depois das regras descobertas terem sido analisadas, a análise mostra
diferentes tipos de regras potencialmente interessantes aos usuários. A chave é mostrar
os aspectos essenciais das regras tal que elas possam levar vantagem às capacidades
visuais humanas para possibilitar o usuário a identificar as regras verdadeiramente
interessantes com rapidez e facilmente. Os aspectos essenciais são:
• Tipos de regras potencialmente interessantes: Diferentes tipos de regrasinteressantes devem ser separadas porque elas dão ao usuário diferentes tipos
de conhecimento interessante.
• Graus de Interessabilidade (valores “igualados”): As regras devem ser
agrupadas de acordo com seus graus de Interessabilidade. Isto permite ao
usuário focalizar primeiramente nas regras máximo inesperado (ou
correspondente) e decidir se olha às regras com menor grau de
Interessabilidade.• Itens Interessantes: Mostrando os itens interessantes numa regra são mais
importantes que toda a regra. Isto é talvez a decisão crucial máxima. Os itens
inesperados são aqueles mais importantes ao usuário devido ao primeiro
aspecto acima, os usuários já sabem qual tipo de regras interessantes eles estão
procurando. Por exemplo, quando eles olham para as regras conseqüentes
inesperadas, é natural que a primeira coisa que eles querem saber é o quais são
os itens inesperados nas partes conseqüentes. Sempre que se quer mostrar todo
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 27/115
20
o conjunto de regras, os usuários ainda precisam procurar pelos itens
inesperados nas regras.
Maiores detalhes podem ser obtidos em [41]. Este procedimento é
extremamente útil e será utilizado para extrair regras interessantes do banco de dados de
escorregamentos, neste trabalho.
2.4.8 Regras de Classificação de Dados.
A classificação baseada em regras de associação consiste basicamente em
descobrir um pequeno conjunto de regras numa base de dados que forme um
classificador acurado, LIU et al. [44]. Para as regras de associação, o alvo da mineração
não é predeterminado, mas para as regras de classificação existe um e somente um alvo
predeterminado, a classe. A particularidade desse conjunto de regras de classificação,
portanto, é de possuir o atributo classe posicionado do lado direito da regra.
Esta metodologia de classificação assume que o banco de dados é uma tabela
relacional, que consiste de N casos descritos por l distintos atributos. Estes N casos têm
sido classificados dentro de q classes conhecidas. Um atributo pode ser categórico
(discreto) ou contínuo (numérico). Durante a classificação, todos os atributos são
tratados uniformemente. Para um atributo categórico, todos os possíveis valores são
mapeados para um conjunto de positivos inteiros consecutivos. Para um atributo
contínuo, seu valor é discretizado dentro de intervalos, e os intervalos também são
mapeados em um conjunto de positivos inteiros consecutivos. Com esses mapeamentos,
pode-se tratar um caso (objeto ou registro) como um conjunto de pares (atributo, valor
inteiro) e um rótulo de classe. Cada par (atributo, valor inteiro) é chamado de item.Seja D o conjunto de dados, I o conjunto de todos os itens em D, e Y o conjunto
de rótulos de classes. Pode-se dizer que um caso d ∈ D contém X ⊆ I , um subconjunto
de itens, se X ⊆ D. Uma regra de associação de classificação ( RAC ) é uma implicação
da forma X → y, onde X ⊆ I , e y ∈ Y . Uma regra X → y em D tem confiança c se c%
dos casos em D que contém X são rotulados com a classe y. A regra X → y tem suporte
s em D se s % dos casos em D que contém X são rotulados com a classe y.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 28/115
21
Para produzir o melhor classificador de todo o conjunto de regras efetua-se a
avaliação de todos os possíveis subconjuntos gerados durante o treinamento dos dados e
a seleção dos subconjuntos com uma seqüência de regras que consegue o menor número
de erro, considerando uma ordem para a seleção destas regras. Dado duas regras, r i e r j,
r i › r j (também chamado r i que precede r j ou tem uma maior precedência que r j) se:
1. a confiança de r i é maior que r j, ou
2. suas confianças são as mesmas, mas o suporte de r i é maior que r j, ou
3. ambos confiança e suporte de r i e r j são os mesmos, mas r i é gerado antes
que r j.
Se R é o conjunto de regras geradas, e D os dados de treinamento, a idéia básica do algoritmo é escolher um conjunto de regras precedentes em R para cobrir D. O
algoritmo do classificador é construído em três passos.
• Classifica o conjunto de regras R de acordo com a relação de precedência para
assegurar regras altamente precedentes;
• Seleciona as regras para o classificador da seqüência de regras classificada.
Para cada regra r , o algoritmo varre D e encontra aqueles casos cobertos por r
(elas satisfazem as condições de r ). É marcada a regra r se ela classifica
corretamente o caso d . Se r pode classificar corretamente ao menos um caso
(se r é marcada) ela será considerada uma regra potencial para o classificador.
Aqueles casos cobertos são removidos de D. Uma classe é também
selecionada (a classe majoritária nos dados remanescentes), que define o
critério de parada da seleção de mais regras para o classificador C . Calcula-se
e registra-se o número de erros durante a classificação, Quando não existirem
mais regras ou casos de treinamento errados, o processo de seleção está
completo;
• São descartadas todas as regras em C que não melhoram a acurácia do
classificador. A primeira regra em que exista o número mínimo de erros
registrados em D é a regra que limita a poda. Todas as regras depois desta
regra podem ser descartadas porque elas irão produzir mais erros. As regras
não descartadas e a classe da última regra selecionada em C formam oclassificador.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 29/115
22
Esta técnica de classificação é muito eficiente, maiores detalhes em [44]. Foi
construído neste trabalho um classificador para predição de escorregamentos usando a
técnica de classificação baseada em associação.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 30/115
23
CAPÍTULO 3VIABILIDADE
A cidade do Rio de Janeiro possui características físicas favoráveis ao
desenvolvimento de escorregamentos em encostas. O relevo acidentado e a ocupação
das áreas de encostas pela população, desconfiguram o meio natural que se torna
suscetível aos escorregamentos durante a ocorrência de chuvas intensas.
A previsão destes acidentes é de fundamental importância para agilizar a
mobilização das instituições responsáveis em prestar socorro aos moradores das
encostas. Este estudo propõe a construção de um modelo para a previsão dos
escorregamentos auxiliando o sistema de alerta existente.
3.1 Descrição do Problema.
A Fundação Geo-Rio emite anualmente um relatório de escorregamentos
composto de acidentes geotécnicos ocorridos nas encostas do Município do Rio deJaneiro. Os acidentes são aqueles relacionados a eventos chuvosos e consolidados
através de laudos técnicos obtidos após vistorias de campo pelos técnicos da Geo-Rio.
A partir dessas informações básicas encontradas no relatório de
escorregamentos, buscou-se criar um banco de dados com todas as possíveis variáveis
relacionadas ao fenômeno.
3.2 Banco de Dados.
Os registros de escorregamentos disponíveis para este estudo contemplam os
anos de 1998 a 2001. Foram realizadas visitas às instituições responsáveis por base de
dados meteorológicos e de uso e ocupação do solo, a fim de criar um banco de dados
adequado para a extração de conhecimento do fenômeno estudado. Durante a fase deobtenção dos dados, não se teve a preocupação com a escala temporal (freqüência de
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 31/115
24
amostragem dos dados), nem com a localização das estações meteorológicas (desde que
estas se situassem dentro do estado do Rio de Janeiro).
Os itens seguintes detalham a base de dados obtida em cada instituição
visitada.
3.2.1 Dados de Escorregamentos.
Embora possam existir outras bases de dados de escorregamentos, foram
obtidos para esta tese somente os dados fornecidos pela Geo-Rio, pois estes dados são
mais detalhados cronologicamente e espacialmente.
• Fundação Geo-Rio.
Nos relatórios anuais da Geo-Rio encontram-se os registros de
escorregamentos [22], [23], [24] e [25]. Em cada registro são anotados o local (bairro
em que ocorreu o acidente), data, hora, tipologia do acidente, volume escorregado
(estimado em metros cúbicos) e os danos ou conseqüências causadas pelos
escorregamentos. A tabela 5 ilustra um registro de escorregamento obtido do relatório
da Geo-Rio:
Tabela 5 - Registro de Escorregamento da Geo-Rio.
Localização Data Hora Descrição da Classe Volume Conseqüências(Rua /Bairro) Ocorrência (m3)
Rua AntônioRego, 1447 -
Ramos
08 /Jan/
1998
20:00 Escorregamentode solo em talude
de corte
ES/tc 15 Danos à moradia
3.2.2 Dados Meteorológicos.
Os parâmetros medidos pelas estações meteorológicas, além dos dados de
precipitação, são importantes indicadores dos processos de formação de grandes chuvas,
e motivou a obtenção desses dados para uma possível análise de uso na construção do
modelo. Foram obtidos dados meteorológicos nas seguintes instituições:
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 32/115
25
• Fundação Geo-Rio.
Os registros dos dados pluviométricos obtidos na Geo-Rio se processam
através do Sistema Alerta Rio, composto por 32 pluviômetros automáticos,
estrategicamente distribuídos na área do Município, e capazes de enviar,
ininterruptamente, em tempo real e a cada 15 minutos, registros de precipitação para
uma estação central computadorizada, localizada na sede da Geo-Rio. Os dados de
precipitação são importantes para a modelagem do fenômeno de escorregamentos, pois
se sabe que as chuvas intensas contribuem para a saturação e conseqüente instabilidade
do solo nas encostas [5], [6], [7], [8] e [9].
A base de dados de chuva cedida pela Geo-Rio para o desenvolvimento desta
tese é composta dos registros de chuva a cada 15 minutos, de 30 pluviômetros da rede
automática, e a partir de 6 dias antecedentes e inclusive aos dias dos acidentes. A Figura
4 ilustra a rede dos 30 pluviômetros automáticos:
Figura 4 - Rede de Pluviômetros Automáticos.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 33/115
26
• Departamento de Controle do Espaço Aéreo – DECEA.
As estações meteorológicas da Diretoria de Proteção ao Vôo estão localizadas
nos cinco principais aeroportos da cidade do Rio de Janeiro e registram a cada 6 horas(4 registros diários) os parâmetros atmosféricos: temperaturas do bulbo úmido e seco;
pressões mínima, média e máxima; registro médio diário da direção e intensidade do
vento; temperaturas mínima e máxima do ar; umidade relativa; precipitação diária;
duração da precipitação no dia, duração de nevoeiro; e duração de trovoada.
A base de dados obtida no DECEA abrange o período de janeiro de 1998 a
dezembro de 2000, das estações meteorológicas conforme tabela 6.
Tabela 6 - Estações Meteorológicas do DECEA (Aeronáutica Brasileira).
CoordenadasNº Nome da Estação - Sigla UTM (E) UTM (N)
Cota (m)
1 Afonsos – AF 665883.09 7470331.04 34,02 Galeão - GL 679652.94 7477557.18 9,03 Jacarepaguá – JR 667449.86 7457393.43 3,04 Santos Dumont – RJ 689781.24 7466358.12 4,05 Santa Cruz - SC 631615.59 7463286.15 1,5
• Instituto Nacional de Meteorologia - INMET .
A base de dados cedida pelo INMET é composta de registros pluviométricos
diários de 3 estações localizadas no município do Rio de Janeiro e durante os anos de
1998, 1999 e 2000, conforme tabela 7.
Tabela 7 - Pluviômetros do Instituto Nacional de Meteorologia ( INMET ).
CoordenadasNº Nome da Estação UTM (E) UTM (N)
Cota (m)
1 Alto da Boa Vista 677,72638 7460,93356 347,02 Bangu 657,31198 7470,38896 40,03 Jardim Botânico 682,83183 7459,02653 5,0
• Secretaria Estadual de Rios e Lagoas - SERLA.
A base de dados cedida pela SERLA é composta de registros pluviométricos
diários de 4 estações localizadas no município do Rio de Janeiro e durante os anos de1998, 1999 e 2000, conforme tabela 8.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 34/115
27
Tabela 8 - Pluviômetros da Secretaria Estadual de Rios e Lagoas (SERLA).
CoordenadasNº Nome da Estação UTM (E) UTM (N)
Cota (m)
1 Capela Mayrink 676,576 7460,085 460,02 Benfica (CCPL) 679,631 7467,771 2,03 Realengo 661,502 7470,437 30,04 Via 11- SUDEBAR 667,439 7455,667 10,0
• Estação Meteorológica da Universidade do Estado do Rio de Janeiro - UERJ .
A estação Meteorológica da UERJ , situada na coordenada UTM 679,831 (E),
7353,840 (N) e cota 11,0 m de altitude, registra a cada 8 horas (3 dados diários) os
seguintes parâmetros atmosféricos: umidade relativa do ar, direção e intensidade do
vento, precipitação, temperatura do ar, temperaturas diária mínima e máxima. O banco
de dados da UERJ , abrange o período de janeiro de 1997 a setembro de 2000.
• Estação Meteorológica da Universidade Federal do Rio de Janeiro – UFRJ .
A estação Meteorológica da UFRJ , situada na coordenada UTM 680,505 (E),
7471,791 (N) e cota 5,0 m de altitude, registra 2 vezes ao dia (12 UTC e 18 UTC) os
seguintes parâmetros atmosféricos: temperatura barômetro, leitura barométrica, pressão
nível estática, barógrafo, term. seco, temperatura do ar, term. úmido, temperatura bulbo
úmido, term. máxima, temperatura máxima, term. mínima, temperatura mínima,
umidade tabular, termógrafo, higrógrafo, direção e velocidade do vento, anemômetro,
visibilidade, alcance, precipitação, evaporação, nebulosidade, cobertura, fenômenos
diversos. O banco de dados cedido pela UFRJ contempla os anos de 1998 e 1999.
• Estações Meteorológicas da Diretoria de Hidrografia e Navegação - DHN .
As estações meteorológicas da Marinha do Brasil registram a cada 3 horas (8
medições diárias), os parâmetros atmosféricos: direção e intensidade do vento, altura
(vagas), período (vagas), altura marul., direção, marul., período marul., temperatura daágua do mar, NR céu coberto, NR cobertura nuvens baixas, tipos nuvens altas, tipos
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 35/115
28
nuvens baixas, tipos nuvens médias, altura base nuvem mais baixa, codificação do
tempo presente, codificação visibilidade horizontal, temperatura bulbo úmido,
temperatura bulbo seco, temperatura do ponto de orvalho, umidade relativa, pressão,
precipitação. A base de dados das estações meteorológicas cedida pela DHN contempla
o período de janeiro de 1995 a outubro de 2000, conforme tabela 9.
Tabela 9 - Estações Meteorológicas da DHN (Marinha do Brasil).
CoordenadasNº Nome da Estação UTM (E) UTM (N)
Cota (m)
1 São Tomé 907,829 7556,323 ≅0,02 Ilha Rasa 689,528 7447,867 ≅0,03 São Pedro da Aldeia 797,698 7473,818 ≅0,0
• Estações de Radiossondagem - Wyoming University.
As radiossondas são equipamentos utilizados para medição de parâmetros
meteorológicos na atmosfera, desde a superfície até cerca de 30 km de altura. Estes
equipamentos possuem sensores de temperatura, umidade e pressão, parâmetros estes
que são transmitidos na freqüência usual do equipamento e recebidos no solo pela
estação de recepção.
O banco de dados de radiossondagem é composto por duas perfilagens diárias
da atmosfera (12 UTC e 24 UTC), compreendendo o período de 1994 a 2000. Os vários
parâmetros medidos permitem identificar padrões de riscos de ocorrência de
tempestades e chuvas intensas. As estações da base de dados obtida são apresentadas na
tabela 10.
Tabela 10 - Estações de Radiossondagem.
CoordenadasNº Nome da Estação Longitude Latitude
1 SBAF (Afonsos) 43° 37´ W 22° 87´ S2 SBGL (Galeão) 43° 25´ W 22° 82´ S3 SBME 41° 77´ W 22° 35´ S4 SBRJ (Santos Dumont) 43° 17´ W 22° 90´ S5 SBSC (Sta. Cruz) 43° 72´ W 22° 93´ S
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 36/115
29
3.2.3 Dados de Parâmetros do Solo.
Os parâmetros do solo são variáveis importantes no estudo de
escorregamentos, pois cada encosta possui sua resistência característica ao
desenvolvimento dos acidentes [29]. Foram obtidos dados de parâmetros do solo na
seguinte instituição:
• Secretaria Municipal de Meio Ambiente do Rio de Janeiro (SMAC )
A SMAC [45] desenvolve uma estratégia de elaboração de diagnósticos
técnicos sobre as condições ambientais da cidade do Rio de Janeiro. Estes estudos são
realizados desde 1984 a partir da análise de imagens de satélite e resultados deste
levantamento proporcionam informações sobre as condições da estrutura e cobertura do
solo no município, mostrando seus problemas e propiciando um melhor planejamento e
a implementação de ações de recuperação e controle das áreas críticas.
A base de dados obtida junto a SMAC contempla o cálculo das áreas dosmapeamentos classificados por 159 bairros do município do Rio de Janeiro. As áreas
calculadas para cada bairro são referentes a 5 taxonomias diferentes (cobertura e uso do
solo, aptidão para reflorestamento e olericultura, qualidade ambiental das terras,
vulnerabilidade ambiental das terras e pedologia), totalizando 46 parâmetros, descritos
detalhadamente no Anexo I. Os dados fornecidos são da classificação realizada no ano
de 1999. A tabela 11 ilustra os 46 parâmetros das 5 taxonomias diferentes usados na
modelagem. Esta tabela é bastante útil para interpretar as siglas utilizadas na
modelagem.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 37/115
30
Tabela 11 – Taxonomias, Parâmetros dos Solos e Siglas.
Taxonomia Parâmetro SiglaFloresta Uso_flor
Floresta Alterada Uso_flat
Mangue Uso_mangApicum Uso_apicRestinga Uso_rest
Área Úmida Uso_arumCampo Antrópico Uso_cpoaCultura / Pastagem Uso_cupa
Praia Uso_praiAfloramento Rochoso Uso_afro
Área Urbana Uso_urbÁrea Urbana Não Consolidada Uso_urbn
Parques Uso_parqSolo Exposto Uso_sexp
Cobertura
e
Uso
do
Solo
Água Uso_aguaBoa Apt_boa
Regular Apt_regRestrita Apt_restEspecial Apt_esp
Sem Aptidão Apt_sem
Aptidão para
Reflorestamento e
OlericulturaOutros Apt_out
Área de Alerta Qld_aler Conservada Qld_cons
Extremamente Degradada Qld_extdFortemente Degradada Qld_ftmd
Ligeiramente Degradada Qld_ligdModeradamente Qld_mod
Qualidade
Ambiental
das TerrasOutros Qld_out
Alta Vul_boaBaixa Vul_reg
Extremamente Alta Vul_restModerada Vul_espMuito Alta Vul_sem
Vulnerabilidade
Ambiental
das Terras
Outros Vul_outAfloramento de Rocha Sol_aflr
Brunizém Sol_bruzLatossolo Sol_lats
Manguezal Sol_mangPlanossolos Sol_plan
Podzol Sol_podzSolos Aluviais Sol_aluv
Profundos Sol_prof Solos Glei Sol_glei
Solos Orgânicos Sol_orgSolos Podzólicos Sol_zoli
Pedologia
Outros Sol_out
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 38/115
31
3.2.4 Topografia.
A declividade de uma encosta é de fundamental importância no estudo de
escorregamentos. Infelizmente não foi obtido nenhum mapa digital de elevação do
terreno. Para incluir algum tipo de informação topográfica para o modelo, foi incluída
na base de dados a variável exposição relativa, uma medida relacionada às altitudes
circunvizinhas do local em estudo, BROWER [46].
A exposição relativa (ER) é igual a exposição absoluta (EA) dividida pela
diferença entre as elevações máxima e mínima nas áreas circunvizinhas. Define-se a
exposição absoluta como a diferença entre a elevação de uma particular célula e aelevação média das células circunvizinhas.
Neste trabalho foram utilizadas as cotas dos pluviômetros para o cálculo das
exposições relativas, pois estas foram as únicas informações de altitude obtidas. A
Figura 5 ilustra os polígonos de Thiessen, delimitadores das áreas de abrangência de
cada pluviômetro, rotulados pela letra P seguido do número correspondente do
pluviômetro, além da letra C (cota) seguida do valor da altitude (em metros).
Figura 5 – Cálculo da Exposição Relativa
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 39/115
32
Para se obter a exposição relativa do pluviômetro localizado em Gericinó (P-
21), é apresentado um roteiro do cálculo que se torna de fácil entendimento ao observar
a figura esquemática:
EA (P21) = ABS {C21 – [Média (C29, C26, C 22)]} (4)
EA (P21) = ABS {0 – [(15+30+736)/3]} (5)
EA (P21) = 260.63
ER (P21) = 100*EA / { [Máximo (C29, C26, C22)] - [Mínimo (C29, C26, C 22)] } (6)
ER (P21) = 100*260.63/ [736 - 15] (7)
ER (P21) = 36,11%
Um valor de ER próximo de 100 significa que este pluviômetro está localizado
numa região de maior altitude em comparação com os pluviômetros vizinhos; e um
valor de ER próximo de 0 (zero) significa que este pluviômetro está localizado num
ponto baixo em relação aos pluviômetros vizinhos.
Também é importante ressaltar que foram consideradas algumas
particularidades durante os cálculos:
• Se o pluviômetro (polígono) fosse vizinho do mar, esta informação também foi
considerada assinando a cota 0 para o cálculo;
• Se o pluviômetro (polígono) fosse vizinho de outro município, esta informação
não foi considerada por não haver dados de altimetria dos municípios vizinhos.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 40/115
33
CAPÍTULO 4METODOLOGIA
As atividades necessárias para o desenvolvimento deste trabalho basicamente
consistem da obtenção, digitalização, preparação e modelagem dos dados. A primeira
atividade foi descrita no item 3.2 (Banco de Dados). Os itens seguintes da metodologia
descrevem as duas últimas atividades: preparação dos dados e modelagem.
4.1 Estudo de Aproveitamento dos Dados.
A base de dados obtida apresenta uma diversidade de parâmetros medidos,
escalas espaciais completamente aleatórias e diferentes freqüências de amostragem.
Para definir em que escalas de tempo e espaço seria viável trabalhar foi necessário
primeiramente “minerar” esta quantidade de dados e informações. A definição das
escalas foi realizada confrontando os diversos parâmetros medidos em relação aoespaço e ao tempo, mas de forma simultânea.
4.1.1 Análise dos Dados de Pluviometria.
A principal causa dos escorregamentos analisada neste trabalho é a
pluviosidade acumulada. A rede de pluviômetros da Geo-Rio registra a cada 15minutos, os níveis de pluviometria na cidade do Rio de Janeiro. Esta freqüência de
amostragem permite com facilidade a obtenção de uma relação cronológica do
momento em que ocorreu o acidente e os índices pluviométricos acumulados
associados.
Os outros dados de chuva obtidos são medições diárias, e uma possível relação
cronológica com o momento do acidente seria muito incerta, devido ao intervalo muito
grande entre uma medição e outra. Sob a ótica espacial, a rede de pluviômetros da Geo-
Rio consegue cobrir as áreas de abrangência das estações de medições diárias.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 41/115
34
Dessa forma, os dados diários de pluviometria foram descartados e os dados da
rede automática foram selecionados para o tratamento de consistência ou preparação.
4.1.2 Análise dos Dados de Parâmetros Meteorológicos.
Os dados meteorológicos obtidos contemplam estações localizadas no
município do Rio de Janeiro, além de estações localizadas no estado fluminense.
Foi realizado um estudo estatístico da distribuição da velocidade e direção do
vento de quatro estações meteorológicas: UERJ e Ilha Rasa localizadas no município do
Rio de Janeiro, e São Tomé e São Pedro da Aldeia localizadas no norte do estado. Estas
estações realizam no mínimo 3 medições diárias e no máximo 5 medições diárias.
Para calcular as freqüências dos dados de direção do vento da estação
meteorológica da UERJ , que originalmente apresentava-se na forma categórica, C
(calmaria), N, NE, E, SE, S, SW, W e NW, foi primeiramente necessário, que os valores
categóricos fossem convertidos para numéricos na mesma ordem, 0, 1, 2, 3, 4, 5, 6, 7 e
8. A Figura 6 ilustra a rosa dos ventos com a configuração original:
Figura 6 – Rosa dos Ventos.
Este estudo teve o objetivo de se identificar algum padrão que ocorresse nos
dias dos escorregamentos que fosse diferente do padrão encontrado na população dos
dados. Portanto, foram gerados histogramas de velocidade e rosa dos ventos para três
amostragens diferentes: população, 8 dias anteriores e inclusive os dias dos acidentes, edias dos acidentes. Não foi identificado nenhum padrão diferente nos dias dos
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 42/115
35
escorregamentos quando comparado à estatística da população. Além desta constatação,
a freqüência de medição do vento e de outros parâmetros atmosféricos também dificulta
uma associação cronológica com o momento do escorregamento. Por estes motivos,
foram descartados os dados dos parâmetros meteorológicos para a construção do
modelo. Os resultados deste estudo de vento são apresentados no Capítulo 5.
4.1.3 Análise dos Dados de Parâmetros do Solo.
A base de dados obtida junto a SMAC contempla o cálculo das áreas dos
mapeamentos classificados por 159 bairros do município do Rio de Janeiro. O mapa de
bairros georreferenciado foi adotado como base para esta tese, e os valores das
coordenadas dos pluviômetros da rede automática foram convertidos para o mesmo
sistema de referência (Datum SAD 69).
4.2 Preparação dos Dados.
Os dados são uma coleção de observações de eventos, que acontecem em
função de outros, e que possuem uma relação com o mundo real de onde ele foi
coletado. A manipulação dos dados promove o entendimento da natureza da qual ele foi
medido. Contudo, antes de se aplicar qualquer método de análise nos dados, é preciso
prepará-los previamente corrigindo qualquer inconsistência presente.
A preparação de dados é a parte mais importante de qualquer projeto, PYLE
[47], e o conjunto de dados preparado cuidadosamente expõe melhor a informação
contida para as ferramentas de modelagem.
As variáveis constantes devem ser descartadas, pois não alteram seu padrão
com a mudança de circunstância e com isso não alcançam informação e entendimento.
As variáveis esparsas possuem muitos valores vazios e a mudança desses valores traz
pouca informação. Os dados altamente esparsos devem ser reduzidos a um número de
variáveis de tal modo que permita a extração de conhecimento. Esta redução também
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 43/115
36
deve ser aplicada às variáveis redundantes e colineares. A numeração de variáveis
categóricas pode também ser útil em muitas aplicações.
Nos bancos de dados na vida real, algumas observações de um ou mais
atributos estão tipicamente ausentes.
Estes valores ausentes são um problema crítico para os métodos de mineração
dos dados, que muitas vezes não são aptos para manuseá-los numa forma automática, ou
seja, sem a prévia preparação dos dados. Em geral, existem várias aproximações para
proceder com o problema de valores ausentes: i) ignorar os objetos contendo valores
ausentes; ii) preencher os vazios manualmente; iii) substituir os valores ausentes por
uma constante; iv) usar a média ou moda dos dados na mesma classe como um valor de
substituição; e v) usar o valor mais provável para preencher os valores ausentes. A
primeira aproximação envolve remover os exemplos e /ou atributos com valores
ausentes. Contudo, a perda dos dados pode ser considerável e o conjunto de dados
incompleto pode ficar vulnerável a tendências nas análises estatísticas. A segunda
aproximação é normalmente impossível nas tarefas de mineração de dados, devido a
grande dimensionalidade dos conjuntos de dados analisados. A terceira aproximação
assume que todos os valores ausentes representam o mesmo valor, permitindo
consideráveis distorções. A substituição pelo valor médio /moda é uma prática comum e
algumas vezes pode-se chegar a resultados razoáveis, contudo, esta aproximação não
considera a relação entre as variáveis, que são usualmente úteis para o processo de
substituição dos valores ausentes. Por essa razão, a melhor aproximação envolve o
preenchimento dos valores ausentes com o método do valor mais provável.
A substituição dos valores ausentes, também chamada imputação, não deve
mudar as características importantes do conjunto de dados. Neste sentido, é necessário
definir as características importantes para serem mantidas. Os métodos de mineração de
dados usualmente exploram, as relações entre as variáveis e, dessa forma, as preservam,
tanto quanto possível, quando substituem os valores ausentes. Em outras palavras, o
objetivo da imputação é substituir os valores ausentes cuidadosamente, tentando evitar a
imputação de tendências no conjunto de dados. Quando a imputação é realizada de uma
maneira apropriada, são produzidos dados com alta qualidade, e o resultado da
mineração de dados pode ser melhorado.
A Figura 7 ilustra as atividades desenvolvidas por SOUZA & EBECKEN [48],
durante a preparação dos dados.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 44/115
37
Figura 7 – Atividades necessárias para a preparação dos dados.
4.2.1 Preparação das Variáveis de Escorregamento.
Os valores das variáveis categóricas data, hora, danos causados e tipologia
foram convertidos para números inteiros positivos. Os valores da variável data foram
convertidos para números inteiros positivos no intervalo de 1 a 12, referentes aos meses
do ano; e os valores da variável hora para números inteiros positivos no intervalo de 1 a
4, referentes aos períodos do dia, sendo 1, 2, 3 e 4, para os registros ocorridos entre
03as09h, 09as15h, 15as21h e 21as03h, respectivamente. Os valores da variável danos
causados foram convertidos para números inteiros positivos no intervalo de 1 a 6,
conforme ilustra a última coluna da Tabela 12:
Tabela 12 - Classes de Danos Causados.
Danos Causados Sigla ClasseSem Danos, Sem conseqüências Sem dano 1Danos à Acessos, Vias, Ruas, Log. Público, Bens Públicos AVRL 2Talude, Meio Ambiente, Erosão, Assoreamento MeioAmb 3Danos à estrutura de contenção, Água/Drenagem/Esg. ContADE 4Dano(s) à Moradia(s), Terrenos, Bens Materiais MorTB 5
Destruição (total/parcial) de moradia(s) / Vítimas (fatais ou não) VITDEST 6
Cálculo dasTaxas por
Bairros
Regionalização
Predição da FalhaRNA
Data/ Hora/ Local
Índices de Chuva Acumulada
Predição do Volume (KNN)
Solos Chuva Escorregamentos
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 45/115
38
Os valores da variável tipologia foram convertidos para números inteiros
positivos no intervalo de 1 a 12, conforme ilustra a última coluna da Tabela 13:
Tabela 13 - Classes de Tipologia dos Acidentes.
Tipologia Sigla Classe Não Ocorrência Nada 1Pânico PANICO 2Escorregamento de Tálus, Corrida ETOC 3Escorregamento de Rocha ER 4Ruptura de Aterro RA 5Processos Erosivos/ Assoreamento PE/A 6Escorregamento de Solo encosta ES/en 7Queda/Rolamento de Blocos ou Lascas Rochosos Q/R 8
Escorregamento de Lixo/Entulho EL/E 9Escorregamento de Solo e Rocha ES/R 10Ruptura de Estrutura de Contenção REC 11Escorregamento de Solo em talude ES/tc 12
Os relatórios de escorregamentos da GEO-RIO apresentam os acidentes
geotécnicos localizados pelo endereço e proximidade do pluviômetro, mas sem as
coordenadas geográficas, conforme exemplo da Tabela 14.
Tabela 14 – Exemplo de laudo da GEO-RIO.
No Localização Data Descrição daOcorrência
Pluviômetro Laudo
30 Rua Iguatemino 321, Ilha do
Governador
15/jan Ruptura deestrutura decontenção
Ilha doGovernador
119/99
A localização do acidente foi georreferenciada de acordo com o mapa de
bairros, com a devida Área de Planejamento (AP) e Região Administrativa (RA),
conforme ilustra a tabela 15.
Tabela 15 - Exemplo de laudo da GEO-RIO com a nova informação.
No Localização Data Descrição daOcorrência
Pluviômetro Laudo RA AP Bairro
30 Rua Iguatemino 321, IlhaGovernador
15/jan Ruptura deestrutura decontenção
Ilha doGovernador
119/99 XX AP-3
TAUA
O exemplo da tabela 15 posiciona melhor geograficamente o bairro Tauá, que
é somente um dentre os vários bairros que compõem a Ilha do Governador .
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 46/115
39
4.2.2 Regionalização dos Dados de Chuva, Substituição dos Valores Ausentes eCálculo dos Índices Acumulados de Chuva.
O banco de dados de chuva é composto por registros de precipitação, a
intervalos de 15 minutos, coletados em 30 pluviômetros automáticos instalados no
município. Foram selecionados 28 eventos ou períodos chuvosos, durante os quais
ocorreram escorregamentos nos anos de 1998 a 2001.
Os índices de chuva acumulada devem ser calculados com dados do
pluviômetro mais próximo ao bairro onde ocorreu o escorregamento.Contudo, o banco de dados de chuva apresentava-se com registros ausentes.
Para que se pudesse alcançar uma melhor estimativa dos padrões de chuvas causadores
dos escorregamentos, foi preciso preencher essas falhas.
O preenchimento pôde ser feito com auxílio da técnica de redes neurais
artificiais ( RNA’s), e os dados usados para o treinamento, teste e verificação das RNA’s,
foram agrupados com técnicas de redução de dimensionalidade (regionalização da
chuva).
A Figura 8 ilustra a metodologia utilizada na substituição dos valores ausentes.
Regionalização (preparação de dados)
Redes Neurais (predição)
Camada / Camadade -- deEntrada \ Saída
(Valor Predito)
Figura 8 – Metodologia de substituição de dados ausentes (falhas).
A regionalização dos dados foi necessária para identificar os padrões espaciais
da chuva e permitir que o treinamento da RNA fosse realizado com dados de
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 47/115
40
pluviômetros próximos daquele pluviômetro com falhas. Ou seja, se o treinamento fosse
realizado com todos os dados possíveis, tender-se-ia a adicionar ruído proveniente de
dados de pluviômetros distantes, uma vez que existe uma grande variabilidade espaço-
temporal da chuva no município do Rio de Janeiro. Além disso, a regionalização
configura um número reduzido de variáveis para o treinamento da RNA, reduzindo o
esforço computacional.
SOUZA and EBECKEN [49] utilizaram quatro metodologias neste estudo de
regionalização: Análise de Componente Principal ( ACP), Matriz de Auto-Correlação
( MAC ), Árvore de Agrupamento e o Método K-Means.
Uma vez agrupados os pluviômetros segundo as técnicas de regionalização
citadas, os bancos de dados de chuva puderam ser preparados para o treinamento, teste e
predição dos valores ausentes através das RNA’s, SOUZA and EBECKEN [50].
Os resultados deste preenchimento dos dados ausentes de chuva são
apresentados no Capítulo 5 - Resultados e Discussão.
Depois de substituído os valores ausentes de chuva, foi possível calcular os
índices de chuva acumulada associados a cada escorregamento. Foram calculados 17
índices pluviométricos de acordo com a localização (dados de chuva do pluviômetro
mais perto), data e hora do acidente reportado. Os índices calculados foram: 15, 30, 45 e
90 minutos; 1, 2, 3, 4, 6, 8 e 12 horas, 1, 2, 3, 4, 5 e 6 dias.
4.2.3 Cálculo das Taxas dos Parâmetros do Solo.
Os dados obtidos dos parâmetros do solo são compostos pelas áreas de
ocupação de cada parâmetro (em ha.) para cada um dos 159 bairros existentes nomunicípio do Rio de Janeiro. Portanto, existe uma grande diversidade de grandezas
associadas no banco de dados. Para agregar estes dados no presente estudo, esses
valores de áreas dos parâmetros foram transformados em taxas, ou seja, os valores
foram normalizados entre 0 e 100% seguindo dois critérios: (1) preparação dos dados e
(2) modelagem.
Durante a preparação dos dados, os valores normalizados foram obtidos
dividindo-se a área de ocupação de um determinado parâmetro pela área total do bairro.
A seguir é ilustrado o procedimento da normalização:
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 48/115
41
(1) Dados:
Bairro: Copacabana - Área do Bairro: 409 ha. - Área Urbana: 257 ha.
USO_URB Copacabana = 257 / 409 * 100 (8)
USO_URB Copacabana = 62.78 %
A resolução espacial do modelo é o polígono de Thiessen. Os valores dos
índices pluviométricos foram normalizados dividindo-se a área de ocupação de um
determinado parâmetro (dentro da área de abrangência de um determinado pluviômetro
onde ocorreu o escorregamento) pela área total dos bairros pertencentes ao mesmo
pluviômetro. A seguir é ilustrado um exemplo do procedimento da normalização:
(2) Dados:
Pluviômetro: Copacabana
Bairros pertencentes ao Pluviômetro de Copacabana: Copacabana e Ipanema
Copacabana - Área do Bairro: 409 ha. - Área Urbana: 257 ha.
Ipanema - Área do Bairro: 203 ha. - Área Urbana: 165 ha.
USO_URB Pluv - Copacabana = [(257+165) / (409+203)] * 100 (9)
USO_URB Pluv - Copacabana = 68.94 %
4.2.4 Substituição dos Valores Ausentes de Volume de Escorregamento.
Tal como o banco de dados de chuva, a variável volume de escorregamento
também se apresentava com valores ausentes. Para substituir os valores ausentes devolume foi adotado o método KNN , [38].
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 49/115
42
As ferramentas de mineração de dados usadas neste trabalho, tal como o
método KNN , requerem a construção de um mapa cognitivo que contenha todos os
possíveis parâmetros relacionados ao fenômeno estudo (escorregamentos). Assim, os
índices de chuva acumulada associados a cada escorregamento foram unidos a uma
matriz que inclui todos os parâmetros de solo envolvidos.
Os atributos desta matriz são todas as variáveis relacionadas aos
escorregamentos (data, hora, local, danos causados, tipologia, volume, índices
acumulados de chuva e parâmetros dos solos do bairro onde o acidente ocorreu).
A matriz completa apresenta 1266 registros, sendo que 977 registros são
completos (~77%) e 289 registros apresentam falhas na variável volume de
escorregamento (~23%).
O algoritmo KNN construído para a substituição dos dados ausentes de volume,
teve algumas adaptações específicas para o problema de escorregamentos. O universo
dos objetos foi dividido em três espaços de busca diferentes, ou seja, três valores de k
diferentes. Também foi considerado no cálculo a interseção e união entre as classes de
três variáveis relacionadas aos escorregamentos:
a) a sazonalidade dos eventos (mês do ano em que aconteceu o escorregamento);
b) tipos de danos causados pelos escorregamentos (sem danos, danos ambientais, danos
a bens públicos, danos a moradias, vítimas, etc.);
c) tipologia dos escorregamentos (solos, lixo, ruptura de estruturas de contenção, etc.).
A Figura 9 ilustra a divisão dos espaços de busca. Neste desenho, as figuras
geométricas (losango, quadrado e círculo) são proporcionais aos tamanhos das classes.
É importante ressaltar que ao observar essa figura, nos espaços 0 e 1, quando existeinterseção das classes, sabe-se que a região fora da interseção pertence ao espaço de
busca 2.
A tarefa de substituição dos dados ausentes de volume foi dividida em duas
etapas. Na 1a etapa foram realizados o treinamento e teste do algoritmo KNN em uma
amostra de 98 registros. Na 2a etapa foi realizado o preenchimento dos dados ausentes.
Na 1ª etapa, foram realizadas várias simulações com o algoritmo KNN ,
mudando o número de variáveis, o número de k ou vizinhos para os três espaços de busca diferentes e foram registrados o erro médio absoluto e a correlação do modelo
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 50/115
43
com os dados medidos da amostra. Foram utilizadas duas métricas de análise:
Distâncias Euclidiana e Manhattan [38].
Figura 9 – Divisão do espaço de busca do algoritmo KNN .
Depois de inúmeras simulações, foram extraídos os melhores resultados,
avaliando-se o melhor valor de vizinhos (k=ótimo) que minimizasse o erro absoluto e
maximizasse a correlação dos resultados imputados com os dados medidos.
A configuração de melhor resultado (erro médio mínimo e máxima correlação)
para as duas distâncias (Euclidiana e Manhattan) foi utilizada na 2a etapa para completar
os valores ausentes de volume.
O proposto método KNN pode ser facilmente adaptado para conjunto de dados
formados por atributos discretos. Para fazer isto é necessária a mudança da distância
Euclidiana / Manhattan pela Aproximação Simple Matching, KAUFMAN &
ROUSSEEUW [51].
4.2.5 Discretização das Variáveis para Extração de Regras.
O algoritmo utilizado para a extração de regras requer que os atributoscontínuos sejam previamente discretizados em intervalos. Existem algoritmos propostos
Tipo 1
Tipo 2
Tipo
11
Tipo 12
Dano 1
Dano
3
Dano 5
Mês 1
Mês
2
Mês
12
Tipo 10
Tipo 4
Mês 11
Mês 9
Tipo 5
Mês 7
Dano 4
Tipo 6
Tipo 7
Tipo 9
Dano 6
Mês 5
Tipo 3
Tipo 8
Meses 4, 5, 6 e 8
Mês 10Dano 2
0
2
1
Tipologia
Danos
Meses
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 51/115
44
para discretização, DOUGHERTY et al.[52]. A discretização adotada neste trabalho
baseou-se no balanceamento da distribuição estatística, usando como limites de divisão
das classes, os valores de freqüências (Hz) de notas musicais, [49]. A Figura 10 ilustra
dois gráficos usados para a discretização de duas variáveis (chuva acumulada de 2 e de
6 dias). O gráfico de curvas (1) corresponde aos valores de freqüência (Hz) das notas
musicais e o gráfico de barras (2) ilustra a distribuição estatística das classes (freqüência
em porcentagem) obtidas em função dos valores limites determinados em (1).
Figura 10 – Metodologia para a discretização de duas variáveis dos dados de pluviometria (chuva acumulada de 2 e de 6 dias)
4.3 Modelagem
SOUZA and EBECKEN [53] desenvolveram um processo de modelagem
envolvendo três abordagens: (1) predição dos escorregamentos; (2) extração de regras
de associação da base de dados. (3) predição de chuvas intensas.
Na primeira abordagem foram construídos modelos usando duas técnicas
diferentes de classificação: as RNA’s [36] e Regras de Classificação [44]. A segunda
abordagem considerou a extração de regras da base de dados [41]. Na terceira
0
100
200
300
400
500
Sol -8 Sol -6 Sol -4 Sol -2 Sol o Sol 2 Sol 4 Sol 6 Sol 8
Notas Musicais
F r e q u ü ê n c i a ( H z )
Regressão
Limites (d_2)
Limites (d_6)
0
4
8
12
16
20
1 2 3 4 5 6Classes
F r e q ü ê n
c i a ( % )
d _2 d _6
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 52/115
45
abordagem, foi construído um modelo para predição de chuvas intensas a partir dos
dados de chuvas passadas [36].
As duas últimas abordagens se complementam e formam mais um modelo de
predição de escorregamento. Ou seja, dado que exista uma regra que descreva a
ocorrência de um escorregamento a partir de um determinado índice pluviométrico, e se
é possível predizer este índice pluviométrico, então também é possível fazer uma
associação ao risco do escorregamento de acordo com o nível de confiança da regra. A
regra a seguir ilustra um exemplo desta aplicação:
Rule 1:IF d_1_>_65.4mmTHEN ->> ACIDENTE
(6.635% 100.0% 84 84 6.635%) (10)
(em 84 vezes que o índice pluviométrico acumulado em um dia ultrapassou 65.4 mm,
ocorreram acidentes em todas as vezes).
4.3.1 Montagem da Matriz dos Dados de Escorregamentos.
As ferramentas baseadas em princípio de inteligência artificial requerem para oestudo de um fenômeno uma estrutura composta por entrada (varáveis envolvidas no
fenômeno) e saída (variáveis do próprio fenômeno). Neste estudo a estrutura montada
foi uma matriz, composta por linhas e colunas.
As linhas são formadas pelos 1033 registros correspondentes aos eventos de
escorregamentos ocorridos no período de 1998 a 2001, mais 233 registros inseridos
artificialmente para compor o padrão de não ocorrência, totalizando 1266 registros.
As colunas são as variáveis ou atributos de entrada relacionados aosescorregamentos (entrada e saída). As variáveis de entrada são todos os índices
pluviométricos associados aos acidentes, parâmetros do solo e exposição relativa. Como
variáveis de saída, foram considerados quatro parâmetros (ou resultados) diferentes:
tipologia do acidente, volume de material escorregado (distâncias Euclidiana e
Manhattan) e conseqüências dos acidentes. E dentro de cada saída, procuraram-se dois
níveis de detalhamento, ilustrados na Tabela 16.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 53/115
46
Tabela 16 - Níveis de Detalhamento da Saída dos Modelos.
Tipologia Euclidiana/Manhattan (m3) ConseqüênciasclasseNível 1 Nível 2 Nível 1 Nível 2 Nível 1 Nível 2
1 Nada Nada V= 0 0.0 Sem Danos Sem Danos
2 Pânico Pânico V >0 0.1 e 5.14 Com Danos Infra-Estrutura3 Acidente Es/tc 5.15 e 14.56 Meio Ambiente4 REC > 14.56 Moradia/Vítima5 Outros
A Tabela 16 foi utilizada como referência para a montagem da matriz na
modelagem. Uma matriz construída de acordo com o Nível 1 apresenta menor número
de classes e maior número de registros para o treinamento de cada classe, favorecendo a
identificação e aprendizagem dos padrões pelas ferramentas. Na montagem de uma
matriz com o Nível 2, aumenta-se o número de classes, e embora o modelo enriqueçaem detalhe, existe um número menor de registros para o treinamento de cada classe, e
dificultando a identificação e aprendizagem dos padrões pelas ferramentas.
4.3.2 Classificação com Redes Neurais.
O modelo para predição de escorregamentos foi construído com as técnicas de
RNA’s e considerando duas camadas ou sub-modelos conforme ilustra a Figura 11. Este
artifício foi utilizado devido à dificuldade encontrada pelas RNA’s em classificar mais
de duas classes numa só camada neste problema de escorregamentos. Portanto, no
estudo com RNA’s os resultados foram estimados somente para o primeiro nível de
detalhamento.
Os resultados do modelo são as estimativas de três taxonomias utilizadas neste
estudo, considerando que existam chuvas intensas sobre as encostas do município do
Rio de Janeiro: tipologia do acidente, danos causados pelos acidentes e volume do
escorregamento (considerando os dois resultados obtidos no preenchimento dos dados
ausentes de volume usando o método KNN , ou seja, as duas distâncias Euclidiana e
Manhattan).
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 54/115
47
Treinamento com todos os registros
Treinamento com os registros sem a Classe Nada
Figura 11 - Configuração do Modelo com RNA’s.
No Capítulo 5 são apresentados os resultados do modelo e também discutida a
acurácia.
4.3.3 Geração de Regras de Associação e Análise das Regras Interessantes.
As regras de associação, como o próprio nome sugere, são associações de
causa e efeito entre os parâmetros de uma base de dados, indexadas principalmente por
dois valores, suporte e confiança [41]. Neste estudo foram extraídas regras para as trêstaxonomias: tipologia, danos e volume, para os dois níveis de detalhamento e
considerando os valores mínimos de suporte igual a 8% e confiança igual a 90%.
As regras geradas foram endereçadas para um sistema que as classifica de
acordo com um conhecimento imputado e extrai as regras interessantes [41]. Idealmente
esse conhecimento deve ser imputado por um especialista. Mas neste estudo, o
conhecimento foi classificado de acordo com uma impressão geral adquirida durante a
realização desta tese. As regras interessantes e uma discussão desta aplicação sãoapresentadas no Capítulo 5.
Nada Pânico ou Acidente
Fim
1a Classificação
2a Classificação
TipologiaVolume
(Euclidiana)
VolumeManhattan Danos
Nível 1(N1)
N1N1
N1
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 55/115
48
4.3.4 Regras de Classificação.
Um modelo para a predição de escorregamentos foi construído com as regras
de classificação, considerando duas abordagens: (1) semelhante ao modelo construído
com as técnicas de RNA’s, segmentando em duas camadas ou dois sub-modelos e (2)
realizando a predição em uma só camada [53].
Nestes estudos realizados com as técnicas de classificação com regras de
associação, foram utilizados os conhecimentos adquiridos durante a modelagem com as
técnicas de RNA`s, tais como as variáveis de entrada que contribuíram para os modelosmais acurados. Também foram estudadas as três taxonomias na saída do modelo:
tipologia, danos e volume, para os dois níveis de detalhamento.
4.3.5 Predição de Chuvas Intensas.
A predição de chuvas intensas é de fundamental importância para o sistema de
alerta da Geo-Rio, pois essa informação contribui para um modelo construído a partir de
regras de associação [41]. Se um nível pluviométrico acumulado de uma dada regra
indica a possibilidade de deflagrar um escorregamento, então se deve ficar atento se tal
índice vai ser atingido com um modelo de predição de chuvas.
O modelo proposto para a predição de chuvas intensas também foi construído
com as técnicas de RNA`s [36]. Os resultados desta modelagem são apresentados no
Capítulo 5.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 56/115
49
CAPÍTULO 5RESULTADOS E DISCUSSÃO
Durante a apresentação dos resultados serão descritos os critérios adotados e
mostrados alguns exemplos da aplicação da metodologia, podendo aparecer a
nomenclatura dos pluviômetros adotada pela Geo-Rio. Para auxiliar na localização
espacial dos pluviômetros, optou-se por apresentar no início deste Capítulo, uma figura
contendo o mapa de bairros do município do Rio de Janeiro, com a rede de
pluviômetros automáticos e a respectiva legenda.
Legenda:
1 - Vidigal 11 – Irajá 21 – Gericinó2 – Urca 12 – Bangu 22 – Santa Cruz3 – São Conrado 13 – Piedade 23 – Cachambi4 – Tijuca 14 – Tanque 24 – Anchieta5 – Santa Tereza 15 – Saúde 25 – Grota Funda6 – Copacabana 16 – Jardim Botânico 26 – Campo Grande7 – Grajaú 17 – Itanhangá 27 – Sepetiba8 – Ilha do Governador 18 – Cidade de Deus 28 – Sumaré9 – Penha 19 – RioCentro 29 – Mendanha10 – Madureira 20 – Guaratiba 30 – Itaúna
Figura 12 – Rede de Pluviômetros Automáticos da Geo-Rio.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 57/115
50
A seguir são apresentados os resultados obtidos durante o desenvolvimento
desta tese e a análise de tais resultados.
5.1 Estudo da Distribuição da Velocidade e Direção do Vento.
Este estudo teve o objetivo de se identificar algum padrão que ocorresse nos
dias dos escorregamentos que fosse diferente do padrão encontrado na população dos
dados. Portanto, foram gerados histogramas de velocidade e rosa dos ventos para três
amostragens diferentes: população (total de registros obtidos - 1995 a 2000 das estações
da DHN e 1997 a 2000 da estação da UERJ ), 8 dias anteriores e inclusive os dias dos
acidentes, e dias dos acidentes. As próximas três figuras ilustram a estatística dos
padrões da direção do vento calculados para as três amostragens:
Figura 13 – Rosa dos Ventos da População dos Dados.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 58/115
51
Figura 14 – Rosa dos Ventos dos 8 Dias Anteriores e Dias dos Acidentes.
Figura 15 – Rosa dos Ventos dos Dias dos Acidentes.
A estação São Tomé possui maior freqüência de registros de ventos
provenientes das direções E e NE, cerca de 38% dos registros. A estação São Pedro da
Aldeia possui maior freqüência de registros de ventos provenientes da direção E e SE,
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 59/115
52
cerca de 52% dos registros. A estação de Ilha Rasa possui maior freqüência de registros
de ventos provenientes da direção E e SE, cerca de 49% dos registros. A estação da
UERJ possui maior freqüência de registros de ventos provenientes da direção SW, cerca
de 15% dos registros, porém, a maioria dos registros (49%) são de calmaria.
Também foram calculadas as freqüências dos dados de intensidade do vento
para as 6 classes: c1=0, 0< c2 <1, 1< c3 <2, 2< c4 <3, 3< c5 ≤4, c6>4 m/s para a
estação da UERJ , e c1=0, 0< c2 <2,6, 2,6< c3 <5,1, 5,1< c4 <7,6, 7,7< c5 ≤10,3, c6>
10,3 m/s para as estações da DHN . Os padrões de velocidade do vento são ilustrados nas
próximas três figuras.
Figura 16 – Histograma das Velocidades do Vento da População dos Dados.
As estações São Tomé, São Pedro da Aldeia e Ilha Rasa, possuem maior
freqüência de registros de ventos de intensidades entre 5,1 e 7,7 m/s, próximos de 40,
40, e 43% dos registros, respectivamente. A estação da UERJ possui maior freqüência
de registros de ventos de intensidades nulas (calmaria), cerca de 50% dos registros, e
mais de 35% dos registros variam entre as intensidades de 1 a 2 m/s.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 60/115
53
Figura 17 – Histograma das Velocidades do Vento 8 Dias Anteriores e Dias dosAcidentes.
Figura 18 – Histograma das Velocidades do Vento dos Dias dos Acidentes.
Observando as Figuras 13 a 18 das Rosas dos Ventos e dos Histogramas das
Velocidades do Vento, não se constatou nenhum padrão diferente nos dias dosescorregamentos em relação aos padrões da população dos dados. Neste sentido, não
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 61/115
54
houve nenhum ganho de conhecimento ou algum indicativo a partir dos dados de vento
que pudesse auxiliar na emissão de alertas para a deflagração dos acidentes.
5.2 Regionalização das Chuvas.
As atividades necessárias à identificação dos padrões de chuva acumulada que
causam os escorregamentos, requerem o cálculo dos índices acumulados de chuva, que
por sua vez, dependem do preenchimento dos dados ausentes.
A predição dos valores ausentes de chuva foi realizada através das técnicas de
RNA’s depois das atividades de regionalização. Uma vez identificado o pluviômetro
com dado ausente (camada de saída das RNA’s), então é necessário utilizar as técnicas
de regionalização, que servem para selecionar os pluviômetros para o treinamento das
RNA`s (camada de entrada).
Foram adotadas [49],[50] quatro técnicas para a regionalização dos dados de
chuva: Análise de Componente Principal ( ACP), Matriz de Auto-Correlação ( MAC ),
Árvore de Agrupamento e o Método K-Means.
Os resultados da regionalização para um exemplo de pluviômetro com dado
ausente são descritos a seguir. As simulações foram realizadas com os dados medidos
dos 30 pluviômetros durante o período de 31 de dezembro de 1998 a 13 de janeiro de
1999. Foi escolhido o pluviômetro instalado em Santa Tereza, polígono 5 da Figura 12
que abre o Capítulo ou polígono branco à leste do município nas próximas figuras, por
apresentar valores elevados de precipitação (pico de 26.8 mm / 15min).
Na abordagem que considera ACP, foram agrupados os pluviômetros em cinza
escuro (polígonos de Thiessen) com o mesmo fator do pluviômetro de Santa Tereza
(inclusive), conforme ilustra a Figura 19.
O critério de correlação agrupou os pluviômetros em cinza escuro cujas
medidas de correlação da MAC fossem maiores ou iguais a 0,70 (c≥0,70), se
comparados com o pluviômetro de Santa Tereza (inclusive), conforme ilustra a Figura
20.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 62/115
55
Figura 19 - Pluviômetros Selecionados com o Critério de ACP.
Figura 20 - Pluviômetros Selecionados com o Critério de Correlação.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 63/115
56
No critério da árvore de agrupamento foram agrupados os pluviômetros em
cinza escuro (Figura 21) pertencentes ao mesmo “galho” (Figura 22) da árvore que
possui o pluviômetro de Santa Tereza (inclusive).
Figura 21 - Pluviômetros Selecionados com o Critério de Árvore.
M A D U R_
1 0
A N C H T_
2 4
I L H A G V_
8
G T F D A_
2 5
B A N G U_
1 2
P I E D A_
1 3
C A C H B_
2 3
G R A J A U_
7
S U M A R_
2 8
S T A T Z A_
5
S A U D E_
1 5
T I J U C A_
4
R C T R O_
1 9
I T A G A_
1 7
C D E U S_
1 8
T A N Q E_
1 4
G U A B A_
2 0
M D N H A_
2 9
P E N H A_
9
S C R U Z_
2 2
S E P B A_
2 7
C P G D E_
2 6
G E R I C_
2 1
I T A U N_
3 0
U R C A_
2
J D B O T_
1 6
C O P A C A_
6
S C O N D O_
3
V I D G A L_
1
I R A J A_
1 1
5
10
15
20
25
30
35
40
D i s t â n c i a E u c l i d i a n a
Figura 22 – Dendograma [33] com os Pluviômetros Agrupados na Árvore.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 64/115
57
Para o método de K-Means foram agrupados os pluviômetros em cinza escuro
pertencentes à mesma classe que possui o pluviômetro de Santa Tereza (inclusive), e
para o valor de k=3 (3 classes), conforme Figura 23.
Figura 23 - Pluviômetros Selecionados com o Critério K-means.
A escolha do método de regionalização foi realizada em função do melhor
resultado de predição das RNA’s. Se em nenhuma das quatro abordagens citadas fossem
conseguidos bons resultados de predição, então se optou por outras abordagens de
redução de dimensionalidade ou de agrupamento, além do critério mero geográfico ou
de proximidade espacial (pluviômetros vizinhos daquele com falhas). Depois determinada a etapa de regionalização então foram realizadas as simulações com as
RNA’s, visando a predição dos valores ausentes.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 65/115
58
5.3 Predição do Valor Ausente de Chuva
Para o preenchimento das falhas com RNA’s foram selecionados somente
aqueles intervalos vazios em que se observasse valor de precipitação diferente de zeroem pelo menos um pluviômetro da rede, e em pelo menos duas horas antes ou depois da
falha. Pois diferente destas condições, os vazios puderam ser preenchidos com o valor
zero (não chove no município).
Para o treinamento das redes neurais, foram descartados os registros cuja soma
de precipitação de todos os pluviômetros fosse igual a zero (não chove no município).
Este tipo de registro dificulta o aprendizado da rede, além de consumir esforço
computacional, pois muitas vezes abrangem mais de 90% do banco de dados de chuva.
As simulações com as [49], [50] RNA’s foram realizadas com os bancos de
dados dos 28 eventos chuvosos, pois todo evento apresentava falha em pelo menos um
pluviômetro. Foi utilizada a rede do tipo PMC’s séries temporais (3 camadas). Devido à
escassez de dados, foi preciso separar grande parte do banco de dados para o
treinamento (mais de 90% dos registros por várias vezes), para que a rede obtivesse boa
performance preditiva.
A tabela 17 apresenta um resumo estatístico da parcela de validação, com
resultados de dois parâmetros determinantes na escolha da melhor predição.
Tabela 17 – Resumo estatístico das predições (validação).
Métodos Razão deDesvioPadrão
Correlaçãode
Pearson-R ACP 0,34 0,94Correlação 0,34 0,95
Árvore 0,55 0,83K-Means 0,48 0,89
Esta simulação teve na camada de saída o pluviômetro com falhas (Santa
Tereza no 1º evento). A razão de desvio padrão é o quociente entre o desvio padrão dos
erros e o desvio padrão dos dados medidos, e quanto menor for seu valor, indica uma
melhor predição. O coeficiente de correlação de Pearson-R é uma métrica usada para
avaliar a relação entre os valores preditos e os dados, e quanto mais próximo do valor 1,
indica uma melhor predição. Pode-se observar na tabela 17 que as melhores prediçõesforam obtidas das regionalizações com critérios de Correlação e ACP.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 66/115
59
A Figura 24 ilustra o resultado da predição com Correlação.
Dados Medidos
Predição
740 742 744 746 748 750 752
Casos
0
5
10
15
20
25
30
P r e c
i p i t a ç ã o ( m m /
1 5 m i n )
Figura 24 - Resultado da predição (Correlação ou MAC ).
Pode-se observar na Figura 24 que a linha de predição (pontilhada) apresenta
boa aderência com a linha dos dados medidos (linha cheia). A linha de predição
consegue aproximar os valores máximos registrados e as variações bruscas no tempo
com resultados satisfatórios.
Os erros absolutos ficaram muito próximos do valor zero durante quase todas
as simulações, e os valores dos erros nunca ultrapassaram o intervalo de -4,0 a +4,0
mm/15min.Os erros médios quadráticos também ficaram muito próximos do valor zero
durante quase todas as simulações, e quando a linha se deslocou do eixo, os valores dos
erros nunca ultrapassaram o intervalo de -0,2 a +0,2.
A escolha do critério de regionalização dependeu, portanto, da análise dos
vários resultados obtidos:
• Resultados estatísticos e erros;
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 67/115
60
• Aderência da linha de predição aos dados (identificação dos valores máximos e
variações bruscas no tempo).
Estes resultados indicaram que o critério de Correlação (c ≥ 0,70) pôde ser
adotado para o preenchimento da falha do pluviômetro de Santa Tereza.
Quando o intervalo de preenchimento da falha ultrapassou dois valores (maior
que meia hora), então foi realizado um estudo adicional considerando a “vizinhança”. A
Figura 25 ilustra um exemplo de comparação da predição da RNA’s e os dados de
pluviômetros vizinhos:
Predição
Dados
GRAJAU_7
SAUDE_15
CACHB_23
STATZA_5
JDBOT_16
SUMAR_28
Méd_viz1978 1980 1982 1984 1986 1988 1990
Casos
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
P r e c i p i t a ç ã o ( m m / 1 5 m i n u t o s )
Figura 25 – Estudo regional (pluviômetros vizinhos).
Neste exemplo da figura 25, os dados medidos (linha cheia preta) durante o 20º
evento chuvoso são do pluviômetro instalado na Tijuca (no 4 da Figura 12). A predição
da rede (linha cheia cinza) apresenta coerência quando comparada com os valores
médios dos dados medidos nos pluviômetros vizinhos (linha fina preta), e pode ser
adotada para a substituição das falhas.
A Tabela 18 resume os resultados quantitativos dos critérios de regionalizaçãoadotados como eficientes para a substituição das falhas. Conforme se pode observar na
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 68/115
61
Tabela 18, o método de ACP foi o que alcançou mais vezes as melhores predições
(considerando os resultados estatísticos, aderências da linha de predição aos dados e
erros), e foi o método mais utilizado para o preenchimento das falhas.
Tabela 18 – Resumo da eficiência dos métodos adotados.
Métodos BoaPerformance
(%)
PobrePerformance
(%) ACP 67,6 25,0Correlação 13,3 20,0Árvore 10,5 35,0K-Means 7,6 15,0
O método com ACP também foi o que mais abrangeu as áreas atingidas por escorregamentos (bairros com contorno branco nas Figuras 19, 20, 21 e 23).
Durante o estudo de preenchimento de falhas nos dados de chuva, deve-se
priorizar os métodos de regionalização por ACP e Matriz de Auto-Correlação, e depois
se deve tentar os métodos de Árvore de Agrupamento, K-Means, além de outros.
5.4 Predição do Valor Ausente de Volume
Depois de substituído os valores ausentes de chuva, foi possível calcular os
índices de chuva acumulada associados a cada escorregamento e a montagem de uma
matriz com todos os parâmetros envolvidos.
Contudo, a variável volume de escorregamento também se apresentava com
dados ausentes. Para estimar e substituir os valores vazios de volume foi utilizada atécnica de KNN [38].
Durante as simulações, vários artifícios foram considerados buscando-se
encontrar os menores erros e as maiores correlações das predições com os dados
medidos. Portanto, vários conjuntos de variáveis foram testados como parâmetros de
entrada, e o número de vizinhos mais próximos foi alterado nos três espaços de busca.
Em todas as simulações foram utilizadas como parâmetros de entrada valores
discretos (meses, período diário, tipologia e danos causados) e contínuos (índices de
chuva acumulada e parâmetros do solo).
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 69/115
62
Dentre todas as simulações, foram extraídos três conjuntos de configurações
com boa performance. Todos estes três conjuntos tiveram como parâmetros de entrada
todas as variáveis discretas, e diferentes variáveis contínuas:
(1) índices de chuva acumulada – ICA (um, dois, cinco e seis dias, quatro e oito
horas) e parâmetros do solo;
(2) ICA (dois, cinco e seis dias); e
(3) ICA (cinco e seis dias).
A Tabela 19 ilustra os resultados das simulações usando duas diferentes
distâncias, Euclidiana (Euc) e Manhattan ( Man).
Tabela 19 – Resultados das predições (KNN).
Erro Médio (m3) CorrelaçãoConfiguraçõesEuc Man Euc Man
(1) 6.192 6.248 0.476 0.421(2) 5.652 5.014 0.468 0.573(3) 5.129 3.857 0.673 0.836
Os números de vizinhos mais próximos ótimos são 9, 13 e 6, para o primeiro,segundo e terceiro espaço de busca, respectivamente.
Os erros estimados (em metros cúbicos) pelo método Manhattan na terceira
configuração podem ser considerados excelentes (< 4 m3), uma vez que esta informação
é adquirida no campo por uma inspeção visual e esta metodologia de medição introduz
incertezas nos dados.
O melhor resultado de correlação também foi obtido na terceira configuração
(índices acumulados de chuva correspondentes a 5 e 6 dias como variáveis de entrada).
Depois que o método foi validado, os valores ausentes foram substituídos usando a
terceira configuração da Tabela 19 e com as duas distâncias Euc e Man.
A Figura 26 ilustra os resultados da distribuição estatística antes e depois da
substituição pelo método KNN .
A distribuição das classes não sofreu com a introdução de tendência e,
portanto, esta metodologia pode ser aplicada para a tarefa de substituição dos valores
ausentes dos dados de volume de escorregamento.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 70/115
63
0
5
10
15
20
25
30
3540
45
50
55
60
<=0.09 0.09 a 2.88 2.88 a 4.85 4.85 a 9.72 9.72 a 29.1 >29.1
Classes de volume (m
3
)
F r e q ü ê n c i a ( %
)
(% - Registros Completos - antes da substituição)
(% - Euclidiana - depois da substituição)
(% - Manhattan - depois da substituição)
Figura 26 – Distribuição Estatística – antes e depois da substituição com KNN.
Uma vez preparada e consistida toda a base de dados, pôde-se dar início ao
processo de modelagem. Os tópicos seguintes ilustram os resultados da modelagem.
5.5 Classificação com RNA’s.
Um modelo para predição de escorregamentos foi construído com as técnicas
de RNA’s usando a arquitetura de PMC’s e o algoritmo de treinamento
BackPropagation.
Este modelo de RNA’s considerou duas camadas ou sub-modelos. Na primeira
camada são usados todos os registros da base de dados e o processo termina se aestimativa o modelo for Nada, ou seja, embora a cidade esteja sendo castigada por
chuvas intensas, o modelo indica que não ocorrerá escorregamento. Se a estimativa
desta primeira camada for diferente de Nada, ou seja, pode ocorrer algo, então a
segunda camada, treinada com todos os registros menos a classe Nada, é acionada. As
respostas da segunda camada são as estimativas das três taxonomias: tipologia, danos
causados, e volume do escorregamento, porém, somente para o Nível 1.
Durante a construção do modelo, e na primeira simulação, foram utilizados
como parâmetros de entrada, todas as variáveis envolvidas no fenômeno, ou seja,
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 71/115
64
índices pluviométricos acumulados, parâmetros do solo e exposição relativa da região
do pluviômetro. A partir da análise da sensibilidade da rede, em que são avaliadas quais
variáveis foram sensíveis durante o treinamento e na performance preditiva, foi
selecionado um outro conjunto de variáveis para a segunda simulação, e assim
sucessivamente, até ser encontrado um resultado considerado aceitável dentro da
realidade do problema.
As amostras para o treinamento, teste e validação foram compostas de 80, 10 e
10 % dos registros, respectivamente.
A Figura 27 apresenta um resultado estatístico de todas as simulações para a
construção da primeira camada do modelo.
Figura 27- Estatística das Simulações– Acerto Médio na Validaçãoda Primeira Camada.
A grande maioria das simulações, mais de 65%, apresentaram bons resultados
(taxa média de acerto na validação maior que 70%).
Dentre as inúmeras simulações realizadas na construção do sub-modelo inicial,
ou primeira camada, foram selecionados três resultados considerados bons e
apresentados na Tabela 20.
0
5
10
15
20
25
30
35
40
45
<=60 60.1 a 65.0 65.1 a 70.0 70.1 a 75.0 75.1 a 80.0 80.1 a 85.0 85.1 a 90.0 90.1 a 95.0 >95
Faixas de Acerto (%)
A c e r t o ( % ) / F a i x a
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 72/115
65
Tabela 20 - Resultados da Simulação das RNA’s – Validação do Modelo.
Taxa de Acerto (%)Classe 1- Nada
Classe 2 – Pânico ouAcidente
Médio No de
Var.Variáveis de Entrada
94.12 93.58 93.85 6 MES, TURNO, D_2, D_3, D_4, D_694.74 88.79 91.76 7 MES, TURNO, D_2, D_3, D_4, D_5, D_695.83 87.25 91.54 7 MES, TURNO, H_12, D_2, D_6,
USO_FLOR, USO_SEXP
A Tabela 20 ilustra os resultados da classificação da primeira camada. As três
primeiras colunas mostram as taxas de acerto na validação do modelo, para as duas
classes Nada e algo que pode ocorrer (Pânico ou Acidente e acionada a segunda
camada), e a média das duas primeiras colunas. A quarta coluna da tabela mostra o
número de variáveis usadas na camada de entrada da RNA, e essas variáveis são
apresentadas na quinta coluna. A tabela apresentada no item 3.2.3 auxilia na
compreensão da codificação das variáveis.
A segunda camada do modelo realiza as estimativas das três taxonomias deste
estudo: tipologia, danos causados e volume do escorregamento. As simulações foram
realizadas de forma análoga à construção da primeira camada, com a exceção de que osregistros usados para o treinamento não contemplam a classe Nada.
Dentre as inúmeras simulações realizadas na construção do sub-modelo final,
ou segunda camada, foram selecionados três resultados considerados bons para a
estimativa da tipologia do escorregamento e apresentados na Tabela 21.
Tabela 21 - Resultados da Simulação das RNA’s – Validação do Modelo.
Taxa de Acerto (%)Classe 1Pânico
Classe 2Acidente
Médio No de
Var.
Variáveis de Entrada
93.58 72.37 88.67 5 MES, TURNO, H_2, D_5, D_683.90 78.40 86.72 5 MES, TURNO, H_4, D_2, D_681.50 79.28 85.91 4 MES, TURNO, D_5, D_6
A interpretação desta tabela é análoga aos resultados apresentados na
classificação da primeira camada, porém, os valores das duas primeiras colunas foram
calculados considerando a probabilidade condicional em relação ao resultado do sub-
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 73/115
66
modelo inicial, ou camada de entrada. Portanto, a classificação de Pânico na primeira
linha da tabela acima teve uma acurácia de 100 %, mas devido à probabilidade
condicional, este valor foi igualado à incerteza da segunda classe na primeira camada do
modelo.
Ainda assim, pode-se observar que o modelo estima com uma boa acurácia as
duas situações: Pânico e Acidente.
A Figura 28 apresenta um resultado estatístico de todas as simulações para a
estimativa da tipologia do escorregamento (segunda camada do modelo).
Figura 28 - Estatística das Simulações– Acerto Médio na Validação da SegundaCamada para a estimativa da tipologia do escorregamento.
A grande maioria das simulações, mais de 90 %, apresentaram bons resultados(taxa média de acerto na validação maior que 65%).
Dando seqüência aos resultados obtidos na construção do sub-modelo final, ou
segunda camada, são apresentados na Tabela 22 três resultados considerados bons para
a estimativa do volume do escorregamento, considerando o preenchimento dos dados
ausentes do volume utilizando o critério da distância Euclidiana.
0
5
10
15
20
25
30
35
40
45
<=60 60.1 a 65.0 65.1 a 70.0 70.1 a 75.0 75.1 a 80.0 80.1 a 85.0 85.1 a 90.0 90.1 a 95.0 >95
Faixas de Acerto (%)
A c e r t o ( % ) / F a i x a
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 74/115
67
Tabela 22 - Resultados da Simulação das RNA’s – Validação do Modelo.
Taxa de Acerto (%)Classe 1V=0 m3
Classe 2 – V > 0 m3
Médio No de
Var.
Variáveis de Entrada
87.12 75.87 87.09 4 MES, TURNO, H_3, D_681.37 77.20 84.73 4 MES, TURNO, H_2, D_678.48 76.68 82.91 4 MES, TURNO, H_4, D_6
A interpretação desta tabela com os resultados das estimativas de volume deve
ser feita de maneira análoga ao estudo da tipologia. Podem-se observar bons resultados
nas estimativas das duas classes, mas o modelo tem um acerto ligeiramente maior para a
classe de volume igual a zero (V=0m
3
). A Figura 29 apresenta um resultado estatísticode todas as simulações para a estimativa do volume do escorregamento (Euclidiana).
Figura 29 - Estatística das Simulações– Acerto Médio na Validação da SegundaCamada para a estimativa do volume do escorregamento.
A grande maioria das simulações, mais de 85 %, apresentaram bons resultados
(taxa média de acerto na validação maior que 65%).
Na Tabela 23 são apresentados três resultados considerados bons para a
estimativa do volume do escorregamento, considerando o preenchimento dos dadosausentes do volume utilizando o critério da distância Manhattan.
0
5
10
15
20
25
30
35
40
45
<=60 60.1 a 65.0 65.1 a 70.0 70.1 a 75.0 75.1 a 80.0 80.1 a 85.0 85.1 a 90.0 90.1 a 95.0 >95
Faixas de Acerto (%)
A c e r t o ( % ) / F a i x a
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 75/115
68
Tabela 23 - Resultados da Simulação das RNA’s – Validação do Modelo.
Taxa de Acerto (%)Classe 1
V=0 m3
Classe 2 –
V > 0 m3
Médio No de
Var.
Variáveis de Entrada
90.35 74.61 88.14 8 MES, TURNO, H_6, D_4, D_5,USO_PARQ, USO_SEXP, USO_URB
84.81 77.76 86.86 8 MES, TURNO, H_4, D_4, D_5,USO_PARQ, USO_SEXP, USO_URB
83.18 76.34 85.23 8 MES, TURNO, H_4, D_5, D_6,USO_PARQ, USO_SEXP, USO_URB
Pode-se observar bons resultados nas estimativas das duas classes, mas o
modelo tem um acerto considerável em favor para a classe de volume igual a zero
(V=0m3). É importante ressaltar que durante a tarefa de preenchimento dos dados
ausentes de volume, os resultados obtidos com a distância Manhattan também foram
melhores que os obtidos com o cálculo da Distância Euclidiana.
A Figura 30 apresenta um resultado estatístico de todas as simulações para a
estimativa da volume do escorregamento (Distância Manhattan).
Figura 30 - Estatística das Simulações– Acerto Médio na Validação da SegundaCamada para a estimativa do volume do escorregamento.
0
5
10
15
20
25
30
35
40
45
<=60 60.1 a 65.0 65.1 a 70.0 70.1 a 75.0 75.1 a 80.0 80.1 a 85.0 85.1 a 90.0 90.1 a 95.0 >95
Faixas de Acerto (%)
A c e r t o ( % ) / F a i x a
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 76/115
69
A grande maioria das simulações, mais de 90 %, apresentaram bons resultados
(taxa média de acerto na validação maior que 65%),.
Na Tabela 24 são apresentados três resultados considerados bons para a
estimativa dos danos causados pelo escorregamento.
Tabela 24 - Resultados da Simulação das RNA’s – Validação do Modelo.
Taxa de Acerto (%)Classe 1
SemDanos
Classe 2Com
Danos
Médio No de
Var.
Variáveis de Entrada
80.21 70.75 80.66 6 MES, TURNO, D_3, D_5, D_6, USO_URB86.38 60.76 78.62 6 MES, TURNO, D_2, D_3, D_5, D_6
79.54 63.14 76.23 5 MES, TURNO, D_2, D_3, D_5
Podem-se observar bons resultados na estimativa da primeira classe, mas
razoáveis para a estimativa da segunda classe.
A Figura 31 apresenta um resultado estatístico de todas as simulações para a
estimativa dos danos causados pelo escorregamento.
Figura 31 - Estatística das Simulações– Acerto Médio na Validação da SegundaCamada para a estimativa dos danos causados pelo escorregamento.
A grande maioria das simulações, mais de 60 %, apresentaram bons resultados(taxa média de acerto na validação maior que 65%).
0
5
10
15
20
25
30
35
40
45
<=60 60.1 a 65.0 65.1 a 70.0 70.1 a 75.0 75.1 a 80.0 80.1 a 85.0 85.1 a 90.0 90.1 a 95.0 >95
Faixas de Acerto (%)
A c e r t o ( % ) / F a i x a
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 77/115
70
A Figura 32 ilustra a configuração do modelo total, obtida da escolha dos
melhores resultados:
Treinamento com todos os registros
Variáveis de entrada (VE) – MES, TURNO, D_2, D_3, D_4, D_6
Treinamento com os registros sem a Classe Nada
VE (MES, TURNO, H_2, D_5, D_6) VE (MES, TURNO, H_3, D_6)
VE (MES, TURNO, H_6, D_4, D_5, VE (MES, TURNO, D_3, D_5,USO_PARQ,USO_SEXP, USO_URB) D_6, USO_URB)
Figura 32 - Configuração Final do Modelo de RNA’s.
A análise do modelo acima permite concluir que a ferramenta de RNA’s é um
bom estimador para o problema de escorregamentos. O modelo obteve taxa média de
acerto sempre maior que 70% em todas as classes.
Nada94.12 %
Pânico ou Acidente93.58 %
Fim
1
a
Classificação
2a Classificação
TipologiaVolume(Euclidiana)
VolumeManhattan
Danos
Pânico(100.0 %)P(2a|1a)93.58 %
Acidente(77.33 %)P(2a|1a)72.37 %
V=0 m3 (93.10 %)P(2a|1a)87.12 %
V>0 m3 (81.08 %)P(2a|1a)75.87 %
V=0 m3 (96.55 %)P(2a|1a)90.35 %
V>0 m3 (79.72 %)P(2a|1a)74.61 %
Sem Danos(85.71 %)P(2a|1a)80.21 %
Com Danos (75.61 %)P(2a|1a)70.75 %
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 78/115
71
5.6 Extração de Regras de Associação Interessantes.
A tarefa de geração de regras foi realizada explorando-se as variáveis que
contribuíram para a construção do modelo de RNA’s. Além dessas variáveis, foramincluídas algumas a partir do conhecimento adquirido durante o desenvolvimento da
tese.
Foram extraídas regras para as três taxonomias: tipologia, danos e volume do
escorregamento, para os dois níveis de detalhamento e considerando os valores mínimos
de suporte igual a 8% e confiança igual a 90%.
Dois critérios foram utilizados para estudar os índices pluviométricos
acumulados ( IPA’s) nas regras: o primeiro critério usou os IPA’s importantes do modelo
de RNA’s e o segundo critério usou os IPA’s adotados como índices para emissão de
alerta da Geo-Rio (chuvas acumuladas de 1 hora, 1 dia e 4 dias). A Tabela 25 apresenta
o número de regras geradas para os dois critérios.
Tabela 25 – Número de Regras de Associação Geradas.
Número de Regras GeradasModelosModelo RNA’s Geo-Rio
Tipo – Nível1 (N1) 49705 49740Tipo – Nível2 (N2) 45717 45807Volume – EUC (N1) 49611 49822Volume – EUC (N2) 46059 46276Volume – MAN (N1) 49793 49822Volume – MAN (N2) 45971 46057Danos (N1) 49791 49848Danos (N2) 45837 45936
Conforme pode ser observado na Tabela 25, o número de regras geradas pelos
IPA’s da Geo-Rio são ligeiramente maiores que o número de regras geradas pelos IPA’s do modelo de RNA’s. O número de regras geradas nos dois critérios possui uma ordem
de grandeza muito grande, e muitas das quais não são interessantes.
Portanto, as regras geradas foram endereçadas para um sistema que as
classifica de acordo com um conhecimento imputado e extrai as regras interessantes.
Idealmente esse conhecimento deve ser imputado por um especialista. Mas neste estudo,
o conhecimento foi classificado de acordo com uma impressão geral adquirida durante a
realização desta tese. A Tabela 26 apresenta o conhecimento imputado.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 79/115
72
Tabela 26 – Conhecimento Imputado para a Classificação.
Conhecimento para a ClassificaçãoModelosModelo RNA’s Geo-Rio
Tipo (N1) [h_6_0.01a8.6mm, PANICO] [h_1_>9.17mm, PANICO]
Tipo (N2) [h_6_0.01a8.6mm, Pânico] [h_1_>9.17mm, Pânico]EUC (N1) [d_6_>92.6mm, EUC>0 m3] [d_4_>87.4mm, EUC>0 m3]EUC (N2) [d_6_>92.6mm, EUC_0.09a5.14m3] [d_4_>87.4mm, EUC_0.09a5.14m3]
AN (N1) [d_5_>87.4mm, MAN>0 m3] [d_4_>87.4mm, MAN>0 m3]AN (N2) [d_5_>87.4mm, MAN_0.09a5.14m3] [d_4_>87.4mm, MAN_0.09a5.14m3]anos (N1) [d_6_>92.6mm, COM DANOS] [d_4_>87.4mm, COM DANOS]anos (N2) [d_6_>92.6mm, MorTB] [d_4_>87.4mm, MorTB]
A seguir são apresentadas algumas regras interessantes que podem ser
acionáveis e contribuir com o sistema alerta existente. As três primeiras regras são
referentes à ocorrência de qualquer tipo de escorregamento (ACIDENTE):
Rule 9:" d_6_>_92.6mm " = Y-> " ACIDENTE = Y
(25.513% 91.950% 323 297) (11)
Explicando os índices da regra acima:
25.513% - é o valor suporte da regra (porcentagem das vezes em que a chuva
acumulada em 6 dias ultrapassa 92.6mm ou que ocorre acidente ou
escorregamento), ou seja, do total de 1266 registros da base de dados, 323
registros apresentam um dos dois itens: d_6_>_92.6mm ou ACIDENTE.
91.950% - é a confiança da regra, ou seja, dado que o primeiro item aconteça
(d_6_>_92.6mm), existe uma probabilidade de 91.95% que aconteça o
segundo item (ACIDENTE).
323 - é o valor suporte da regra expresso em número de vezes que ocorre os itens
d_6_>_92.6mm ou ACIDENTE.
297 – é o número de vezes em que os dois itens ocorrem simultaneamente
d_6_>_92.6mm e ACIDENTE.
Rule 18: Rule 10:"d_4_>_87.4mm" = Y " d_2_>_73.5mm " = Y
-> "ACIDENTE" = Y -> " ACIDENTE = Y(25.039% 91.480% 317 290) (25.118% 91.510% 318 291)
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 80/115
73
Observando as três regras associadas com ACIDENTE, nota-se que todas
apresentam altos valores de suporte e confiança, acima de 25% e 91% dos registros,
respectivamente. A regra número 9 apresenta os maiores valores de suporte e confiança.
As quatro próximas regras são referentes ao volume do escorregamento, em
que os dados foram preenchidos com o critério da distância Euclidiana:
Rule 8: Rule 21:" d_6_>_92.6mm " = Y "d_4_>_87.4mm
-> " EUC>0 = Y -> "EUC>0 = Y(25.513% 91.950% 323 297) (25.039% 91.480% 317 290)
Rule 20: Rule 14:
"d_1_>_65.4mm" = Y " h_6_>_43.7mm " = Y-> "EUC>0 = Y " Exp_Rel_20.61a23.14" = Y(25.276% 91.560% 320 293) " Qld_extd_ate_0.09 " = Y
" Apt_boa_ate_0.09 " = Y-> " EUC>0 = Y(9.242% 90.600% 117 106)
Novamente pode-se observar altos valores de suporte e confiança nas regras e
de novo o índice de chuva acumulada em 6 dias apresentou o melhor resultado.
A regra 14 possui a exposição relativa (Exp_Rel) e parâmetros do solo
associados, permitindo que esta regra seja mapeada. O índice pluviométrico acumulado
( IPA) de 6 horas que descreve a regra permite que esta regra tenha um suporte inferior
(apenas 10.032%) se comparado ao suporte das regras com IPA maior que 1 dia.
As cinco próximas regras são referentes ao volume do escorregamento, em que
os dados foram preenchidos com o critério da distância Manhattan:
Rule 19: Rule 23:" d_5_>_87.4mm " = Y "d_4_>_87.4mm" = Y
-> " MAN>0 = Y -> "MAN>0 = Y(26.066% 90.610% 330 299) (25.039% 91.480% 317 290)
Rule 13: Rule 22:" d_2_>_73.5mm " = Y "d_1_>_65.4mm" = Y-> " MAN>0 = Y -> "MAN>0 = Y
(25.118% 91.510% 318 291) (25.276% 91.560% 320 293)
Rule 20:" h_6_>_43.7mm " = Y" Uso_urb_58.34a77.89" = Y-> " MAN>0 = Y
(10.032% 90.550% 127 115)
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 81/115
74
Novamente pode-se observar que a regra de maior suporte também é a que
possui maior IPA. A regra 20 associa o IPA de 6 horas às áreas urbanas e pode ser
mapeada. Porém, esta regra possui suporte inferior (apenas 10.032%) às demais regras
com IPA maior que 1 dia.
As três próximas regras são referentes aos danos causados pelo
escorregamento:
Rule 1: Rule 2:" d_3_>_82.5mm " = Y " d_6_>_92.6mm " = Y" Sol_lats_>_17.33 " = Y " Sol_lats_>_17.33 " = Y-> " COMDANOS = Y -> " COMDANOS = Y
(10.111% 92.190% 128 118) (10.900% 92.030% 138 127)Rule 13: Rule 3:
" d_3_>_82.5mm " = Y "d_4_>_87.4mm" = Y" Qld_extd_ate_0.09 " = Y "Sol_lats_>_17.33" = Y" Apt_boa_ate_0.09 " = Y -> "COMDANOS = Y-> " COMDANOS = Y (10.269% 91.540% 130 119)
(12.085% 90.200% 153 138)
As quatro regras acima apresentam suporte inferior àquelas obtidas nos estudos
de tipologia e volume. As regras 1, 2 e 3 apresentam o parâmetro de solo Latossolo comtaxas maiores que 17.33%. Este tipo de solo possui textura argilosa e sua associação
com danos causados merece um estudo mais detalhado.
5.7 Classificação com Regras de Associação.
Um modelo para a predição de escorregamentos foi construído com as regras
de classificação, considerando duas abordagens: (1) realizando a predição em uma só
camada e (2) semelhante ao modelo construído com as técnicas de RNA’s, segmentando
em duas camadas ou dois sub-modelos.
Foram utilizadas nestes estudos as variáveis de entrada que contribuíram para
os modelos de RNA`s mais acurados. Foram consideradas as três taxonomias na saída do
modelo: tipologia, danos e volume, para os dois níveis de detalhamento.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 82/115
75
As Figuras 33 e 34 ilustram dois modelos construídos em uma só camada, para
os níveis de detalhamento 1 e 2, respectivamente.
Treinamento com todos os registros
IP – H_6, D_2, D_6
IP – H_3, H_6, D_6 IP – H_1, H_2, H_3, H_6, D_1, D_2, D_3,
D_4, D_5, D_6
IP - H_1, H_2, H_3, H_6, D_1, D_2, D_3, D_4, D_5, D_6
Figura 33 –Modelo de Regras de Classificação – Nível 1.
Conforme se observa na Figura 33, este modelo construído com as técnicas de
Regras de Classificação apresentou ótima acurácia de predição. A taxa de acerto médio
foi sempre superior a 79% em todas as classes. A taxonomia de tipologia teve
performance inferior ao modelo construído com as técnicas de RNA’s para as classes
Nada e Pânico, mas teve índice de acerto maior para a classe Acidente. Nas taxonomias
volume de escorregamento e danos causados a metodologia de Regras de Classificaçãoteve performance preditiva superior ao modelo construído com as técnicas de RNA’s.
Nada80.69 %
Pânico89.35 %
Acidente79.03 %
Tipologia
Vol = 0 m3 89.34 %
Vol > 0 m388.09 %
Volume (Euclidiana) Volume (Manhattan)
Vol = 0 m3 87.32 %
Vol > 0 m391.27 %
Sem Danos91.45 %
Com Danos88.10 %
Danos
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 83/115
76
Treinamento com todos os registros - IP da GEO-RIO – H_1, D_1, D_4
Figura 34 – Modelo de Regras de Classificação – Nível 2.
Conforme pode ser observado na Figura 34, o modelo diminui a performance preditiva quando simula o nível de detalhamento 2. Isto se deve ao menor número de
amostras para o treinamento de cada classe.
A Figura 35 apresenta um resultado obtido na tentativa construir um modelo
semelhante ao das RNA’s, ou seja, em duas camadas.
Treinamento com todos os registrosVariáveis de entrada (VE) – todas
Figura 35 – Predição do Modelo Inicial com Regras de Classificação.
Conforme pode ser observado na Figura 35, o modelo apresenta um resultado
excelente na predição das classes Pânico ou Acidente, mas razoável para a classe Nada.
Nada78.54 %
Pânico ou Acidente98.84 %
1a Classificação
Nada82.40 %
Es/tc72.73 %
REC66.09 %
Tipologia
Vol = 0 m3 89.54 %
Volume (Manhattan)
Vol entre 0.1 e 5.14 m3 64.75 %
Vol > 14.56 m362.60 %
Pânico81.29 %
Outros73.36 %
Vol entre 5.15 e 14.56 m3 64.50 %
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 84/115
77
Uma outra tentativa foi a de construir um modelo misto, sendo a primeira
camada composta pelo modelo de RNA’s e a segunda camada construída com as Regras
de Classificação. Dentro desta abordagem ainda tentou-se estimar os escorregamentos
para as três taxonomias (tipologia, volume e danos causados) e para os dois níveis de
detalhamento.
A Figura 36 ilustra um modelo misto, construído com as duas técnicas:
Treinamento com todos os registros ( RNA – PMC’s)Variáveis de entrada (VE) – MES, TURNO, D_2, D_3, D_4, D_6
Treinamento com os registros sem a Classe Nada ( Regras de Classificação)VE – Selecionadas do modelo de RNA’s
Figura 36 - Configuração de um Modelo Misto com RNA’s e Regras de Classificação.
Conforme ilustra a Figura 36, o modelo apresenta performance preditiva
comprometida quando simula o nível de detalhamento 2. Isto se deve ao menor número
de amostras para o treinamento de cada classe.
Nada
94.12 %
Pânico ou Acidente
93.58 %
Fim
1a Classificação
2a Classificação
Vol = 0 m3
(87.18 %)P(2a|1a) 81.58 %
Volume (Euclidiana)
Vol entre 0.1 e 5.14 m3 (72.61 %)P(2a|1a) 67.95 %
Vol > 14.56 m3(69.76 %)P(2a|1a) 65.28 %
Vol entre 5.15 e 14.56 m3 (71.55 %)P(2a|1a) 66.96 %
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 85/115
78
5.8 Predição de Chuvas Intensas.
A matriz dos dados de escorregamentos construída para a modelagem possui
como parâmetros de entrada os índices pluviométricos acumulados ( IPA) associados aosescorregamentos, parâmetros do solo e exposição relativa.
A partir dos índices pluviométricos calculados, foi construído um modelo para
predição de chuvas intensas usando as técnicas de RNA’s usando a arquitetura de
PMC’s e o algoritmo de treinamento BackPropagation.
Foram realizadas simulações com os PMC’s, usando como parâmetros de
entrada das RNA’s, os IPA’s relacionados aos escorregamentos e anteriores ao da
previsão. Na saída das RNA’s, foram estimados 5 índices pluviométricos conforme
ilustra a Tabela 27.
Tabela 27 - Previsão de Chuvas com RNA’s.
Índices Pluviométricos (IP) -Saída
IPEntrada
d_4 d_1 h_4 h_1 min_15min_15min_30 *
min_45 *h_1 *min_90 * *
h_2 * *h_3 * *h_4 * *h_6 * * *h_8 * * *
h_12 * * *d_1 * * *d_2 * * * *d_3 * * * *d_4 * * * *d_5 * * * * *d_6 * * * * *
O número de amostras para o treinamento, teste e validação, variou para os 5
diferentes modelos, e conforme mostra a tabela 28.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 86/115
79
Tabela 28 – Número de amostras.
Índices Pluviométricos (IP)Amostras(%) d_4 d_1 h_4 h_1 15min
Treinamento 80 85.0 90 85.0 80
Teste 10 7.5 5 7.5 10Validação 10 7.5 5 7.5 10
A Tabela 29 apresenta um resumo estatístico das predições da parcela de
validação, para os 5 modelos, com resultados de dois parâmetros: Razão de Desvio
Padrão ( RDP) e Correlação de Pearson-R (CPR).
Tabela 29 – Resultados Estatísticos.
Índices Pluviométricos (IP)mostras(%) d_4 d_1 h_4 h_1 15min RDP 0.19 0.28 0.24 0.28 0.32CPR 0.98 0.96 0.97 0.96 0.95
Conforme se observa na Tabela 29, a razão de desvio padrão apresenta valores
baixos, próximos de 0, e o coeficiente de correlação de Pearson-R apresenta valores
próximos do valor 1, indicando boas predições.
A Figura 37 ilustra o resultado da predição do IPA de 4 horas nos casos de
maiores precipitações.
0
20
40
60
80
100
120
140
160
180
35 55 75 95 115 135 155 175 195 215
Casos
P r e c i p i t a ç ã o ( m m )
Predição
Dado
Figura 37 – Resultado da Predição do IPA de 4 horas.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 87/115
80
Pode-se observar na Figura 37 que a linha de predição (pontilhada) apresenta
boa aderência com a linha dos dados medidos (linha cheia). Portanto, pode-se concluir
que a técnica de RNA’s é excelente para este tipo de tarefa.
O modelo de previsão de chuvas intensas pode ser integrado às regras de
associação e formarem mais um modelo de predição de escorregamento. Ou seja, dado
que exista uma regra que descreva a ocorrência de um escorregamento a partir de um
determinado índice pluviométrico, e se é possível predizer este índice pluviométrico,
então também é possível fazer uma associação dos modelos.
5.9 Desempenho de Classificadores.
Muitas pesquisas em construção de classificadores tem sido focalizadas no erro
mínimo de classificação. Este critério permite minimizar o número de predições ou
classificações incorretas feitas pelos classificadores. Este tipo de método de
aprendizagem ignora as diferenças entre os diferentes tipos de predição incorreta, TING
and ZHENG [54]. É muito comum nas aplicações do mundo real que diferentes tipos de predições incorretas possuem custos diferentes.
5.9.1 Custos de Classificação.
O custo das predições incorretas muitas vezes é mais importante que o número
de predições incorretas em muitas áreas do mundo real, tais como as financeiras e
médica. Por exemplo, no diagnóstico médico, diagnosticando alguém como saudável
quando essa pessoa tem uma moléstia ameaçadora de vida é usualmente considerado
mais sério (deste modo com maior custo) que um outro tipo de erro – de diagnosticar
alguém como doente quando essa pessoa está de fato saudável.
Apesar disso, muito pouca atenção tem sido dada ao custo sensibilidade de
classificação onde o objetivo é minimizar o custo total de predições incorretas ou ao alto
número de erros de custo.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 88/115
81
A estimativa da acurácia de um classificador é importante para a avaliar o quão
preciso um determinado classificador irá se comportar com os dados futuros, ou seja,
nos dados em que o classificador não foi treinado, [33].
5.9.2 Melhorando a Acurácia de um Classificador.
Existem técnicas para melhorar a acurácia do classificador, tais como
“ Bagging” (ou bootsrap aggregation) e “boosting” [33]. Cada técnica combina uma
série de T classificadores treinados, C 1, C 2, ..., C T com o objetivo de criar um
classificador composto melhorado, C *.Supondo que um paciente queira ter um diagnóstico feito baseado nos seus
sintomas. Ao invés de perguntar a um médico, ele pode perguntar para vários. Se um
certo diagnóstico ocorre mais do que outros, então esse pode ser o melhor diagnóstico
ou o final. Substituindo cada médico por um classificador, tem-se a intuição de um
bagging.
Supondo que sejam atribuídos pesos ou importâncias aos “valores” de cada
diagnóstico médico, baseado na acurácia dos diagnósticos prévios que eles tenham feito.O diagnóstico final é então uma combinação dos diagnósticos ponderados. Esta é a
essência de um boosting.
Dado um conjunto S de s amostras, pode-se utilizar “bagging”, que trabalha
como descrito a seguir. Para iteração t (t = 1, 2, ..., T ), um conjunto de treinamento St é
amostrado em substituição ao conjunto original de amostras, S. Uma vez que a
amostragem em substituição é usada, algo das amostras de S original pode não estar
incluída em St , enquanto outras podem ocorrer mais de uma vez. Um classificador C t será treinado para cada conjunto de treinamento St . Para classificar uma amostra não
conhecida, X , cada classificador C t retorna sua classe de predição, que conta como um
voto. O classificador bagged , C *, conta os votos e assim a classe com o maior número
de votos para X . Bagging pode ser aplicado a predição de valores contínuos utilizando o
valor médio da predição de cada classificador.
Em Boosting, os pesos são fixados para cada amostra de treinamento. Um série
de classificadores é treinado. Depois que um classificador C t está treinado, os pesos são
atualizados para permitir o classificador subseqüente, C t+1, para “corrigir” os erros de
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 89/115
82
classificação feitos por C t . O classificador final boosted , C *, combina os votos de cada
classificador individual, onde o peso de cada voto do classificador é uma função da sua
acurácia. O algoritmo boosting pode ser estendido para a predição de valores contínuos.
5.9.3 Sensibilidade, Singularidade e Precisão – Medindo a Acurácia.
Supondo que se tenha um classificador treinado para classificar amostras de
dados médicos como ou “câncer ” ou “sem câncer ”. Uma taxa de acurácia de 90 % pode
fazer parecer o classificador bastante acurado, mas o que fazer, se somente 3 ou 4 % das
amostras de treinamento são realmente “câncer ”? Claramente, uma taxa de acurácia de
90% não pode ser aceitável – o classificador poderia corretamente rotular somenteamostras “sem câncer ”, por exemplo. Ao invés, se quisesse ter acesso a quão bem o
classificador pode reconhecer as amostras “câncer ” (referidas como amostras positivas)
e quão bem o classificador poderia reconhecer as amostras “sem câncer ” (referidas
como amostras negativas). As medidas de sensibilidade e singularidade podem ser
usadas, respectivamente para este propósito. Além disso, pode-se usar a precisão para
acessar a porcentagem de amostras rotuladas como “câncer ” que são realmente
amostras “câncer ”. Estas medidas são definidas como:
Sensibilidade = t_pos / pos (12)
Singularidade = t_neg / neg (13)
Precisão = t_pos / (t_pos+f_pos) (14)
onde:
t_pos é o número de positivos verdadeiros (amostras “câncer ” que foram corretamente
classificadas como tais),
pos é o número de amostras positivas (“câncer ”),
t_neg é o número de negativos verdadeiros (amostras “sem câncer ” que foram
classificadas corretamente como tais),
neg é o número de amostras negativas (“sem câncer ”), e
f_pos é o número de positivos falsos (amostras “sem câncer ”que foram incorretamente
rotuladas como “câncer ”).
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 90/115
83
Dessa forma pode ser mostrado que acurácia é uma função de sensibilidade e
singularidade:
Acurácia = { sensibilidade [pos/(pos+neg)]} + {singularidade [neg / (pos + neg)]} (15)
5.9.4 Melhorando a Acurácia do Classificador de Escorregamentos.
Os modelos estudados nesta tese ainda requerem um pós-processamento para
serem implementados como um sistema de apoio à decisão. Durante a ocorrência de
chuvas intensas nas encostas, o custo de classificar incorretamente a situação Nada (não
vai ocorrer escorregamento), tem um custo diferente de um erro de classificação do Acidente. É muito mais grave errar na primeira situação - tranqüilizando a população
das encostas de que não vai haver escorregamento, quando de fato ocorre - do que
alertar a população de um possível escorregamento que não venha a ocorrer.
Muitos classificadores são construídos visando minimizar o número de erros
global da classificação. Nessa metodologia, o classificador busca classificar
corretamente todas as classes em igual proporção, adotando como limite de decisão, um
eixo que delimita o ponto médio da região de interseção das curvas de distribuição de
probabilidades, conforme ilustra o eixo na posição 1 da Figura 38.
DUDA et al. [55] propõe técnicas de ponderação em que este eixo pode ser
deslocado para a esquerda (posição 2 da Figura 38), durante a construção do
classificador. Nesta segunda abordagem, o erro global da classificação vai aumentar,
mas também aumenta a confiança de que a classe Nada seja classificada corretamente.
Ou seja, o sistema comporta-se com pesos diferenciados, mas dando maior
confiabilidade ao sistema de alerta.
Além disso, a aplicação das técnicas de Bagging e Boosting merece um estudo
mais detalhado para melhorar a acurácia dos modelos propostos nesta tese, e garantir
um índice de confiança maior no processo de tomada de decisão.
Na realidade os classificadores desenvolvidos no presente trabalho serão
atualizados em dados recentes, relativos aos anos de 2002, 2003 e 2004, o que
certamente, seguindo a metodologia desenvolvida refletirá em crescente melhoria do
desempenho.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 91/115
84
Figura 38 – Metodologias para construção dos Classificadores
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 92/115
85
CAPÍTULO 6CONCLUSÕES E RECOMENDAÇÕES
Esta tese teve como objetivo principal, desenvolver uma metodologia de
Mineração de Dados, utilizando Sistemas Geográficos de Informação (SIG), para
estudar a ocorrência dos escorregamentos nas encostas do Município do Rio de Janeiro,
ocasionados por chuvas intensas.
A mineração dos dados é uma atividade multidisciplinar e engloba o
desenvolvimento de modelos aplicáveis a fenômenos em engenharia nas diversas
escalas: espacial, temporal e multivariada.
A fase mais importante de um projeto em Mineração de Dados, é a Preparação
dos Dados [47]. A metodologia desenvolvida para a tarefa de preenchimento dos dados
ausentes de chuva utilizou técnicas estatísticas, atividades de agrupamento de dados e
redes neurais artificiais [48], [49], [50]. Os resultados obtidos podem ser considerados
satisfatórios. A variável volume de escorregamento também apresentava valores
ausentes. O preenchimento desses valores foi realizado aplicando o algoritmo KNN
[38], [39], [40], e os resultados podem ser considerados excelentes, dada a condição em
que a variável é medida.
Depois de terminada a fase de preparação dos dados, foram construídos
modelos para a predição dos escorregamentos e de chuvas intensas na cidade do Rio de
Janeiro [53].
Os modelos construídos com as técnicas em Redes Neurais Artificiais ( RNA’s)
[36] mostraram boa performance preditiva para um determinado nível de detalhamento
e os resultados mostraram que as RNA’s são bastante úteis para o estudo de
escorregamentos.
Os modelos de Classificação construídos com as Regras de Associação [41],
[44] também apresentaram boa performance preditiva, e os resultados mostraram que
aplicação destas técnicas podem atingir um nível de detalhamento maior na predição, se
comparadas às RNA’s.
Os modelos para a previsão de chuvas intensas, construídos com as técnicas de
RNA’s, apresentaram excelentes resultados de precisão. Estes modelos podem ser
acoplados às Regras de Associação Interessantes [41], e obtendo-se mais um modelo para a predição de escorregamentos.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 93/115
86
Os classificadores desenvolvidos no presente trabalho podem ainda conseguir
melhoria no desempenho, após atualização com dados recentes e com a aplicação de
técnicas para enriquecer a performance preditiva.
Os SIG’s provaram ser bastante úteis para a análise espacial do problema de
escorregamentos, e permitem uma visualização clara das relações entre as variáveis no
tempo e no espaço. Os SIG’s também podem ser considerados ferramentas de
mineração de dados, pois extraem informações do banco de dados de forma automática
e explícita.
A metodologia implementada supriu a escassez de dados consistidos e permitiu
gerar diversos modelos para construir classificadores. Muito esforço deve ser ainda feito
para construir uma ferramenta de uso prático e integrada no ambiente de alerta.
Algumas recomendações são feitas para estudos mais detalhados do problema
de escorregamentos no Município do Rio de Janeiro.
• As imagens de radar coletadas pela Geo-Rio, atualmente, são descartadas após
um período de 2 ou 3 meses. O possível arquivamento das imagens de radar
poderia servir para incorporar estes dados na modelagem.
• Uma encosta na região do Pluviômetro instalado no bairro de Itanhangá
(polígono 17 da Figura 12) é monitorada com instrumentação geotécnica. A
utilização destes dados para a extração de regras seria bastante útil para
entender a relação das variáveis de Geotecnia no problema de
escorregamentos.
• Um modelo para a predição dos escorregamentos considerando as técnicas de
melhoramento do desempenho deve ser implementado para auxiliar o sistema
de alerta existente. A Figura 39 apresenta um fluxograma do modelo proposto.
Neste sistema, seria gerado um mapa com granularidades de risco,
contribuindo para o controle da mobilização das instituições responsáveis em
prestar auxílio aos moradores das encostas. É evidente que a construção de um
ensemble de classificadores fornece o melhor desempenho de predições.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 94/115
87
Deve-se ressaltar que todo o conhecimento adquirido na metodologia proposta
foi obtido de dados monitorados; resta ainda a consideração do conhecimento dos
especialistas que em muito pode acrescentar em benefício da qualidade das predições.
Dados
BaggingHAN (2001);PonderaçãoDUDA (2001);BoostingTING & ZHENG (1998)
Figura 39 – Modelo de Previsão de Escorregamentos.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 95/115
88
REFERÊNCIAS BIBLIOGRÁFICAS
[1] MENEZES, W. F., PAIVA, L. M. S, SILVA, M. G. A. J. et al., 2000, “Estudo
do Ambiente Favorável à Propagação de Sistemas Convectivos de
Mesoescala sobre o Município do Rio de Janeiro”, In XI Congresso
Brasileiro de Meteorologia, Rio de Janeiro.
[2] ALERTA-RIO, 1996, “Condições das Chuvas e Probabilidade de
Escorregamentos no Município do Rio de Janeiro”,
http://www2.rio.rj.gov.br/georio/site/alerta/alerta.htm.
[3] KAIBORI, M., KUWADA, S., UMEKI, K., 2001, “Some Features of debris
flow movements from the view point of disaster prevention”, Pre-prints of
Papers for the Asian Technical Committee on Geotechnology for Natural
Hazards, Hong Kong, December.
[4] ENOKI, M, 2001, “Mechanism of rain-induced landslide of slope surface”, Pre-
prints of Papers for the Asian Technical Committee on Geotechnology for
Natural Hazards, Hong Kong, December.
[5] ABOSHI, H. et al., 1976, A fundamental study on prediction of slope failure and
classification of dangerous zone, Report of Kagaku-Kenkyu-Seika (in
Japanese).
[6] HARUYAMA, M., 1983, Slope failures caused by heavy rainfall in Shirasu
region in southern Kyu-shu, Tsuchi to Kiso, 31 (1): pp. 105-110 (in
Japanese).
[7] KITAMURA, R., 1988, A study on failure mechanism of Shirasu slopes, Report
of Kagaku-Kenkyu-Seika (in Japanese).
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 96/115
89
[8] YAGHI, N., ENOKI, M., YATABE, R., 1991, “Prediction of slope failure based
on amount of rainfall”, Proceedings of International Symposium on Natural
Disaster Prevention and Civil Engineering, Japanese Society of Civil
Engineering: pp. 349-358.
[9] SASAKI, Y. et al., 2000, Rainfall property and critical amount of rainfall of
Masado slopes in the rain-induced disaster in the end of June 1999, Report
on the Rain-induced Disasters in Hiroshima, 1999, pp. 141-152 (in
Japanese).
[10]
ARRAIS, Y. R., ARRAES, F. F., 2001, Estabilidade de Lixo em Encostas,Projeto Final do Curso de Engenharia Civil com ênfase em Meio Ambiente e
Geotecnia, PUC-RJ, p. 1-90, Rio de Janeiro.
[11] FEIJÓ, R. L., PAES, N. M., et al., 2001, “Chuvas e Movimentos de Massa no
Município do Rio de Janeiro”, III Conferência Brasileira de Estabilidade de
Encostas, Novembro, Rio de Janeiro.
[12] ZÁRUBA, Q., MENEL, V., 1969, “Landslides and their control”, Elsevier , p 31.
[13] KITAMURA, R., MIYAMOTO, Y., SAKO, K., 2001, “In Situ Measurement of
Suction Change in Soil due to Rainfall in Kagoshima, Japan”, Pre-prints of
Papers for the Asian Technical Committee on Geotechnology for Natural
Hazards, Hong Kong, December.
[14] KITAMURA, R., SAKO, K., 2001, “A Synthetic Research Strategy for
Prediction of Slope Failures due to Heavy Rain”, Pre-prints of Papers for
the Asian Technical Committee on Geotechnology for Natural Hazards,
Hong Kong, December.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 97/115
90
[15] IKEYA, H., KONDO, K., 2001, “On the New Measures for Sediment Disasters
based on the Hiroshima Sediment Disaster of 1999”, Pre-prints of Papers
for the Asian Technical Committee on Geotechnology for Natural Hazards,
Hong Kong, December.
[16] CHEN, Z. Y., 2001, “Case Record of several Rainfall-Induced Landslides in
China’s Water Resources Development”, Pre-prints of Papers for the Asian
Technical Committee on Geotechnology for Natural Hazards, Hong Kong,
December.
[17]
LIN, M. L., JENG, F. S., 2001, “Hazards induced by extremely heavy Rainfallin a major Fault Zone”, Pre-prints of Papers for the Asian Technical
Committee on Geotechnology for Natural Hazards, Hong Kong, December.
[18] CHEUNG, P., LAI, E. S. T., 2001, “Short-range rainfall forecast in Hong
Kong”, Pre-prints of Papers for the Asian Technical Committee on
Geotechnology for Natural Hazards, Hong Kong, December.
[19] SASAKI, Y., MORIWAKI, T., DISSANAYAKE, A. K., KANO, S., 2001,
“Geotechnical Aspects of Rain-Induced Landslides in Hiroshima, June
1999”, Pre-prints of Papers for the Asian Technical Committee on
Geotechnology for Natural Hazards, Hong Kong, December.
[20] GUIDICINI, G., NIEBLE, C. M., 1976, “Estabilidade de Taludes Naturais e de
Escavação”, Ed. Edgard Blücher e Ed. da Universidade de São Paulo.
[21] FREIRE, E. S. M., 1965, “Movimentos Coletivos de Solos e Rochas e sua
Moderna Sistemática”, Construção, Rio de Janeiro, (95): pp. 10 -18.
[22] FUNDAÇÃO GEORIO, 1998, Relatório de Escorregamentos, In: Prefeitura da
Cidade do Rio de Janeiro.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 98/115
91
[23] FUNDAÇÃO GEORIO, 1999, Relatório de Escorregamentos, In: Prefeitura da
Cidade do Rio de Janeiro.
[24]
FUNDAÇÃO GEORIO, 2000, Relatório de Escorregamentos, In: Prefeitura daCidade do Rio de Janeiro.
[25] FUNDAÇÃO GEORIO, 2001, Relatório de Escorregamentos, In: Prefeitura da
Cidade do Rio de Janeiro.
[26] OHNUMA, C. S., SILVA, F. S. M., MAGRO, S. O., 1994, “Riscos Geológicos
no Brasil”, 38º Congresso Brasileiro de Geologia.
[27] HEIMILLER, D. M., HAYMES, S. R., 2001, “Geographic Information Systems
in Support of Wind Energy Activities at NREL”, 39th AIAA Aerospace
Sciences Meeting, Reno, Nevada, January 8–11.
[28] FELGUEIRAS, C. A., 1987, Desenvolvimento de um Sistema de Modelagem
Digital de Terreno para Microcomputadores. Tese de M.Sc., INPE, São Josédos Campos, SP, Brasil.
[29] BABU, G. L. S., MUKESH, M. D., 2001, Landslide Analysis in Geographic
Information Systems, Department of Civil Engineering Indiana Institute of
Science, Bangalore.
[30] EBECKEN, N. F. F., EVSUKOFF, A. G., 2003, “Métodos Numéricos em
Recursos Hídricos”, Associação Brasileira de Recursos Hídricos, Volume 6,
Capítulo 1, pp. 1 -92.
[31] PEARSON, K., “Regression, heredity, and panmixia”, Philosophical
Transactions of the Royal Society of London, Ser. A, 187, 253-318, 1896.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 99/115
92
[32] WHERRY, R. J., Contributions to correlational analysis, New York: Academic
Press, 1984.
[33]
HAN, J., KAMBER, H., 2001, Data Mining - Concepts and Techniques – Chapters 6, 7 and 8.
[34] RUMELHART, D.E., McCLELLAND, J., 1986, “Parallel Distributed
Processing”, MA: MIT Press, Cambridge, Vol. 1.
[35] BISHOP, C., 1995, Neural Networks for Pattern Recognition, Oxford:
University Press.
[36] HAIKIN, S, 2001, Redes Neurais – Princípios e Prática, 2.ed., Porto Alegre,
Bookman.
[37] ROSENBLATT, F., 1958. “The Perceptron: A probabilistic model for
information storage and organization in the brain”, Psychological Review,
vol. 65, pp. 386-408.
[38] MITCHELL, T. M., 1997, Machine Learning, McGraw-Hill.
[39] KENNEDY, R., LEE, Y., REED, C., ROY, B. V., 1997, Solving Pattern
Recognition Problems, Unica Technologies, Lincoln.
[40] HRUSCHKA, E. R., HRUSCHKA Jr, E. R., EBECKEN, N. F. F., 2003.
“Evaluating a Nearest-Neighbor Method to Substitute Continuous Missing
Values”, Australian Conference on Artificial Intelligence, pp. 723-734.
[41] LIU, B., HSU, W., CHEN, S., MA, Y., 2000, “Analyzing the Subjective
Interestingness of Association Rules”, IEEE Intelligent Systems, National
University of Singapore.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 100/115
93
[42] AGRAWAL, R., SRIKANT, R., 1994, “Fast algorithms for mining association
rules”, VLDB-94.
[43]
AGRAWAL, R., IMIELINKSI, T., SWAMIZ, A., 1993, “Mining AssociationRules between Sets of Ítems in Large Databases”, Proc. SIG-MOD-93, ACM
Press, New Cork, 1993, pp. 207-216.
[44] LIU, B., HSU, W., CHEN, S., MA, Y., 1998, “Integrating Classification and
Association Rule Mining”, KDD-98, August, New York.
[45] SMAC, 1999, Mapeamento e Caracterização do uso das Terras e CoberturaVegetal no Município do Rio de Janeiro entre os anos de 1984 e 1999 , In:
Secretaria Municipal de Meio Ambiente, Prefeitura da Cidade do Rio de
Janeiro.
[46] BROWER, M., 1997, New Mexico Wind Resources - A GIS Approach, In: A
Report to the State of new Mexico, Energy, Minerals, and Natural Resources
Department, September.
[47] PYLE, D., 1999. Data Preparation for Data Mining, Morgan Kaufmann
Publishers, Inc., San Francisco, California, pp. 9-43.
[48] SOUZA, F. T., EBECKEN, N. F. F., 2004, “Landslides Data Preparation for
Data Mining”, Paper accepted to published at the IX International
Symposium on Landslides, June 28 to July 2, Rio de Janeiro.
[49] SOUZA, F. T., EBECKEN, N. F. F., 2003, “A Data Mining Approach for
Landslide Analysis Caused by Rainfall in Rio de Janeiro”, International
Conference on Slope Engineering, pp.611-616, 8-10 December, Hong Kong.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 101/115
94
[50] SOUZA, F. T., EBECKEN, N. F. F., 2004, “Preparação de Dados de Chuvas
Intensas utilizando técnicas de Mineração de Dados”, Artigo aceito para
publicação na Revista Brasileira de Recursos Hídricos (ABRH), Porto
Alegre, Setembro, vol. 9, número 2.
[51] KAUFMAN, L., ROUSSEEUW, P. J., 1990, Finding Groups in Data – An
Introduction to Cluster Analysis, Wiley Inter-Science, Brussels, Belgium.
[52] DOUGHERTY, J., KOHAVI, R., SAHAMI, M., 1995, “Supervised and
unsupervised discretization of continuous features”, ICML-95.
[53] SOUZA, F. T., EBECKEN, N. F. F., 2004, “A Data Mining Approach to
Landslides Prediction”, Abstract accepted at the Data Mining 2004, Fifth
International Conference on Data Mining, Text Mining and their Business
Applications, 15 - 17 September, Malaga, Spain.
[54] TING, K. M., ZHENG, Z., 1998, “Boosting Trees for Cost-Sensitive
Classifications”, Proceedings of the Tenth European Conference on Machine Learning, LNAI-1398, Berlin: Springer-Verlag, pp. 190-195.
[55] DUDA, R. O., HART, P. E., STORK, D. G., 2001, Pattern Classification, Wiley
Interscience, Second Edition.
[56] EMBRAPA, 2001, Os Solos do Estado do Rio de Janeiro – Estudo
GeoAmbiental do Estado do Rio de Janeiro, Empresa Brasileira de PesquisaAgropecuária, Centro Nacional de Pesquisa de Solos.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 102/115
95
Conforme descrito no item 3.2.3, são apresentadas a seguir as descrições dos
parâmetros do solo:
ANEXO I
COBERTURA E USO DO SOLO.
O “Mapeamento e Caracterização do Uso das Terras e Cobertura Vegetal no
Município do Rio de Janeiro entre os anos de 1984 e 1999” possuem a intenção básica
de retratar os remanescentes dos grandes ecossistemas presentes na cidade. Neste
mapeamento conduzido pela [45] foram incluídas importantes classes do ponto de vista
ecológico. Classificadas sob a ótica dos grandes ecossistemas presentes na cidade, as
diferentes classes de mapeamento puderam ser agregadas em “áreas artificializadas” e
“áreas naturais”.
ÁREAS ARTIFICIALIZADAS
SÍMBOLO DESCRIÇÃO
Au – Área
Urbana
Inclui um grupo heterogêneo de alvos espectrais característicos de
áreas urbanas densas, em grande parte não separáveisespacialmente, na escala 1:50.000
Ac – ÁreaUrbana NãoConsolidada
Inclui as áreas com ocupação humana esparsa, seja por estarem em processo de ocupação ou por serem áreas onde incidem limitaçõesfísicas ou legais para o processo de ocupação urbana. Inclui, ainda,áreas com concentrações de pequenas propriedades com atividadeagropecuária e de chácaras para lazer.
Vp – Vegetaçãoem ParquesPúblicos
Áreas com vegetação de campo e porte arbóreo inseridas nosgrandes parques públicos da cidade. O Jardim Botânico do Rio deJaneiro, por apresentar dentro dos seus limites áreas de florestanatural e por ser contíguo à Floresta da Tijuca, foi incluído noconjunto da cobertura vegetal nativa do município.
Ca – CampoAntrópico
Áreas de origem antrópica em sua quase totalidade, incluindocampos de capim-colonião, de outras gramíneas, de dicotiledôneasherbáceas, e áreas de macega.
CP – Cultura ePastagem
Inclui as áreas de no mínimo 4 ha. onde se identificou o usoagropastoril.
Sm – Solo
Exposto e Áreade Mineração
Inclui áreas de solo exposto, seja por ocorrência de terraplenagens,
deslizamentos ou outras causas, e áreas de mineração, pedreiras,saibreiras e afins.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 103/115
96
ÁREAS NATURAIS
SÍMBOLO DESCRIÇÃOF - Floresta Floresta ombrófila densa – Mata Atlântica – pouco
alterada ou não alterada. Pode também representar uma floresta secundária tardiaFa – Floresta Alterada Inclui diversas fitofisionomias associadas à alteração
das florestas nativas, como raleamento por corteseletivo ou pequenas áreas de desmatamento, além deassociadas às diversas fases sucessionais que seguema supressão total ou parcial da floresta nativa. Inclui,também, os bananais que ocupam diversos trechosdas encostas, principalmente no maciço da pedraBranca, que não puderam ser separados das florestasnativas de forma segura devido à semelhança das
assinaturas espectrais e à interposição espacial entreos dois alvos.
M - Mangue Inclui as várias fisionomias de mangue, comvegetação halófita de porte arbustivo-arbóreo, emdiferentes estados de conservação.
A - Apicum Inclui as áreas de mangue não cobertas por vegetação, ou com vegetação halófita herbácea, como típico substrato lodoso, sendo parte integrante dosecossistemas de manguezal.
R – Vegetação de Restinga Inclui os remanescentes de restinga, arbóreo-
arbustiva e arbustiva-herbácea, além dosremanescentes de “mata-de-caixeta” (floresta paludosa) que existem na Baixada de Jacarepaguá.
B – Área Úmida comVegetação
Inclui as áreas com vegetação arbustivo-herbácea-nativa, secundária ou invasora – sobre solosencharcados, seja por deficiência de drenagem, seja
por afloramento de lençol freático. Foram mapeadasas áreas que apresentavam resposta espectral típica desolo encharcado, com presença de vegetação, naimagem de satélite.
Am – Ambientes Marinhos Inclui as baías de sepetiba e da Guanabara, além da
zona costeira do Oceano Atlântico.H – Águas Continentais eAmbientes Estuarinos
Inclui as lagoas, rios, córregos e canais, além de áreasestuarinas no município.
PA – Praia e Areal Inclui as baías de Sepetiba e Guanabara e o OceanoAtlântico, nos limites do Município do Rio deJaneiro.
Ar – Afloramento Rochoso Inclui os afloramentos de rocha de origem natural ecostões rochosos.
Rf - Reflorestamento Pontos assinalados onde existem áreas emreflorestamento ou reflorestadas.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 104/115
97
ANEXO II
APTIDÃO PARA REFLORESTAMENTO E OLERICULTURA.
Foi estimada a partir dos graus de limitação de parâmetros que sintetizam as
qualidades de um ecossistema, a saber: deficiência de fertilidade, deficiência de água,
excesso de água / deficiência de oxigênio, suscetibilidade à erosão e impedimentos ao
manejo. Os graus de limitação foram estimados considerando-se as informações desolos e das paisagens recuperadas do mapeamento de cobertura vegetal.
(APTIDÃO BOA)
SÍMBOLO DESCRIÇÃO
1 Ro / h Terras com aptidão boa para reflorestamento e regular para olericultura.Fator limitante: deficiência de água.
1 Ro / fh Terras com aptidão boa para reflorestamento e regular para olericultura.Fatores limitantes: deficiência de fertilidade e de água.
1 R(o) /hem
Terras com aptidão boa para reflorestamento. Fatores limitantes:deficiência de água e erosão. Terras com aptidão restrita paraolericultura. Fatores limitantes: suscetibilidade à erosão e impedimentosao manejo.
1 R(o) /fhem Terras com aptidão boa para reflorestamento. Fatores limitantes:deficiência de fertilidade e de água. Terras com aptidão restrita paraolericultura. Fatores limitantes: deficiência de fertilidade,suscetibilidade à erosão e impedimentos ao manejo.
1 R(o) / e Terras com aptidão boa para reflorestamento e restrita para olericultura.Fator limitante: suscetibilidade à erosão.
1 O Terras com aptidão boa para olericultura, sem fator limitante.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 105/115
98
(APTIDÃO REGULAR)
SÍMBOLO DESCRIÇÃO2 r / fhe Terras com aptidão regular para reflorestamento. Fatores
limitantes: deficiência de fertilidade e de água esuscetibilidade à erosão.
2 r / fhe ==== Terras com aptidão regular para reflorestamento. Fatoreslimitantes: deficiência de fertilidade e de água esuscetibilidade à erosão. Apresentam, em menor proporção,terras com aptidão inferior.
2 r / hem ==== Terras com aptidão regular para reflorestamento. Fatoreslimitantes: deficiência de água, suscetibilidade à erosão eimpedimentos ao manejo. Apresentam, em menor proporção,terras com aptidão inferior.
2 o / f Terras com aptidão regular para olericultura. Fator limitante:deficiência de fertilidade.
2 o / fom Terras com aptidão regular para olericultura. Fatoreslimitantes: deficiência de fertilidade, excesso deágua/deficiência de oxigênio e impedimentos ao manejo.
(APTIDÃO RESTRITA)
SÍMBOLO DESCRIÇÃO3 (r) / e Terras com aptidão restrita para reflorestamento. Fator
limitante: suscetibilidade à erosão.3 (r) / e ---- Terras com aptidão restrita para reflorestamento. Fator
limitante: suscetibilidade à erosão. Apresentam, em menor proporção, terras com aptidão superior.
3 (r) / e ==== Terras com aptidão restrita para reflorestamento. Fator limitante: suscetibilidade à erosão. Apresentam, em menor
proporção, terras com aptidão inferior.3 (r) / em Terras com aptidão restrita para reflorestamento. Fatores
limitantes: suscetibilidade à erosão e impedimentos ao manejo.3 (o) / fom Terras com aptidão restrita para olericultura. Fatores
limitantes: deficiência de fertilidade, excesso deágua/deficiência de oxigênio e impedimentos ao manejo.
(APTIDÃO ESPECIAL)
SÍMBOLO DESCRIÇÃO
4 E r Terras com aptidão especial para reflorestamento. Paisagens derestinga incluindo dunas.
4 E ma Terras com aptidão especial para reflorestamento. Paisagens demangue.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 106/115
99
(SEM APTIDÃO)
SÍMBOLO DESCRIÇÃO
5 I ar Terras sem aptidão para reflorestamento e olericultura.Paisagens de afloramentos de rocha.
5 i s Terras sem aptidão para reflorestamento e olericultura.Paisagens de solos hidromórficos com caráter salino e/outiomorfismo.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 107/115
100
ANEXO III
QUALIDADE AMBIENTAL DAS TERRAS.
Nível de pressão que as ações antrópicas exercem sobre os atributos naturais e
de como o próprio ambiente reage a esta pressão. A avaliação tomou por base as
informações de vulnerabilidade ambiental em cruzamento com a cobertura vegetal
atual.
QUALIDADE (ÁREA DE ALERTA)
SÍMBOLO DESCRIÇÃO
ALa Áreas de alerta referentes a presença de afloramentos de rocha.Representam risco para as terras a jusante devido à queda de blocos.
Alb Áreas de alerta referentes aos mangues, Apicum e dunas. Representamambientes de preservação extremamente frágeis.
QUALIDADE (CONSERVADA) SÍMBOLO DESCRIÇÃO
Coa Terras conservadas. As interferências antrópicas são brandas, com pouco prejuízo na paisagem. Apresentam cobertura de Mata Atlântica.
Cob Terras conservadas. As interferências antrópicas são brandas, com pouco prejuízo na paisagem. Correspondem à parte da restinga deMarambaia.
QUALIDADE (EXTREMAMENTE DEGRADADA)
SÍMBOLO DESCRIÇÃO
Eda Terras extremamente degradadas. Áreas de solo exposto (decorrência deterraplanagens e deslizamentos) e de mineração (pedreiras e saibreiras).
Edb Terras extremamente degradadas. Áreas de solo exposto, decorrência deterraplanagens e retirada de areia.
Edu Terras extremamente degradadas. Áreas de solo exposto (decorrência de
terraplanagens e deslizamentos) e de mineração (pedreiras, saibreiras eretirada de aréola), inseridas na área urbana.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 108/115
101
QUALIDADE (FORTEMENTE DEGRADADA)
SÍMBOLO DESCRIÇÃO
FDa Terras fortemente degradadas. As interferências antrópicascausam grandes prejuízos na qualidade das terras. Apresentamcobertura de campo antrópico associada à classe devulnerabilidade Muito Alta.
FDb Terras fortemente degradadas. As interferências antrópicascausam grandes prejuízos na qualidade das terras. Apresentamcobertura de cultura e pastagem associada à classe devulnerabilidade Muito Alta.
QUALIDADE (LIGEIRAMENTE DEGRADADA)
SÍMBOLO DESCRIÇÃO
Lda Terras ligeiramente degradadas. As interferências antrópicascausam pequenos prejuízos na qualidade das terras.Apresentam cobertura de floresta alterada, reflorestamento ecampo antrópico, dependendo da classe de vulnerabilidade dasterras.
LDb Terras ligeiramente degradadas. As interferências antrópicascausam pequenos prejuízos na qualidade das terras.Apresentam coberturas de restinga, floresta alterada,reflorestamento e área úmida com vegetação e campoantrópico, dependendo da classe de vulnerabilidade.
QUALIDADE (MODERADAMENTE DEGRADADA)
SÍMBOLO DESCRIÇÃO
Mda Terras moderadamente degradadas. As interferênciasantrópicas causam significativos prejuízos na qualidade dasterras. Apresentam coberturas de floresta alterada,reflorestamento e campo antrópico, dependendo da classe devulnerabilidade das terras.
MDb Terras moderadamente degradadas. As interferênciasantrópicas causam significativos prejuízos na qualidade dasterras. Apresentam coberturas de campo antrópico e cultura e
pastagem, dependendo da classe de vulnerabilidade das terras.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 109/115
102
ANEXO IV
VULNERABILIDADE AMBIENTAL DAS TERRAS.
Os fatores considerados na avaliação da vulnerabilidade foram a
suscetibilidade à erosão no caso das terras altas e as restrições de drenagem no caso das
terras baixas. A avaliação foi elaborada a partir das informações contidas no
levantamento dos solos, considerando-se principalmente as características do solo,
drenagem, relevo, rochosidade, pedregosidade e vegetação original. Não foi
considerado o uso atual das terras.
VULNERABILIDADE (ALTA)
SÍMBOLO DESCRIÇÃO
A v Vulnerabilidade alta, condicionada por textura arenosa ao longo do perfil. Vegetação original de restinga.
A hbw Vulnerabilidade alta, condicionada por presença de argilas expansivas,
camadas adensadas em subsuperfície e presença temporária de lençolfreático. Vegetação original de floresta tropical subcaducifólia.
A hfw Vulnerabilidade alta, condicionada por presença de argilas expansivas,risco de inundação e presença de lençol freático. Vegetação original decampo higrófilo de várzea.
A g Vulnerabilidade alta, condicionada por declividade. Vegetação originalde floresta tropical subcaducifólia.
A kgr Vulnerabilidade alta, condicionada por espessura do solo, declividade,rochosidade e pedregosidade. Vegetação original de floresta tropicalsubcaducifólia e caducifólia.
VULNERABILIDADE (BAIXA)
SÍMBOLO DESCRIÇÃO
B g Vulnerabilidade baixa, condicionada por declividade. Vegetaçãooriginal de floresta tropical subcaducifólia.
B tg Vulnerabilidade baixa, condicionada por declividade e presença de
gradiente textural. Vegetação original de floresta tropicalsubcaducifólia.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 110/115
103
VULNERABILIDADE (EXTREMAMENTE ALTA)
SÍMBOLO DESCRIÇÃO
EA gr Vulnerabilidade extremamente alta, condicionada por declividade erochosidade. Vegetação original de campo rupestre.
EA c Vulnerabilidade extremamente alta, condicionada por ambienteecológico muito frágil. Vegetação original de mangue.
EA v Vulnerabilidade extremamente alta, condicionada por textura arenosa.Vegetação original de restinga.
VULNERABILIDADE (MODERADA)
SÍMBOLO DESCRIÇÃO
M fw Vulnerabilidade moderada, condicionada por risco ocasional deinundação e presença de lençol freático. Vegetação original de florestatropical subperenifólia de várzea.
M bw Vulnerabilidade moderada, condicionada por presença de camadasadensadas em subsuperfície e presença temporária de lençol freático.Vegetação original de floresta tropical subcaducifólia.
M tg Vulnerabilidade moderada, condicionada por declividade e presença degradiente textural; vegetação original de floresta tropical subcaducifólia.
VULNERABILIDADE (MUITO ALTA)
SÍMBOLO DESCRIÇÃO
MA kgc Vulnerabilidade muito alta, condicionada por espessura do solo,declividade e clima; vegetação original de floresta tropicalsubperenifólia.
MA kgr Vulnerabilidade muito alta, condicionada por espessura do solo,declividade, rochosidade e pedregosidade. Vegetação original defloresta tropical subcaducifólia e caducifólia.
MA hgr Vulnerabilidade muito alta, condicionada por presença de argilasexpansivas, declividade, rochosidade e pedregosidade. Vegetaçãooriginal de floresta tropical subcaducifólia.
MA ofw Vulnerabilidade muito alta, condicionada por presença de camadasorgânicas, risco de inundação e presença de lençol freático. Vegetaçãooriginal de campo e floresta hidrófila de várzea.
MA sfw Vulnerabilidade muito alta, condicionada por presença no solo desalinidade e tiomorfismo, risco de inundação e presença de lençolfreático. Vegetação original de campo halófilo de várzea.
MA vw Vulnerabilidade muito alta, condicionada por textura arenosa e presençade lençol freático. Vegetação original de restinga.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 111/115
104
ANEXO V
PEDOLOGIA
As principais classes de solos são definidas a seguir, em função das descrições
morfológicas, análises físicas, químicas e mineralógicas de seus perfis representativos,
EMBRAPA [56].
PEDOLOGIA (LATOSSOLOS)
SÍMBOLO DESCRIÇÃO
Lap Latossolo amarelo álico podzólico A moderada textura argilosafase floresta subcaducifólia relevo suave ondulado.
LVa1 Latossolo vermelho-amarelo álico A moderada textura argilosafase floresta subcaducifólia relevo forte ondulado.
LVa2 Latossolo vermelho-amarelo álico pouco profundo A moderadatextura argilosa fase floresta subperenifólia relevo forte ondulado.
LVa3 Associação Latossolo vermelho-amarelo pouco profundo +Cambissolo latossólico fase substrato rochas alcalinas ambosálicos A moderada textura muito argilosa fase florestasubperenifólia relevo montanhoso.
LVa4 Associação Latossolo vermelho-amarelo pouco profundo +Cambissolo latossólico ambos textura argilosa + Cambissolo Tbtextura média cascalhenta + Solos Litólicos indiscriminados todos
álicos A moderada fase floresta subperenifólia relevo montanhososubstrato rochas cristalinas ácidas.
PEDOLOGIA (SOLOS PODZÓLICOS)
SÍMBOLO DESCRIÇÃO
PVa1 Podzólico vermelho-amarelo Tb álico A moderada texturamédia/argilosa fase floresta subcaducifólia relevo ondulado.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 112/115
105
Continuação PEDOLOGIA (SOLOS PODZÓLICOS)
SÍMBOLO DESCRIÇÃO
PVa2 Associação Podzólico vermelho-amarelo Tb álico + Podzólicovermelho-amarelo Tb eutrófico raso ambos A moderada texturamédia/argilosa + Solos Litólicos indiscriminados fase substrato rochasgnáissicas ácidas todos fase floresta subcaducifólia relevo forteondulado.
PVa3 Associação Podzólico vermelho-amarelo Tb álico raso A moderadatextura média/argilosa fase floresta subcaducifólia relevo forte ondulado+ Afloramento de rocha.
PVl1 Podzólico vermelho-amarelo álico latossólico A moderada texturamédia/muito argilosa fase floresta subcaducifólia relevo suaveondulado.
PVl2 Podzólico vermelho-amarelo álico latossólico A moderada texturamédia/muito argilosa fase floresta subcaducifólia relevo ondulado.
PVd1 Associação Podzólico vermelho-amarelo Tb distrófico + Podzólicovermelho-amarelo álico latossólico ambos A moderada texturamédia/muito argilosa fase floresta subcaducifólia relevo suaveondulado.
PVd2 Associação Podzólico vermelho-amarelo Tb distrófico + Podzólicovermelho-amarelo Tb eutrófico ambos A moderada textura média/muito
argilosa fase floresta subcaducifólia relevo suave ondulado.PVd3 Podzólico vermelho-amarelo Tb distrófico planossólico A moderado,
textura arenosa/argilosa fase floresta subcaducifólia relevo suaveondulado.
PVe1 Podzólico vermelho-amarelo Tb eutrófico A moderada texturamédia/argilosa fase floresta subcaducifólia relevo ondulado.
PVe2 Associação Podzólico vermelho-amarelo Tb eutrófico raso A moderado+ Podzólico vermelho-amarelo Tb eutrófico A chernozêmico ambostextura médio/argilosa fase pedregosa I floresta subcaducifólia relevo
forte ondulado.
PVe3 Associação Podzólico vermelho-amarelo Tb eutrófico raso A moderado+ Podzólico vermelho-amarelo Tb eutrófico ambos A moderada texturamédia/argilosa fase floresta subcaducifólia + Solos Litólicosindiscriminados fase substrato rochas gnáissicas ácidas e básicas(migmatitos) floresta caducifólia todos relevo forte ondulado +Afloramento de rocha.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 113/115
106
Continuação PEDOLOGIA (SOLOS PODZÓLICOS)
SÍMBOLO DESCRIÇÃO
PVe4 Associação Podzólico vermelho-amarelo Tb eutrófico raso + Podzólicovermelho-amarelo Tb eutrófico + Podzólico vermelho-amarelo Tbdistrófico todos A moderada textura média/argilosa + Solos Litólicosindiscriminados fase substrato rochas graníticas e gnáissicas ácidas e
básicas (migmatitos) todos fase floresta subcaducifólia relevo forteondulado.
PVe5 Associação Podzólico vermelho-amarelo Tb eutrófico A chernozêmicotextura argilosa/muito argilosa + Brunizém avermelhado texturamédia/argilosa fase erodida todos fase pedregosa I florestasubcaducifólia relevo forte ondulado.
PVe6 Associação Podzólico vermelho-amarelo Tb eutrófico raso textura
média/argilosa fase floresta subcaducifólia + Solos Litólicosindiscriminados fase floresta caducifólia substrato rochas gnáissicasambos A moderado relevo forte ondulado + Afloramento de rocha.
PEDOLOGIA (BRUNIZÉM)
SÍMBOLO DESCRIÇÃO
BV Brunizém avermelhado textura argilosa e média/argilosa fase pedregosaI floresta subcaducifólia relevo forte ondulado.
PEDOLOGIA (PODZOL)
SÍMBOLO DESCRIÇÃO
P1 Podzol profundo distrófico A moderada textura arenosa fase restingaarbustiva e campo de restinga relevo plano e suave ondulado.
P2 Podzol hidromórfico álico A moderada textura arenosa fase campo efloresta hidrófilos de restinga relevo plano.
P3 Associação Podzol hidromórfico álico + Areias quartzosas marinhasálicas intermediárias para Podzol ambos A moderado textura arenosafase campo e floresta hidrófilos de restinga relevo plano.
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 114/115
107
PEDOLOGIA (PLANOSSOLOS)
SÍMBOLO DESCRIÇÃO
PLa1 Planossolo Tb álico A proeminente textura arenosa/argilosa fasefloresta subcaducifólia relevo plano.
PLa2 Planossolo Tb álico A proeminente textura arenosa/média fasefloresta subcaducifólia relevo plano.
PLa3 Planossolo Tb álico A moderada textura arenosa/argilosa fasefloresta subcaducifólia relevo plano.
PLa4 Planossolo Tb álico A moderada textura arenosa/média fasefloresta subcaducifólia relevo plano.
PLa5 Associação Planossolo Tb álico textura arenosa/argilosa +
Planossolo Tb álico com fragipan textura arenosa/média ambosA moderada fase floresta subcaducifólia relevo plano.
PLS Associação Planossolo Ta solódico + Planossolo Tb solódicoambos A moderada textura média/argilosa fase florestasubcaducifólia relevo plano.
PEDOLOGIA (SOLOS GLEI)
SÍMBOLO DESCRIÇÃOGHa1 Glei húmico Ta álico A Bi C textura argilosa e muito argilosa
fase campo higrófilo de várzea relevo plano.
GHa2 Glei húmico Ta álico AC textura argilosa e muito argilosa fasecampo higrófilo de várzea relevo plano.
GPa Glei pouco húmico Ta álico AC textura argilosa fase campohigrófilo de várzea relevo plano.
GHT Glei húmico salino tiomórfico textura argilosa e muito argilosa
fase campo halófilo de várzea relevo plano.GIS Associação complexa Solos glei salinos + Solos glei salinos
tiomórficos ambos indiscriminados fase campo halófilo devárzea relevo plano.
PEDOLOGIA (MANGUE)
SÍMBOLO DESCRIÇÃO
M Manguezal
5/9/2018 SOUZA_FT_04_t_D_int - slidepdf.com
http://slidepdf.com/reader/full/souzaft04tdint 115/115
108
PEDOLOGIA (SOLOS ORGÂNICOS)
SÍMBOLO DESCRIÇÃO
Od1 Solos orgânicos distróficos fase campo e floresta hidrófilos de várzea
relevo plano.Od2 Solos semi-orgânicos distróficos sobre areias ou argilas fase campo e
floresta hidrófilos de várzea relevo plano.
Oe Solos semi-orgânicos eutróficos sobre areias ou argilas conchíferas fasecampo e floresta hidrófilos de várzea relevo plano.
OT Solos orgânicos salinos tiomórficos fase campo halófilo de várzearelevo plano.
PEDOLOGIA (SOLOS ALUVIAIS)
SÍMBOLO DESCRIÇÃO
Ae Associação Solos aluviais Tb distróficos e eutróficos + Cambissolo Tbdistrófico e eutrófico fase substrato sedimentos aluviais ambos Amoderada textura indiscriminada fase floresta subperenifólia de várzearelevo plano.
PEDOLOGIA (SOLOS ARENO QUARTZOSOS)
SÍMBOLO DESCRIÇÃO
AMd Areias quartzosas marinhas distróficas (dunas) fase restinga arbustiva ecampo de restinga relevo plano e ondulado.
AMe Associação Areias quartzosas marinhas hidromórficas eutrófica Achernozêmico sobre areias conchíferas + Podzol hidromórfico álico Amoderada textura arenosa ambos campo e floresta hidrófilos de restingarelevo plano.
PEDOLOGIA (AFLORAMENTO DE ROCHA)
SÍMBOLO DESCRIÇÃO
AR Afloramentos de rocha
Recommended