Aplicacao de Metodos Quantitativos para
a Precificacao de Imoveis Rurais no Mercado Financeiro
Pedro Maia Caldas
Projeto de Graduacao apresentado ao Curso
de Engenharia Eletronica e de Computacao
da Escola Politecnica, Universidade Federal
do Rio de Janeiro, como parte dos requisitos
necessarios a obtencao do tıtulo de Enge-
nheiro.
Orientadores:
Sergio Palma da Justa Medeiros
Rio de Janeiro
Setembro de 2016
Aplicacao de Metodos Quantitativos para
a Precificacao de Imoveis Rurais no Mercado Financeiro
Pedro Maia Caldas
PROJETO DE GRADUACAO SUBMETIDO AO CORPO DOCENTE DO CURSO
DE ENGENHARIA ELETRONICA E DE COMPUTACAO DA ESCOLA PO-
LITECNICA DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO
PARTE DOS REQUISITOS NECESSARIOS PARA A OBTENCAO DO GRAU
DE ENGENHEIRO ELETRONICO E DE COMPUTACAO
Autor:
Pedro Maia Caldas
Orientador:
Prof. Sergio Palma da Justa Medeiros, Dr. Ing.
Examinador:
Carlos Jose Ribas D’Avila, M.Sc.
Examinador:
Jose Arthur da Rocha, M.Sc.
Rio de Janeiro
Setembro de 2016
ii
UNIVERSIDADE FEDERAL DO RIO DE JANEIRO
Escola Politecnica - Departamento de Eletronica e de Computacao
Centro de Tecnologia, bloco H, sala H-217, Cidade Universitaria
Rio de Janeiro - RJ CEP 21949-900
Este exemplar e de propriedade da Universidade Federal do Rio de Janeiro, que
podera incluı-lo em base de dados, armazenar em computador, microfilmar ou adotar
qualquer forma de arquivamento.
E permitida a mencao, reproducao parcial ou integral e a transmissao entre bibli-
otecas deste trabalho, sem modificacao de seu texto, em qualquer meio que esteja
ou venha a ser fixado, para pesquisa academica, comentarios e citacoes, desde que
sem finalidade comercial e que seja feita a referencia bibliografica completa.
Os conceitos expressos neste trabalho sao de responsabilidade do(s) autor(es).
iii
DEDICATORIA
A todos que fizeram deste momento possıvel.
iv
AGRADECIMENTO
Primeiramente, gostaria de agradecer a minha famılia e aos amigos, sem os quais
nao seria possıvel completar essa etapa.
Agradeco nao somente por todo o investimento feito em minha formacao, mas
principalmente agradeco pelo incentivo, motivacao e confianca no meu crescimento.
Tenho certeza de que os valores que foram transmitidos corroboraram com todos
os passos dados em minha graduacao. A crenca pela persistencia, trabalho duro e
multiplas inteligencias foi essencial nessa investida.
Adicionalmente, agradeco a UFRJ e todos os professores com quem tive o
privilegio de aprender. Em especial, gostaria de agradecer ao professor Carlos Jose
Ribas D’Avila por ter sido meu tutor por toda essa jornada e me mostrado valores
que ficam acima de hierarquias e tıtulos. Ao professor Sergio Palma agradeco por
ter me incentivado e apoiado esse projeto e, principalmente, por ter transmitido
conhecimentos que se estendem alem da sala de aula e estao presentes nas decisoes
mais importantes do meu dia a dia.
Um agradecimento tambem ao grupo do GTA/UFRJ e ao professor Otto
Carlos Muniz Bandeira Duarte por ter me iniciado no ambiente cientıfico e pas-
sado conhecimentos e valores que sempre vou utilizar. Uma mencao ao meu colega
de classe Antonio Gonzalez Pastana Lobato por ter me orientado e revisado esse
trabalho inumeras vezes.
Tambem gostaria de agradecer a instituicao financeira que apoiou esse tra-
balho, fornecendo recursos para elaborar partes essenciais do projeto. Nao posso
deixar de citar meu coordenador, Rodrigo Chamoun, que sustentou a ponte entre o
projeto e o banco, me orientando e transmitindo conceitos e valores que para sempre
vou carregar.
Por fim, gostaria de agradecer a instituicao UFRJ e tudo o que ela me pro-
porcionou, nao somente um curso ımpar de engenharia, mas todas as experiencias e
relacionamentos que ela abriu. A oportunidade de estudar na NYU e muitos outros
acontecimentos moldaram o que sou hoje e tenho certeza de que vou gerar o retorno
esperado e o investimento feito em mim.
v
RESUMO
A ma avaliacao de uma garantia em uma analise de credito pode provocar danos
substanciais a uma instituicao financeira. Embora sempre exista o risco de supe-
ravaliacao/subavaliacao do ativo, existem formas de mitiga-lo. Ao garantir uma
avaliacao justa de uma garantia, mais especificamente de um imovel rural, o risco
de inadimplencia da operacao de credito diminuira na medida em que a instituicao
financeira podera executar seu colateral e cobrir seu prejuızo. Esse projeto propoe
um sistema para precificar o valor de mercado das terras dadas em garantia para
um determinado banco, com dados reais. A arquitetura do projeto foi baseada nos
modelos quantitativos da Inteligencia Artificial sobre uma base historica, trazendo
a vantagem de um sistema que se auto adapta, nao sendo necessario a intervencao
constante de um especialista. Dessa forma, o sistema consegue prever, atraves de re-
gressoes em sua base historica, o valor esperado para um determinado imovel dado
em alienacao de uma operacao de credito, proporcionando um apoio de decisao
para o analista de credito de forma eficiente e escalavel. O conjunto de dados foi
construıdo a partir de dados reais de avaliacoes historicas de terras. Os resultados
mostram um modelo bem explicativo, com o coeficiente de determinacao, R2, de
aproximadamente 87%.
Palavras-Chave: precificar, inteligencia artificial, analise de credito, inadimplencia,
apoio de decisao.
vi
ABSTRACT
The misjudgment of a guarantee on a credit analysis may cause substantial damage
to a financial institution. Although there is always risk of overvaluation/underva-
luation of assets, there are ways to mitigate it. By ensuring a fair evaluation of
security, more specifically a rural property, the risk of default of the loan will decre-
ase to the extent that the financial institution can perform its side and cover your
loss. This project proposes a system for pricing the market values of land, given
as collateral for a bank, with real data. The architectural design was based on the
quantitative models of Artificial Intelligence on a historical basis, bringing the ad-
vantage of a system that is always self-adapting, therefore, the constant intervention
of a specialist is not necessary. Thus, the system can provide, through regressions
in its historical base, the expected value for a given property given as collateral of a
credit operation. The result is a support on the credit analyst's decision, delivering
efficiency and scalability. The data set was constructed from real data of land of
historical assessments. The results show a very explanatory model with a coefficient
of determination, R2, of approximately 87%.
Key-words: pricing, artificial intelligence, credit analysis, decision support.
vii
SIGLAS
ANN - Artificial Neural Network
AI - Artificial Intelligence
CCIR - Certificado de Cadastro de Imovel Rural
IA - Inteligencia Artificial
MAE - Mean Absolute Error
MLP - Multilayer Perceptron
MSE - Mean Squared Error
RNA - Redes Neurais Artificiais
RPROP - Resilient Backpropagation
SG&A - Selling, General and Administrative Expenses
UFRJ - Universidade Federal do Rio de Janeiro
VBA - Visual Basic for Applications
WEKA - Waikato Environment for Knowledge Analysis
viii
Sumario
1 Introducao 1
1.1 Proposta e Objetivos do Projeto . . . . . . . . . . . . . . . . . . . . . 3
1.2 Metodologia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Organizacao do Texto . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 Trabalhos Relacionados 6
2.1 Redes Neurais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.2 O Neuronio de McCulloch e Pitts . . . . . . . . . . . . . . . . 7
2.1.3 Aprendizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.4 Perceptron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1.5 MLP e o algoritmo RPROP . . . . . . . . . . . . . . . . . . . 11
2.1.6 Trabalhos Relacionados . . . . . . . . . . . . . . . . . . . . . . 14
3 Mercado Financeiro e a Dinamica das Garantias 17
4 O Sistema Proposto 25
4.1 Criterios da Nota Agronomica . . . . . . . . . . . . . . . . . . . . . . 26
4.2 Notas e Pesos dos Criterios . . . . . . . . . . . . . . . . . . . . . . . . 31
4.2.1 Pesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.2.2 Domınios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.2.3 Calculo das Notas . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.3 Desenvolvimento do Sistema de Precificacao . . . . . . . . . . . . . . 34
4.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5 Conclusao 41
ix
Bibliografia 43
A Codigo Fonte 46
x
Lista de Figuras
2.1 Caracterizacao do neuronio de McCulloch e Pitts, consistindo em
uma camada com N neuronios de entrada e um neuronio de saıda.
O neuronio de saıda recebe a soma das entradas ponderada pelos
pesos de cada neuronio de entrada. Dependendo do resultado dessa
soma, o neuronio de saıda vai apresentar um valor diferente. Essa
relacao entre o valor de saıda e um determinado limite, threshold e
estabelecida por uma funcao de transferencia. . . . . . . . . . . . . . 8
2.2 Arquitetura da configuracao simples do Perceptron, com apenas um
neuronio de saıda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Arquitetura da configuracao de classificacao multipla do Perceptron,
com mais de um neuronio de saıda. . . . . . . . . . . . . . . . . . . . 12
2.4 Arquitetura de uma Rede Neural MLP, com uma camada extra, uma
camada escondida, que fornece a rede uma maior capacidade de decisao. 13
3.1 Dinamica da liberacao de credito. 1 - Inıcio com a prospeccao do
cliente pelo operador de credito; 2 - Seguido pela analise de credito e
a avaliacao da garantia feita pelo controle de credito; 3 - E realizado
o Comite de Credito para aprovar ou nao a concessao do credito, e se
sim, quais sao as exigencias; 4 - Liberacao de recursos que contem a
elaboracao da minuta de credito e a checagem de sua representacao.
5 - Controle do fluxo de pagamentos e das garantias da operacao . . . 20
xi
3.2 Dinamica da avaliacao da garantia. 1 - Realizacao do laudo por uma
empresa contratada pelo banco; 2 - Visita de campo da equipe (do
Controle de Credito) especializada em agro; 3 - Elaboracao do pa-
recer do Controle de Credito determinando o valor da garantia na
operacao; 4 - Julgamento do Comite de Credito para esta operacao e
sua respectiva garantia . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.3 Dinamica da avaliacao da garantia agora com a utilizacao da IA no
apoio da tomada de decisao. . . . . . . . . . . . . . . . . . . . . . . . 24
4.1 Essa figura descreve os insumos necessarios para a construcao da nota
de cada terra. Primeiro, selecionar quais sao os atributos relevantes
para eventual classificacao do algoritmo; em seguida, atribuir notas
para cada tipo de valor que essas caracterısticas terao, e por fim,
atribuir um peso para cada criterio . . . . . . . . . . . . . . . . . . . 27
4.2 Essa figura descreve os pesos de cada variavel com abertura por es-
tado. Bahia esta representada pelo estado numero 0 e Mato Grosso
pelo estado numero 1. O banco de garantias do banco XYZ abrange
mais estados, mas, apenas desses dois estados foram coletadas in-
formacoes necessarias para a elaboracao da base. . . . . . . . . . . . . 32
4.3 Figura mostra 3 das 13 tabelas contendo os domınios de cada variavel.
A tabela esquerda superior se refere ao atributo Altitude, a da direita
superior ao Relevo e a inferior ao Solo. A coluna Domınio se refere
aos valores esperados pelo laudo, a Nota, a qual nota o atributo tera
dependendo de seu valor no laudo e a coluna Estado possui valor 0
ou 1, onde 0 representa Bahia e 1, Mato Grosso. . . . . . . . . . . . . 34
4.4 Essa figura ilustra a base de terras apos o algoritmo de quantizacao.
A tabela possui um identificador de cada terra (ID), seus atributos e
o preco de venda do laudo. Alguns dos 13 atributos foram omitidos
para a otimizacao da imagem. . . . . . . . . . . . . . . . . . . . . . . 35
4.5 Arquitetura utilizada no programa Knime. A figura ilustra quais
modulos foram utilizados, desde o leitor da base de dados ate o modulo
de estatısticas dos resultados obtidos. . . . . . . . . . . . . . . . . . . 35
xii
4.6 Resumo dos conceitos apresentados no capıtulo, desde a proposta de
garantia ate a tomada de decisao apoiada pelo sistema proposto. . . . 38
5.1 Essa figura resume a dinamica de funcionamento do sistema proposto.
Uma terra nova e apresentada e incluıda na base de dados; a base
passa pelo algoritmo de quantizacao dos dados; a base esta preenchida
com notas; e e enviada para o algoritmo de IA que por sua vez gera
um resultado que apoiara a tomada de decisao do Banco XYZ. . . . . 42
xiii
Lista de Tabelas
4.1 As 13 caracterısticas selecionadas para a classificacao das terras. . . . 28
4.2 Resultados estatısticos do sistema proposto. . . . . . . . . . . . . . . 40
xiv
Capıtulo 1
Introducao
Um dos principais componentes da receita de bancos comerciais sao as operacoes
de credito. Elas sao efetuadas atraves de produtos como: capital de giro, adianta-
mento de contrato de cambio, fianca entre outros. No que tange a mitigacao do
risco dessas concessoes, o papel da garantia de credito se torna essencial, pois ela
e um ativo fundamental em qualquer instituicao financeira. Dessa forma, muitas
operacoes so sao liberadas atraves de garantias solidas que cubram o risco de credito
em eventual cenario de estresse, onde o cliente do credito pode vir a nao pagar o
emprestimo. Para assegurar que essa cobertura de risco seja feita, e essencial que
as garantias sejam precificadas de forma precisa.
Precificar ativos sempre foi fundamental para o Mercado Financeiro e, atu-
almente, essa tarefa tem se tornado cada vez mais custosa, tendo em vista a grande
quantidade de dados disponıveis que vem sendo produzida por empresas e insti-
tuicoes financeiras e o grande custo associado com a analise de todas essas in-
formacoes. Quanto maior esse volume de dados, maior a complexidade para trata-los
e ainda mais importante, maior a dificuldade de extrair informacoes uteis que apoiem
a tomada de decisao [1].
A tomada de decisao e um processo de extrema importancia e o sucesso de um
indivıduo esta intimamente ligado com sua capacidade decisoria. No entanto, este
processo e muito complexo, possuindo varias etapas como: analisar um problema;
escolher criterios de decisao; pesar esses criterios; e, finalmente, chegar a uma decisao
otima. Todo esse processo nao e trivial [2]. Nesse contexto, o campo de pesquisa
1
da Inteligencia Artificial (IA) 1 vem obtendo grande importancia como facilitador
na tomada de decisao, contendo uma caracterıstica essencial que muitas vezes o ser
humano ignora, a racionalidade sob risco. Nas situacoes mais diversas, as pessoas
ignoram o valor esperado de suas escolhas e decidem sob o aspecto emocional e a
capacidade de limitar esse lado emocional e exatamente o que diferencia a IA. Esse
diferencial lancou um cenario de grande procura de diversos setores da economia
pela IA. Em especial, o Mercado Financeiro foi um grande patrocinador para o
investimento em pesquisa dessa ciencia [1].
A capacidade de determinar padroes, relacionamentos e prever resultados em
grandes massas de dados atraves de metodos dinamicos e adaptativos fazem com que
a IA ofereca algo que os agentes do Mercado Financeiro estao sempre buscando, o
melhor custo de oportunidade. Para alcancar esse objetivo, existem diversas tecnicas
da Inteligencia Artificial que realizam esse tipo de analise, entre as quais podem ser
citadas Arvores de Decisao e Redes Neurais. Essas tecnicas tem uma caracterıstica
essencial e intrınseca da IA, ao levantar vastas quantidades de dados estruturados
e nao estruturados, elas podem melhorar continuamente o processo de tomada de
decisao [4].
As Redes Neurais constituem uma poderosa ferramenta de previsao e se des-
tacam como um dos principais bracos de pesquisa da IA. Sao modelos lineares ou
nao lineares que, a partir de algoritmos de treinamento, sao capazes de mapearem
e estimarem valores esperados de series historicas. Com isso, acabam extraindo as
estruturas e relacoes escondidas que governam esses dados. Logo, existem inumeras
aplicacoes que podem utilizar essas caracterısticas no Mercado Financeiro, como por
exemplo, a precificacao de ativos desde o retorno de acoes ate o valor de mercado
de uma garantia real como uma terra. Por esse motivo, grandes instituicoes como
Goldman Sachs e Morgan Stanley tem dedicado departamentos inteiros para o de-
senvolvimento de pesquisas de metodos quantitativos e implementacao de modelos
com Redes Neurais [5].
Este projeto de graduacao propoe e desenvolve um sistema para a precificacao
1Inteligencia Artificial, do ingles Artificial Intelligence - AI e a ciencia que tem como objetivo
simular o comportamento humano, usando matematica, estatıstica e software de computacao, para
achar padroes de dados que proveem conhecimento, informacao util ou visoes de dados [3].
2
de garantias, utilizando uma plataforma gratuita para isso, a plataforma Knime [6].
O sistema proposto utiliza a tecnica de Redes Neurais para a classificacao e posterior
previsao de valores de terras sobre uma base historica. A arquitetura da rede e do
tipo MLP (Multilayer Perceptron) com uma camada escondida, a rede utiliza uma
variacao do algoritmo de aprendizagem back propagation, utilizando o conceito de
derivada do erro de cada iteracao para ajustar os pesos da rede. Essa base historica
contem terras reais fornecidas como garantia, nela ocorre um pre-processamento na
medida em que existe uma serie de caracterısticas nominais para cada terra que
e transformada em um conjunto de notas antes de servir de entrada para a rede.
Assim, o sistema proposto e capaz de prever valores para novas terras fornecidas
como garantia, o que auxilia em uma melhor tomada de decisao de um analista de
credito quanto a liberacao de um emprestimo a uma determinada empresa, tendo
em vista que o risco da operacao vai estar sendo mitigado pela garantia. Isso resulta
em um processo de credito mais eficiente e com maiores chances de detectar o default
de um cliente, otimizando a rentabilidade da carteira da instituicao financeira.
1.1 Proposta e Objetivos do Projeto
O objetivo desse trabalho e o projeto de um sistema de precificacao de ativos,
mais especificamente de terras fornecidas como garantia em operacoes de credito.
Para alcancar tal objetivo, o sistema utiliza a topologia de Redes Neurais Multilayer
Perceptron que faz uma regressao da base de terras ja existente para treinar seus
parametro de pesos, sendo capaz de prever valores de novas terras. Conforme novas
operacoes, que possuem alienacao de terras como garantia, vao sendo pautadas, a
base sera preenchida com as caracterısticas da terra fornecidas pelo laudo e entao
o sistema vai ser capaz de prever o possıvel valor dessa terra, valor esse que sera
utilizado no calculo de cobertura da dıvida. O sistema vai fornecer um apoio na
decisao do analista de credito sem a necessidade de ser configurado por especialis-
tas, ele vai estar sempre se realimentando e fortalecendo as configuracoes da rede
na medida que novas operacoes de credito vao sendo pautadas. Desta forma, os
objetivos especıficos do sistema proposto sao:
1. Desenvolver uma plataforma de precificacao de garantias com ferramentas gra-
3
tuitas;
2. Quantizar valores nominais das caracterısticas das terras preenchidas de acordo
com o laudo, etapa anterior a Rede Neural;
3. Prever valores de terras com base em suas caracterısticas e valores historicos
de terras que compoem a base historica;
4. Distinguir boas garantias mitigando o risco economico da instituicao financeira
em cenario de inadimplencia;
5. Automatizar ferramentas, tecnicas e procedimentos de forma integrada e inte-
ligente para otimizar o processo de analise de credito.
1.2 Metodologia
Este trabalho de fim de curso consiste no projeto e implementacao de um
sistema de precificacao dos valores de terras alienadas em garantia de operacoes
de credito. Para isso, o projeto foi separado em duas partes: a preparacao da base
historica de terras e a quantizacao de seus valores nominais; integracao com o sistema
gratuito Knime, que tem como ferramenta principal o modulo de Redes Neurais que
atua no aprendizado e regressao dos dados a serem classificados.
Apos selecionar quais caracterısticas definem a classificacao de uma terra, a
base comeca a ser preenchida com os valores, nominais ou numericos, fornecidos
pelo laudo de avaliacao, assim como o preco de venda sugerido pelo mesmo. Apos
isso, um algoritmo feito em VBA (do ingles, Visual Basic for Applications, e a
linguagem de programacao do programa Excel e outros programas do pacote Office
do Windows) para quantizar os valores dessas caracterısticas, ou seja, transformar
essas caracterısticas em notas de acordo com o domınio de cada caracterıstica e seu
peso, chegando assim em uma nota final para cada terra.
Portanto, a base esta preparada para servir como parametro de entrada para
a Rede Neural. Os algoritmos supervisionados estudados sao implementados no
Knime e a Rede, a partir de um estrutura de cross-validation, le esses dados e
converge para determinados parametros de pesos que sejam capazes de chegar aos
valores de cada terra apresentada. Com isso, toda nova terra que for adicionada vai
4
levar a uma nova rodada de aprendizado com ajuste de pesos e uma previsao de
valor para essa nova terra. Portanto, o sistema gera um contra ponto ao valor de
venda fornecido pelo laudo, fornecendo apoio ao processo de tomada de decisao com
relacao a aprovacao do credito e seu colateral.
1.3 Organizacao do Texto
O restante do trabalho esta dividido em 4 capıtulos. O Capıtulo 2 apresenta
os fundamentos teoricos do campos da Inteligencia Artificial utilizados, no caso, as
Redes Neurais. O capıtulo introduz os conceitos mais basicos e os evolui ate o al-
goritmo de fato utilizado neste trabalho. No mesmo capıtulo sao apresentados os
trabalhos na literatura relacionados a este projeto. No Capıtulo 3 sao apresenta-
dos os fundamentos do mercado financeiro no que tange a polıtica de credito e a
influencia das garantias, assim como os eventuais processos de liberacao e analise
de credito. Com isso, o capıtulo tambem introduz o problema que esse trabalho
propoe resolver. No Capıtulo 4, sao detalhados os processos de elaboracao desse
projeto, como a estruturacao da base de garantias e a implementacao do sistema de
precificacao. O capıtulo detalha como essa base foi elaborada, quais criterios foram
utilizados para compor a nota de cada atributo e quais foram os pesos e valores de
domınios utilizados para cada um deles. A arquitetura utilizada no Knime tambem
e detalhada, passando por cada bloco utilizado. Adicionalmente, o capıtulo introduz
junto a qual instituicao o projeto foi elaborado, os recursos humanos envolvidos e
a descricao das melhorias e benefıcios que a resolucao desse problema real traz. E
importante ressaltar que essa instituicao e apresentada como Banco XYZ devido a
necessidade da preservacao do sigilo das informacoes, normais neste setor empresa-
rial. Por fim, o Capıtulo 5 apresenta a conclusao do projeto, mostrando os resultado
obtidos, os problemas encontrados e trabalhos futuros a serem implementados.
5
Capıtulo 2
Trabalhos Relacionados
2.1 Redes Neurais
2.1.1 Introducao
A Inteligencia Artificial foi criada com objetivo de imitar, simular a capa-
cidade humana em raciocinar, perceber, entre outras caracterısticas que definem
ser inteligente [3]. Nesse ambito, o estudo das Redes Neurais Artificiais, RNA (do
ingles, Artificial Neural Networks, ANN) se destaca como um dos metodos mais
utilizados. A inovacao dessa tecnica se da na medida em que seu modelo se baseia
na estrutura cerebral do ser humano. Muitas vezes o cerebro humano lida melhor
do que o computador para solucionar uma serie de problemas. O cerebro humano
possui, aproximadamente, 1011 neuronios [7], onde cada neuronio atua como uma
unidade de processamento. Esses neuronios se conectam atraves das sinapses e a
grande capacidade de paralelizar a troca de informacao, no sentido em que varios
neuronios trabalham simultaneamente, faz com que essa estrutura seja tao pode-
rosa. Ao ajustar a intensidade e caminhos dessas sinapses, o cerebro humano e
capaz de aprender novas tarefas. Dessa forma, ao simular essa arquitetura, as RNA
possuem as seguintes vantagens intrınsecas ao seu modelo: grande capacidade de
paralelizacao; tolerancia a falha, pois muitas celulas cerebrais morrem diariamente
e mesmo assim a capacidade cognitiva nao e deteriorada; e capacidade de aprendi-
zagem e generalizacao.
6
2.1.2 O Neuronio de McCulloch e Pitts
As Redes Neurais sao formadas por uma estrutura interconectada de unida-
des de processamento simples, que modelam o neuronio biologico. Essas unidades
sao conectadas por canais de comunicacao que sao associados a um determinado
peso, sendo a inteligencia das RNA vinculada, justamente, a interacao entre os seus
neuronios. Em 1943, McCulloch e Pitts desenvolveram modelos iniciais de Redes
Neurais baseados em sua experiencia na Neurologia. Esse modelo pode ser descrito
da seguinte forma [8]:
1. Sinais sao apresentados a entrada;
2. Cada sinal e multiplicado por um numero, ou peso, que indica a sua influencia
na saıda da unidade;
3. E feita a soma ponderada dos sinais que produz um nıvel de atividade;
4. Se este nıvel de atividade exceder um certo limite (threshold) a unidade produz
uma determinada resposta de saıda. Essa relacao e dada por uma funcao de
transferencia. Funcoes binarias e bipolares sao bastante utilizadas.
y = f(yin) =
1 if f(yin) ≥ θ
−1 if f(yin) < θ
As equacoes acima descrevem a funcao de transferencia do tipo bipolar. O
neuronio apresenta saıda com valor igual a 1 ou -1 dependendo do valor de f(yin)
em relacao ao threshold estabelecido. Onde yin e dado pela soma produto dos pesos
e entradas da rede.
Os modelos de RNA sao essencialmente organizados por camadas pode-se
identificar 3 principais tipos de camada [9]:
• Camada de Entrada: Camada receptora de estımulos, onde os parametros de
entrada sao fornecidos a Rede;
• Camadas Intermediarias, ou Escondidas: Onde e feito grande parte do proces-
samento atraves das conexoes ponderadas;
7
Figura 2.1: Caracterizacao do neuronio de McCulloch e Pitts, consistindo em uma
camada com N neuronios de entrada e um neuronio de saıda. O neuronio de saıda
recebe a soma das entradas ponderada pelos pesos de cada neuronio de entrada.
Dependendo do resultado dessa soma, o neuronio de saıda vai apresentar um valor
diferente. Essa relacao entre o valor de saıda e um determinado limite, threshold e
estabelecida por uma funcao de transferencia.
• Camada de Saıda: Resultado e apresentando levando em conta os estımulos
de camadas anteriores.
2.1.3 Aprendizado
Uma das premissas das Redes Neurais e o aprendizado atraves de exemplos.
A partir de alguma regra, os pesos das conexoes dos neuronios sao ajustados, esses
ajustes sao realizados de acordo com os padroes apresentados a rede. Essencial-
mente, existem dois tipos de aprendizado:
• Aprendizado Supervisionado: Neste tipo de treinamento, existe um agente
externo a rede, um supervisor. Para tanto, deve existir pares de entradas
8
e saıdas, ou seja, para cada entrada deve existir uma saıda correspondente.
Dessa forma, toda saıda obtida pela rede sera comparada com a saıda esperada
ate que a acuracia esteja dentro de uma banda considerada satisfatoria.
• Aprendizado Nao Supervisionado: Nesse caso, nao existe um agente externo.
E uma forma de auto-organizacao, que nao necessita de saıdas desejadas para
guiar o aprendizado.
2.1.4 Perceptron
Uma das arquiteturas mais conhecidas de Redes Neurais Supervisionadas e
o Perceptron. Uma arquitetura do tipo linear, ou feedforward, capaz de realizar
classificacoes de padroes em dois ou mais tipos. Para tal, a configuracao pode ser
tao simples quanto N neuronios de entrada, 1 neuronio de saıda e nenhuma camada
escondida. A figura 2.2 ilustra essa arquitetura que se assemelha muito ao neuronio
de Pitts.
Figura 2.2: Arquitetura da configuracao simples do Perceptron, com apenas um
neuronio de saıda.
9
As equacoes a seguir representam a funcao de transferencia utilizada no Per-
ceptron. Uma banda de largura 2θ e utilizada, com o caso de indecisao possuindo
valor 0, exatamente no meio entre os valores de ativacao -1 e 1.
y = f(yin) =
1 if f(yin) > θ
0 if f(yin) = θ
−1 if f(yin) < θ
Utilizando uma funcao de transferencia do tipo acima e assumindo um vetor
de entrada x e de pesos w com N componentes, pode-se equacionar a saıda da
seguinte forma
y = fθ(x.w + b) (2.1)
onde b representa um neuronio extra chamado de bias que serve para aumen-
tar os graus de liberdade da rede, facilitando o processo de adaptacao ao conheci-
mento a ela fornecido [7].
O objetivo em questao e achar um vetor de pesos w e um de bias, b, que
resolva um determinado problema, ou seja, encontrar vetores capazes de achar a
saıda esperada para uma determinada entrada. Dessa forma, a regra de aprendizado
do Perceptron e o algoritmo que sera responsavel pelo treinamento supervisionado
dessa arquitetura.
Assumindo um conjunto de dados de treinamento
{sq, tq}, q = 1, 2...Q (2.2)
onde sq e o vetor de treinamento, e tq o vetor de saıdas correspondente.
O Algoritmo:
1. Escolher um valor para a taxa de aprendizado α(> 0) e para o threshold θ;
2. Os proximos passos deverao ser repetido ate que todo o vetor de treinamento
seja classificado corretamente;
10
(a) Inicializar a entrada x
x = sq (2.3)
(b) Calcular a entrada do neuronio de saıda
yin = x.w + b (2.4)
(c) Calcular a saıda
y = fθ(yin) (2.5)
(d) Atualizar o valor do vetor de pesos e do bias, apenas se a saıda nao tiver
sido corretamente classificada
wnew = wold + αtqx (2.6)
bnew = bold + αtq. (2.7)
Dessa forma, existindo um vetor de pesos que classifique corretamente todas
as entradas de um determinado vetor de treinamento, a regra de aprendizado do
Perceptron convergira em um numero finito de passos [7]. Esse raciocınio pode ser
estendido para a classificacao de saıdas em mais de duas categorias, basta acrescentar
mais neuronios de saıda, como mostrado em nova configuracao dos neuronios na
Figura 2.3.
2.1.5 MLP e o algoritmo RPROP
Uma extensao do Perceptron e a Rede Neural do tipo MLP (do ingles Mul-
tilayer Perceptron), esse tipo de arquitetura contem camadas escondidas, alem das
camadas de entrada e saıda. Com camadas extras (uma ou mais camadas escon-
didas) a rede passa a ter a capacidade de alcancar solucao mais complexas, nao
lineares, exemplo da funcao logica XOR que nao e mapeada por uma rede simples
[10].
Assim como feito anteriormente, pode-se mapear o MLP com as seguintes
equacoes [10] [11]:
fx = G(b2 +W 2(s(b1 +W 1x))), (2.8)
11
Figura 2.3: Arquitetura da configuracao de classificacao multipla do Perceptron,
com mais de um neuronio de saıda.
com vetores de bias b1 e b2, vetores de pesos W 1 e W 2, e funcoes de ativacao G() e
s().
E possıvel tratar essa equacao em duas formas, considerando duas con-
tribuicoes, uma relacionada a conexao da camada de entrada com a escondida
e a outra relacionando a camada escondida com a camada de saıda. O vetor
h(x) = s(b1 + W 1x) constitui o vetor da camada escondida, no qual os vetores
b1 e W 1 sao os bias e pesos que conectam a camada de entrada com a camada es-
condida. Ja o vetor o(x) = G(b2 + W 2h(x)) e o vetor de saıda, onde o vetor b2 e
W 2 sao os bias e pesos que conectam a camada escondida com a camada de saıda.
As funcoes de ativacao G() e s() costumam ser do tipo G(z) = 11+e−z , uma funcao
Sigmoid [12]. Para valores elevados de z, ela vale 1 e para valores baixos, ela vale 0.
Com relacao ao treinamento do MLP, os parametros a serem descobertos
sao θ = W 1, b1,W 2, b2. Para esse projeto de graduacao, foi utilizado o software
Knime [6]. A parte de aprendizado de Redes Neurais do projeto foi feita utilizando
12
Figura 2.4: Arquitetura de uma Rede Neural MLP, com uma camada extra, uma
camada escondida, que fornece a rede uma maior capacidade de decisao.
os pacotes de aprendizado do Knime que utilizam o MLP com um algoritmo de
aprendizado chamado de RPROP [13].
4(t)ij =
η+ ∗ 4(t−1)
ij , if ∂E(t−1)
∂wij∗ ∂E(t)
∂wij> 0
η− ∗ 4(t−1)ij , if ∂E(t−1)
∂wij∗ ∂E(t)
∂wij< 0
4(t−1)ij , else
onde 0 < η− < 1 < η+ (2.9)
Resumindo as equacoes, toda vez que a derivada parcial do erro do peso
correspondente wij mudar seu sinal, quer dizer que a ultima atualizacao foi muito
grande, e o algoritmo passou por um mınimo local, dessa forma, o valor de atua-
lizacao4(t)ij sofre uma atualizacao redutora com o fator η−. Caso o sinal da derivada
seja mantido, entao o valor de atualizacao sera incrementado por um fator η+ para
acelerar a convergencia. Um vez que o valor de atualizacao, para cada componente
13
de peso, esteja adaptado, o algoritmo segue a simples regra de atualizacao de pesos:
4w(t)ij =
−4(t)
ij , if ∂E(t)
∂wij> 0
+4(t)ij , if ∂E(t)
∂wij< 0
0, else
w(t+1)ij = w
(t)ij +4w(t)
ij (2.10)
Se a derivada parcial for positiva (aumento do erro), entao o peso e decre-
mentado pelo valor de ajuste, caso contrario, o peso e incrementado. No entanto,
ha uma ultima excecao do algoritmo, caso o incremento do ultimo passo tenha sido
muito grande, de forma que um mınimo tenha sido passado, entao o ultimo passo e
desfeito:
w(t)ij = w
(t−1)ij , if
∂E(t−1)
∂wij∗ ∂E
(t)
∂wij< 0 (2.11)
2.1.6 Trabalhos Relacionados
No mercado financeiro, atividades como analise de credito de uma empresa,
seja para uma concessao de credito ou para adquirir participacao, sao atividades
que exigem decisao com alto grau de complexidade. Essas decisoes exigem, alem da
experiencia do analista de credito, ferramentas que possam apoiar essa decisao [14].
Nesse ambito, as ferramentas quantitativas sao muito utilizadas, tecnicas como por
exemplo Redes Neurais, Arvores de Decisao, entre outros algoritmos de Inteligencia
Artificial.
Neste processo, uma serie historica com informacoes pertinentes a decisao do
credito servem de entrada para o algoritmos, assim como a respectiva saıda esperada
como, por exemplo, se aquele cliente se tornou inadimplente ou nao. Com isso, essas
tecnicas sao capazes de classificar ou prever (classificacao ou regressao depende do
tipo de saıda, nominal ou numerica) a saıda esperada e, dessa forma, o analista pode
utilizar como contra ponto de sua decisao.
Steiner et al. ([15]) elaboram uma proposta, atraves de analises quantitativas,
para o reconhecimento da qualidade do perfil de credito de determinados clientes,
separando os adimplentes dos inadimplentes. Para tal, o trabalho faz uso de duas
14
tecnicas, Redes Neurais e Arvores de Decisao, utilizando os softwares MatLab-Neural
Networks Toolbox e WEKA, respectivamente. Como parametros de entrada, foram
utilizadas sete informacoes de 2.855 clientes com respostas binarias (sim ou nao)
e tambem a informacao do banco sobre o credito se houve cumprimento ou nao.
Essas oito informacoes serviram de entrada para a classificacao da Rede Neural e
Arvore de Decisao. E importante ressaltar que para as 7 informacoes de entrada,
existem 127(27) combinacoes possıveis de casos, mas so foram utilizados 48 casos,
que efetivamente ocorreram. Dessa forma, a tabela de entrada possui 48 linhas
com essas combinacoes e a saıda esperada para cada uma. No entanto, essa saıda
discrimina o numero de clientes, dos 2.855, que nao pagaram ou pagaram, em cada
caso.
Para a arquitetura da Rede Neural, foi utilizado um modelo de camadas
multiplas, com uma camada escondida, no qual foi aplicado o algoritmo de apren-
dizagem back propagation. A camada escondida possui i unidades, onde 0 ≤ i ≤ 20,
dessa forma, o processo e iniciado com 0 neuronio na camada escondida, e para
cada convergencia esse numero e incrementado e no final e escolhido o i que retor-
nou maior padrao de acerto. O pesos W e bias sao definidos de forma aleatoria no
comeco de cada rodada. Atraves do MatLab, foram efetuadas 10 mil iteracoes e a
topologia definida ficou com oito neuronio na camada escondida.
Adicionalmente, foi aplicado a tecnica de Arvore de Decisao, especificamente
a tecnica J4.8, uma implementacao em Java do algoritmo C4.5 [16], ao problema
abordado, atraves do software WEKA (do ingles, Waikato Environment for Kno-
wledge Analysis).
Pelos resultados obtidos, ambos algoritmos encontraram percentuais elevados
de acertos e proximos entre eles. No entanto, vale ressaltar que a ferramenta WEKA
nao chegou a formar uma arvore efetivamente, ela classificou todos os casos como
adimplentes, provavelmente, pelo percentual de adimplentes 95,48% (2.726/2.855)
ser tao alto. Logo, os resultados obtidos pela arvore sao percentuais baseados em
uma probabilidade tao simples quanto [(1 - #ClientesPagou=Nao)/(#ClientesPagouTotal)].
Portanto, apesar de ambas ferramentas satisfazerem o criterio de apoio da decisao
da equipe de credito, a tentativa por meio das Redes Neurais teve uma solucao mais
criteriosa e abrangente.
15
Shachmurove et al.([5]) investigam a aplicacao de redes neurais com a dinamica
relacao das grandes bolsas de valores do mundo. Os ındices utilizando sao do Ca-
nada, Franca, Alemanha, Reino Unido, Japao, Estados Unidos e o Mundo, excluindo
os Estados Unidos. Dessa forma, esse artigo procura encontrar a melhor tecnica para
prever o retorno diario dessas bolsas de valores. Nesse escopo, sao utilizadas duas
tecnicas para fins de comparacao:
1. Redes Neurais;
2. Modelo de regressao utilizando mınimos quadrados;
Para o modelo de regressao, foram construıdo cinco tipos de regressao, va-
riando apenas o numero de lags entre si, o que afeta diretamente o numero de
parametros a ser estimado. Ja para o modelo de Redes Neurais, Shachmurove et
al. utilizam dois modelos: modelo simples com uma camada de entrada possuindo
cinco neuronios, utilizando uma funcao de ativacao linear, uma rede MLP (Multi-
layer perceptron) com uma camada escondia e um neuronio de saıda. Foram feitas
duas configuracoes, uma topologia com dois neuronios na camada escondida e ou-
tra com cinco, quanto as funcoes de ativacao, foi utilizado uma funcao Sigmoid na
camada escondida e uma funcao linear na saıda. Os resultados encontrados em [5]
demonstram que a rede MLP teve melhor desempenho na previsao do retorno das
acoes, obteve melhores coeficientes de acerto do que a rede simples e tambem do
que o modelo de regressao. Adicionalmente, mostrou-se que a rede MLP com cinco
neuronios na camada escondida performou melhor do que a com dois neuronios.
Este trabalho de graduacao faz uso de conceitos presentes em ambos os artigos
apresentados, no que tange ao uso do algoritmo da Inteligencia Artificial, as Redes
Neurais, e tambem em sua aplicacao no Mercado Financeiro. Diferentemente desses
artigos, esse projeto atua em um problema ja existente em uma instituicao financeira,
na medida em que e proposto a utilizacao da IA para avaliar a garantia de uma
liberacao de credito, utilizando uma base de dados reais, e em ultima instancia, tendo
seus resultados como fatores de otimizacao da instituicao financeira mencionada.
16
Capıtulo 3
Mercado Financeiro e a Dinamica
das Garantias
Um dos principais processos do mercado financeiro e o de tomada e concessao
de credito. Muitas etapas contemplam esse processo, desde a analise do credito, for-
malizacao contratual ate o acompanhamento do fluxo de pagamento e controle de
garantia. Cabe ao departamento da Analise de Credito indicar se o possıvel to-
mador tem capacidade de honrar suas dıvidas e, para isso, sao necessario diversos
tipos de documentos da empresa como demonstracoes financeiras e dados operacio-
nais/setoriais. Com esses dados, a equipe e capaz de elaborar um parecer e leva-lo
para o comite de credito, onde entao, sera tomada a decisao sobre a liberacao do
credito. Adicionalmente, o departamento Quantitativo tambem fornece seu parecer,
rodando um modelo de risco que gera uma nota para a operacao, existindo uma nota
mınima como referencia para aprovacao do credito. Com isso, duas abordagens sao
realizadas, uma focando em aspectos economicos e setoriais e outra em um modelo
quantitativo. Utilizando esses dois vieses, o comite decide se deve aprovar ou nao a
liberacao do credito.
Apos a aprovacao do credito, existe uma etapa de formalizacao do instru-
mento bancario, ou seja, elaboracao do contrato que estabelece a relacao financeira
entre o credor e o tomador. E de suma importancia que o contrato seja bem assi-
nado e esteja bem representado (pessoas com devida autoridade para assinar o do-
cumento) para ter relevancia jurıdica em um cenario de execucao de credito. Cabe
ao departamento de Controle de Credito garantir que essa minuta sera bem repre-
17
sentada e que contenha todos os criterios aprovados pelo comite como, por exemplo,
valor da operacao, garantia e percentual que a garantia deve cobrir, duracao do
contrato, taxa entre outros. Feito isso, o Controle de Credito deve continuar mo-
nitorando a operacao e o fluxo de recebimento assim como controlar a eventual
garantia da operacao. A garantia pode ser um bem tangıvel como um imovel, que
podera tornar-se propriedade do banco, ou um fluxo de pagamentos que a empresa
tomadora recebera pela prestacao de um servico e cedera ao banco para cobrir a
operacao. Existem garantias que necessitam de um controle diario como, por exem-
plo, recebıveis ou duplicatas e outras que exigem maior cuidado somente na liberacao
da operacao como a alienacao de imoveis. Dessa forma, a relacao bilateral entre cre-
dor e tomador se torna bastante dinamica e intensa ate a quitacao da dıvida em
questao.
Para um banco poder fornecer credito, deve se existir uma contrapartida,
alguma garantia para cobrir o risco da contraparte, que pode ser na forma de:
1. Aval, onde um avalista se torna responsavel pelo devedor em eventual caso
de inadimplencia, ou seja, em uma execucao judicial, o banco iria atras do
patrimonio do avalista;
2. Cessao de Direitos Creditorios, e dado em garantia o fluxo de recebimento de
um servico que ja foi ou sera performado pelo tomador junto a uma terceira
parte. A garantia da operacao sera esse fluxo que entrara na conta do banco
pelo servico prestado pelo devedor a terceira parte;
3. Cessao de Duplicatas, nessa modalidade a garantia sao os recebıveis do deve-
dor, normalmente optado por lojas de varejo. Os boletos de pagamento de
seu produto, que serao cobrado aos clientes, sao dados em garantia para o
credor, dessa forma esse fluxo vai correr ao longo da operacao ate a quitacao
do emprestimo;
4. Alienacao Fiduciaria de um Imovel, uma modalidade bastante utilizada, prin-
cipalmente em creditos para o agronegocio, a terra do devedor e alienada ao
banco, constituindo assim a garantia da operacao. Ate o final da operacao,
o credor e detentor desta terra e em um cenario de estresse do credito, pode
utiliza-la para reaver o saldo devedor;
18
Esses ativos vao garantir a parte credora em um possıvel evento de default
1, portanto, o controle de garantias e essencial para um banco de credito [17].
Comumente, compete ao departamento de Controle de Credito formalizar
as garantias acompanhando a sua respectiva liquidez e suficiencia. Alem disso,
esse departamento tambem verifica o enquadramento das garantias as condicoes
estipuladas no Comite de Credito, comite onde as operacoes de credito sao aprovadas
e as ressalvas e condicoes de credito sao determinadas. Especificamente para a
alienacao de imovel rural, o banco contrata uma empresa para realizar um laudo
do imovel e cabe tambem ao Controle de Credito visitar a terra e ter seu parecer
sobre a avaliacao da mesma para chegar em um denominador comum quanto ao
valor avaliado. Esse parecer leva em conta diversos aspectos sobre a terra como:
1. Localizacao do imovel, levando em conta aspectos como o acesso da terra, se
faz fronteira com reservas indıgenas, tem incidencia de pragas etc;
2. Solo, qual o tipo de solo do imovel;
3. Tamanho, qual e o tamanho da terra e como isto afeta sua liquidez;
4. Area Util, qual a porcentagem da terra que esta apta para cultivo;
5. Conservacao do Solo, como e feito o manejo do solo e de suas culturas;
6. Relevo, quao ıngreme e a terra em garantia, isto afeta ou nao o plantio;
7. Bioma, qual o bioma da terra, qual a porcentagem que deve ser reservada para
area legal deste bioma;
8. Altitude, qual a altitude da fazenda e como isto afeta a fisiologia do plantio;
9. Pluviosidade, regularidade da chuva e seu volume;
10. Tempo de Cultivo, ha quanto tempo as culturas sao realizadas e como isto
afeta o solo;
11. Situacao Ambiental, como esta o cumprimento das leis e regras ambientais,
essa garantia possui algum onus que e passıvel de multa;
1Evento de inadimplencia, onde o tomador deixa de pagar sua dıvida junto ao banco.
19
12. Georreferenciamento, a fazenda e georreferenciada, ou seja, seus limites e
domınios estao demarcados e contem coordenadas;
13. Benfeitoria, quais foram as melhorias feitas na terra em garantia, casas etc.
Como descrito, fazer essa valoracao e muito complexo e envolve diversas
variaveis, mas sua precisao e fundamental, tendo em vista que essa terra que vai
estar garantindo a operacao de credito. Em caso de inadimplencia, a expectativa de
retorno e o valor que se espera receber da garantia, dessa forma, caso o processo de
avaliacao nao seja bem feito e a terra possua menos valor do que o avaliado, o banco
pode incorrer em prejuızos.
Esse prejuızo pode ser ainda maior, visto que o banco pode acabar ficando
com uma terra com diversos onus. Alem de nao conseguir cobrir o risco de credito
da operacao inadimplente, essa propriedade ainda vai gerar um passivo para a ins-
tituicao.
Figura 3.1: Dinamica da liberacao de credito. 1 - Inıcio com a prospeccao do cliente
pelo operador de credito; 2 - Seguido pela analise de credito e a avaliacao da garantia
feita pelo controle de credito; 3 - E realizado o Comite de Credito para aprovar ou
nao a concessao do credito, e se sim, quais sao as exigencias; 4 - Liberacao de recursos
que contem a elaboracao da minuta de credito e a checagem de sua representacao.
5 - Controle do fluxo de pagamentos e das garantias da operacao
20
Este projeto de graduacao e feito junto ao Banco XYZ, um banco tradicional
no mercado de credito que sempre foi muito alinhado ao credito rural. Grande parte
da carteira do banco e de operacoes no agronegocio e, dessa forma, muitas das garan-
tias sao alienacoes de imoveis rurais. O problema em questao e como precificar, de
forma mais precisa esses imoveis, visto que muitas vezes o banco fica suscetıvel a erro
de terceiros, das empresas avaliadoras, o que acarreta no fechamento de operacoes
com garantias que nao possuam os valores aprovados em comite. O seguinte cenario
exemplo ilustra bem a situacao atual e suas desvantagens: foi aprovado pelo comite
do banco uma concessao de credito a um plantador de soja do Mato Grosso, o mon-
tante emprestado e de R$ 10 milhoes e como garantia foi aprovado 120% de alienacao
de imovel rural. Portanto, a terra precisa ter um valor de venda que seja igual ou
superior a 120% do saldo da dıvida, o que na largada representa R$ 12 milhoes.
Para aprovacao do comite, uma empresa avaliadora ja havia sido contratada para
valorar a terra em questao e chegou a um valor de venda de R$ 13 milhoes. No
entanto, essa terra tinha as mesmas caracterısticas de outras terras que ja estavam
na carteira do banco e que tinham valores muito abaixo do valor estimado para a
garantia. A operacao continuou e depois de alguns meses de inadimplencia, o banco
tenta executar o cliente e verifica que a terra em garantia tem um valor bem abaixo
do que foi avaliado e com isso toma um prejuızo relevante na operacao. O risco
descrito e bastante relevante e cresce proporcionalmente com o aumento da carteira
de emprestimos do banco, portanto, e necessario elaborar uma solucao robusta e
escalavel.
A utilizacao de metodos quantitativos da Inteligencia Artificial (IA) e fer-
ramenta efetiva para o apoio na tomada de decisoes e se encaixam muito bem no
problema abordado por esse trabalho de graduacao. Alem de conseguirem mapear
processos complexos como a precificacao de ativos, utilizam dados de experiencias
anteriores como base historica para chegar a uma decisao mais bem fundamentada,
o que no caso descrito teria sido determinante, visto que o banco ja possuıa terras
semelhantes que poderiam ter levantado o questionamento do laudo. Sendo bem
empregadas, essas tecnicas podem trazer vantagens como:
1. Decisoes objetivas, dependendo menos de criterios subjetivos;
2. Menor numero de recursos humanos envolvidos no processo, otimizando o custo
21
Figura 3.2: Dinamica da avaliacao da garantia. 1 - Realizacao do laudo por uma
empresa contratada pelo banco; 2 - Visita de campo da equipe (do Controle de
Credito) especializada em agro; 3 - Elaboracao do parecer do Controle de Credito
determinando o valor da garantia na operacao; 4 - Julgamento do Comite de Credito
para esta operacao e sua respectiva garantia
da operacao;
3. Os pedidos de credito serao processados de forma mais rapida, o que agregara
mais valor ao servico do banco;
4. Menor numero de terras supervalorizadas serao aceitas como garantia, dimi-
nuindo as perdas do banco.
1 – A avaliacao dos imoveis dependera menos das subjetividades dos lau-
dos realizados pelas empresas avaliadoras, que estao intrinsecamente ligados com
a opiniao de um avaliador. A utilizacao de metodos quantitativos fornecera maior
objetividade, realizando previsoes a partir de uma base historica que continuara a
crescer e se solidificar, gerando cada vez mais dados a serem usados pelos algorit-
mos de Inteligencia Artificial. 2 – Com a automatizacao da avaliacao, menor sera o
numero de funcionarios alocados nesta tarefa, tendo em vista que o algoritmo con-
segue chegar a uma analise fundamentada em dados, isolando decisoes emocionais,
de uma forma, muitas vezes, melhor que o ser humano. Logo, o banco reduzira
22
gastos de SG&A (do ingles, Selling, General & Administrative Expenses represen-
tam todas as despesas gerais, com venda e de administracao de uma empresa). Essa
informacao, normalmente, e apresentada na demonstracao de resultado do exercıcio,
DRE, da companhia.), mas isso nao substituira a opiniao de um especialista, para
nao somente interpretar o modelo quantitativo, como tambem o alimentar, forne-
cendo os parametros de entrada necessarios. 3 – Todo processo de analise da garantia
sera otimizado com o uso da IA, dando velocidade com a objetividade descrita no
primeiro item. Dessa forma, o banco podera liberar ou recusar a operacao de forma
mais rapida, o que garantira maior capacidade de prospeccao, visto que clientes
buscam sempre o menor leading time da liberacao de seus recursos. 4 – Com uma
tomada de decisao mais racional, separando de forma mais clara os valores esperados
dos resultados, menor sera o numero de garantias insuficientes aceitas. Com isso, o
banco tera um resultado melhor, evitando cenarios de recuperacao de credito, sem
sucesso, como descrito no exemplo do plantador de soja.
Adicionalmente, a necessidade de um metodo quantitativo se da tambem na
medida em que existem poucas transacoes bem registradas no mercado imobiliario
rural do Brasil. O risco de fraude no laudo de terceiros e muito alto, visto que
muitas vezes a influencia de grandes produtores se estende ate entidades publicas.
Com isso, para obter ganhos fiscais, muitos registros de compra e venda de imoveis
sao mascarados com valores irreais.
No fluxo de controle exibido na Figura 3.2, a insercao da IA se daria junto
ao parecer do Controle de Credito, logo, sera feito um apoio a tomada de decisao,
mitigando erros como do exemplo citado anteriormente e fornecendo escalabilidade
ao banco. Em um cenario de expansao, onde o banco, eventualmente, dobre sua car-
teira de credito, erros operacionais tanto internos, quanto externos serao inevitaveis.
Os metodos quantitativos apontariam esses erros, levando a um processo de revisao
da avaliacao, e maximizam o sucesso no processo de avaliacao de garantias.
23
Figura 3.3: Dinamica da avaliacao da garantia agora com a utilizacao da IA no
apoio da tomada de decisao.
24
Capıtulo 4
O Sistema Proposto
No capıtulo 3, foi analisada a dinamica das operacoes de credito e a im-
portancia da precificacao das garantias para as Instituicoes Financeiras, na medida
em que o colateral estara garantindo o retorno esperado em um eventual cenario de
inadimplencia. Nesse ambito, este projeto de graduacao foi elaborado para propor
uma solucao robusta e aplicavel em cenarios reais para a precificacao das terras em
garantia do Banco XYZ, nao se restringindo ao estudo do estado da arte e analise
dos conceitos mais atuais da Inteligencia Artificial (IA).
O Banco XYZ e um banco tradicional nas concessoes de credito para o agro-
negocio, operacoes que representam quase 20% de sua carteira de credito. Portanto,
o controle das terras dadas em garantias nas operacoes tem um peso muito grande
para a empresa. O problema em questao e como garantir resiliencia, robustez e
escalabilidade para a avaliacao de terras rurais de modo que o banco fique menos
vulneravel as falhas das empresas avaliadoras. A ferramenta de solucao proposta e
um modelo que utiliza tecnicas de IA para o apoio na tomada de decisoes, que nesse
caso, consiste em precificar os ativos que estao garantindo as operacoes de credito.
Contudo, para se utilizar tecnicas de IA, como Redes Neurais e Arvores de Decisao,
e necessario uma estrutura de dados como entrada, e, no problema em questao, nao
existia nenhuma forma de dado consolidado ou serie historica. Portanto, o projeto
consiste em duas etapas:
1. Construcao de uma Base de Dados que contenha duas importantes informacoes
para a posterior utilizacao de metodos de IA: criterios que componham um
conceito de nota agronomica para cada terra e o preco da avaliacao dessas
25
terras, ajustado pela opiniao do especialista de agronegocio do Controle de
Credito. Apos a elaboracao do laudo da terra pela empresa avaliadora, a
equipe do Controle de Credito preenchera a base de dados com esses criterios.
No entanto, e necessaria uma etapa de quantizacao desses criterios, os transfor-
mando em notas para que essa base fique pronta para servir como parametro
de entrada para o modelo;
2. Modelo IA que consumira a base de dados com as terras, seus criterios e precos,
para dessa forma, conseguir relacionar a nota dos criterios com o preco dado a
terra, logo, o modelo sera capaz, atraves de regressoes, de prever precos para
eventuais novas garantias. Esse modelo ira atribuir pesos aos parametros, des-
cobrindo quais sao mais relevantes na previsao de preco de uma nova amostra.
Com isso, o banco tera um contraponto da avaliacao do laudo, tendo di-
ligencia e seguranca na tomada de decisao sobre a aprovacao da garantia e sobre
qual o risco ela sera capaz de cobrir, o que esta diretamente ligado ao seu preco.
4.1 Criterios da Nota Agronomica
Nessa etapa, foi pensado quais atributos seriam capazes de diferenciar uma
terra da outra e compor um conceito de nota. Um conjunto de 13 criterios foram
selecionados, como referencia bibliografica foi utilizado o [18], alem da orientacao
dos especialistas em agronegocio do Controle de Credito [19].
1. Localizacao: A boa localizacao de uma fazenda e um ponto muito importante
e esta diretamente ligada ao seu valor agregado. Ha uma serie de fatores que
afetam esse criterio e contribuem para a maior ou menor liquidez da terra
no momento de uma possıvel venda. Podem ser destacados, entre outros, os
seguintes fatores: acesso independente, ou seja, nao depender de terceiros para
acessar a propriedade; estar ao lado de rodovias e estradas em boas condicoes
de trafego; proximidade de centros consumidores, ou seja, estar perto do local
onde sera entregue a mercadoria, alem de centros que possam prover maior
infraestrutura para o proprietario. O preenchimento da Localizacao e mais
subjetivo e envolve a analise dos criterios descritos;
26
Figura 4.1: Essa figura descreve os insumos necessarios para a construcao da nota
de cada terra. Primeiro, selecionar quais sao os atributos relevantes para eventual
classificacao do algoritmo; em seguida, atribuir notas para cada tipo de valor que
essas caracterısticas terao, e por fim, atribuir um peso para cada criterio
2. Solo: O solo e um elemento fundamental para a agricultura. Um bom solo e
condicao imprescindıvel para o plantio e pode ser definido atraves de criterios
como profundidade; balanco dos materiais; toxicidade; atividade biologica en-
tre outros. O preenchimento deste criterio e mais objetivo, visto que consiste
apenas no tipo de solo da terra avaliada, latossolo, argissolo etc [20];
3. Tamanho: A liquidez de venda e diretamente afetada pelo tamanho de uma
propriedade, dessa forma, essa caracterıstica e determinante na formulacao de
uma nota agronomica. No entanto, e importante notar que este criterio varia
de localidade para localidade e cultura para cultura. Por exemplo, sabe-se que
o custo por hectare do cultivo de flores e muito mais elevado do que para a
producao, para a mesma area, de soja [21]. Ou seja, a venda de 100 hectares
de terras produtivas de soja e flor vao possuir diferentes valores. No caso deste
27
Tabela 4.1: As 13 caracterısticas selecionadas para a classificacao das terras.
Caracterıstica
Localizacao
Solo
Tamanho
Area Util
Conservacao do Solo
Relevo
Bioma
Altitude
Pluviosidade
Tempo de Cultivo
Situacao Ambiental
Georreferenciamento
Benfeitorias
projeto, o banco opera com produtores em diferentes estados, e a variacao de
culturas e o que diferencia cada estado, por exemplo, producao de acucar em
Sao Paulo e de soja no Mato Grosso. Portanto, como sera visto mais a frente,
existem classificacoes diferentes para cada estado;
4. Area Util: A area util e o percentual territorial, dentro da matrıcula da fa-
zenda, que e utilizada para fins agrıcolas, ou seja, e a area onde estao as
plantacoes de soja, milho, algodao, cana de acucar e outras culturas. Este e
um fator com muito peso sobre o preco de uma terra, visto que uma terra
que nao seja utilizada para a agricultura possui muito pouco valor agregado,
afinal, a capacidade de producao e os futuros retornos dessa atividade e que
interessam a um comprador no ambito rural. E importante destacar que para
cada regiao, a area agrıcola deve respeitar a legislacao vigente para seu bioma.
Logo, existe um percentual de area legal para cada tio de bioma, como floresta
amazonica, cerrado, entre outros. Por exemplo, para o bioma amazonico deve
ser reservado 80% de area da fazenda como area de reserva legal [22];
28
5. Conservacao do Solo: Neste criterio uma matrıcula se diferencia da outra pelo
conjunto de tecnicas aplicadas que visam proporcionar a saude e cultivo do
solo, gerando assim maior produtividade da colheita. Se mal utilizadas, podem
levar a destruicao dos solos no curto prazo, podendo chegar a desertificacao
das areas cultivadas, o que afeta diretamente o preco do imovel [23];
6. Relevo: Um ponto muito importante a ser avaliado, que e definido basicamente
como a inclinacao do terreno para o cultivo das culturas agrıcolas. Areas com
maior declividade sao mais suscetıveis a erosao e dificultam a mecanizacao,
logo, e um criterio com valor para eventuais garantias para o banco, visto que
infere diretamente na liquidez da terra [23];
7. Bioma: Como destacado na descricao do criterio Area Util, existem diferentes
percentuais de area legal dependendo de qual bioma a terra pertence. Dessa
forma, uma matrıcula em um bioma de floresta amazonica e outra em um
tipo cerrado vao possuir diferentes valores no momento da venda, visto que
uma tera muito mais area util que a outra pelo percentual de reserva legal
determinado no codigo florestal;
8. Altitude: A altitude tem efeito direto na temperatura e implica na fisiologia
das plantas. Quanto mais alto estiver situado a plantacao, menor sera o gasto
energetico das plantas, logo, terras em maiores altitudes possuem a vantagem
de eficiencia na fisiologia de sua plantacao. No entanto, esse criterio nao se
comporta de forma linear, ou seja, nao se pode afirmar que quanto mais elevada
for a altitude de uma fazenda, maior sera seu valor, visto que em determinadas
altitudes comeca a parecer um risco de geada, entre outros fatores externos.
Portanto, existe um treshold deste criterio, como sera visto na analise de notas
de cada uma das caracterısticas descritas [20];
9. Pluviosidade: Dentro de uma propriedade agrıcola as precipitacoes sao de
grande importancia, pois dela dependem a producao das culturas nao irrigadas,
o dimensionamento dos sistemas de drenagem, de barragens, pontes e outras
estruturas hidraulicas, planejamento da conservacao dos solos, entre outras
caracterısticas necessarias para o bom plantio. Uma fazenda localizada em
29
um local chuvoso deve receber um benefıcio maior do que uma em uma area
seca, esse benefıcio e representado pela nota deste atributo [24];
10. Tempo de Cultivo: Como citado anteriormente, o bom cultivo do solo e seu tipo
sao fatores cruciais para a produtividade da terra, mas o seu desenvolvimento
se da por um processo gradual. Normalmente, leva algumas safras ate a terra
chegar ao seu maximo potencial. Essa caracterıstica mede exatamente esse
fator, o tempo de cultivo da terra que, de certa forma, dira sua produtividade;
11. Situacao Ambiental: Situacao Ambiental mede a situacao de onus do produtor
em sua fazenda, ou seja, caso as regras, como a de reserva legal, vista anteri-
ormente, nao sejam respeitadas, o produtor arcara com um passivo ambiental.
Esse passivo interfere diretamente na venda da propriedade, e, por isso, a si-
tuacao ambiental da fazenda deve ser um criterio especıfico na composicao de
sua nota [20];
12. Georreferenciamento: O Georreferenciamento e definido pela descricao dos
limites das propriedades, ou seja, um levantamento do perımetro da terra
e feito para mapear sua extensao e contornos. E exigido por lei, 10.267, a
apresentacao do Certificado de Cadastro de Imovel Rural – CCIR que por sua
vez exige o georreferenciamento do imovel para cadastro. Dessa forma, essa
caracterıstica e importante nao somente para a certificacao dos limites da terra
como tambem para uma questao de cumprimento da lei pelo produtor;
13. Benfeitorias: E definido pelas melhorias feitas a terra, ou seja, construcoes
para a infraestrutura da fazenda como cercos, currais ou mesmo construcoes
para o lazer. Tais itens incrementam o valor da propriedade e, normalmente,
matrıculas que contem a sede da fazenda possuem maior pontuacao neste
criterio.
Com o conceito de nota agronomica formado, espera-se que quando novas
garantias surgirem, a equipe de Controle de Credito alimente essa base, criando uma
nova linha para a garantia em questao e preenchendo cada criterio de acordo com o
laudo fornecido pela empresa avaliadora. No entanto, nessa etapa, a base de dados
ainda nao esta pronta para servir como parametro de entrada para os algoritmos de
30
Inteligencia Artificial. E necessario quantizar os domınios desses criterios, ou seja,
estabelecer notas e pesos para cada atributo.
4.2 Notas e Pesos dos Criterios
4.2.1 Pesos
Para chegar a uma nota de cada criterio analisado, e necessario estabelecer
uma tabela de domınios para cada caracterıstica, com uma nota para cada valor
esperado dos atributos. Adicionalmente, tambem e necessario um peso para cada
atributo, visto que na composicao da nota final, algumas caracterısticas podem ser
mais importantes que outras. Esse peso aumenta a importancia da caracterıstica nos
algoritmos de Inteligencia Artificial, gerando um impacto direto na precificacao final
da terra. Importante ressaltar que o banco de terras do Banco XYZ esta presente
em mais de um estado, mas, uma caracterıstica pode influenciar mais em um estado
do que em outro. Por exemplo, a pluviosidade, na Bahia, e mais relevante que no
Mato Grosso, tendo em vista a volatilidade e escassez de chuvas em algumas regioes
do Estado da Bahia.
Cada atributo possui um peso em uma escala de 1 a 5, onde 5 e o peso
maximo de um atributo, ou seja, essa caracterıstica tem a maior contribuicao na
composicao da nota. Como pode ser observado na Figura 4.2, cada estado possui
seu conjunto de pesos. A figura ainda ratifica o caso da pluviosidade ja citado,
como pode ser observado, na Bahia (Estado 0) esse atributo tem peso 5, enquanto
no Mato Grosso (Estado 1) o mesmo possui peso 2. Contudo, e possıvel observar que
alguns atributos como Area Util, Relevo e Solo possuem peso maximo em ambos os
estados, devendo-se ao fato de que esses elementos sao impeditivos em qualquer que
seja a localizacao. Se uma terra nao tiver um percentual mınimo de area util, entao
sua liquidez e seu valor sao praticamente nulos. Ao mesmo tempo, um relevo muito
elevado torna impropria a mecanizacao da terra, e, consequentemente o plantio na
mesma, o que infere diretamente em seu preco. Quanto ao solo, infertilidade significa
inaptidao agrıcola, e como nos cenarios anteriores, isso desvaloriza integralmente a
matrıcula analisada [18].
31
Figura 4.2: Essa figura descreve os pesos de cada variavel com abertura por estado.
Bahia esta representada pelo estado numero 0 e Mato Grosso pelo estado numero
1. O banco de garantias do banco XYZ abrange mais estados, mas, apenas desses
dois estados foram coletadas informacoes necessarias para a elaboracao da base.
4.2.2 Domınios
Para cada atributo foi feita uma tabela contendo o seu domınio de valores.
Logo, existe uma nota esperada para cada valor nominal ou numerico, originados
do laudo, de determinada caracterıstica. A Figura 4.3 contem 3 tabelas referentes
aos atributos: altitude; relevo e solo. Com excecao do atributo area util, no qual
32
sua nota e diretamente o percentual atribuıdo no laudo, ou seja, 90% de area util
equivale a uma nota de 0,9, cada uma das 13 caracterısticas possui uma tabela de
domınio. Elas foram preparadas junto ao especialista em agronegocio da equipe
do Controle de Credito do banco XYZ. A tabela de altitude exemplifica o racional
por tras de cada um dos 13 domınios: quanto mais elevada a regiao que a terra
se situa, menor o gasto fisiologico das plantas, ou seja, o plantio tende a ter uma
produtividade melhor. Por isso, para ambos os estados, a nota e proporcional ao
aumento da altitude, com excecao de valores maiores que 900 metros. Esse limiar,
ja comentado anteriormente, se deve ao fato de que nessa altitude existe uma forte
probabilidade de geada, o que devastaria qualquer tipo de cultivo [24].
4.2.3 Calculo das Notas
Com a tabela de notas de cada caracterıstica e seus respectivos pesos, e ne-
cessario um algoritmo que faca a transformacao dos valores do laudo para notas.
Para isso, foi escrito um codigo em VBA, apresentado no Apendice A. Esse codigo
percorre uma base de dados inicial que contem uma linha para cada terra e colunas
contendo: informacoes cadastrais, os 13 atributos ja vistos com seus valores forne-
cidos pelo laudo e o preco de venda tambem fornecido pelo laudo. Para cada linha,
o algoritmo percorre seus atributos, faz uma busca na tabela de notas e de pesos e
chega a uma nota para cada atributo. A equacao que rege cada nota individual se
da por:
nota∗ = 10× (nota× pesosomapesos
) (4.1)
Onde, a nota e o peso sao fornecidos pelas tabelas ja analisadas, e a soma de
pesos vai ser a soma dos pesos das 13 variaveis, dependendo de qual estado a terra
estiver inserida. O fator multiplicativo 10 serve como normalizador da nota. Apos
esse passo, a base de dados ficara com o layout ilustrado pela Figura 4.4. Nessa
figura, as informacoes cadastrais, como nome, matrıcula, foram substituıdas por um
atributo identificador (ID) e essa mudanca se deve a necessidade de preservacao da
confidencialidade das informacoes do Banco XYZ.
33
Figura 4.3: Figura mostra 3 das 13 tabelas contendo os domınios de cada variavel.
A tabela esquerda superior se refere ao atributo Altitude, a da direita superior ao
Relevo e a inferior ao Solo. A coluna Domınio se refere aos valores esperados pelo
laudo, a Nota, a qual nota o atributo tera dependendo de seu valor no laudo e a
coluna Estado possui valor 0 ou 1, onde 0 representa Bahia e 1, Mato Grosso.
4.3 Desenvolvimento do Sistema de Precificacao
A parte relacionada a Inteligencia Artificial foi elaborada com o auxılio do
software gratuito Knime [6]. Como um software especializado em analytics 1, ele
oferece diversos modulos de IA comentados neste trabalho, inclusive de Redes Neu-
1Analıtica, do ingles analytics, e a ciencia da analise logica, isto e, a analise de enormes conjuntos
de dados, usando matematica, estatıstica e software de computacao, para achar padroes de dados
que proveem conhecimento, informacao util ou visoes de dados bruto [25].
34
Figura 4.4: Essa figura ilustra a base de terras apos o algoritmo de quantizacao. A
tabela possui um identificador de cada terra (ID), seus atributos e o preco de venda
do laudo. Alguns dos 13 atributos foram omitidos para a otimizacao da imagem.
rais. Dessa forma, utilizando a topologia retratada na Figura 4.5, o sistema de
precificacao de garantias pode ser completado.
Figura 4.5: Arquitetura utilizada no programa Knime. A figura ilustra quais
modulos foram utilizados, desde o leitor da base de dados ate o modulo de es-
tatısticas dos resultados obtidos.
Os modulos utilizados e o funcionamento de cada um deles podem ser des-
critos da seguinte forma:
1. File Reader: Esse modulo e responsavel pela leitura de arquivos. Neste caso,
o arquivo de entradas e a base de terras, como visto na Figura 4.4, no formato
.csv ;
35
2. Normalizer: Responsavel por normalizar a coluna com os valores de venda
das terras, fornecidos pelo laudo. Esse passo e necessario, visto que o modulo
de Rede Neural imprescinde que a coluna target, que contem os dados a serem
previstos, seja um valor numerico normalizado. Portanto, os valores de venda
sao normalizados entre 0 e 1. Isso e feito, pois parametros com ordem de
grandeza diferente podem influenciar na saıda do modelo;
3. X-Partitioner: Modulo de inıcio do loop de cross-validation [26]. Essa
tecnica e aplicada para otimizar o percentual de acerto do sistema e miti-
gar o risco de overfitting. O overfitting ocorre quando o modelo de previsao
fica muito especıfico para determinados dados de treino, dessa forma, no trei-
namento o modelo apresenta bom percentual de acerto, mas no momento em
que outros dados sao validados esse percentual cai drasticamente. O cross-
validation minimiza esse risco na medida em que separa a base de dados em k
blocos, onde, em cada rodada, 1 bloco e selecionado para validar o sistema e
k−1 blocos para serem treinados. Em cada rodada, essa distribuicao e modifi-
cada de forma que todos os blocos passem pela validacao ao final das iteracoes.
Com isso, e garantido que os k blocos passaram tanto pela posicao de treina-
mento quando de validacao, o que reduz a variacao do sistema e minimiza o
risco de sobreajuste;
4. RProp MLP Learner: Esse modulo e responsavel pelo aprendizado da Rede
Neural. Nele uma arquitetura do tipo MLP (Multilayer Perceptron) e utili-
zada, junto ao algoritmo de aprendizagem RProp. Ambos os conceitos foram
apresentados no Capıtulo 2. A arquitetura so utiliza uma camada escondida
e nela sao utilizados 10 neuronios;
5. MultiLayerPerceptron Predictor: Esse modulo recebe como entrada o
modulo MLP ja treinado e na sequencia computa os valores de saıda da rede;
6. X-Aggregator: Modulo final do loop de cross-validation. Modulo responsavel
por coletar os resultados do modulo Predictor e comparar com os resultados
reais e com as iteracoes anteriores, para depois das 10 iteracoes, escolher o
melhor percentual de acerto;
36
7. Numeric Scorer: Modulo que computa as estatısticas da coluna resultado
da rede comparando com a coluna de valores reais. No caso deste trabalho, ele
compara os valores de venda das terras do laudo com os valores calculados pela
rede. Nele sao fornecidos indicadores como o coeficiente de determinacao, R2,
o erro absoluto medio, entre outros coeficientes que serao vistos no capıtulo 5.
O seguinte cenario unifica os conceitos apresentados ate entao:
1. Uma operacao que tenha a alienacao de imovel rural como garantia e proposta
no comite de credito;
2. Antes da avaliacao do comite, e feito uma avaliacao do imovel por uma empresa
avaliadora, e entao, esse laudo e enviado para o departamento do Controle de
Credito do banco;
3. Os encarregados da area adicionarao essa nova terra a base de dados ja exis-
tente, completando cada um dos 13 atributos com as informacoes do laudo,
assim como o respectivo valor de venda da terra;
4. Na sequencia, sera rodado o algoritmo para transformar esses atributos em
notas, os ponderando com seus respectivos pesos;
5. Essa base servira como entrada para a rede criada no programa Knime, que
ira computar o valor esperado dessa nova terra;
6. A area do Controle de Credito ira contrapor o valor computado pelo algoritmo
com o do laudo, dessa forma, sera capaz de fazer seu parecer e enviar para o
comite de credito. O conjunto: parecer da garantia pela area do Controle de
Credito, parecer da empresa pela Analise de Credito e o parecer quantitativo
pela area Quantitativa serao os insumos na escolha do comite em aceitar ou
nao aquela operacao.
37
Figura 4.6: Resumo dos conceitos apresentados no capıtulo, desde a proposta de
garantia ate a tomada de decisao apoiada pelo sistema proposto.
4.4 Resultados
O projeto foi aplicado em um problema real do Banco XYZ e, dessa forma,
foi utilizada uma base de dados contendo 33 terras fornecidas como garantias, sendo
14 terras na Bahia e 19 no Mato Grosso. Para o preenchimento dessa base, foram
obtidos os laudos de cada uma das terras, com isso, os 13 atributos e o valor de venda
da terra foram preenchidos de acordo com a avaliacao. No entanto, com o intuito
de obter maior validade estatıstica, uma segunda base foi criada. Esta base e uma
extensao da base de dados real, ou seja, foram acrescentadas 67 terras hipoteticas
a base, com os valores dos atributos preenchidos com a orientacao dos especialistas
em agronegocio do Banco XYZ. Essa orientacao levou em conta, nao somente as 33
terras ja avaliadas e seus respectivos precos, mas tambem toda a experiencia da area
do Controle de Credito em anos de operacao no setor. Mais uma vez, foi utilizado a
38
vantagem do metodo Delphi 2, na medida em que os precos e atributos hipoteticos
foram previstos por um grupo de especialistas, de maneira estruturada e coletiva
[19].
Esta base estendida ficou com 100 terras, sendo 47 terras da Bahia e 53 do
Mato Grosso. Com relacao a Rede Neural, foi utilizado o algoritmo de aprendizagem
RPROP [13]. A topologia contem uma camada escondida com dez neuronios.
A Tabela 4.2 mostra os principais coeficientes estatısticos coletados pelo
modulo Numeric Scorer do Knime em ambas as bases de dados. Tanto para a
base de dados reais, quanto para a base estendida, pode-se observar que o sistema
apresentou um bom compromisso com relacao a variabilidade dos dados, ou seja, a
rede foi capaz de entregar uma alta taxa de correlacao entre os valores das terras
e as notas dos atributos, o que e justificado por um coeficiente de determinacao,
R2, de aproximadamente 87% para os dados reais e 93,1% para os dados estendidos.
Esse coeficiente fornece uma proporcao entre a variacao da regressao com relacao a
variacao total do sistema, ou seja, o quao correlacionada esta a curva de regressao
com a curva real da base de dados [27]. Importante indicar que esses coeficientes
foram retirados atraves da comparacao dos precos das terras gerados pelo modelo
com os precos obtidos nos laudos, parametros de entrada da rede. Alem disso, foram
obtidos indicadores de erros que sustentam o bom resultado do coeficiente de deter-
minacao: o MSE, erro quadratico medio, de 1,4% e 0,6%; e o MAE, erro absoluto
medio, de 7,7% e 5,1%. O erro quadratico menor que o absoluto pode ser explicado
pelo fato da maioria das amostras possuırem modulo do erro menor que um. Logo,
o erro quadratico e menor do que seu valor absoluto [28].
2Metodo de decisao baseado no princıpio de que previsoes feitas por um grupo de especialistas
de forma estruturada sao mais eficientes do que quando feitas de forma individual [19].
39
Tabela 4.2: Resultados estatısticos do sistema proposto.
Sistema Proposto (MLP)
Estatısticas Dados Reais Dados Estendidos
R2 86,8% 93,1%
Erro Absoluto Medio (MAE) 7,7% 5,1%
Erro Quadratico Medio (MSE) 1,4% 0,6%
40
Capıtulo 5
Conclusao
Este projeto propoe um sistema de precificacao de imoveis rurais dados como
garantias de operacoes de credito. O sistema proposto utiliza o algoritmo de Redes
Neurais MLP (Multilayer Perceptron), que combina as vantagens da auto adaptacao
da rede e a capacidade de extrair informacoes uteis de grandes massas de dados. A
rede esta em constante processo de aprendizagem, na medida em que cada nova
garantia inserida na base de dados vai reforcar suas conexoes e capacidade de prever
resultados.
A Figura 5.1 ilustra, resumidamente, a dinamica de atuacao do sistema pro-
posto. Pelos resultados demonstrados, o projeto cumpriu com as premissas es-
tabelecidas e consegue simular um agente de apoio de decisao, entregando maior
confiabilidade e escalabilidade no processo de analise de credito. Com isso, o Banco
XYZ ira mitigar os riscos de perda em cenario de inadimplencia.
Todavia, ha alguns desafios a serem superados, como, por exemplo, adicionar
novas terras a base, visto que a quantidade de terras na base de dados ainda e muito
pequena. O volume de dados em modelos estatıstico e importante, mas a dificuldade
de se obter dados reais, dados bem documentados e avaliados se mostra uma dificul-
dade nesse sentido. Alem disso, desenvolver outras metricas, outros algoritmos da
Inteligencia Artificial tambem forneceria maior consistencia para o projeto. Dessa
forma, a implementacao de outros algoritmos, assim como o incremento da base de
dados serao realizados em um trabalho futuro.
41
Figura 5.1: Essa figura resume a dinamica de funcionamento do sistema proposto.
Uma terra nova e apresentada e incluıda na base de dados; a base passa pelo al-
goritmo de quantizacao dos dados; a base esta preenchida com notas; e e enviada
para o algoritmo de IA que por sua vez gera um resultado que apoiara a tomada de
decisao do Banco XYZ.
42
Referencias Bibliograficas
[1] MANYIKA, J., CHUI, M., BROWN, B., et al., “Big data: The next frontier
for innovation, competition, and productivity”, , 2011.
[2] BAZERMAN, M., MOORE, D. A., “Judgment in managerial decision making”,
, 2012.
[3] RUSSELL, S., NORVIG, P., INTELLIGENCE, A., “A modern approach”, Ar-
tificial Intelligence. Prentice-Hall, Egnlewood Cliffs, v. 25, pp. 27, 1995.
[4] KULIKOWSKI, C. A., WEISS, S. M., “Computer systems that learn: classi-
fication and prediction methods from statistics, neural nets, machine learning,
and expert systems”, Machine Learning. San Francisco: Morgan Kaufmann
Publishers. ISBN, pp. 1–55860, 1991.
[5] SHACHMUROVE, Y., WITKOWSKA, D., OTHERS, Utilizing artificial neural
network model to predict stock markets. University of Pennsylvania, Center for
Analytic Research in Economics and the Social Sciences, 2000.
[6] “KNIME, Open for Innovation”, https://www.knime.org/.
[7] FAUSSET, L., “Fundamentals of neural networks”, Architecture, Algorithm and
Application. Prentice Hall, , 1994.
[8] ALVAREZ, A., LUQUE, B., “Rede Neural de Kohonen e Outras Tecnicas para
Treinamento Nao-Supervisionado”, Universidade Estadual de Campinas, , 2003.
[9] HAYKIN, S. S., HAYKIN, S. S., HAYKIN, S. S., et al., Neural networks and
learning machines, v. 3. Pearson Upper Saddle River, NJ, USA:, 2009.
43
[10] GARDNER, M. W., DORLING, S., “Artificial neural networks (the multilayer
perceptron)—a review of applications in the atmospheric sciences”, Atmosphe-
ric environment, v. 32, n. 14, pp. 2627–2636, 1998.
[11] “MLP, Deep Learning Tutorial”, http://deeplearning.net/tutorial/mlp.html.
[12] GLOROT, X., BENGIO, Y., “Understanding the difficulty of training deep
feedforward neural networks.” In: Aistats, v. 9, pp. 249–256, 2010.
[13] RIEDMILLER, M., BRAUN, H., “A direct adaptive method for faster back-
propagation learning: The RPROP algorithm”. In: Neural Networks, 1993.,
IEEE International Conference On, pp. 586–591, IEEE, 1993.
[14] CAOUETTE, J. B., ALTMAN, E. I., NARAYANAN, P., Managing credit risk:
the next great financial challenge, v. 2. John Wiley & Sons, 1998.
[15] STEINER, M. T. A., SOMA, N. Y., SHIMIZU, T., et al., “Redes
Neurais e Arvores de Decisao na Analise do Credito Bancario”, SBPO,
http://ws2.din.uem.br/ ademir/sbpo/sbpo2004/pdf/arq0035.pdf, , 2004.
[16] WITTEN, I. H., FRANK, E., TRIGG, L. E., et al., “Weka: Practical machine
learning tools and techniques with Java implementations”, , 1999.
[17] DE SOUSA, A. F., CHAIA, A. J., “Polıtica de credito: uma analise qualitativa
dos processos em empresas”, , 2000.
[18] RAMALHO FILHO, A., PEREIRA, L., Aptidao agrıcola das terras do Brasil:
potencial de terras e analise dos principais metodos de avaliacao. Embrapa
Solos, 1999.
[19] LINSTONE, H. A., TUROFF, M., OTHERS, The Delphi method: Techniques
and applications, v. 29. Addison-Wesley Reading, MA, 1975.
[20] “Embrapa, Publicacoes e Manuais”, https://www.embrapa.br/publicacoes.
[21] SOJA, E., “Sistemas de Producao”, , 2010.
[22] SPAROVEK, G., BARRETTO, A., KLUG, I., et al., “A revisao do Codigo
Florestal brasileiro”, Novos Estudos-CEBRAP, , n. 89, pp. 111–135, 2011.
44
[23] BRADY, N. C., WEIL, R. R., Elementos da natureza e propriedades dos solos.
Bookman Editora, 2009.
[24] SENTELHAS, P. C., DE ALMEIDA MONTEIRO, J. E. B., “Agrometeorologia
dos Cultivos”, Brasılia, DF: INMET, , 2009.
[25] LOBATO, A. G. P., Um Sistema Acurado de Deteccao de Ameacas em Tempo
Real por Processamento de Fluxos. Ph.D. dissertation, Universidade Federal do
Rio de Janeiro, 2016.
[26] KOHAVI, R., OTHERS, “A study of cross-validation and bootstrap for accu-
racy estimation and model selection”. In: Ijcai, v. 14, pp. 1137–1145, 1995.
[27] WOOLDRIDGE, J. M., Introductory econometrics: A modern approach. Nelson
Education, 2015.
[28] HAMILTON, J. D., Time series analysis, v. 2. Princeton university press Prin-
ceton, 1994.
45
Apendice A
Codigo Fonte
Funcao principal do codigo elaborado em VBA para quantizar os atributos da
base de terras. Nele a base de dados e percorrida, e para cada linha, uma sub funcao
e chamada. Essa funcao busca a nota e o peso de cada atributo dependendo de seu
valor de entrada. Com isso, o programa chega a uma nota de cada caracterıstica.
1
2 Sub CalculaNota ()
3
4 Dim oconn As ADODB.Connection
5 Dim sConn As String
6 Dim oRs As ADODB.Recordset
7 Dim sSQL As String
8
9 Dim Estado As String
10
11
12 Dim LinhaTabela As ListRow
13
14
15 Dim NotaLocalizacao As Double
16 Dim NotaSolo As Double
17 Dim NotaTamanho As Double
46
18 Dim NotaAreaUtil As Double
19 Dim NotaConservacaoSolo As Double
20 Dim NotaRelevo As Double
21 Dim NotaAltitude As Double
22 Dim NotaPluviosidade As Double
23 Dim NotaTempoCultivo As Double
24 Dim NotaSituacaoAmbiental As Double
25 Dim NotaGeorreferenciamento As Double
26 Dim NotaBenfeitoria As Double
27 Dim NotaBioma As Double
28 Dim NotaFinal As Double
29
30 Dim Linha As Integer
31
32 ’Seleciona a Sheet de Calcula Nota Ativa
33 shtNota.Activate
34
35 ’Limpa as tabelas das Sheets Calcula Nota
36 Call LimpaTabela(shtNota , "TableRank")
37
38 ’Define o Estado no qual as notas serao geradas
39 Estado = Range("Estado").Text
40
41 ’Abre conexao com a Base de Dados (Access)
42 Call AbrirConexao(sConn , oconn)
43 oconn.Open sConn
44
45 ’Roda consulta na base de dados para buscar todas as
terras ativas do estado escolhido
46 sSQL = "SELECT * FROM [AF] WHERE Estado = ’" & Estado & "
’ and Ativo = ’Sim ’"
47 Set oRs = New ADODB.Recordset
47
48 oRs.Open sSQL , oconn , adOpenStatic , adLockBatchOptimistic
, adCmdText
49
50 ’Inicializa as variaveis
51 NotaFinal = 0
52 Linha = 0
53
54 ’Para cada linha retornada da Consulta acima (cada linha
eh uma matricula na base de dados), faremos a iteracao
abaixo
55 If Not (oRs.EOF And oRs.BOF) Then
56 oRs.MoveFirst
57 Do Until oRs.EOF = True
58
59 ’As notas sao multiplicadas por um fator de ajuste (
multiplica por 10 e divide pelo somatorio de pesos do
estado correspondente) para normalizar seu valor de 0
a 10
60
61 With shtNota.ListObjects("TableRank")
62 If .DataBodyRange.Rows.Count = 1 Then
63 Set LinhaTabela = .ListRows.Add(AlwaysInsert :=True)
64 End If
65
66 ’Nome do Cliente
67 LinhaTabela.Range.Cells(Linha , 1).Value = oRs!
Cliente
68
69 ’Matricula do Imovel
70 LinhaTabela.Range.Cells(Linha , 2).Value = oRs!
Matricula
71
48
72 ’Nota da Localizacao
73 NotaLocalizacao = CalculaNotaVariavel(oRs![
Localizacao], "Localizacao", "Dom_Localizacao"
, NotaFinal , Estado , oconn)
74 LinhaTabela.Range.Cells(Linha , 3).Value = Round(
NotaLocalizacao , 2) * FatorAjuste(Estado ,
oconn)
75
76 ’Nota do Solo
77 NotaSolo = CalculaNotaVariavel(oRs![Solo], "Solo"
, "Dom_Solo", NotaFinal , Estado , oconn)
78 LinhaTabela.Range.Cells(Linha , 4).Value = Round(
NotaSolo , 2) * FatorAjuste(Estado , oconn)
79
80 ’Nota do Tamanho da Terra
81 NotaTamanho = CalculaNotaVariavel(
AjustaTamanhoArea(oRs![Total ha]), "Tamanho",
"Dom_Tamanho_Area", NotaFinal , Estado , oconn)
82 LinhaTabela.Range.Cells(Linha , 5).Value = Round(
NotaTamanho , 2) * FatorAjuste(Estado , oconn)
83
84 ’Nota da Area Util (0 a 1 => 100% aberta = 1)
85 NotaAreaUtil = BuscaPeso("% Area util", Estado ,
oconn) * oRs ![% Agricola Aberto]
86 LinhaTabela.Range.Cells(Linha , 6).Value = Round(
NotaAreaUtil , 2) * FatorAjuste(Estado , oconn)
87
88 ’Nota da Conservacao do Solo
89 NotaConservacaoSolo = CalculaNotaVariavel(oRs![
Conservacao Solo], "Conservacao Solo", "
Dom_Conservacao_Solo", NotaFinal , Estado ,
oconn)
49
90 LinhaTabela.Range.Cells(Linha , 7).Value = Round(
NotaConservacaoSolo , 2) * FatorAjuste(Estado ,
oconn)
91
92 ’Nota do Relevo
93 NotaRelevo = CalculaNotaVariavel(oRs![ Relevo], "
Relevo", "Dom_Relevo", NotaFinal , Estado ,
oconn)
94 LinhaTabela.Range.Cells(Linha , 8).Value = Round(
NotaRelevo , 2) * FatorAjuste(Estado , oconn)
95
96 ’Nota do Bioma
97 NotaBioma = CalculaNotaVariavel(oRs![ Bioma], "
Bioma", "Dom_Bioma", NotaFinal , Estado , oconn)
98 LinhaTabela.Range.Cells(Linha , 9).Value = Round(
NotaBioma , 2) * FatorAjuste(Estado , oconn)
99
100 ’Nota da Altitude
101 NotaAltitude = CalculaNotaVariavel(AjustaAltitude
(oRs![ Altitude ]), "Altitude", "Dom_Altitude",
NotaFinal , Estado , oconn)
102 LinhaTabela.Range.Cells(Linha , 10).Value = Round(
NotaAltitude , 2) * FatorAjuste(Estado , oconn)
103
104 ’Nota da Pluviosidade
105 NotaPluviosidade = CalculaNotaVariavel(
AjustaPluviosidade(oRs![ Pluviosidade], Estado ,
oRs![ Irrigacao ]), "Pluviosidade", "
Dom_Pluviosidade", NotaFinal , Estado , oconn)
106 LinhaTabela.Range.Cells(Linha , 11).Value = Round(
NotaPluviosidade , 2) * FatorAjuste(Estado ,
oconn)
50
107
108 ’Nota do Tempo de Cultivo
109 NotaTempoCultivo = CalculaNotaVariavel(
AjustaTempoCultivo(oRs![Tempo de Cultivo ]), "
Tempo de cultivo", "Dom_Tempo_cultivo",
NotaFinal , Estado , oconn)
110 LinhaTabela.Range.Cells(Linha , 13).Value = Round(
NotaTempoCultivo , 2) * FatorAjuste(Estado ,
oconn)
111
112 ’Nota Situacao Ambiental
113 NotaSituacaoAmbiental = CalculaNotaVariavel(oRs![
Situacao Ambiental], "Situacao ambiental", "
Dom_Situacao_Ambiental", NotaFinal , Estado ,
oconn)
114 LinhaTabela.Range.Cells(Linha , 14).Value = Round(
NotaSituacaoAmbiental , 2) * FatorAjuste(Estado
, oconn)
115
116 ’Nota Georreferenciamento
117 NotaGeorreferenciamento = CalculaNotaVariavel(oRs
![ Georreferenciado], "Georreferenciado", "
Dom_Georreferenciamento", NotaFinal , Estado ,
oconn)
118 LinhaTabela.Range.Cells(Linha , 19).Value = Round(
NotaGeorreferenciamento , 2) * FatorAjuste(
Estado , oconn)
119
120 ’Nota Benfeitoria
121 NotaBenfeitoria = CalculaNotaVariavel(oRs![
Benfeitorias], "Benfeitorias", "
Dom_Benfeitoria", NotaFinal , Estado , oconn)
51
122 LinhaTabela.Range.Cells(Linha , 20).Value = Round(
NotaBenfeitoria , 2) * FatorAjuste(Estado ,
oconn)
123
124 LinhaTabela.Range.Cells(Linha , 21).Value = oRs![
R$/HA]
125 LinhaTabela.Range.Cells(Linha , 23).FormulaR1C1 =
"=SUM(TableRank[@[Localizacao ]:[ Benfeitorias
]])"
126
127
128 Linha = Linha + 1
129
130 oRs.MoveNext
131 End With
132
133
134 Loop
135
136 Else
137 MsgBox "Nenhum registro encontrado na consulta."
138 End If
139
140
141 Call OrdenaTabela(shtNota , "TableRank")
142
143 ’Atualiza Pivot Table
144 Call AtualizaPivot(shtNota , "PivotTerras")
145
146
147 ’Atualiza Graficos
148 Call Atualiza_Grafico(shtChartIndiv , "ChartTerra", True)
52
149 Call Atualiza_Grafico(shtChartGrupo , "ChartGrupo", False)
150
151
152
153
154 End Sub
53