XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 1
ENCOINFO 2016 XVIII Congresso de Computao e Sistemas de Informao
09 a 12 de Maio de 2016 Palmas Tocantins
ANAIS 18 CONGRESSO DE COMPUTAO E SISTEMAS
Realizao
Curso de Bacharelado em Sistemas de Informao Curso de Bacharelado em Cincia da Computao
2 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Nota: Os conceitos e a redao contidos nos resumos dos artigos so de exclusiva responsabilidade de seus autores, pois os mesmos foram transcritos na ntegra para esta publicao.
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 3
ENTIDADE MANTENEDORA
Associao Educacional Luterana do Brasil
Presidente Paulo Augusto Seifert
CENTRO UNIVERSITRIO LUTERANO DE PALMAS
Reitor Adriano Chiarini da Silva
Diretora Acadmica Parcilene Fernandes de Brito Diretora Acadmica Adjunta
Adriana Ziemer Gallert Dimy Sousa Freitas
Diretora Administrativa Shirley Silvia Borges de Oliveira Rodrigues
Assessora da Reitoria Alda Adriana Lima Gonalves
Assessor Jurdico Josu Pereira de Amorim
Coordenadora de Pesquisa Conceio Aparecida Previero
Coordenadora de Ps-Graduao Micheline Pimentel Ribeiro
Coordenador de Extenso e Assuntos Comunitrios Luiz Gustavo Santana
Secretria Geral Drili Drvela Cabral Arajo
Assessor de Comunicao Social Leonardo Maximiano
Capelo Pastor Ari Schulz
4 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Bacharelado em Sistemas de Informao Bacharelado em Cincia da Computao
Coordenadora dos Cursos Parcilene Fernandes de Brito
Coordenadora Adjunta de Sistemas de Informao
Madianita Bogo Marioti
Coordenador Adjunto de Cincia da Computao Fabiano Fagundes
Coordenador de Estgios e de Trabalhos de Concluso de Curso
Fernando Luiz de Oliveira
Coordenador do Projeto Informtica & Sociedade Fernando Luiz de Oliveira
Edeilson Milhomem da Silva
Coordenadores da Fbrica de Software Jackson Gomes de Souza
Edeilson Milhomem da Silva
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 5
6 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
ENCOINFO 2016
Comisso Organizadora
Cristina DOrnellas Filipakis Edeilson Milhomem da Silva
Fabiano Fagundes Fernando Luiz de Oliveira Jackson Gomes de Souza Madianita Bogo Marioti
Parcilene Fernandes de Brito
Arte e Capa Jackson Gomes de Souza
Site do Evento
Fbrica de Software
Fbrica de Software Edeilson Milhomem da Silva
Jackson Gomes de Souza Antnio Carlos Mota Jnior
Gabriel Borges Lucas Henrique Roese
Murillo Roseno Robson Ferreira Gomes
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 7
8 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Equipe Editorial
Editora Chefe
Parcilene Fernandes de Brito
Editores Assistentes
Jackson Gomes de Souza
Edeilson Milhomem da Silva
Fabiano Fagundes
Comit Tcnico
Alberto Csar Cavalcanti Frana Universidade Federal Rural de Pernambuco
Andreia Rosangela Kessler Mhlbeier Instituto Federal de Santa Catarina
Bruno Vilar Instituto de Pesquisas Eldorado
Daniel Costa de Paiva Universidade de So Paulo
Edilson Ferneda - Universidade Catlica de Braslia
Eliane Pozzebon - Universidade Federal de Santa Catarina
Flavius Gorgnio Universidade Federal do Rio Grande do Norte
Kalil Araujo Bispo - Universidade Federal de Sergipe
Leandro Maciel Almeida Universidade Federal de Pernambuco
Leandro Pasa Universidade Tecnolgica Federal do Paran/Universidade Federal do Rio Grande do Norte
Luciana de Oliveira Rech Universidade Federal de Santa Catarina
Luciano de Souza Cabral Instituto Federal de Pernambuco
Maria Adelina Silva Brito Universidade de So Paulo
Maristela Oliveira dos Santos Universidade de So Paulo
Paulyne Juc Universidade Federal do Cear
Raul Sidnei Wazlawick - Universidade Federal de Santa Catarina
Ricardo Arajo Costa - Banco Central do Brasil
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 9
Rodolfo Adamshuk Silva Universidade de So Paulo
Silvana Morita Melo Universidade de So Paulo
Simone Senger Souza Universidade de So Paulo
Tales Rebequi - Banco Ita - Tecnologia
Victor Hugo Santiago Costa Pinto Universidade de So Paulo
10 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 11
APRESENTAO
O Encoinfo atinge a maturidade. O que comeou como o primeiro Encontro de Estudantes
de Computao e Informtica do Tocantins foi se desenvolvendo e chegou ao seu dcimo-
oitavo ano como Congresso de Computao e Sistemas de Informao.
Buscou-se, desde a primeira edio, oferecer comunidade tocantinense a possibilidade de
apresentar e publicar artigos completos nos anais de um evento cientfico de qualidade.
Estes artigos so avaliados por um Comit Cientfico e a reviso ocorre de acordo com o
sistema duplo de reviso annima ou cega, em que tanto os nomes dos revisores quanto dos
autores permanece sigiloso durante o processo de avaliao.
Foi com estas publicaes em seus currculos, desde l no incio e ainda agora, que muitos
alunos foram aceitos em programa de ps-graduao de renome em todo o pas. Uma volta
no tempo e, ao ver os 8 artigos apresentados no primeiro evento, observamos que de 7
deles saram professores universitrios que atua hoje em instituies de ensino do Tocantins
e Gois. Proporo que se mantm nos eventos seguintes, evidenciando que um dos
objetivos iniciais do evento foi atingido com sucesso.
E com isso em mente e com a certeza da concretizao de sonhos de quem esteve l em
1999 criando este evento que oferecemos comunidade o 18 Congresso de Computao e
Sistemas de Informao.
Que venham mais 18 anos!
Comisso Organizadora
12 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 13
SUMRIO
Palestrantes ...................................................................................................................... 15
Minicursos ........................................................................................................................ 19
Artigos Completos
A Importncia da Auditoria de TI: Estudo de Caso em um rgo do Governo
do Estado do Tocantins ..................................................................................................... 25
Fabricio da Silva Rodrigues, Brunna Caroline do Carmo Mouro,
Thatiane de Oliveira Rosa
Adequao e Testagem do IMP Digital para a Anlise do Esquema Corporal ............... 34
Leomar Camargo de Souza, Pierre Soares Brando, Fernando Luiz de Oliveira,
Fabiano Fagundes
Aplicao da Tcnica de Text Mining para Comentrios Relacionados ao
Contexto do Turismo ......................................................................................................... 43
Felipe Eduardo Bechert Schmitz, Parcilene Fernandes de Brito
Aplicao das Boas Prticas da User Experience na Nova Interface
do Portal (En)Cena ............................................................................................................ 52
Srgio Silva Barros, Parcilene Fernandes Brito
Aplicao de Ferramenta OLAP para Identificar Quebras de Ligaes Qumicas em
Molculas de Antocianina ................................................................................................. 61
Ranyelson Neres Carvalho, Madianita Bogo Marioti, Walkiria Regis de Medeiros
Avaliao dos Processos de Desenvolvimento de Software das Unidades
Organizacionais da Administrao Pblica do Estado do Tocantins
com Base no MPS.BR ....................................................................................................... 70
Felipe Oliveira Simes, Tathinay de Souza Siqueira,
Brunna Caroline do Carmo Mouro, Thatiane de Oliveira Rosa,
Andr Mesquita Rincon
CODE LIVE: Gamificao de um Ambiente Virtual de Programao ............................ 78
Djonathas Carneiro Cardoso, Jesiel Souza Padilha, Jackson Gomes de Sousa, Fabiano
Fagundes, Parcilene Fernandes de Brito
Estudo da Segmentao do ICMS no Estado do Tocantins entre 2013 e 2014 ................ 87
Leomar Camargo de Souza, Haroldo Fernando Fritsch, Fernando Luiz de Oliveira
Modelo de inferncia de locais potencialmente favorveis a acidentes fatais e
graves em Palmas-TO ....................................................................................................... 97
Pedro Henrique Gomes Camargo, Fernando Luiz de Oliveira,
Felipe Dias da Silva Cabral, Joo Batista Borges Junior, Maicon Juliano Fristh
Modelo de Inferncia de Preferncias de Clientes em Shoppings Centers ....................... 104
14 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Douglas J. Ramalho Araujo, Jackson Gomes Souza, Parcilene Fernandes de Brito,
Edeilson Milhomem da Silva
Modelo de Visualizao de Informao de um Processo de Anlise de
Sentimentos no Contexto do Turismo ............................................................................... 113
Lucas Henrique Roese, Parcilene Fernandes de Brito
ORDENA Um Jogo Educacional para Auxlio ao Ensino de Mtodos
de Ordenao ..................................................................................................................... 123
Haroldo Fernando Fritsch, Edeilson Milhomem da Silva, Jackson Gomes de Souza
Proposta de Framework para uso Coexistente de Prticas geis das
Metodologias Scrum e TDD ............................................................................................. 132
Mrcia M. Savoine, Joyce Karoline M. Matias, Vanessa F. Rocha,
Andr M. Rincon, Andr Magno C. Arajo
Sistema de Avaliao de Usabilidade: usando Heursticas de Usabilidade
e Inteligncia Artificial para a Avaliao Ergonmica de Softwares ............................... 141
Fernando Lcio, Guilherme Reinaldo, Matheus Gregorio, Miguel Lemos,
Rodrigo Melo
Utilizao do Algoritmo de Mquina de Vetores de Suporte (SVM) para
Predio de Dados Climticos ........................................................................................... 149
Kevin Martins Arajo, Edeilson Milhomem da Silva
Programa .......................................................................................................................... 159
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 15
PALESTRANTES
16 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 17
Gisele L. Pappa DCC/UFMG
Palestra: Inteligncia Computacional: Passado, Presente e Futuro
Resumo: A rea de inteligncia computacional engloba vrios mtodos computacionais
inspirados na natureza, tais como algoritmos genticos - que so inspirados na teoria da
evoluo de Darwin, e redes neurais artificiais - inspiradas no funcionamento do crebro humano.
Essa palestra ir introduzir a rea de inteligncia computacional, mostrar como os primeiros
algoritmos foram concebidos, discutir os mtodos mais utilizados nos dias de hoje e as
tendncias para o futuro em termos de algoritmos e aplicaes.
Mini CV: Professora do Departamento de Cincia da Computao da UFMG e Bolsista de
Produtividade em Pesquisa Nvel 2 do CNPq. Ela doutora em Cincia da Computao pela
Universidade de Kent, na Inglaterra (2007). Foi coordenadora do comit de programa do BRACIS
2015 (principal conferncia nacional na rea de inteligncia artificial), alm de estar envolvida em
diversas atividades da GECCO (conferncia internacional sobre computao bio-inspirada) desde
2012 Seus principais interesses de pesquisa esto nas reas de aprendizado de mquina e
inteligncia computacional, com foco em algoritmos de programao gentica. Dentre seus
ltimos projetos, destacam-se o foco nos dados vindos de redes sociais e suas aplicaes na
sade e no monitoramento de eventos.
18 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Anselmo Castelo Branco Ferreira
Recod/UNICAMP
Palestra: Problemas e Solues em Anlise Forense de Documentos
Resumo: A popularizao da tecnologia da informao nos dias de hoje ampliou os conceitos de
crime. A tecnologia forense, antes aplicada anlise por meios computacionais de pistas deixadas
em locais fsicos, precisa tambm analisar documentos em computadores visando a busca de
indcios de crimes nos mesmos. Nessa palestra sero abordadas as principais tcnicas propostas
na literatura cientfica em Anlise Forense de Documentos: tcnicas responsveis por atribuir a
origem de um documento (atribuio de fonte), que verificam se h mensagem escondida em
imagens (esteganlise), que identificam tentativas de burlar sistemas biomtricos (anti-spoofing)
e que verificam se um documento digital como uma imagem verdadeiro ou manipulado
(deteco de adulteraes). Tambm sero discutidos os principais problemas encontrados por
peritos forenses na rea, como os avanos na tecnologia e tcnicas anti-forenses bem como os
desafios atuais na rea.
Mini CV: Anselmo Castelo Branco Ferreira formado em Tecnologia em Anlise e
Desenvolvimentos de Sistemas pela Faculdade de Tecnologia da UNICAMP. Possui mestrado em
Tecnologia e Inovao pela UNICAMP e atualmente cursa doutorado no Instituto de Computao
da UNICAMP, orientado pelo prof. Dr. Anderson Rocha. membro do laboratrio de inferncia
em dados complexos (RECOD) do Instituto de Computao da UNICAMP, onde pesquisa a
padronizao de tcnicas para a identificao de adulteraes em imagens, atribuio de fonte de
documentos e busca de crimes em imagens de sensoriamento remoto. revisor de trs
peridicos cientficos internacionais e sua pesquisa focada em solues de Viso Computacional
e Aprendizado de Mquina aplicadas ao reconhecimento de crimes em documentos.
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 19
MINICURSOS
20 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 21
Arduino
Glaycow Sivleira e Antnio Carlos Mota Jnior - Acadmicos de Sistemas de Informao e Cincia da Computao CEULP
Aprendizagem de Mquina: Redes Bayesianas
Douglas Ramalho - Egresso de Sistemas de Informao CEULP
Desenvolvimento de Aplicativos para Dispositivos Mveis com Ionic Framework
Van Neves - Egresso de Sistemas de Informao CEULP
Introduo ao Web Design com HTML 5 e CSS 3
Gabriel Borges e Robson Gomes - Fbrica de Software do CEULP
Desenvolvimento Front-End com AngularJS
Lucas Henrique Roese e Jesiel Souza Padilha - Fbrica de Software do CEULP
Canvas e Design Thinking
Jeferson Moraes e Brbara Nunes SEBRAE
Desenvolvimento Web com Python e Django
Fbio Castro Arajo e Charles Rockenbach - Egressos de Sistemas de Informao CEULP
22 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 23
ARTIGOS COMPLETOS
24 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 25
A Importncia da Auditoria de TI: Estudo de Caso em um rgo
do Governo do Estado do Tocantins
Fabricio da Silva Rodrigues1, Brunna Caroline do Carmo Mouro
1, Thatiane de
Oliveira Rosa1
1 Curso de Gesto da Tecnologia da Informao - Instituto Federal de Educao, Cincia e
Tecnologia do Tocantins, Campus Paraso (IFTO)
Distrito Agroindustrial, BR 153, KM 480 Caixa Postal 151 77.600-000 Paraso do
Tocantins TO Brasil
[email protected], [email protected],
Resumo. A TI tem se demonstrado um fator de sucesso dentro das organizaes,
devido s vantagens que ela proporciona. Diante disso, o controle dos processos de
TI se faz importante, alm de ser necessrio que ela esteja alinhada com os
objetivos da organizao e por isso precisa de um planejamento e monitoramento.
Logo, os gestores devem ter um olhar estratgico sobre a TI e sempre avaliar os
seus processos para que assim confirme se os seus objetivos esto conforme os do
negcio. Diante deste contexto, o objetivo deste trabalho avaliar a infraestrutura
de TI de uma organizao pblica, por meio do procedimento de auditoria de TI.
1. Introduo Com o passar dos anos, a TI tem ganhado importncia no ambiente organizacional,
aumentando assim a necessidade dos gestores realizarem monitoramento e avaliao dos
processos, para que assim possa utiliz-la de forma mais eficiente. Diante disso, foram criados
mtodos e prticas para gerenciar processos de TI, surgindo o conceito de governana de TI,
que tem como finalidade organizar, monitorar e controlar os processos, de forma que fique
mais transparente possvel o seu papel dentro da organizao perante os stakeholders, fazendo
com que a TI possa cada vez mais estar alinhada aos objetivos da organizao. A partir disso,
foram desenvolvidas ferramentas como o COBIT (Control Objectives for Information and
Related Technology).
Nas ltimas dcadas, o conceito de auditoria de TI tem sido muito discutido em
organizaes pblicas e privada. No caso das organizaes pblicas, existe uma grande
necessidade de controle e monitoramento da utilizao da TI, o que as obriga a fazerem uso
de auditorias, para verificar os aspectos relativos confiabilidade, integridade, eficcia,
eficincia, confidencialidade, disponibilidade, e conformidade, das informaes geridas pela
TI dentro da organizao (MONTEIRO, 2008).
Auditoria de TI um tipo de averiguao na qual se analisa sistemas, ambiente
computacional, infraestrutura de TI, segurana das informaes, e controle interno da
organizao identificando as fraquezas e pontos fortes (DIAS, 2000). Para realizar uma
auditoria de TI preciso conhecer os seus processos existentes na organizao a ser auditada.
Como parmetro deve-se utilizar a documentao do COBIT, normas de governana, servios
e manuais de auditorias de TI, para que se possa ter uma direo de como proceder
(HANASHIRO, 2009).
Segundo Hanashiro (2009), o assunto auditoria de TI muito amplo, pois existem
vrios tipos, como: Auditoria de Infraestrutura; Auditoria de Gesto; Auditoria de Segurana;
Auditoria de Licitaes e Contratos; e Auditoria de Softwares. importante ressaltar que o
presente trabalho ir abordar a Auditoria de Infraestrutura de forma mais detalhada. Esse tipo
de auditoria foi escolhido, pois segundo Weill e Ross (2006), a infraestrutura a base da
capacidade da TI, tida como servios compartilhados pela organizao e coordenados
centralmente. Alm disso, o conjunto de sistemas de infraestrutura fornece a capacidade
26 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
humana e tcnica que alavanca a capacidade do negcio, que necessria para o
posicionamento competitivo da organizao.
Diante do contexto apresentado, esta pesquisa visa avaliar a infraestrutura de uma
organizao pblica no Estado do Tocantins, utilizando procedimento de auditoria baseado
em modelos e normas.
2. Infraestrutura e Auditoria de TI Weill e Ross (2006) consideram a infraestrutura de TI a base tecnolgica de uma organizao,
a qual tem por objetivo subsidiar componentes tecnolgicos para disponibilizar servios
confiveis, que so compartilhados em uma organizao. Concordando com Miglioli (2006) e
Albertin (2005), que afirmam que a infraestrutura de TI organizada e formada por hardware,
software, banco de dados, redes de computadores e pessoas. Atravs desses componentes
possvel manipular, gerar, distribuir dados e informaes para toda organizao.
Visto que cada vez mais processos dependem da TI para serem executados, a
realizao de auditorias por parte dos rgos mostra-se essencial para garantir que a gesto de
TI colabore para o atendimento dos objetivos da organizao. Assim como favorea a
avaliao correta de riscos de TI (MONTEIRO, 2008). Outro fato relevante para a realizao
de auditorias que hoje as informaes que transitam nas organizaes so geridas, em sua
maioria, por ferramentas de TI (HANASHIRO, 2007).
Segundo Hanashiro (2009) a auditoria de TI tem o objetivo de verificar a
conformidade e a operacionalidade dos controles dos processos, que se baseiam em
Tecnologia da Informao. Albertin (2002) complementa informando que a auditoria est
baseada em confiana e controles internos, visando confirmar se tais controles existem, foram
implementados e se so confiveis. Esta pesquisa est direcionada infraestrutura, escolha
que se fundamenta no estudo de Weill e Ross (2006), onde afirmam que a infraestrutura a
base da capacidade da TI, que alavanca a capacidade humana e tcnica e consequentemente a
capacidade do negcio, que necessria para o posicionamento competitivo da organizao
no mercado.
Para realizar uma auditoria de TI necessrio cumprir etapas, e cada etapa tem seu
objetivo. Monteiro (2008) orienta que ela seja realizada em quatro etapas, sendo:
planejamento, execuo, relatrio e acompanhamento.
Planejamento: onde o auditor independente estabelece a estratgia de execuo, definindo o objetivo geral, o objeto a ser auditado, e os procedimentos gerais (TCU, 2010; CFC, 2008;
HANASHIRO, 2007). Esta etapa composta pelas seguintes atividades (TCU, 2010): anlise
preliminar do objeto de auditoria, definio do objetivo e escopo da auditoria, especificao
dos critrios de auditoria, elaborao da matriz de planejamento, validao da matriz de
planejamento, elaborao de instrumentos de coleta de dados, e elaborao do projeto de
auditoria;
Execuo: consiste em executar o planejamento elaborado a fim de se obter evidncias. As principais atividades realizadas so: desenvolvimento dos trabalhos de campo, anlise dos
dados coletados, elaborao da matriz de achados, validao da matriz de achados, elaborao
da anlise de riscos (TCU, 2010);
Relatrio: Todas as atividades realizadas sero registradas, para que seja possvel extrair evidncias e informaes de como est o desempenho das atividades executas e tambm obter
feedback (TCU, 2010);
Acompanhamento: Nesta etapa o principal ponto o monitoramento de tudo que foi implantado e executado, utilizando para isso mtricas para mensurar o andamento das
atividades (TCU, 2010).
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 27
3. COBIT O COBIT um modelo que contm todos os domnios e processos de governana de TI,
tendo como objetivo auxiliar os auditores de sistemas, gerentes de TI e administradores em
geral a visar um melhor direcionamento tecnolgico para a organizao atravs de mtodos e
prticas de excelncia. Ele prope uma srie de objetivos e de boas prticas a serem seguidos
(COBIT 4.1, 2007).
O COBIT possui quatro domnios, os quais permitem que gestores e auditores de TI
definam melhor as medies e controlem a governana, que so: Planejar e Organizar,
Adquirir e Implementar, Entregar e Suportar e Monitorar e Avaliar. Cada domnio possui seus
processos, totalizando 34 (COBIT 4.1, 2007). Alguns dos processos que se mostram
relevantes para esta pesquisa, so elencados a seguir.
Planejar e Organizar: PO1 - Definir o plano estratgico de TI; PO4 - Definir a organizao de TI e seus relacionamentos; PO5 - Gerenciar os investimentos de TI; PO6 - Gerenciar a
comunicao das direes de TI; PO9 - Avaliar os Riscos;
Adquirir e Implementar: AI1 - Identificar solues automatizadas; AI4 - Manter operao em uso; AI6 - Gerenciar mudanas; AI7 - Instalar e certificar solues e mudanas;
Entregar e Suportar: ES1 - Definir e manter os acordos de nveis de servios; ES4 - Assegurar a continuidade dos servios; ES5 - Garantir a segurana dos servios; ES10 -
Gerenciar problemas e incidentes; ES12 - Gerenciar a infraestrutura fsica; ES13 - Gerenciar
as operaes;
Monitorar e Avaliar: MA1 - Monitorar e avaliar o desempenho; MA2 - Monitorar e avaliar os controles internos; MA4 - Prover a governana de TI.
O COBIT possui um modelo de maturidade, composto por seis nveis, que visa
identificar o grau de maturidade atual da organizao (Tabela 1).
Tabela 1. Nveis de Maturidade (COBIT 4.1, 2007).
Nvel Maturidade
0 Inexistente No existe um processo definido, a organizao no reconhece um gerenciamento a ser iniciado.
1 Inicial/Ad hoc A organizao reconhece que precisa ser resolvido alguns problemas, mas no inicia um processo
padronizado, mostrando muita desorganizao desses processos.
2 Repetvel, porm
Intuitivo
Os processos neste estgio so reconhecidos e padronizados, mas no h uma comunicao e um
treinamento formal dos procedimentos, a reponsabilidade fica mais por parte de cada indivduo.
3 Processo Definido Neste estgio os procedimentos j so definidos, padronizados, documentados e comunicados,
aqui feito um treinamento.
4 Gerenciado e
Mensurvel
realizado um controle contnuo do que j foi implementado, e analisado o feedback, buscando,
atravs disso, melhorias ou mudanas nos processos j definidos.
5 Otimizado Neste estgio, grande parte dos processos esto bem refinados, buscando sempre a otimizao para
aprimorar a qualidade e efetividade da organizao.
Aps compreender o COBIT de forma genrica, a prxima seo realiza uma
explanao sobre a norma ISO NBR 27002, que dispe sobre a segurana da informao e
possui alguns procedimentos relacionados auditoria de infraestrutura de TI.
4. ISO/IEC NBR 27002 A norma NBR ISO/IEC 27002, dispe sobre a segurana da informao, estabelecendo
diretrizes e princpios para planejar, organizar, implementar, monitorar e melhorar a
segurana da informao em uma organizao. Esta norma contm 11 sees de controle
de segurana da informao, sendo que cada seo tem sua categoria e cada categoria
principal tem a sua definio e os objetivos a serem alcanados. A Tabela 2 apresenta os
Controles de Segurana da Informao (CSI) e seus objetivos.
Tabela 2. Controles de Segurana da Informao (NBR ISO/IEC 27002, 2005).
Controle Objetivo
CSI 1. Poltica de Segurana da
Informao
Estabelecer um planejamento de segurana da informao, alinhada com os
objetivos da organizao. Elaborar um documento contendo diretrizes e
mtodos relacionados segurana da informao.
28 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
CSI 2. Organizando a Segurana da
Informao
A segurana da informao deve ser gerenciada, para iniciar e controlar a
implementao de sua segurana dentro da organizao.
CSI 3. Gesto de Ativos Administrar, manter e proteger todos os ativos da organizao.
CSI 4. Segurana em Recursos
Humanos
Conscientizar e assegurar que todo o pessoal envolvido na organizao,
entenda suas responsabilidades e assinem acordos sobre os seus papis e
responsabilidades.
CSI 5. Segurana Fsica e do
Ambiente
A proteo das instalaes fsicas se faz necessria para proteo dos dados
lgicos, preveno ao acesso fsico no autorizado, danos e interferncias.
CSI 6. Gesto das Operaes e
Comunicaes
Administrar as operaes e comunicaes garantindo a operao segura e
correta dos recursos de processamento da informao, definir procedimentos
e responsabilidades pela gesto e operao de todos os recursos de
processamento das informaes.
CSI 7. Controle de Acesso Controlar o acesso informao e proteg-la de modo que somente pessoas
autorizadas possam ter acesso, de acordo com seu privilgio.
CSI 8. Aquisio, Desenvolvimento
e Manuteno dos Sistemas de
Informao
Garantir que a segurana parte integrante dos sistemas de informao
CSI 9. Gesto de Incidentes de
Segurana da Informao
As fragilidades e eventos de segurana da informao encontrados devem
ser comunicados, permitindo a ao corretiva em tempo hbil.
CSI 10. Gesto da Continuidade do
Negcio
A continuidade do negcio no deve ser interrompida, para isso, deve-se
proteger os processos crticos contra erros ou desastres significativos.
CSI 11. Conformidade O projeto, o sistema, a operao, o uso, e a gesto devem estar em
conformidade com os requisitos legais.
Vale ressaltar que a seo Segurana fsica e do ambiente ser adotada como base
para realizar a anlise de segurana da informao, na organizao estudada. Esta seo
da norma NBR ISO/IEC 27002 dispe sobre a segurana dos equipamentos e do ambiente.
Assim parte do pressuposto de que toda informao lgica est inserida em ambiente fsico,
ou em um equipamento. Portanto, para que seja possvel proteger os dados lgicos,
necessrio proteger e prevenir possveis riscos relacionados s instalaes fsicas (NBR
ISO/IEC 27002, 2005). Diante disso, a norma apresenta as seguintes recomendaes:
Proteo do acesso ao ambiente, Proteo contra ameaas externas e do meio ambiente,
Proteo dos equipamentos de TI, Segurana do cabeamento e Manuteno dos
equipamentos.
5. Resultado e Discusses
5.1. Caracterizao da Instituio Estudada
A instituio escolhida para a realizao do estudo de caso constitui-se em uma unidade de
um rgo do Governo do Estado do Tocantins, que visa prestar servios relacionados rea
agropecuria. Dentre os servios prestados pode-se citar fiscalizao de lojas agropecurias e
de vacinao dos animais em reas de riscos, entre outros servios, Nesse contexto a TI
mostra-se um recurso muito importante para atingir a realizao dos servios propostos.
A instituio possui uma Coordenao de TI, com objetivo de criar ferramentas e gerir
os equipamentos computacionais, para a eficincia da realizao das atividades dos
funcionrios. Um dos principais sistemas utilizados pela instituio foi desenvolvido por tal
coordenao. Para que as unidades de atendimento, que compem esse rgo, possam utilizar
o sistema em questo e usufruir dos seus benefcios, deve-se ter uma infraestrutura de TI
composta por no mnimo: computador, impressora, modem roteador, linha telefnica, acesso
internet e funcionrios capacitados para operar o sistema.
5.2. Procedimentos Realizados
No contexto deste trabalho o objeto de auditoria constitui-se da Infraestrutura de TI da
unidade adotada para o estudo de caso. O objetivo da realizao da auditoria em questo
analisar a infraestrutura de TI do ambiente, esclarecendo como esta composta e utilizada e
quais prticas os gestores podero seguir para se ter um melhor aproveitamento da
infraestrutura de TI.
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 29
O responsvel pela realizao da simulao de auditoria em questo foram os autores
deste trabalho. Portanto, para executar tal simulao e avaliar a infraestrutura da unidade, os
procedimentos realizados foram os seguintes:
1 procedimento: Anlise de infraestrutura de rede, envolvendo elementos como cabeamento, dispositivos, estrutura e problemas da rede;
2 procedimento: Anlise dos sistemas operacionais e softwares instalados nas mquinas, sendo verificada a compatibilidade com programas essenciais e problemas no sistema
operacional;
3 procedimento: Anlise da segurana fsica do ambiente, examinando extintores de incndio, aterramento dos equipamentos e sistemas de alarmes e proteo;
4 procedimento: Anlise do mecanismo de armazenamento de arquivos, sendo averiguados os procedimentos e equipamento de backup;
5 procedimento: Aplicao de um questionrio subjetivo no formato de entrevista oral com o responsvel tcnico em TI da unidade, e na aplicao do questionrio objetivo para o
chefe geral da unidade, para que fosse possvel avaliar o controle interno da unidade.
5.3. Resultados Encontrados
A partir da aplicao dos questionrios e do estudo feito no processo de avaliao de riscos
(PO09) relacionado ao domnio de planejamento e organizao do COBIT tornou-se possvel
realizar uma anlise de riscos de TI encontrados na organizao. Os resultados encontrados
so apresentados na Tabela 3.
Tabela 3. Anlise de Riscos
Nome Descrio Probabilidade Magnitude Impacto Mitigao
Acesso rede
somente via
cabo.
Alcance de
cobertura de rede
limitada.
Altamente
provvel Baixa
Acesso internet e
rede local s pode ser
realizado por meio de
computadores ou
dispositivos via cabo.
Adquirir um
dispositivo de
modem
roteador WI-
FI.
Perda total de
arquivos.
Perda total de
arquivos
armazenados nos
computadores.
Provvel Alta
Arquivos importantes
podero no ser
recuperados caso o
computador
apresente um
problema grave.
Realizar
backup mensal
dos arquivos
utilizando
acesso remoto.
Erros e falhas no
computador.
Computador pode
apresentar muitos
problemas, por
falta de
manutenes
preventivas.
Provvel Alta
O computador fica
indisponvel para uso
no atendimento ao
pblico, uma vez que
preciso desloca-lo
para o setor de
suporte de TI, a fim
de executar
manuteno
corretiva.
Realizar
manuteno
preventiva por
meio de
assistncia
remota.
Quantidade
excessiva de
cabos rede de
internet.
Aumento
excessivo de
utilizao de cabos
ethernet.
Muito provvel Mdia
Desorganizao no
ambiente, e
probabilidade de
acontecer problemas
nos cabos.
Estruturar e
organizar
cabos de rede
ou adquirir
dispositivo
WI-FI.
Falhas de
equipamentos e
curto- circuito na
rede eltrica
(conforme
ISO/IEC27002:
Falta de
aterramento. Pouco provvel Alta
Choques eltricos,
equipamentos podem
no funcionar
corretamente, risco
de incndio.
Implantar um
aterramento.
30 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
2005)
Incndio
(conforme
ISO/IEC27002:
2005)
Falta de extintor de
incndio. Pouco provvel Alta
Risco de vida dos
funcionrios.
Adquirir
extintor de
incndio.
Alm da anlise dos riscos, realizou-se um diagnstico da infraestrutura de TI do
ambiente utilizando como base as respostas obtidas a partir dos questionrios e das
observaes in loco. Os resultados dessa anlise so exibidos na Tabela 4.
Tabela 4. Anlise das Observaes
Processo de TI Resultados encontrados
Hardware
- Falta de equipamentos reservas (nobreak, modem, impressora e switch);
- Falta de manuteno preventiva de hardware;
- Pouca memria RAM instalada em um dos computadores;
- Desligamento inesperado de computadores devido a bateria de o nobreak estar desgastada.
Recomendaes:
- Adotar polticas de manutenes preventivas: Fazer averiguaes nos equipamentos de TI para
acompanhar se esto funcionando corretamente;
- Incentivo de planejamento e investimento em novos hardwares: Adquirir equipamentos que
resultem na melhor execuo dos processos, realizar um levantamento de quais equipamentos
esto em desuso e quais precisam ser trocados, investir na compra de mais equipamentos de
hardware para serem substitutos caso venha acontecer algum problema.
Software
- Softwares instalados nos computadores esto em perfeito funcionamento.
- O software denominado de Kurupira mostrou-se interessante, pois proporciona bloqueio de sites
proibidos, no entanto foi observado que um dos computadores encontra-se sem esse software
instalado, permitindo assim o acesso a sites proibidos por parte do usurio.
- Foi encontrado um problema de um dos computadores est instalado o sistema operacional
Windows 7 de 32 bits, sendo que o computador possui 4GB de memria RAM, ocasionado assim
a perda de 1GB, ou seja, o computador est utilizando somente 3 GB da memria RAM.
Recomendaes:
- Adotar polticas de manuteno preventiva de software: verificar periodicamente se todos os
softwares dos computadores esto em perfeita configurao e funcionamento;
- Adotar polticas de legalidade: Verificar se os softwares proprietrios instalados nos
computadores esto todos licenciados;
- Instalar um sistema operacional de 64 bits no computador que possui mais de 4GB de memria,
a fim de aproveitar toda a memria RAM instalada neste computador.
Redes de
Computadores
- Limitao da rede;
- Perda do sinal DSL;
- Velocidade da internet lenta;
- Falta de compartilhamento dos arquivos;
- Acesso internet somente via cabo;
- Cabos de rede instados sem estruturao.
A conexo da rede cabeada, sendo observados problemas de limitao, pois o alcance no chega
a todos dentro da organizao. Alm disso, existem problemas constantes de queda do sinal de
internet e velocidade lenta. Outro problema identificado, que os arquivos dos computadores no
esto compartilhados em rede, dificultando assim o acesso rpido pelos funcionrios, fazendo com
que tenham que se descolar de um computador para outro.
Recomendaes:
- Reestruturar a rede da unidade a fim de ter melhor gerenciamento dos recursos e a
disponibilizao de servios de melhor qualidade;
- Adquirir um modem roteador WI-FI
- Aumentar velocidade contratada da internet;
- Ativar o compartilhamento de rede do Windows;
- Reestruturar cabos de rede, instalando-os em caneletas.
Servidores
(funcionrios)
- Existem 8 funcionrios na unidade, sendo 3 da rea administrativa, 2 fiscais, 1 inspetor, 1
motorista e 1auxiliar de servios gerais;
- No existe um cargo na rea de informtica dentro da organizao, mas um dos administrativos
responde pela rea da informtica;
- Falta de treinamento dos servidores que utilizam a TI para realizar suas atividades, muitas vezes
alguns servidores no sabem lidar com um software novo instalado nos computadores e tambm
no sabe lidar com equipamentos de hardware novos.
Recomendaes:
- Realizar treinamento dos usurios que utilizam a TI, para que assim possam ter conhecimento de
como utilizar a tecnologia corretamente e novas tendncias da TI. Uma vez que um usurio com
conhecimento evita problemas futuros na organizao, cada usurio tem que saber com qual
tecnologia est lidando no dia a dia.
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 31
Backup
- Foram encontrados muitos arquivos importantes armazenados nos computadores, mas no h
procedimento de backup dos mesmos, representando um grande risco de perda dos dados
armazenados nos computadores.
Recomendaes:
- Adotar polticas de backup: realizar o procedimento de guardar os arquivos em outros
dispositivos, como pendrives, HD externos, CDs, DVDs e servidores da nuvem e uma cpia
desses arquivos, em pelos menos em dois computadores da organizao, j que no existe um
servidor instalado.
Segurana do ambiente
- Falta de proteo na sala dos equipamentos de TI;
- Falta de sistema de alarmes instalados;
- Pouca proteo contra roubo de perifricos internos do computador;
- No existe extintor de incndio;
- No existe aterramento devidamente instalado.
- No adotar polticas de segurana, representa um problema srio organizao, como visto a
organizao no possui nem o mnimo exigido para garantir a segurana do ambiente.
Recomendao:
- Adotar polticas de segurana conforme a norma ISO/IEC NBR 27002;
- Adquirir uma trava de cabo para os computadores;
- Adquirir cadeados e chaveamento por senhas para dificultar a entrada de pessoas no autorizadas
sala de equipamentos da unidade;
- Instalar sistema de alarmes no prdio;
- Adquirir urgentemente um extintor de incndio;
- Realizar o aterramento para proteo dos equipamentos de TI e dos usurios.
Planejamento e
controle de TI
- Foi encontrada uma documentao sobre controle de equipamentos patrimonial denominado de
guia dos bens patrimoniais, contendo todos os bens da organizao, incluindo os equipamentos de
TI. Entretanto, no existe uma documentao especfica dos equipamentos de TI;
- No existe um planejamento estratgico direcionado tecnologia da informao na organizao;
- Pouco espao para acomodao dos equipamentos de TI.
Recomendao:
- Alocar os equipamentos de TI para um espao maior;
- Adotar polticas de planejamento e controle de TI: desenvolver um documento contendo todas as
informaes da Infraestrutura de TI atual, e tambm desenvolver um manual com os
procedimentos corretos para seu uso.
- Implementao de um sistema de inventrios de TI, que possibilite cadastrar todos os
equipamentos de TI, softwares, contratos, arquivos, problemas e incidentes encontrados na
unidade local. Com esse sistema possvel manter o controle da infra de TI, pois possibilita o
acesso a todas as informaes cadastradas sobre a infraestrutura tecnolgica da organizao, e
encontrar melhores solues para cada tipo de problema tratado.
De maneira geral foi visto que a infraestrutura de TI da unidade analisada est fora das
recomendaes descritas nos manuais e normas apresentados neste trabalho. Dentre os
problemas identificados, pode-se destacar a no realizao de um planejamento estratgico de
TI, e consequentemente no execuo de investimentos mnimos na melhoria da
infraestrutura, a no realizao de manutenes peridicas tanto em hardwares como em
softwares. A rede no gerenciada, e a infraestrutura existente hoje precria. Atualmente
no existe mecanismo de backup de arquivos. Os funcionrios no recebem treinamento para
utilizao correta e mais eficiente da TI. Alm disso, foram identificados srios problemas de
segurana, no existindo equipamentos considerados bsicos, como extintor.
Tais problemas dificultam que os objetivos da organizao sejam atendidos, sendo,
portanto imprescindvel que acontea uma mudana na forma de gerenciamento da
infraestrutura de TI. A situao encontrada prejudica a organizao local e a matriz, os seus
funcionrios, os usurios dos servios (como proprietrio e produtores rurais), e a
comunidade, que de forma indireta necessita que esses servios funcionem plenamente.
Com isso possvel constatar que o nvel de maturidade (de acordo com as
recomendaes do COBIT) da organizao analisada 0, uma vez que verificou-se que no
existe um processo definido, e a organizao no reconhece um gerenciamento a ser iniciado.
6. Consideraes Finais O presente trabalho foi direcionado para auditoria de infraestrutura de TI, atravs do COBIT e
de livros na rea foi possvel desenvolver questionrios para extrair informaes que deram
embasamento para conquistar o objetivo deste trabalho, ou seja, avaliar a infraestrutura de TI
de uma organizao pblica.
32 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Com a execuo do estudo de caso foi possvel perceber a realidade de como a
infraestrutura da unidade analisada organizada. Neste caso, constatou-se uma situao
precria, no existindo procedimentos regulares de manuteno preventiva de hardware,
software e rede. Alm de no existir um planejamento estratgico e consequentemente falta de
investimento na infraestrutura de TI, o que por sua vez afeta diretamente na qualidade dos
servios oferecidos pela unidade.
Atravs da avaliao foram realizadas algumas recomendaes de prticas a serem
seguidas pelos gestores, para o melhor aproveitamento dos processos de TI existentes e para
sanar os problemas encontrados.
O chefe responsvel pela unidade reconheceu os problemas existentes, e explicou que
no depende dele para realizar as mudanas necessrias na infraestrutura de TI, e sim de
superiores, mas afirma estar disposto a mudar isso, levando os resultados encontrados nesta
pesquisa ao diretor regional, a fim de discutirem e definirem estratgias para resoluo dos
problemas detectados.
Ficam aqui recomendaes para outras pesquisas no assunto, bem como outras formas
de avaliar uma infraestrutura de tecnologia da informao em uma organizao. Sendo assim,
como trabalhos futuros prope-se que este estudo seja ampliado, a fim de verificar se a
realidade encontrada nesta unidade a mesma de outras no Estado do Tocantins.
References
Albertin, Alberto Luiz. Administrao de Informtica: funes e fatores crticos de sucesso;
colaborao de Rosa Maria de Moura. 4 ed. So Paulo: Atlas, 2002.
Albertin, Alberto Luiz. Beneficio do uso de tecnologia da informao no desempenho
empresarial. GV pesquisa, 2005.
Associao Brasileira de Normas e Tcnicas ABNT. NBR ISO/IEC 27002: Tecnologia da
informao: Tcnicas de segurana: Cdigo de prtica para a gesto de segurana da
informao. Rio de Janeiro, 2005
CFC. Manual de Auditoria de Sistemas. Disponvel
em:. Acesso em: 21 de Mar. 2014.
COBIT 4.1 The IT Governance Institute. 2007. Disponvel em: <
http://www.isaca.org/knowledge-center/cobit/pages/overview.aspx >. Acesso em: 06Abr.
2014.
Dias, Cludia. Segurana e Auditoria da Tecnologia da Informao.1.ed. Rio de Janeiro:
Axcel Books, 2000.
Hanashiro, Mara. Metodologia Para Desenvolvimento De Procedimentos E Planejamento De
Auditorias De Ti Aplicada Administrao Pblica Federal. 2007. 168 p. Dissertao
(Mestrado em Engenharia Eltrica). Faculdade de Tecnologia, Universidade de Braslia,
Braslia/DF, 2007. Disponvel em:<
http://portal2.tcu.gov.br/portal/pls/portal/docs/2053984.PDF>. Acesso em: 09 Abr. 2014.
Hanashiro, Mara. Auditoria de TI na CGU. 2009. 95 p. Relatrio tcnico cientifico
(especializao em auditoria interna). TCU, Braslia/DF, 2009. Disponvel
em:. Acesso em: 02 Abr.
2014.
Miglioli, Afrnio Maia. Tomada de Deciso na Pequena Empresa. 2006. 107p.
Dissertao (Mestre em engenharia da produo). Escola de Engenharia de So Carlos, So
Carlos-SP, 2006. Disponvel
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 33
em:. Acesso em: 31 mai. 2015.
Monteiro, Gustavo Bastos. Auditoria de tecnologia da informao na administrao pblica
no mbito dos municpios do estado do rio de janeiro. 2008. 132 p. Dissertao
(Mestrado em administrao pblica). Escola
Brasileira de Administrao Publica , Fundao Getlio Vargas, Rio de Janeiro, 2008. Disp
onvel em:< http://www.ecg.tce.rj.gov.br/dissertacoes>. Acesso em: 28 Mar. 2015.
TCU. Manual de Auditoria Operacional. 2010. Disponvel
em:. Acesso em: 20 mar.
2015.
Weill; Peter; ROSS; Jeanne W. Governana de TI: Tecnologia da Informao. So Paulo: M.
Books Brasil Editora Ltda. 2006.
34 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Adequao e testagem do IMP Digital para a anlise do esquema
corporal1
Leomar Camargo de Souza, Pierre Soares Brando, Fernando Luiz de Oliveira4,
Fabiano Fagundes5
Mestrando em Informtica da Universidade de Braslia
3 Fisioterapeuta e Educador Fsico. Mestre em Gerontologia. Professor no curso de Educao
Fsica e de disciplinas institucionais do CEULP/ULBRA
4 Mestre em Cincia da Computao e Professor dos cursos de Sistemas de Informao e
Cincia da Computao do CEULP/ULBRA
5 Psiclogo,
Mestre em Cincia da Computao e Professor dos cursos de Sistemas de
Informao e Cincia da Computao do CEULP/ULBRA
[email protected], {pierrebrandao, fernando.luiz,
fagundes}@ceulp.edu.br
Resumo. O IMP Digital um software que visa automatizar a tcnica de Image
Marking Procedure (IMP) na avaliao das modificaes que o corpo humano sofre
ao longo do tempo. Para isso, o software utiliza o Microsoft Kinect na captura das
regies corpreas que avaliam o grau de Percepo Corporal que um indivduo tem
com o seu corpo. Entretanto, constatou-se que o software apresentava carncia de
funcionalidades para o gerenciamento das informaes das avaliaes realizadas.
Dessarte, o presente trabalho teve como objetivo o desenvolvimento de melhorias e
a implementao de novas funcionalidades ao software bem como a realizao de
testes para averiguar a preciso dos resultados fornecidos pelo software em
comparao ao mtodo tradicional - manual - da tcnica de IMP.
1. Introduo
Existem diversos estudos acerca da relao que o ser humano tem consigo e com seu corpo,
por meio da representao social na qual ele est inserido. Essa relao est diretamente
ligada Percepo Corporal (PC), que o reconhecimento que um indivduo tem de seu
corpo no decorrer da vida. Thurm (2007) afirma que a PC corresponde ao conjunto de
representaes neurofisiolgicas e espaciais que permite que o indivduo reconhea
conscientemente seu corpo e seus segmentos no tempo e no espao, com informaes
vivenciadas e armazenadas no decorrer da vida.
A PC pode ser decomposta em duas caractersticas primordiais: Imagem Corporal (IC)
e Esquema Corporal (EC). A IC definida como a conscincia que o ser humano tem em
relao ao seu convvio cultural e tico, associado a suas metas, expectativas, padres e
preocupaes (FERREIRA et al, 2012). O EC corresponde representao das partes do
corpo no espao e permite ao indivduo reconhecer estas partes e a interao que elas tm com
o meio, originando a percepo de sua dimenso corporal (CHAVES, 2014, p.16).
Um dos meios de se avaliar as alteraes sofridas pelo corpo em relao a PC
atravs da tcnica de IMP, proposta por Askevold (1975), em que o paciente projetado por
meio de um auto desenho e onde o EC avaliado sem que haja nenhum intermdio visual,
1 Projeto vinculado ao Grupo de Estudos e Pesquisa em Tecnologia, Sade e Qualidade de Vida GEPETS.
Endereo:
http://dgp.cnpq.br/dgp/espelhogrupo/8640931866899270
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 35
cognitivo ou qualquer artefato externo, com o intuito de fornecer resultados menos
tendenciosos. Existem outros meios para avaliar o EC, que atingem resultados equivalentes
aos resultados do IMP, como o caso do Kinesthetic Size Estimating Apparatus, ou Aparato
Sinestsico de Estimativa de Largura Corporal, que compreende um basto graduado em
centmetros em que o sujeito dever mostrar, por meio do posicionamento das mos no
basto, a largura dos pontos anatmicos tocados em seu corpo, que so os mesmos tocados no
IMP (THURM, 2007, p.28).
A caracterstica fundamental do IMP a marcao de sete pontos correspondentes as
regies do corpo do corpo humano, de modo que sejam calculados o ndice de Percepo
Corporal (IPC). So eles: o pice da cabea, a articulao acrmio-clavicular esquerda, a
articulao acrmio-clavicular direita, a curva da cintura esquerda, a curva da cintura direita,
o trocanter maior do fmur esquerdo e o trocanter maior do fmur direito.
Contudo, apesar do IMP ter sua eficincia comprovada cientificamente por meio de
diversos estudos no mundo inteiro, o uso do procedimento manual chega a ser exaustivo, pois
exige um dado esforo do avaliador para utilizao da tcnica e principalmente na coleta das
informaes para o clculo do IPC. Sendo assim, com essa viso, Chaves (2014) desenvolveu
um software capaz de substituir o mtodo tradicional e os materiais utilizados pelo IMP por
um mtodo automatizado, utilizando o Microsoft Kinect - pertencente ao console Xbox, em
que a mo a referncia para captura dos sete pontos referentes as regies do corpo. Contudo,
o software no armazenava nenhuma informao da avaliao para consultas posteriores, de
modo que, se um profissional desejasse salvar alguma informao da avaliao emitida pelo
software, teria que fazer tal processo de forma manual, acarretando gasto de tempo e material.
Tal situao tambm inviabilizava um trabalho de avaliao da preciso dos resultados
fornecidos pelo software em comparao ao mtodo tradicional da tcnica.
Com essas necessidades, o presente trabalho teve como objetivo o desenvolvimento de
melhorias para o software acrescentando funcionalidades para gerenciamento as avaliaes
realizadas e obteno de relatrio das avaliaes bem como realizar correes de algumas
funcionalidades existentes. Tambm fez parte do escopo desse trabalho a integrao do
software em uma plataforma, denominada FisioKinect, para agregao dos trabalhos
desenvolvidos no Grupo de Pesquisa do qual este projeto faz parte.
2. Metodologia
Para atingir os objetivos propostos neste trabalho, utilizou--se como desenho de estudo uma
pesquisa com finalidade metodolgica aplicada, objetivo metodolgico exploratrio e
natureza quantitativa, sendo realizado em laboratrio com procedimento quase experimental
em um estudo piloto para teste de acurcia. A Figura 1 apresenta um resumo de um modo
geral da metodologia utilizada no presente trabalho.
Figura 1. Etapas da metodologia
36 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Primeiramente, realizou--se um estudo das funcionalidades do software desenvolvido
por Chaves (2014), alm de conceitos referentes PC, IC, EC, IMP e IPC. Posteriormente,
consultou--se um profissional da sade com conhecimento das tcnicas do IMP tradicional
para realizar o levantamento de requisitos, onde foram desenvolvidas novas funcionalidades,
alm de corrigir funcionalidades j existentes.
Ao trmino da implementao, o software foi integrado ao projeto unificado do LTS,
que contm alguns softwares desenvolvidos em outros trabalhos, tais como software para
coleta de atributos antropomtricos e software para avaliao da amplitude e movimento,
dentre outros, de modo que eles se conectassem por meio de uma nica base de dados.
Por fim, realizou--se a coleta de avaliaes utilizando o mtodo tradicional do IMP e
posteriormente, utilizando o software em questo, para que fosse verificada a eficincia da
software em relao ao mtodo tradicional.
3. Desenvolvimento
O levantamento de requisitos aconteceu no primeiro trimestre de 2015, com a participao de
um profissional fisioterapeuta com conhecimento no domnio do IMP. Questes como layout,
usabilidade e disposio dos dados foram levantadas a fim de de tornar o uso da aplicao da
forma mais simples possvel. Posteriormente, iniciou-se o levantamento de requisitos para as
novas funcionalidades. As subsees seguintes exibem informaes do FisioKinect, bem
como informaes dos artefatos desenvolvidos durante o decorrer de todo o trabalho.
3.1. FisioKinect
A plataforma FisioKinect voltada especificamente para a integrao de softwares
desenvolvidos no Grupo de Pesquisa ao qual este trabalho est relacionado, que envolvem
anlises e avaliaes do corpo humano utilizando o Kinect. Ela conta com funcionalidades
para gerenciamento dos pacientes, de modo que haja um nico registro do mesmo na base de
dados, fazendo com que este seja utilizado em qualquer software integrado. Dessa forma,
possvel visualizar detalhadamente cada avaliao que foi realizada para um paciente
especfico, de modo que se tenha todas as informaes necessrias em poucos cliques.
Acrescente-se que cada software integrado segue o padro de design da plataforma,
para que o usurio tenha a impresso de estar usando um nico software, e no vrios
softwares integrados em uma plataforma. A Figura 2 apresenta a tela inicial do FisioKinect,
com os softwares desenvolvidas at o terceiro trimestre de 2015.
Figura 2. Tela inicial da plataforma FisioKinect
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 37
Conforme a Figura 2, at o presente momento, existem seis softwares integrados ao
projeto, que esto localizadas ao lado esquerdo da imagem. Ao lado direito, h um
datagrid para exibio dos pacientes cadastrados, e logo abaixo encontra-se as opes
para gerenci-los. No canto inferior direito h o boto Relatrio, para acesso aos softwares
que esto integrados e que contenham a funcionalidade de relatrios.
3.2. Gerenciar avaliaes
A primeira etapa de implementao foi desenvolver funcionalidades para gerenciamento das
avaliaes realizadas, j que o software no possua tal recurso implementado. A Figura 3
mostra a tela de gerenciamento das avaliaes realizadas atravs do software.
Figura 3. Tela de gerenciamento das avaliaes realizadas
Conforme exibe a figura acima, existe um boto Nova avaliao que, depois de
acionado, exibe uma nova janela para selecionar o paciente no qual se deseja realizar a
avaliao. O campo de texto ao meio responsvel pela pesquisa das avaliaes. O boto
Inserir IPC Manual responsvel por inserir o valor do IPC Geral de uma avaliao
realizada pelo mtodo tradicional, para que o usurio tenha tanto o resultado da avaliao feita
pelo sistema, quanto a avaliao feito pelo mtodo tradicional. Para isso, basta que o usurio
selecione uma avaliao que ainda no tenha o valor do IPC de uma avaliao pelo mtodo
tradicional e clique no boto mencionado, que uma nova tela ser exibida para que seja
informado o resultado obtido.
3.2.1. Nova avaliao
Para acessar tal funcionalidade, necessrio que o paciente esteja cadastrado na base de dados
do FisioKinect. Com o paciente selecionado, exibida a tela de avaliao, conforme ilustra a
Figura 4.
38 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Figura 4. Tela de avaliao da percepo corporal
No levantamento de requisitos, ficou definida a alterao do modo como eram
capturados os pontos relativos IP. Na verso anterior do software, eram capturados apenas
um ponto por cada regio do corpo, sendo assim, a nova abordagem consistiu em capturar trs
pontos para cada regio, totalizando 21 pontos para as sete regies. Com isso, cada vez que
uma regio capturada, calcula-se a mdia dos trs pontos, de acordo com a abordagem
proposta por Askvold (1975), que indica a necessidade de repetir-se a avaliao para maior
preciso. A sequncia de captura dos pontos pode ser verificada pelo usurio clicando no
boto azul a esquerda do box da Imagem Percebida.
Para iniciar uma avaliao, preciso que o paciente seja identificado pelo software.
Para isso, o mesmo tem que estar com as duas mos acima da cabea. Tal requisito foi
pensado para, caso haja a necessidade do avaliador entrar no campo de viso do Kinect, evitar
que este seja considerado na avaliao. Uma vez que tenha o paciente identificado, basta que
o avaliador clique no boto Iniciar Avaliao. Aps isso, o avaliado indica com a palma da
mo as regies que so avaliadas no IMP. Para capturar a regio existem duas formas: na
primeira, o paciente deve falar OK em voz alta; na segunda o avaliador clica no boto
Capturar Ponto quando tiver uma indicao do paciente para que o ponto seja capturado.
Aps realizar todo procedimento da avaliao, basta clicar no boto Resultado, quando ser
exibida a tela da Figura 5.
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 39
Figura 5. Tela de avaliao da percepo corporal
Como mostra a Figura 5, exibida a projeo da avaliao realizada e o IPC
Especfico de cada ponto capturado, alm do IPC Geral. A diferena entre essa tela de
resultados e tela original da aplicao o acrscimo do boto Salvar avaliao e a reduo
das opes de visualizao, logo abaixo da projeo. O motivo de tal reduo deu-se pelo fato
de que algumas das opes da antiga verso da aplicao estavam vinculadas a todos os
pontos capturados para cada regio do corpo. Sendo assim, essas opes tornaram-se
desnecessrias, uma vez que a mdia dos pontos de cada regio foi calculada na tela anterior.
Ao lado do box de IPC Especfico existe uma numerao e o boto ?, que, ao ser clicado,
exibe uma tela - Figura 6 - para identificar a referncia dos valores ao lado da numerao.
Figura 6. Tela de auxlio ao usurio quanto ao IPC Especfico
O IPC de cada regio do corpo calculado atravs da frmula:
. J o IPC Geral (IPCg) a mdia do IPC da altura da cabea, IPC da
largura do ombro, IPC da largura da cintura e o IPC da largura do trocnter.
3.2.2. Detalhes de uma avaliao Essa funcionalidade responsvel por exibir todos os dados da avaliao que foram salvos
pelo avaliador. Para isso, o usurio deve estar na tela apresentado na Figura 3 e clicar duas
vezes sobre a avaliao desejada. Feito isso, uma nova tela exibida, conforme a Figura 7.
40 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Figura 7. Tela de detalhes da avaliao
Alm de exibir todas as informaes presentes na tela de resultado - apresentado na
Figura 5 - ainda exibe o valor do IPC Geral da avaliao realizada pelo mtodo tradicional,
bem como sua classificao. Nessa funcionalidade tambm possvel imprimir as
informaes da avaliao.
3.3. Gerenciamento de relatrios
Uma vez que as informaes de uma avaliao so salvas, surgiu a necessidade da
implementao de um mdulo capaz de gerar os relatrios. Para isso, foi criada uma nica tela
para o relatrio referente PC. Nessa tela o usurio seleciona o tipo de relatrio desejado e
informa o(s) parmetro(s) de pesquisa, se houver.
Figura 8. Tela para emisso de relatrios
Vrios tipos de relatrios podem ser gerados pela tela acima, sem a necessidade de
mudar de tela, onde cabe ao usurio selecionar o tipo de relatrio desejado, no combobox
localizado no campo superior esquerdo da tela. Como existem vrias categorias de relatrios e
nem todas contm os mesmos tipos de parmetros, foi necessrio criar quatro diferentes
campos, para filtragem das informaes.
Na medida em que uma categoria de relatrio selecionada no combobox, h um
mtodo responsvel por fazer com que trs dos quatros campos fiquem invisveis. As
excees ficam para a relao geral, onde nenhum campo visvel e os relatrios com
intervalo de datas, onde dois campos ficam visveis.
3.4 Antiga verso do software em relao a nova verso
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 41
A antiga verso do software possua apenas duas telas: de avaliao e resultados. Abaixo, na
Figura 9 apresentado um antes e depois das alteraes realizadas.
Figura 9. Comparativo entre o antes e depois das alteraes do software
Como percebe-se, a nova verso visou deixar o layout da aplicao mais limpo,
mesmo com a adio de mais informaes na tela - que o caso da tela de avaliao. Tambm
foram reduzidas quatro opes no box Opes de Visualizao da tela de resultados, devido
nova abordagem para captura dos pontos referentes as regies do corpo, conforme explicado
anteriormente.
3.5 Testando o software
Os testes aconteceram na segunda quinzena de maio de 2015 no LTS, onde avaliou-se oito
pessoas com idade entre 19 e 41 anos. Primeiramente, coletaram-se os dados pelo mtodo
tradicional do IMP e posteriormente pela avaliao digital.
No procedimento manual utilizou-se papel craft e pincis para marcao dos pontos.
Nas avaliaes realizadas pelo software o sensor Kinect encontrava-se a 1,14m altura. A
distncia entre o participante e o dispositivo foi de 2,8m. A Tabela 1 exibe as classificaes
das avaliaes conforme a especificao proposta por Segheto et al. (2010).
Tabela 1. Classificao das avaliaes realizadas
PARTICIPANTE CLASSIFICAO MANUAL CLASSIFICAO DIGITAL
1 Normoesquemtico Normoesquemtico
2 Hipoesquemtico Normoesquemtico
3 Hipoesquemtico Normoesquemtico
4 Normoesquemtico Normoesquemtico
5 Hipoesquemtico Normoesquemtico
6 Hipoesquemtico Hipoesquemtico
7 Hipoesquemtico Hipoesquemtico
8 Normoesquemtico Hipoesquemtico
42 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Conforme exibido na Tabela 1, tem-se que houve concordncia entre a avaliao
tradicional e a avaliao digital em 4 dos 8 casos, superestimao em 3 casos e subestimao
em 1 caso.
importante ressaltar que na avaliao realizada pelo software o paciente utiliza a
palma da mo na captura dos pontos utilizados no IMP e, no procedimento manual, usado
um pincel para projetar os pontos no papel craft. Deste modo, h diferena quanto ao grau de
preciso dos pontos coletados, ainda assim, a ferramenta mostrou concordncia em metade
dos casos do estudo.
Este resultado no invalida a utilizao da ferramenta e novos estudos podem propor
novas faixas de valores de clculo e/ou formas de melhorar a preciso da captura dos pontos
com o kinect.
Outro detalhe importante que mesmo realizando duas avaliaes tanto pelo sistema
quanto pelo mtodo manual, quase impossvel obter os mesmos resultados. Sendo assim,
novos estudos devem avaliar no apenas a concordncia entre os mtodos, mas tambm intra
mtodos.
4. Concluso
As alteraes realizadas no IMP Digital simplificam o trabalho dos profissionais da sade,
fazendo com que as informaes referentes s avaliaes de Percepo Corporal sejam
gerenciadas de maneira mais eficiente, alm da possibilidade de gerenciar relatrios que
podem ser utilizado para acompanhamento do paciente quando este se submeta a um
tratamento de longa durao. A testagem da ferramenta mostrou concordncia entre os
resultados dos dois mtodos em metade dos casos, todavia novos estudos so necessrios.
5. Referncias
ASKEVOLD, Finn. Measuring Body Image. Psychotherapy And Psychosomatics, [s.l.], v.
26, n. 2, p.71-77, 1975. S. Karger AG.
CHAVES, Carlos Diego Carvalho. Automatizao do Image Marking Procedure para
anlise do esquema corporal utilizando o Kinect. 2014. 67 f. TCC (Graduao) - Curso
de Sistemas de Informao, Centro Universitrio Luterano de Palmas, Palmas - To, 2014.
FERREIRA, Cntia de Cssia et al. Anlise da imagem e esquema corporal em indivduos
com diagnstico de sndrome de ps-poliomielite. Revista Neurocincia, So Paulo, n. 20,
p.50-57, 2012.
SEGHETO, Wellington et al. Proposta de categorizao para anlise da percepo
corporal. In: I Simpsio Internacional de Imagem Corporal e o I Congresso Brasileiro de
Imagem Corporal, 1, 2010, Campinas: Centro de Convenes da Unicamp, 2010. P. 1 - 6.
THURM, Bianca Elisabeth. Efeitos da dor crnica em atletas de alto rendimento em
relao ao Esquema Corporal, Agilidade Psicomotora e estados de Humor. 82 f.
Dissertao (Mestrado) - Curso de Educao Fsica, Universidade So Judas Tadeu, So
Paulo, 2007.
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 43
Aplicao da tcnica de Text Mining para comentrios
relacionados ao contexto do Turismo
Felipe E. B. Schmitz, Parcilene F. de Brito
Sistemas de Informao Centro Universitrio Luterano de Palmas (CEULP/ULBRA)
Avenida Teotnio Segurado 1501 Sul Palmas TO Brazil
{felipeebs,parcilene}@gmail.com
Resumo. Este artigo apresenta o processo de Text Mining e anlise de dados
sobre uma base de comentrios extrados de um site relacionado temtica
turismo. Sobre o banco de dados minerado de comentrios de um site de turismo
e aspectos extrados atravs da tcnica de anlise de sentimentos por Christhie
(2015), aplicou-se a tcnica de associao com o algoritmo Apriori para extrair
as regras associativas entre os aspectos positivos mais frequentes nos
comentrios. A partir destas regras, foi possvel identificar conexes, analisar
como estes aspectos interagem e tirar concluses sobre a importncia destes
aspectos para o domnio estudado.
1. Introduo A criao de ferramentas de interao e colaborao na internet acarreta no crescimento
contnuo da quantidade de informaes disponveis sobre as mais diversas temticas. Uma
forma de colaborao que se tornou comum na internet foi o compartilhamento de opinies de
usurios sobre todo tipo de assunto. A grande quantidade de crticas fornecidas sobre um
produto ou servio se mostra valiosa, tanto para clientes que querem tomar a deciso
informada sobre o que ser adquirido, quanto para os fornecedores, inclusive concorrentes,
que querem conhecer os pontos positivos e negativos avaliados para se adaptar e conquistar
esses clientes.
Mas o acompanhamento dessa grande quantidade de informao se tornou
impraticvel sem o auxlio de ferramentas capazes de fazer agregaes e fornecer dados
sucintos e relevantes.
Este trabalho integra a pesquisa desenvolvida por Brito (2015), que tem como foco a
anlise de avaliaes de usurios sobre destinos tursticos. Em Christhie (2015), os
comentrios e dados relacionados foram extrados do site TripAdvisor, passaram por pr-
processamento e anlise de sentimentos a nvel de aspecto para extrair opinies positivas e
negativas. Depois de extrados e processados, os dados obtidos servem de entrada para
diversos tipos de anlises, entre eles a classificao, agrupamento e associao. O banco de
dados resultante foi utilizado como base para o presente trabalho.
2. Text Mining O Text Mining uma etapa intermediria do processo KDT, sigla em ingls para Descoberta
de Conhecimento em Textos. Dentro deste processo maior, a minerao de textos uma etapa
de recuperao da informao, que acontece aps a coleta de documentos e resulta em uma
base de informaes das quais ser extrado o conhecimento.
Segundo Feldman (2007, p. 1, traduo nossa), a minerao de texto ou Text Mining
pode ser definida como um processo anlogo ao Data Mining, no qual se extrai informaes
teis de documentos textuais atravs da identificao e explorao de padres interessantes.
Text Mining uma tcnica de automao de anlise de grandes quantidades de documentos
textuais para se obter conhecimento sobre um determinado domnio.
44 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Figura 1: Arquitetura bsica de um sistema de Text Mining
Fonte: Schmitz (2015, p. 7)
Na Figura 1, Tokenizao refere-se separao do texto nos documentos a serem
analisados, atravs da remoo de smbolos e marcaes. Normalizao Lxica e Morfolgica
referem-se preparao desse texto para ser processado e, de certa forma, compreendido por
um computador. Anlise Sinttica a parte do processo em que o texto processado e
organizado por algum algoritmo preparado para encontrar padres e auxiliar no processo de
Extrao da Informao, que de fato o momento em que um especialista analisa o que foi
encontrado para extrair conhecimento sobre o domnio. Todas estas etapas so explicadas com
mais detalhes nas sees subsequentes.
2.1. Captao de dados textuais
O elemento chave do Text Mining a coleo de documentos, que pode ser definida como
qualquer grupo de elementos textuais a serem processados. Os elementos textuais podem
variar de pequenos trechos de poucos caracteres at livros completos, e a quantidade entre
algumas centenas at dezenas de milhes (e contando). A coleo de documentos pode ser
esttica, contendo apenas os elementos coletados inicialmente, ou dinmica, caracterizada
pela incluso de novos elementos ao longo do tempo.
Os documentos podem ser coletados a partir de uma base (e.g. PubMed, IEEExplore,
ACM Digital Library, Domnio Pblico), fornecidos manualmente (arquivos ou textos
alimentados por um ser humano) ou obtidos com o uso de um crawler, que descobre
elementos textuais a partir de uma pgina web e links subsequentes.
2.2. Pr-processamento
Esta etapa da minerao de texto consiste em preparar a coleo de documentos para a
extrao do conhecimento. Ela pode ser dividida em alguns processos gerais, mas podem
variar em quantidade de acordo com a necessidade de preparao do domnio. A ordem mais
comum desses processos pode ser observada na Figura 2. Figura 2: Etapas comuns do pr-processamento
Fonte: Schmitz (2015, p. 8).
A Anlise Lxica (Tokenizao) consiste na converso de uma cadeia de caracteres de
entrada em um vetor de palavras ou tokens, isto , a separao de palavras e eliminao de
marcaes, smbolos, caracteres especiais e espaos. Nesta etapa tambm podem ser
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 45
utilizados dicionrios de sinnimos para padronizar o texto e eliminar possveis erros
ortogrficos.
A Identificao de Termos Compostos (Word-phrase formation) a deteco de
conceitos que s podem ser expressos atravs da utilizao de duas ou mais palavras
adjacentes, as quais perdem o sentido quando separadas. Para isso podem ser utilizadas
tcnicas de contage de palavras ou dicionrios de termos pr-definidos.
A Remoo de Termos Irregulares (stopwords) a etapa em que ocorre a remoo de
palavras que no fazem diferena na indexao, como artigos, conjunes e preposies.
Essas palavras podem apresentar uma frequncia muito alta e no tem nenhum valor para a
busca dentro do contexto do documento, por isso devem ser removidas antes da extrao do
conhecimento.
A Normalizao Morfolgica (stemming) consiste na reduo de palavras ao seu
radical pela eliminao de sufixos, plurais e inflexes de gnero. Com esse processo
possvel diminuir o tamanho de um documento em at 50% (MORAIS, 2007).
O Clculo de Relevncia visa identificar em um texto quais palavras representam
maior peso ou relevncia em relao s outras palavras. A definio desse peso pode ser
calculada, dependendo do caso, analisando-se a frequncia, posio sinttica, palavras
adjacentes, estrutura do documento e at a classe gramatical de um termo.
2.3. Organizao dos documentos da coleo
A prxima etapa do Text mining consiste na organizao dos documentos da coleo. Os
documentos podem passar por dois processos distintos, a classificao ou clustering.
A Classificao o processo assistido de separao dos documentos em categorias pr-
determinadas, onde necessrio um treinamento prvio do algoritmo para poder reconhecer a
categoria de um texto.
Clustering o processo no supervisionado de separao dos documentos por semelhana e
correlao de contedo, que no utiliza categorias pr-definidas. O clustering pode ser plano,
onde os documentos so separados em um nmero de conjuntos no-relacionados, ou
hierrquico, onde todos os documentos esto relacionados, mas so divididos em grupos cada
vez menores de acordo com as diferenas.
2.4. Anlise de dados Regras de associao (Apriori)
Anlise de dados a atividade de transformar um conjunto de dados de maneira a possibilitar
uma anlise racional. Existem diversas formas de anlise de dados, de listagem, tabelas e
grficos a regras de associao. Para a aplicao no domnio do trabalho foi utilizada uma
tcnica de associao chamada Apriori.
Regras de associao tem o objetivo de determinar os elementos que implicam a
presena de outros elementos em um conjunto, ou seja, identificar padres frequentes de
dados.
O algoritmo Apriori, introduzido inicialmente por Agrawal (1993), parte do princpio
de que, se um conjunto frequente, todos seus subconjuntos tambm devem ser frequentes. A
anlise consiste nas duas etapas a seguir. (1) identificar conjuntos frequentes e (2) gerar regras
de associao a partir dos conjuntos frequentes. Para um melhor entendimento do processo,
considere o fluxograma apresentado na Figura 3.
46 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
Figura 3: Fluxograma do algoritmo Apriori
Fonte: Schmitz (2015, p. 15).
Como primeiro passo, o algoritmo identifica os conjuntos possveis com a quantidade
de itens (k) mnima, ou seja, os itens nicos existentes no conjunto. Em cada iterao o k
incrementado para a gerao de conjuntos (itemsets) candidatos.
Conjuntos candidatos so todas as possibilidades de combinaes de tamanho k entre
os itens do conjunto anterior. Itemsets frequentes so os conjuntos, dentre os candidatos, que
tm o suporte mnimo, ou seja, que ocorrem pelo menos um nmero determinado de vezes. O
suporte pode ser uma quantidade fixa no algoritmo ou uma porcentagem referente ao nmero
total de dados.
Estes passos do algoritmo repetem-se at que seja gerado um conjunto vazio de
itemsets frequentes, i.e., quando no h ocorrncias com o suporte mnimo para nenhum
conjunto candidato. Neste caso, as listas de conjuntos frequentes das iteraes anteriores so
utilizadas para a gerao das regras de associao.
Para se gerar as regras de associao, cada Itemset frequente passa por duas
etapas. Na primeira etapa os conjuntos so divididos em todos seus subconjuntos
possveis. Na segunda etapa so filtrados os conjuntos com a confiana mnima. A confiana
c calculada a partir do suporte (frequncia) do conjunto I em relao ao conjunto S
( ). As regras com a confiana maior ou igual mnima so,
ento, sugeridas no formato .
3. Metodologia Para a realizao da anlise dos dados foi escolhida a ferramenta Weka, desenvolvida na
Universidade de Waikato, que consiste em uma coleo de algoritmos de anlise de dados e
aprendizado de mquina e fornece uma interface grfica que facilita a configurao e
utilizao desses algoritmos. O Weka trabalha com um formato de arquivo prprio, ARFF
(Attribute-Relation File Format), que descreve instncias que compartilham os mesmos
atributos. Os dados extrados para anlise foram convertidos para este formato utilizando uma
biblioteca JAVA fornecida junto com a ferramenta.
XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767 47
4. Resultados Para realizar as anlises foram extrados os 20 aspectos positivos (caractersticas sobre
destinos tursticos) com maior frequncia entre as avaliaes (comentrios de usurios do site
TripAdvisor) e os dados foram exportados considerando a presena ou ausncia de tal aspecto
em cada comentrio. A lista de aspectos foi, depois, alterada pare remover aspectos
redundantes.
Com a lista de aspectos, foi realizada a consulta no banco de dados que extrai a lista
de aspectos, dentre os 20 analisados, para cada comentrio. Aps a filtragem de valores
vazios, esta consulta retornou 894.310 resultados. Para esta anlise, a confiana mnima das
regras de associao foi modificada para retornar uma quantidade satisfatria de regras sobre
o nmero elevado de conjuntos analisados. O algoritmo encontrou 82 regras de associao
com confiana entre 40% de 51%.
Segundo anlise das regras de associao pela especialista no domnio, responsvel
pelo projeto desenvolvido em Brito (2015), essas inferncias indicam algumas relaes
interessantes para anlise de produtos tursticos. Por exemplo a grande ocorrncia do aspecto
hotel nos comentrios. Hotel um dos trs objetos gerais do estudo (Hotel, Restaurante e
Atraes), mas utilizado pelos autores dos comentrios tanto como um objeto quanto uma
caracterstica (aspecto), ou seja, hotel, juntamente com outras caractersticas relacionadas,
citado por usurios do site como um fator importante para descrever suas experincias.
Nas tabelas a seguir so apresentadas as regras de associao geradas a partir da
aplicao do algoritmo Apriori. A primeira coluna apresenta a Premissa, um conjunto
frequente de aspectos. Em seguia a quantidade de ocorrncias (suporte) desta premissa. A
terceira coluna apresenta a quantidade de ocorrncias do aspecto analisado (resultado) e a
ltima coluna apresenta a confiana da regra, baseada nos dois nmeros anteriores. Cada
tabela apresenta as premissas e ocorrncias de apenas um aspecto, seguidas de um grfico
para melhor analisar as frequncias e o ndice de confiana. Tabela 1: Regras de associao com consequncia Hotel
Premissa Ocorrncia Ocorrncia
Hotel
Confiana
restaurante "cafe da manha" quartos 459 219 0.48
comida funcionarios quartos 334 159 0.48
comida "cafe da manha" quartos 242 109 0.45
restaurante "cafe da manha" vista 210 94 0.45
restaurante quartos 2059 921 0.45
comida "cafe da manha" funcionarios 254 113 0.44
restaurante "cafe da manha"
funcionarios 389 169
0.43
restaurante funcionarios quartos 238 102 0.43
atendimento restaurante quartos 549 234 0.43
"cafe da manha" qualidade
funcionarios 335 142
0.42
restaurante "cafe da manha" 2583 1078 0.42
restaurante localizacao "cafe da
manha" 684 285
0.42
atendimento restaurante localizacao
"cafe da manha" 214 89
0.42
atendimento restaurante "cafe da
manha" 687 284
0.41
restaurante localizacao quartos 516 213 0.41
48 XVII Encoinfo Congresso de Computao e Sistemas de Informao ISSN: 2447-0767
comida quartos 2418 996 0.41
"cafe da manha" quartos opcoes 256 104 0.41
pratos quartos 251 101 0.4
comida "cafe da manha" 1565 627 0.4
comida localizacao quartos 385 154 0.4
A Tabela 1 apresenta as premissas que tiveram como consequncia o aspecto
hotel, e as ocorrnc