Upload
rommel-carvalho
View
130
Download
0
Embed Size (px)
Citation preview
Mapeamento de Risco de Corrupção naAdministração Pública Federal
Brasil 100% Digital: 2º Seminário sobre Análise de Dados na Administração Pública | 25/08/2016 @ TCU
Dr. Rommel Novaes Carvalho – Coordenador-Geral do ODP/DIE/CGU | https://about.me/rommelnc
Mapeamento de Risco de Corrupção na Administração Pública Federal
Identificação de risco de corrupção através da análise cadastral, histórica e comportamental do servidor público
Mapeamento de Risco de Corrupção na APFMapeamento de Risco de Corrupção na APFMapeamento de Risco de Corrupção na APFMapeamento de Risco de Corrupção na APFMapeamento de Risco de Corrupção na APF
Introdução
Mapeamento de Risco de Corrupção na APF
2014 2017
RISCOMÉDIO
RISCOALTO
DIRIGENTE UNIDADE
Introdução
Introdução
Desafio: Transformar dados em indicadores confiáveis
Como?Mineraçãode Dados
Estatística ConhecimentoEspecializado dosAnalistas da DIE
Computação emLarga Escala
Cor
Vínculos Societários
Auditorias
Cargo
Função
Punições
Filiações
/Referência de Corrupção:Cadastro de Expulsões (CEAF)
Dirigentes:Servidores com Naturezas de
Responsabilidade
Unidades:UGs não-virtuais
responsáveis por dotação
PARÂMETROSATRIBUTOS
Introdução
2012Problema: Falta visão de corrupção
Poder decisório, dotação e histórico
Mapa de um ministério construído manualmente em 6 meses
2013Problema: Falta de automatização
Indicadores arbitrados e integração de bases
Mapa para dois ministérios automatizado
2014Problema: Excesso de subjetividade
Abordagem estatística
Modelos estatísticos intermediários sendo validados
2015Problema: Falta de método científico
Mineração de dados
Metodologia desenvolvida e Versão Beta construída
ENVOLVIDOS NO PROJETO 4 doutores, 6 mestres
Artigos relacionados publicados e a publicarDissertações defendidas na parte técnica
Introdução
Servidor
Cargo Técnico
Demitido em 2010 por valer-se do cargo para lograr proveito pessoal ou de outrem
INVESTIGAÇÃO MARA
Sem vínculos com empresas Uma filiação partidária Proprietário de um carro comum
Risco do Servidor:
MUITO ALTO
Cenários
Cenários
Servidora
Analista aposentada
Responsável pela conformidade contábil
Condenada pelo TCU a devolver recursos para União
Contas julgadas irregulares
INVESTIGAÇÃO MARA
Risco da Servidora:
MUITO ALTO
Suporte Estatístico Inicial 2
1 12
k l
ij iji j
ij
O E
E
Embasamento Teórico
AgregaçãoPivoteamento
PadronizaçãoAtualização
Tratamento Básicode Dados
Discretização
Normalização
Sampling
Datasets
Pré-Processamentode Dados
Seleção de Atributos Relevantes
Aprendizagem de Máquina
Validação de Modelos
Ajuste de Modelos
Teste deModelo Final
Implantação
de Modelo no Sistema
ModeloFinal
Confiável?
SIM
Mineração de Dados
Exemplo: “7) Análise Intermediária” inclui Análise de Correlação Dados de 242.000 linhas por 12.000 colunas Código vetorizado 20 cores full = 2 horas
Mineração de Dados
1º Loop (5000 iterações) = 200.000 modelos 12+ cores = Sem memória 10 cores = 7 horas full2º Loop (1000 iterações) = 11.000 modelos 20 cores = 30 minutos full
Amostra dos dados: 305.569 linhas de 2.287 variáveis = 5 GB1º Loop = 5000 iter.2º Loop = 1000 iter.
Mineração de Dados
Mais que Minerar
Alguns dados da construção da versão Beta:18 bases de dados utilizadas (+500 GB)5.000 horas de trabalho4.376 atributos elaborados62.204 atributos de interação76 atributos selecionados > 1022 possibilidadesGodzilhões de cálculos estatísticos10 produtos descritos, sendo 3 implementados296 páginas de Wiki150 arquivos produzidos23.000 linhas de código31.476 dirigentes e 5.186 UGs abordados
Transforma DADOS em CONHECIMENTO ESTRATÉGICO Vasta gama de técnicas e tecnologias de ponta utilizadas Possibilita atualização constante
Produto sempre em desenvolvimento Incentiva atuação a priori – e isso é HOJE!
Inúmeros desafios Infraestrutura x Escalabilidade x Equipe capacitada Atividades rotineiras x Dedicação ao projeto x Equipe disponível
Conclusão
Mapeamento de Risco de Corrupção naAdministração Pública Federal
Brasil 100% Digital: 2º Seminário sobre Análise de Dados na Administração Pública | 25/08/2016 @ TCU
Dr. Rommel Novaes Carvalho – Coordenador-Geral do ODP/DIE/CGU | https://about.me/rommelnc
data-science-gov-br