Mapeamento de risco de corrupção na administração pública federal

Preview:

Citation preview

Mapeamento de Risco de Corrupção naAdministração Pública Federal

Brasil 100% Digital: 2º Seminário sobre Análise de Dados na Administração Pública | 25/08/2016 @ TCU

Dr. Rommel Novaes Carvalho – Coordenador-Geral do ODP/DIE/CGU | https://about.me/rommelnc

Mapeamento de Risco de Corrupção na Administração Pública Federal

Identificação de risco de corrupção através da análise cadastral, histórica e comportamental do servidor público

Mapeamento de Risco de Corrupção na APFMapeamento de Risco de Corrupção na APFMapeamento de Risco de Corrupção na APFMapeamento de Risco de Corrupção na APFMapeamento de Risco de Corrupção na APF

Introdução

Mapeamento de Risco de Corrupção na APF

2014 2017

RISCOMÉDIO

RISCOALTO

DIRIGENTE UNIDADE

Introdução

Introdução

Desafio: Transformar dados em indicadores confiáveis

Como?Mineraçãode Dados

Estatística ConhecimentoEspecializado dosAnalistas da DIE

Computação emLarga Escala

Cor

Vínculos Societários

Auditorias

Cargo

Função

Punições

Filiações

/Referência de Corrupção:Cadastro de Expulsões (CEAF)

Dirigentes:Servidores com Naturezas de

Responsabilidade

Unidades:UGs não-virtuais

responsáveis por dotação

PARÂMETROSATRIBUTOS

Introdução

2012Problema: Falta visão de corrupção

Poder decisório, dotação e histórico

Mapa de um ministério construído manualmente em 6 meses

2013Problema: Falta de automatização

Indicadores arbitrados e integração de bases

Mapa para dois ministérios automatizado

2014Problema: Excesso de subjetividade

Abordagem estatística

Modelos estatísticos intermediários sendo validados

2015Problema: Falta de método científico

Mineração de dados

Metodologia desenvolvida e Versão Beta construída

ENVOLVIDOS NO PROJETO 4 doutores, 6 mestres

Artigos relacionados publicados e a publicarDissertações defendidas na parte técnica

Introdução

Servidor

Cargo Técnico

Demitido em 2010 por valer-se do cargo para lograr proveito pessoal ou de outrem

INVESTIGAÇÃO MARA

Sem vínculos com empresas Uma filiação partidária Proprietário de um carro comum

Risco do Servidor:

MUITO ALTO

Cenários

Cenários

Servidora

Analista aposentada

Responsável pela conformidade contábil

Condenada pelo TCU a devolver recursos para União

Contas julgadas irregulares

INVESTIGAÇÃO MARA

Risco da Servidora:

MUITO ALTO

Suporte Estatístico Inicial 2

1 12

k l

ij iji j

ij

O E

E

Embasamento Teórico

AgregaçãoPivoteamento

PadronizaçãoAtualização

Tratamento Básicode Dados

Discretização

Normalização

Sampling

Datasets

Pré-Processamentode Dados

Seleção de Atributos Relevantes

Aprendizagem de Máquina

Validação de Modelos

Ajuste de Modelos

Teste deModelo Final

Implantação

de Modelo no Sistema

ModeloFinal

Confiável?

SIM

Mineração de Dados

Exemplo: “7) Análise Intermediária” inclui Análise de Correlação Dados de 242.000 linhas por 12.000 colunas Código vetorizado 20 cores full = 2 horas

Mineração de Dados

1º Loop (5000 iterações) = 200.000 modelos 12+ cores = Sem memória 10 cores = 7 horas full2º Loop (1000 iterações) = 11.000 modelos 20 cores = 30 minutos full

Amostra dos dados: 305.569 linhas de 2.287 variáveis = 5 GB1º Loop = 5000 iter.2º Loop = 1000 iter.

Mineração de Dados

Mais que Minerar

Alguns dados da construção da versão Beta:18 bases de dados utilizadas (+500 GB)5.000 horas de trabalho4.376 atributos elaborados62.204 atributos de interação76 atributos selecionados > 1022 possibilidadesGodzilhões de cálculos estatísticos10 produtos descritos, sendo 3 implementados296 páginas de Wiki150 arquivos produzidos23.000 linhas de código31.476 dirigentes e 5.186 UGs abordados

Transforma DADOS em CONHECIMENTO ESTRATÉGICO Vasta gama de técnicas e tecnologias de ponta utilizadas Possibilita atualização constante

Produto sempre em desenvolvimento Incentiva atuação a priori – e isso é HOJE!

Inúmeros desafios Infraestrutura x Escalabilidade x Equipe capacitada Atividades rotineiras x Dedicação ao projeto x Equipe disponível

Conclusão

Mapeamento de Risco de Corrupção naAdministração Pública Federal

Brasil 100% Digital: 2º Seminário sobre Análise de Dados na Administração Pública | 25/08/2016 @ TCU

Dr. Rommel Novaes Carvalho – Coordenador-Geral do ODP/DIE/CGU | https://about.me/rommelnc

data-science-gov-br

Recommended