23
Filiação Partidária e Risco de Corrupção de Servidores Públicos Federais Ricardo Silva Carvalho – CGU/SE/DIE/CGIE Brasil 100% Digital: 1º Seminário sobre Análise de Dados na Administração Pública | 11/09/2015 @ TCU

Filiação partidária e risco de corrupção de servidores públicos federais

Embed Size (px)

Citation preview

Page 1: Filiação partidária e risco de corrupção de servidores públicos federais

Filiação Partidária e Risco de Corrupção

de Servidores Públicos Federais

Ricardo Silva Carvalho – CGU/SE/DIE/CGIEBrasil 100% Digital: 1º Seminário sobre Análise de Dados na

Administração Pública | 11/09/2015 @ TCU

Page 2: Filiação partidária e risco de corrupção de servidores públicos federais

Roteiro

1) Introdução

2) Entendimento do Negócio

3) Entendimento dos Dados

4) Preparação dos Dados

5) Modelagem

6) Avaliação

7) Conclusão

CRISP-DM

2

Page 3: Filiação partidária e risco de corrupção de servidores públicos federais

Roteiro

1) Introdução

2) Entendimento do Negócio

3) Entendimento dos Dados

4) Preparação dos Dados

5) Modelagem

6) Avaliação

7) Conclusão

CRISP-DM

3

Page 4: Filiação partidária e risco de corrupção de servidores públicos federais

Introdução

INTERESSESILEGÍTIMOS

CORRUPÇÃO FILIAÇÃO

PartidoPolítico

4

Page 5: Filiação partidária e risco de corrupção de servidores públicos federais

Introdução

Objetivo

5

Page 6: Filiação partidária e risco de corrupção de servidores públicos federais

Roteiro

1) Introdução

2) Entendimento do Negócio

3) Entendimento dos Dados

4) Preparação dos Dados

5) Modelagem

6) Avaliação

7) Conclusão

CRISP-DM

6

Page 7: Filiação partidária e risco de corrupção de servidores públicos federais

Entendimento do Negócio

DIE

PREVENÇÃO E COMBATE À CORRUPÇÃO

Diretoria de Pesquisas e InformaçõesEstratégicas

Servidores públicos federaisalocados em todos os estados

PRIORIZAÇÃO EFETIVAEM LARGA ESCALA

SERVIDORPÚBLICOFEDERAL

EquipeReduzida

7

Page 8: Filiação partidária e risco de corrupção de servidores públicos federais

Roteiro

1) Introdução

2) Entendimento do Negócio

3) Entendimento dos Dados

4) Preparação dos Dados

5) Modelagem

6) Avaliação

7) Conclusão

CRISP-DM

8

Page 9: Filiação partidária e risco de corrupção de servidores públicos federais

Entendimento dos Dados

SIAPE TSE

BD PRINCIPALSERVIDORES

FILIADOS

TCURFBCGU

CEAFCORRUPTOSFILIADOS

NÃO-CORRUPTOSFILIADOS

CORRUPTONÃO-CORRUPTO

SERVIDOR PÚBLICO

Cadastro de servidores

Dados de filiação partidária

9

Page 10: Filiação partidária e risco de corrupção de servidores públicos federais

Entendimento dos Dados

SIAPE TSE

CORRUPTOSFILIADOS

NÃO-CORRUPTOSFILIADOS

2

1 12

k l

ij ij

i j

ij

O E

E

2

1 158

H0: Variáveis sãoindependentes

H0 não pode ser aceita

10

Page 11: Filiação partidária e risco de corrupção de servidores públicos federais

Roteiro

1) Introdução

2) Entendimento do Negócio

3) Entendimento dos Dados

4) Preparação dos Dados

5) Modelagem

6) Avaliação

7) Conclusão

CRISP-DM

11

Page 12: Filiação partidária e risco de corrupção de servidores públicos federais

Preparação dos DadosCORRUPTOSFILIADOS

NÃO-CORRUPTOSFILIADOS

LIMPEZA DE DADOS Valores inválidos

Total de dias filiado

Número máximo de diasfiliado a um partido

Maior código de motivo de cancelamento

SELEÇÃO DE ATRIBUTOS Correlation-Based 3 atributos selecionados

UNDERSAMPLING Não-Corruptos filiados

AGREGAÇÃO 6 Atributos

ATRIBUTOS FINAIS

12

Page 13: Filiação partidária e risco de corrupção de servidores públicos federais

Preparação dos Dados

DISCRETIZAÇÃO Multi-interval (MI) Equal-Freq. (EQ) Prop. K-int. (PKI)

9

NORMALIZAÇÃOMédia 0Variância 1

1

10 datasets

Total de dias filiado

Número máximo de dias filiado a um partido

Maior código de motivo de cancelamento

ATRIBUTOS FINAIS

13

Page 14: Filiação partidária e risco de corrupção de servidores públicos federais

Roteiro

1) Introdução

2) Entendimento do Negócio

3) Entendimento dos Dados

4) Preparação dos Dados

5) Modelagem

6) Avaliação

7) Conclusão

CRISP-DM

14

Page 15: Filiação partidária e risco de corrupção de servidores públicos federais

Modelagem

TREINAMENTO = 90%

TESTE = 10%

Bayesian Networks (BN)Random Forest (RF)Support Vector Machines (SVM)Artificial Neural Networks (ANN)

MetaCost WRAPPER[0.0 1.0][5.0 0.0]

CUSTO de FALSOS POSITIVOS

15

Modelagem 4 algoritmos x 10 datasets = 40 modelos

Page 16: Filiação partidária e risco de corrupção de servidores públicos federais

Roteiro

1) Introdução

2) Entendimento do Negócio

3) Entendimento dos Dados

4) Preparação dos Dados

5) Modelagem

6) Avaliação

7) Conclusão

CRISP-DM

16

Page 17: Filiação partidária e risco de corrupção de servidores públicos federais

Avaliação

DATASET 4 Atrib. 1 = MI Atrib. 2 = PKI

RESULTADO MÉDIO DOS 4 ALGORITMOS PARA CADA DATASET

17

Page 18: Filiação partidária e risco de corrupção de servidores públicos federais

Avaliação

RANDOM FOREST

RESULTADO FINAL POR ALGORITMO PARA DATASET 4

18

Page 19: Filiação partidária e risco de corrupção de servidores públicos federais

Avaliação

86%15% +13% +12% - 7% +

COMPARAÇÃO FINAL ENTREMODELO DE ESPECIALISTAS

E MODELO GERADO PELO RANDOM FOREST(DADOS DE TESTE)

19

Page 20: Filiação partidária e risco de corrupção de servidores públicos federais

Avaliação

CONFIRMOU+ COD_MAIOR_MOTIV_CANC

+ RISCO DE CORRUPÇÃO

IGNOROUNR_PARTIDOS_FILIADO

GANHO DE CONHECIMENTO+ NR_DIAS_FILIADO

- RISCO DE CORRUPÇÃO

VISUALIZAÇÃO DE UMA DAS ÁRVORES DO MODELO

20

Page 21: Filiação partidária e risco de corrupção de servidores públicos federais

Roteiro

1) Introdução

2) Entendimento do Negócio

3) Entendimento dos Dados

4) Preparação dos Dados

5) Modelagem

6) Avaliação

7) Conclusão

CRISP-DM

21

Page 22: Filiação partidária e risco de corrupção de servidores públicos federais

Conclusão

1) Dados apoiam hipótese (Filiação Partidária Corrupção)

2) Resultados justificam uso de aprendizagem de máquina

3) Análise piloto de risco de corrupção na DIE / CGU

4) Trabalho gerou artigo aceito em conferência internacional BRACIS 2014 – Brazilian Conference on Intelligent Systems Using Political Party Affiliation Data to Measure Civil Servants’ Risk of Corruption

http://ieeexplore.ieee.org/xpl/articleDetails.jsp?arnumber=6984825

22

Page 23: Filiação partidária e risco de corrupção de servidores públicos federais

Obrigado!

Ricardo Silva Carvalho – CGU/SE/DIE/CGIE

[email protected]

[email protected]

LinkedIn: br.linkedin.com/in/ricardoscr

23