Processos Pontuais Espaciais para dados das unidades ... · rando coordenadas e logaritmo da taxa de ocupa˘c~ao prisional na dimens~ao.54 4.4 Moda e intervalo de credibilidade de

Processos Pontuais Espaciais para dados

das unidades prisionais no Brasil

Rebecca de Oliveira Souza

Universidade Federal do Rio de Janeiro

Instituto de Matematica

Departamento de Metodos Estatısticos

2018

Processos Pontuais Espaciais para dadosdas unidades prisionais no Brasil


Dissertacao de Mestrado submetida ao Programa de Pos-Graduacao em Estatıstica do

Instituto de Matematica da Universidade Federal do Rio de Janeiro, UFRJ, como parte

dos requisitos necessarios a obtencao do grau de Mestre em Estatıstica.

Orientadora: Marina Silva Paez

Coorientador: Vinicius Pinheiro Israel

Rio de Janeiro, RJ - Brasil

2018

ii

Processos Pontuais Espaciais para dadosdas unidades prisionais no Brasil


Dissertacao de Mestrado submetida ao Programa de Pos-Graduacao em Estatıstica

do Instituto de Matematica da Universidade Federal do Rio de Janeiro - UFRJ, como

parte dos requisitos necessarios a obtencao do tıtulo de Mestre em Estatıstica.

Aprovada por:

Rio de Janeiro, RJ - Brasil

2018

iii

CIP - Catalogação na Publicação

Elaborado pelo Sistema de Geração Automática da UFRJ com osdados fornecidos pelo(a) autor(a).

S719pSouza, Rebecca de Oliveira Processos Pontuais Espaciais para dados dasunidades prisionais no Brasil / Rebecca de OliveiraSouza. -- Rio de Janeiro, 2018. 103 f.

Orientadora: Marina Silva Paez. Coorientador: Vinicius Pinheiro Israel. Dissertação (mestrado) - Universidade Federal doRio de Janeiro, Instituto de Matemática, Programade Pós-Graduação em Estatística, 2018.

1. Estatística Espacial. 2. Inferência bayesiana.3. Processo de Cox. 4. Aprisionamento no Brasil. I.Paez, Marina Silva, orient. II. Israel, ViniciusPinheiro, coorient. III. Título.

iv

Agradecimentos

Agradeco, primeiramente, a Deus por nunca desistir de mim. Pelo Seu amor incon-

dicional e pela fe que me faz seguir em frente.

Aos meus pais Alexandre Carlos e Adriana Goncalves por todo carinho e cuidado.

Por entenderem todo meu estresse e me darem conforto quando eu mais precisei.

Aos meus orientadores Marina Paez e Vinicius Israel pela atencao e dedicacao durante

todo o ano. Foi um prazer trabalhar e aprender com voces.

Ao meu melhor amigo e companheiro Marcus Gerardus por ser minha pessoa prefe-

rida. Obrigada tambem pelas ideias compartilhadas sobre esse trabalho.

A minha querida amiga Vanessa Eufrauzino por todas as conversas e desabafos. Por

saber mais de mim do que eu mesma.

A todos os amigos que fiz durante o mestrado por tornarem esses dois anos mais

agradaveis. Em especial a Raıra Marotta por ser minha gemea.

Por fim, agradeco a todos os professores do DME responsaveis pela minha formacao.

v

Resumo

O aprisionamento vem sendo estudado no ambito internacional e apresenta resulta-

dos preocupantes com crescimento acelerado nas ultimas decadas. Segundo dados do

Institute for Criminal Policy Research da universidade de Birkbeck em Londres, o Brasil

multiplicou o numero de presos em 20 vezes desde 1973 ate os dias de hoje. Diante disso,

ha interesse em investigar a distribuicao das unidades prisionais no Brasil e estudar a as-

sociacao de covariaveis para entao entender a disposicao dessas unidades. Neste trabalho,

propomos modelar as localizacoes dessas unidades atraves de Processos de Cox. Primei-

ramente, a funcao de intensidade foi definida a partir de uma mistura de distribuicoes

normais com o objetivo de definir a formacao de conglomerados de pontos. As covariaveis

nesse modelo sao referentes as unidades prisionais e sao inclusas nas dimensoes dos pon-

tos, isso leva a formacao de conglomerados compostos por unidades prisionais proximas

geograficamente e que possuem possıveis caracterısticas semelhantes. Na segunda parte

do trabalho foi utiliza um modelo proposto por Diggle et al. (1997) que permite que a

funcao de intensidade leve em consideracao as distancias das localizacoes das unidades

prisionais as fontes de influencias previamente definidas, alem de covariaveis espaciais.

Em ambos os modelos, a inferencia foi feita sob o enfoque bayesiano.

Palavras-Chave: Estatıstica Espacial; Inferencia bayesiana; Processo de Cox; Aprisiona-

mento no Brasil.

vi

Abstract

Imprisonment has been studied in the international scene and it has worrying out-

comes with a rapid growth in recent decades. According to data from the Institute for

Criminal Policy Research in Birkbeck University in London, the size of the Brazilian im-

prisoned population increased twentyfold from 1973 to the present days. Therefore, there

is an interest in investigating the distribution of the locations of prison units in Brazil

anda also their association with covariates. This work aims to model the location of this

units through a Cox Process. Firstly, the intensity function was defined by the mixture

of normal distributions with the goal of describing the formation of point clusters. The

covariates in this model are realtive to the prison units, and they are included as new

dimensions in the model, leading to the formation of clusters of points which are close

not only geografically but also present similar values of covariates. The second part of

this work uses a model proposed by Diggle et al. (1997) that allows the intensity function

to depend on covariates, as well as on the distance between the prison units to sources of

influence which are fixed, and previously specified. In both parts, inference is performed

under the Bayesian approach.

Keywords: Spatial Statistics; Bayesian inference; Cox process; Imprisonment in Brazil.

vii

Sumario

Sumario viii

Lista de Tabelas x

Lista de Figuras xii

1 Introducao 1

2 Aplicacao motivacional 6

3 Revisao metodologica 16

3.1 Processos pontuais espaciais . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.1.1 Propriedades de primeira e segunda ordem . . . . . . . . . . . . . 18

3.1.2 Analisando padroes pontuais no espaco . . . . . . . . . . . . . . . 19

3.1.3 Modelagem para padroes de pontos espaciais . . . . . . . . . . . . 27

3.2 Inferencia sob o enfoque bayesiano . . . . . . . . . . . . . . . . . . . . . . 29

3.2.1 Amostrador de Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.2.2 Metropolis-Hastings . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.3 Criterios de comparacao de modelos . . . . . . . . . . . . . . . . . . . . . 33

4 Estrutura de mistura normal para a funcao de intensidade 35

4.1 O modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.1.1 Distribuicao a posteriori . . . . . . . . . . . . . . . . . . . . . . . 39

4.2 Estudo simulado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.3 Aplicacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

viii

4.3.1 Mistura de normais em duas dimensoes . . . . . . . . . . . . . . . 51

4.3.2 Mistura de normais em tres dimensoes . . . . . . . . . . . . . . . 54

4.3.3 Mistura de normais em quatro dimensoes . . . . . . . . . . . . . . 61

5 Fontes de pontos para a funcao de intensidade 67

5.1 O modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.1.1 Distribuicao a posteriori . . . . . . . . . . . . . . . . . . . . . . . 70

5.2 Estudo simulado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

5.3 Aplicacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6 Conclusoes 80

Referencias Bibliograficas 83

A Graficos animados para os modelos de mistura 86

ix

Lista de Tabelas

2.1 Numero de unidades prisionais excluıdas das analises, numero de unidades

analisadas e informacoes prisionais para as divisoes administrativas do Brasil. 7

2.2 Resumo das variaveis populacao prisional, capacidade prisional e taxa de

ocupacao das 1392 unidades prisionais no Brasil para o ano de 2014. . . . 9

2.3 Resumo do IDH do ano de 2010 e GINI do ano de 2014 para os estados brasileiros. . 11

2.4 Medidas de posicionamento polıtico para um perıodo de classificacao de

2003 a 2014, segundo criterios de Madeira e da Silva Tarouco (2013) e

Braga et al. (2015), em Israel e Bachini (2017). . . . . . . . . . . . . . . 15

4.1 Criterios de comparacao para os modelos com mistura de normais consi-

derando apenas as coordenadas na dimensao. . . . . . . . . . . . . . . . . 52

4.2 Moda e intervalo de credibilidade de 95% a posteriori para os parametros

do modelo com mistura de 5 normais com dimensoes compostas pelas

coordenadas das unidades prisionais no Brasil. . . . . . . . . . . . . . . . 52

4.3 Criterios de comparacao para os modelos com mistura de normais conside-

rando coordenadas e logaritmo da taxa de ocupacao prisional na dimensao. 54



coordenadas e logaritmo da taxa de ocupacao das unidades prisionais no

Brasil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.5 Criterios de comparacao para os modelos com mistura de normais consi-

derando coordenadas e logaritmo da capacidade prisional na dimensao. . 58

x



coordenadas e logaritmo da taxa de ocupacao das unidades prisionais no

Brasil. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.7 Criterios de comparacao para os modelos com mistura de normais con-

siderando coordenadas, logaritmo da taxa de ocupacao e logaritmo da

capacidade prisional na dimensao. . . . . . . . . . . . . . . . . . . . . . . 61



coordenadas, logaritmo da taxa de ocupacao e logaritmo da capacidade

das unidades prisionais no Brasil. . . . . . . . . . . . . . . . . . . . . . . 63

5.1 Resultados dos ajustes dos modelos com fontes pontuais na funcao de

intensidade do processo. . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

xi

Lista de Figuras

2.1 Localizacao das unidades prisionais no Brasil no ano de 2014. Area e cor

dos cırculos representam a quantidade de presos (a) e a quantidade de

vagas (b). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2 Localizacao das unidades prisionais no Brasil no ano de 2014. Area e cor

dos cırculos representam a taxa de ocupacao. . . . . . . . . . . . . . . . . 9

2.3 Taxa prisional (a) e taxa da capacidade prisional (b) dos estados brasileiros

por 100 mil habitantes no ano de 2014. Cores mais escuras representam

taxas mais altas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.4 Taxa de ocupacao prisional dos estados brasileiros no ano de 2014. Cores mais escuras

representam taxas mais altas. . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.5 Distribuicao do IDH 2010 (a) e do GINI 2014 (b) para os estados brasileiros de acordo

com as regioes Centro-Oeste (CO), Nordeste (NE), Norte (N), Sudeste (SE) e Sul (S). 12

2.6 Logaritmo da taxa prisional por 100 mil habitantes e o IDH 2010 para os estados

brasileiros classificados pelo ındice GINI 2014. . . . . . . . . . . . . . . . . . . . 13

2.7 Distribuicao das medidas de posicionamento polıtico segundo Madeira e da Silva Ta-

rouco (2013) (a) e Braga et al. (2015) (b) para os estados brasileiros de acordo com as

regioes Centro-Oeste (CO), Nordeste (NE), Norte (N), Sudeste (SE) e Sul (S). . . . . 14

3.1 Simulacao de padroes de pontos aleatorios (a); agrupados (b); e regulares

(c). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.2 Estimativa da funcao de intensidade utilizando o estimador Kernel com

funcao quartic para uma simulacao do padrao de pontos agrupados. . . . 21

xii

3.3 Estimador da funcao F (linha preta solida), funcao F aproximada para a

hipotese de CSR (linha vermelha pontilhada) e envelopes de 99 simulacoes

de CSR (polıgono cinza) para dados artificiais de um padrao de pontos

aleatorios (a); agrupados (b); e regulares (c). . . . . . . . . . . . . . . . . 22

3.4 Estimador da funcao G (linha preta solida), funcao G aproximada para a

hipotese de CSR (linha vermelha pontilhada) e envelopes de 99 simulacoes

de CSR (polıgono cinza) para dados artificiais de um padrao de pontos:

aleatorios (a); agrupados (b); e regulares (c). . . . . . . . . . . . . . . . . 23

3.5 Estimador da funcao K menos πx2 (linha preta solida), linha de referencia

em K(x)−πx2 = 0 para a hipotese de CSR (linha vermelha pontilhada) e

envelopes de 99 simulacoes de CSR (polıgono cinza) para dados artificiais

de um padrao de pontos aleatorios (a); agrupados (b); e regulares (c). . . 25

3.6 Estimativas da intensidade pontual das unidades prisionais utilizando a funcao de Quar-

tic Kernel variando a largura da banda. . . . . . . . . . . . . . . . . . . . . . . 27

3.7 Estimador das funcoes G (a), F (b) e K-πx2 (c) para as unidades prisionais brasileiras

(linha preta solida), respectivas funcoes teoricas para a hipotese de CSR (linha vermelha

pontilhada) e envelopes de 99 simulacoes de CSR (polıgono cinza). . . . . . . . . . 27

4.1 Funcao de intensidade simulada considerando o cenario 1 (a) e o cenario

2 (b) para o modelo com mistura de normais. . . . . . . . . . . . . . . . 44

4.2 Pontos simulados considerando o cenario 1 (a) e o cenario 2 (b) para o

modelo com mistura de normais. . . . . . . . . . . . . . . . . . . . . . . . 45

4.3 Histogramas para as amostras a posteriori para os parametros µ1 (supe-

rior) e µ2 (inferior) no primeiro cenario dos dados simulados. Limites do

intervalo de credibilidade de 95% (linha tracejada vermelha), moda a pos-

teriori (linha tracejada azul), valor verdadeiro (linha tracejada verde) e

distribuicao a priori (linha pontilhada preta). . . . . . . . . . . . . . . . . 46

xiii

4.4 Histogramas para as amostras a posteriori para os parametros Σ1 (supe-

rior) e Σ2 (inferior) no primeiro cenario dos dados simulados. Limites

do intervalo de credibilidade de 95% (linha tracejada vermelha), moda a

posteriori (linha tracejada azul) e valor verdadeiro (linha tracejada verde). 47

4.5 Histogramas para as amostras a posteriori para os parametros λ0 (es-

querda), w1 (meio) e w2 (direita) no primeiro cenario dos dados simulados.

Limites do intervalo de credibilidade de 95% (linha tracejada vermelha),

moda a posteriori (linha tracejada azul), valor verdadeiro (linha tracejada

verde) e distribuicao a priori (linha pontilhada preta). . . . . . . . . . . . 47

4.6 Histogramas para as amostras a posteriori para os parametros µ1 (supe-

rior) e µ2 (inferior) no segundo cenario dos dados simulados. Limites do

intervalo de credibilidade de 95% (linha tracejada vermelha), moda a pos-

teriori (linha tracejada azul), valor verdadeiro (linha tracejada verde) e

distribuicao a priori (linha pontilhada preta). . . . . . . . . . . . . . . . . 48

4.7 Histogramas para as amostras a posteriori para os parametros Σ1 (su-

perior) e Σ2 (inferior) no segundo cenario dos dados simulados. Limites

do intervalo de credibilidade de 95% (linha tracejada vermelha), moda a

posteriori (linha tracejada azul) e valor verdadeiro (linha tracejada verde). 49

4.8 Histogramas para as amostras a posteriori para os parametros λ0 (es-

querda), w1 (meio) e w2 (direita) no segundo cenario dos dados simulados.

Limites do intervalo de credibilidade de 95% (linha tracejada vermelha),

moda a posteriori (linha tracejada azul), valor verdadeiro (linha tracejada

verde) e distribuicao a priori (linha pontilhada preta). . . . . . . . . . . . 49

4.9 Funcoes de intensidade ajustada para os dados simulados referentes ao

cenario 1 (a) e cenario 2 (b) para o modelo com mistura de normais. . . . 50

4.10 Contorno da funcao de intensidade ajustada (a) e Mapa de calor para a

funcao de intensidade ajustada (b) para o modelo com estrutura de mistura

normal com coordenadas das unidades prisionais nas dimensoes. . . . . . 53

xiv

4.11 Localizacoes das unidades prisionais com cores representando cada con-

glomerado de pontos para o modelo com coordenadas e logaritmo da taxa

de ocupacao (a). Box-plot do logaritmo da taxa de ocupacao de acordo

com os conglomerados de pontos (b), logaritmo da taxa de ocupacao igual

a zero (linha tracejada vermelha). . . . . . . . . . . . . . . . . . . . . . . 56

4.12 Funcao de intensidade estimada para o modelo com mistura de 4 nor-

mais para cada coordenada e logaritmo da taxa de ocupacao das unidades

prisionais. Cor e area dos cırculos representam a funcao de intensidade

estimada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.13 Localizacoes das unidades prisionais com cores representando cada con-

glomerado de pontos para o modelo com coordenadas e logaritmo da ca-

pacidade prisional (a). Box-plot do logaritmo da capacidade prisional de

acordo com os conglomerados de pontos (b). . . . . . . . . . . . . . . . . 60

4.14 Funcao de intensidade estimada para o modelo com mistura de 5 normais

para cada coordenada e logaritmo da capacidade prisional das unidades

prisionais. Cor e area dos cırculos representam a funcao de intensidade

estimada. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.15 Localizacoes das unidades prisionais com cores representando cada conglo-

merado de pontos para o modelo com coordenadas, logaritmo da taxa de

ocupacao e logaritmo da capacidade prisional (a). Box-plots do logaritmo

da taxa de ocupacao (b) e do logaritmo da capacidade prisional (c) de

acordo com os conglomerados de pontos. . . . . . . . . . . . . . . . . . . 65

4.16 Funcao de intensidade estimada para o modelo com mistura de 5 nor-

mais para cada coordenada, logaritmo da taxa de ocupacao e logaritmo

da capacidade prisional das unidades prisionais. Cor e area dos cırculos

representam a funcao de intensidade estimada. . . . . . . . . . . . . . . . 66

5.1 Funcao de intensidade simulada (a) e pontos simulados (b) para o modelo

com fontes pontuais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

xv

5.2 Histogramas para as amostras a posteriori para os parametros λ0 (superior

esquerda), β1 (superior direita), α (inferior esquerda), φ (inferior meio)

e δ (inferior direito) para o dados simulados. Limites do intervalo de

credibilidade de 95% (linha tracejada vermelha), moda a posteriori (linha

tracejada azul), valor verdadeiro (linha tracejada verde) e distribuicao a

priori (linha pontilhada preta). . . . . . . . . . . . . . . . . . . . . . . . 74

5.3 Funcao de intensidade ajustada para os dados simulados considerando o

modelo com fontes pontuais. . . . . . . . . . . . . . . . . . . . . . . . . . 75

5.4 Funcao de intensidade estimada para o modelo com mistura de normais de

dimensoes compostas pelas coordenadas (a). Numero de unidades prisio-

nais em cada estado do Brasil (b). Cores das barras indicam a regiao dos

estados: Centro-Oeste (vermelho); Nordeste (verde); Norte (azul escuro);

Sudeste (azul claro); Sul (rosa). . . . . . . . . . . . . . . . . . . . . . . . 76

5.5 Localizacao das unidades prisionais com a identificacao das fontes pontuais

(cırculos vermelhos) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

5.6 Funcoes de intensidade estimadas com fontes pontuais para os modelos

com a covariavel: IDH (a); GINI (b); Polıtica I (c); Polıtica II (d). . . . . 79

A.1 Grafico de dispersao da longitude contra latitude contra logaritmo da taxa de ocupacao

marcados com os conglomerados para o modelo que considera as coordenadas e o loga-

ritmo da taxa de ocupacao. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

A.2 Grafico de dispersao da longitude contra latitude contra logaritmo da ca-

pacidade marcados com os conglomerados para o modelo que considera as

coordenadas e o logaritmo da capacidade. . . . . . . . . . . . . . . . . . . 87

A.3 Grafico de dispersao da longitude contra latitude contra logaritmo da taxa

de ocupacao marcados com os conglomerados para o modelo que considera

as coordenadas, logaritmo da taxa de ocupacao e logaritmo da capacidade. 88

A.4 Grafico de dispersao da longitude contra latitude contra logaritmo da ca-

pacidade marcados com os conglomerados para o modelo que considera as

coordenadas, logaritmo da taxa de ocupacao e logaritmo da capacidade. . 89

xvi

Capıtulo 1

Introducao

O aprisionamento vem sendo estudado tanto no ambito nacional quanto no internaci-

onal e apresenta resultados preocupantes com crescimento acelerado nas ultimas decadas

em diversos paıses desenvolvidos e nos estados brasileiros, em particular. Segundo da-

dos do Institute for Criminal Policy Research (ICPR-Instituto de Pesquisa em Polıticas

Criminais) da universidade de Birkbeck em Londres (Jacobson et al., 2017), mais de 10

milhoes de pessoas estavam presas em todo o mundo no ano de 2017. Dentre os princi-

pais paıses que apresentaram rapido crescimento da populacao prisional, destacam-se os

Estados Unidos que mais do que quadruplicou o numero de presos de 1980 a 2008, pas-

sando de aproximadamente 500 mil para 2,3 milhoes. Ja o Brasil multiplicou o numero

de presos em vinte vezes nos ultimos quarenta e quatro anos, passando de cerca de 30

mil presos em 1973 para mais de 600 mil presos em 2017.

Segundo o ultimo relatorio da ICPR com dados referentes a outubro de 2015 (Walms-

ley, 2016), o Brasil tem a quarta maior populacao prisional em numeros absolutos, ficando

atras apenas dos Estados Unidos, China e Russia. Alem disso, o numero de presos sem

condenacao ultrapassa de 212 mil, sendo a terceira maior populacao, em termos absolu-

tos. O aumento dos nıveis de detencao sem julgamento, principalmente em paıses menos

desenvolvidos, expressam a ineficiencia, desorganizacao e falta de recursos dos sistemas

e processos judiciais.

A principal questao esta nas mudancas das polıticas punitivistas dos estados que

1

acarretam no fenomeno conhecido como o “boom carcerario1”. Sao variadas as causas

do aumento da populacao carceraria no Brasil e em muitos outros paıses. Pesquisadores

atribuem esse aumento a fatores como mudancas nos padroes de crimes, debates publicos

cada vez mais punitivistas e culturas polıticas, dominacao de classes, fatores economicos,

entre outros.

Enquanto as causas do crescimento carcerario podem apresentar certa complexidade,

as consequencias sao incontestaveis. O encarceramento em massa junto com a escassez

de cadeias levam a condicoes de superlotacao, que em muitas das vezes, sao agravadas

com a falta de estrutura das unidades prisionais. Isso afeta os grupos mais marginali-

zados e diminui as chances de possıveis reabilitacoes, limitando a eficacia dos sistemas

penitenciarios em lidar com a minoria de presos que representam riscos para a seguranca

publica. Alem de aumentar os riscos para os proprios prisioneiros, gerando violencia e re-

belioes. O uso excessivo da prisao tambem demanda gastos aos cofres publicos, podendo

impedir o desenvolvimento economico.

Segundo relatorio do ministerio da justica, o Brasil possui uma taxa de ocupacao

media de 161%, ou seja, 16 pessoas estariam ocupando um espaco destinado para apenas

10 pessoas. A maioria das unidades prisionais brasileiras nao apresentam condicoes fa-

voraveis para a sobrevivencia dos presos que geralmente depende da protecao de gangues.

A violencia nas prisoes brasileiras tornou-se frequente nas ultimas decadas e e uma das

responsaveis por grande parte das mortes na populacao carceraria. Um dos maiores con-

flitos prisionais ocorreu no Complexo Penitenciario Anısio Jobim (Compaj, Manaus) em

janeiro de 2017, resultando em 56 mortes e desencadeando outros conflitos em diferentes

unidades pelo Brasil. Muitas dessas rebelioes estao ligadas ao controle do narcotrafico e

disputa de poder por faccoes criminosas.

Herancas historicas do perıodo da ditadura militar no Brasil (1964 a 1985) sao

em parte causadoras dos principais problemas do sistema penitenciario brasileiro. A

transicao da ditadura para a democracia marca um perıodo de grandes desafios polıtico-

institucionais (Adorno, 2002), com instabilidade polıtica e nao aprovacao das propostas

1Mudancas nas polıticas de justica criminal e resultam em aumento do tempo de encarceramento,

aumento da populacao carceraria e aumento da revogacao de liberdades condicionais.

2

do novo governo por agentes penitenciarios. A mudanca de regime veio acompanhado

de muita violencia, massacres e rebelioes nas prisoes organizadas por dirigentes do crime

organizado. Grupos como o Comando Vermelho (CV) e o Primeiro Comando da Capital

(PCC) representam duas grandes organizacoes criminosas que foram formadas dentro das

dependencias das prisoes. Esses grupos e o crime organizado controlam 90% das prisoes

do Brasil, onde conseguem organizar operacoes de trafico e extorsao em grande parte do

paıs (Miraglia, 2015).

O aumento da punicao reflete as desigualdades impostas aos grupos pobres e margi-

nalizados da sociedade, incluindo grupos nao nacionais e minoritarios etnicos e culturais

(Israel, 2016). A aplicacao da lei e o sistema de justica sao marcados por corrupcao e

ineficiencia, isso mostra a instabilidade polıtica e a falta de uma polıtica criminal mais

justa. As consequencias levam a deterioracao das prisoes e da comunidade.

A vista disso, e relevante a realizacao de estudos mais aprofundados das informacoes

disponıveis das unidades prisionais. Com a finalidade de compreender melhor o cenario

das prisoes do Brasil, nao apenas tendo uma visao geral do contexto, mas entendendo

como o sistema funciona e quais sao os principais fatores que contribuem para a sua

organizacao. Ferramentas estatısticas atuais sao de grande valor para essa tarefa, pois,

atraves de analises de dados e modelagem e possıvel extrair resultados que podem auxiliar

na tomada de decisao dos responsaveis pelo sistema. Estatıstica voltada para o sistema

prisional oferece, portanto, meios para entender se as decisoes tomadas pelo governo

realmente estao deixando a populacao mais segura.

Nos Estados Unidos, Milgram (2012) usa analise de dados para resolver o problema

de reincidencia nas cadeias americanas e a grande quantidade de pessoas presas que estao

apenas aguardando pelo julgamento. A autora calcula o risco do preso cometer um novo

crime ou um ato de violencia se for solto, alem de prever se o preso vai voltar ao tribunal,

ajudando nas decisoes dos juızes no julgamento do reu. No Brasil, ainda sao poucos os

trabalhos que utilizam ferramentas estatısticas robustas para o estudo do encarceramento

em massa no Brasil. O trabalho desenvolvido por Israel e Bachini (2017) utiliza modelos

estatısticos para investigar quais seriam os principais fatores que contribuem para as

taxas de encarceramento nos estados do Brasil. Variaveis como quantidade de jovens,

3

ındice de desigualdade e influencia polıtica apresentam associacao significativa com essa

taxa.

O presente trabalho propoe explorar uma ferramenta estatıstica que lida com a va-

riabilidade espacial dos dados. Em particular, serao utilizados modelos destinados as

observacoes de eventos em uma regiao geografica. Esses modelos sao conhecidos como

processos pontuais espaciais. Alem disso, a inferencia que sera aplicada a esses modelos

sera sob a perspectiva bayesiana. Apesar do custo computacional, uma das vantagens

da estatıstica bayesiana e a producao de modelos mais realısticos que podem incorpo-

ram suposicoes do proprio pesquisador. Trabalhos que usam processos pontuais espaciais

bayesianos podem ser visto, por exemplo, em Paez e Diggle (2009) e Junior et al. (2015).

Esse trabalho e pioneiro na area, sendo sua proposta estudar a relacao espacial das lo-

calizacoes das unidades prisionais no Brasil, utilizando-se de processos pontuais espaciais

sob o enfoque bayesiano. Ha interesse em investigar a distribuicao das unidades prisi-

onais no Brasil e estudar a associacao de covariaveis para entao entender a disposicao

dessas unidades. A partir disso, e possıvel compreender as caracterısticas das unidades

brasileiras e o fenomeno do encarceramento no Brasil, pois se espera que o numero de

unidades prisionais seja correspondente as necessidades de cada estado.

O primeiro modelo proposto nesse trabalho incorpora uma estrutura de mistura de

distribuicoes normais em modelos para processos pontuais. O objetivo dessa modela-

gem e identificar padroes nas localizacoes das unidades prisionais brasileiras. O estudo

considera nao apenas o espaco geografico, mas tambem um espaco social baseado em

covariaveis. Com isso, deseja-se investigar se unidades proximas geograficamente apre-

sentam caracterısticas sociais semelhantes.

A segunda abordagem proposta nesse trabalho baseia-se no modelo desenvolvido por

Diggle et al. (1997) e faz uso de processos pontuais considerando que as observacoes

estao sendo influenciadas por fontes pontuais. Nesse trabalho, as fontes pontuais serao

selecionadas com base nas analises dos focos ou picos de pontos encontrados na primeira

modelagem. A partir disso, novas covariaveis poderiam ser incluıdas no modelo com o

objetivo de explicar a disposicao das unidades ao redor dessas fontes.

Em suma, o trabalho traz contribuicoes de uma abordagem multidisciplinar que cor-

4

robora com a base da investigacao sociologica defendida por Goldthorpe (2016). Segundo

Goldthorpe, uma investigacao sociologica nao dever ser conduzida atraves dos compor-

tamentos particulares dos indivıduos dessa populacao, mas a partir das regularidades

presentes nessa populacao que sao como propriedades. E necessario que tais regulari-

dades sejam visıveis para entao tornarem-se transparentes, ou seja, deve-se explorar e

descrever essas regularidades e depois deve-se buscar explicacoes para as mesmas.

Este trabalho esta organizado em seis capıtulos, em que o primeiro e a introducao.

O Capıtulo 2 traz a aplicacao motivacional, onde sao realizadas analises descritivas dos

dados sobre encarceramento no Brasil com o objetivo de entender melhor como eles se

organizam e compreender o problema em questao.

O Capıtulo 3 consiste na apresentacao dos metodos estatısticos trabalhados nessa

dissertacao, com foco nos processos pontuais espaciais. Inicialmente, o capıtulo traz

definicoes basicas para a compreensao e identificacao de um processo pontual. Tambem

sao abordados os metodos de inferencia bayesiana e alguns criterios de comparacao de

modelos.

No Capıtulo 4, um processo pontual com uma estrutura de mistura de normais e

estudado. A descricao e a inferencia do modelo sao realizadas, seguidas de um breve

estudo simulado para a validacao do modelo proposto. A aplicacao do modelo e dada

com base nas localizacoes das unidades prisionais brasileiras e a inclusao das covariaveis

no modelo e feita a partir da ampliacao do espaco de estudo.

O capıtulo 5 descreve uma nova abordagem discutida nesse trabalho que incorpora

fontes de pontos ao processo espacial. A organizacao do capıtulo e analoga ao capıtulo

anterior, com descricao e inferencia do modelo proposto, seguidas de um breve estudo

simulado e a aplicacao para os dados das unidades prisionais no Brasil. Por fim, no

Capıtulo 6 sao apresentados a conclusao e trabalhos futuros.

5

Capıtulo 2

Aplicacao motivacional

Os dados sobre encarceramento no Brasil sao provenientes do censo penitenciario bra-

sileiro e foram obtidos a partir do Levantamento Nacional de Informacoes Penitenciarias

(Infopen) organizado pelo Departamento Penitenciario Nacional (DEPEN) em 2014. Os

dados contem informacoes de todas as 1424 unidades prisionais brasileiras. No entanto,

devido a indisponibilidade de alguns dados para determinadas unidades, preferiu-se ex-

cluir essas das analises. A Tabela 2.1 mostra o numero de unidades que apresentam dados

faltantes e que foram excluıdas das analises e tambem o numero de unidades prisionais

por estados e regioes do Brasil que foram consideradas nas analises, totalizando 1392

unidades. O numero de unidades desconsideradas apresenta um percentual pequeno do

numero total de unidades e, aparentemente, nao exibem nenhum padrao espacial. Por-

tanto, a retirada dessas nao deve prejudicar as analises das localizacoes das unidades que

serao discutidas nos capıtulos seguintes.

Das 32 unidades desconsideradas, 12 nao informam a quantidade de presos, 7 nao

informam a quantidade de vagas disponıveis e 2 nao possuem ambas as informacoes.

Alem disso, 11 unidades apresentam quantidade de vagas igual a zero e foi observado que

algumas nao dispunham de infraestrutura adequada e foram interditadas.

Tomando como base as 1392 unidades analisadas, a Tabela 2.1 traz informacoes pri-

sionais dos estados e regioes do Brasil. Os estados do Mato Grosso do Sul e Sao Paulo

com o Distrito Federal sao os que apresentam mais presos por 100 mil habitantes, sendo

Sao Paulo o estado com maior numero de presos em termos absolutos. Quanto a taxa de

6

ocupacao, todas as regioes apresentam numero de presos maior que o numero de vagas

oferecidas, sendo a regiao com maior taxa o nordeste (169,43%) e a com menor taxa a

regiao sul (116,27%).

Tabela 2.1: Numero de unidades prisionais excluıdas das analises, numero de unidades

analisadas e informacoes prisionais para as divisoes administrativas do Brasil.Divisoes N. de unidades N. de unidades N. de Presos por Taxa de

administrativas excluıdas analisadas presos 100 mil hab. ocupacao %

Distrito Federal (DF) - 6 13.269 463,490 200,893

Goias (GO) - 95 13.244 202,376 155,977

Mato Grosso (MT) - 59 10.357 320,330 125,327

Mato Grosso do Sul (MS) 1 44 14.203 540,547 201,948

Centro-Oeste 1 204 51.073 334,513 168,042

Alagoas (AL) 1 8 3345 100,571 129,200

Bahia (BA) - 22 11.836 78,157 142,243

Ceara (CE) 3 155 18.278 206,242 155,030

Maranhao (MA) 3 29 4.392 64,046 89,982

Paraıba (PB) 1 77 9.596 243,058 155,527

Pernambuco (PE) - 77 31.510 339,096 264,923

Piauı (PI) 1 12 2.414 75,499 140,512

Rio Grande do Norte (RN) - 33 7.192 210,489 152,308

Sergipe (SE) - 8 4.057 182,305 157,309

Nordeste 9 421 92.620 164,600 169,435

Acre (AC) 2 10 2384 300,601 114,615

Amapa (AP) - 8 2.654 351,418 139,831

Amazonas (AM) 3 17 6.379 164,045 188,449

Para (PA) - 41 12.604 155,738 139,718

Rondonia (RO) 7 44 6.590 375,840 122,719

Roraima (RR) - 5 1.605 320,915 148,611

Tocantins (TO) 1 42 3.160 210,487 138,354

Norte 13 167 35.376 204,666 140,839

Espırito Santo (ES) 1 34 15461 397,020 119,806

Minas Gerais (MG) - 184 56.236 270,798 150,674

Rio de Janeiro (RJ) 2 48 39.266 238,118 139,093

Sao Paulo (SP) 4 158 214.843 486,730 167,171

Sudeste 7 424 325.806 381,992 157,413

Parana (PR) 1 35 19.516 175,734 102,007

Rio Grande do Sul (RS) 1 95 25.858 230,365 119,145

Santa Catarina (SC) - 46 17.914 265,511 131,759

Sul 2 176 63.288 217,655 116,272

Brasil 32 1392 568.163 279,620 152,904

7

Na Figura 2.1, cada cırculo representa a localizacao de um unidade prisional e a

area do cırculo e proporcional ao numero de presos (mapa da esquerda) ou ao numero

de vagas (mapa da direita) naquela unidade. Observando a Figura 2.1(a), e evidente o

aglomeramento de presos em grande parte do litoral, em maior peso nas regioes sudeste

e nordeste, sendo mais disperso ao norte e no interior do paıs. Percebe-se tambem que a

maioria das unidades que encarceram mais, em numeros absolutos, estao localizadas no

estado de Sao Paulo. Na Figura 2.1(b), o numero de vagas parece acompanhar o numero

de presos que pode ser observado no mapa ao lado, porem, em proporcoes menores.

(a) (b)Figura 2.1: Localizacao das unidades prisionais no Brasil no ano de 2014. Area e cor dos

cırculos representam a quantidade de presos (a) e a quantidade de vagas (b).

A Figura 2.2 traz a taxa de ocupacao para cada uma das unidades prisionais no

Brasil. Em todo o paıs, a situacao de superpopulacao e notoria, destacando-se mais a

regiao nordeste. Os estados que apresentam pelo menos uma unidade prisional com mais

de cinco presos por vaga (cırculo vermelho escuro) sao: Amazonas, Ceara, Goias, Mato

Grosso do Sul, Para, Paraıba, Pernambuco, Rio Grande do Norte, Rio Grande do Sul e

Santa Catarina.

8

Figura 2.2: Localizacao das unidades prisionais no Brasil no ano de 2014. Area e cor dos

cırculos representam a taxa de ocupacao.

A Tabela 2.2 mostra o cenario das unidades prisionais no Brasil em 2014. Em media,

as unidades prisionais brasileiras possuem 408 presos, enquanto que em media as uni-

dades dispoem de 267 vagas. Alem disso, em torno de 75% das unidades apresentam

superpopulacao de presos, ou seja, o numero de presos excede o numero de vagas.

Tabela 2.2: Resumo das variaveis populacao prisional, capacidade prisional e taxa de

ocupacao das 1392 unidades prisionais no Brasil para o ano de 2014.Variavel Mınimo 1o Quartil Mediana Media (Desvio Padrao) 3o Quartil Maximo

Populacao Prisional 0 51 134 408 (354,300) 476 4337

Capacidade Prisional 4 43 105 267 (595,680) 359 2696

Taxa de Ocupacao 0 0,953 1,333 1,563 (0,996) 1,965 9,778

E de grande importancia lembrar a diversidade no ambito economico, polıtico e so-

cial dos estados do Brasil. Consequentemente, e natural pensar que para estados mais

desenvolvidos, ou que possuem uma polıtica punitivista (ou carceraria) mais agressiva,

ou ainda os mais populosos, o quantitativo de presos sera maior. Sendo assim, espera-se

que o numero de unidades prisionais seja correspondente as necessidades de cada estado.

Tendo em vista isso, as analises a seguir possuem grande relevancia para a investigacao

das variaveis associadas as unidades prisionais dos estados brasileiros.

9

A taxa da populacao carceraria brasileira em 2014 foi de 279,62 presos por 100 mil

habitantes, apesar das cadeias brasileiras ofertarem apenas 182,87 vagas por 100 mil habi-

tantes. Esses dados sao ainda mais preocupantes no cenario estadual. Os mapas represen-

tados nas Figuras 2.3 e 2.4 remetem a realidade da superpopulacao de presos dos estados

brasileiros no ano de 2014. O grafico da esquerda, na Figura 2.3, representa a taxa prisi-

onal dos estados por 100 mil habitantes (#presos/#habitantes × 100mil) e o grafico da

direita indica a taxa da capacidade prisional por 100 mil habitantes (#vagas/#habitantes

× 100mil). Observa-se que o mapa da taxa prisional possui cores mais escuras para a

maioria dos estados do que o mapa da taxa da capacidade prisional, indicando a super-

populacao carceraria para esses estados. A superpopulacao pode ser mais evidenciada

na Figura 2.4 que apresenta a taxa de ocupacao (#presos/#vagas) para cada estado

do Brasil. Apenas o estado do Maranhao possui um quantitativo de presos inferior ao

numero de vagas disponıveis. Alem disso, o Distrito Federal e os estados do Mato Grosso

do Sul e Pernambuco sao os que possuem mais que o dobro de presos por vagas, sendo

Pernambuco o estado com maior taxa de ocupacao com 264,92%.

(a) (b)

Figura 2.3: Taxa prisional (a) e taxa da capacidade prisional (b) dos estados brasileiros

por 100 mil habitantes no ano de 2014. Cores mais escuras representam taxas mais altas.

Com o objetivo de entender as caracterısticas das unidades prisionais, foram estudadas

tambem variaveis referentes aos estados brasileiros. O IDH (Indice de Desenvolvimento

Humano), ındice desenvolvido pelo Programa das Nacoes Unidas para o Desenvolvimento

10

Figura 2.4: Taxa de ocupacao prisional dos estados brasileiros no ano de 2014. Cores mais escuras

representam taxas mais altas.

(PNUD) em 1990, e comumente utilizado para mensurar as condicoes basicas de vida de

uma sociedade. Valores altos desse ındice indicam sociedades com condicoes de vida

basica melhores. Ja o GINI (Indice de desigualdade), foi criado pelo matematico italiano

Conrado Gini, e mensura a concentracao de renda em determinada sociedade. O valor de

GINI igual a zero representa a situacao de igualdade, ou seja, todos tem a mesma renda.

A Tabela 2.3 mostra medidas resumo para o IDH e o GINI dos estados brasileiros.

Tabela 2.3: Resumo do IDH do ano de 2010 e GINI do ano de 2014 para os estados brasileiros.

Indices Mınimo 1o Quartil Mediana Media (Desvio Padrao) 3o Quartil Maximo

IDH 2010 0,631 0,664 0,699 0,705 (0,049) 0,738 0,824

GINI 2014 0,429 0,463 0,480 0,480 (0,027) 0,495 0,565

Na Figura 2.5, estao representados os box-plots das distribuicoes do IDH 2010, a

esquerda, e do GINI 2014, a direita, para os estados brasileiros segundo as respectivas

regioes. Nota-se que ha uma alta variabilidade tanto do IDH 2010 quanto do GINI

2014 para os estados da regiao centro-oeste. Nessa regiao tambem se encontra o Distrito

Federal que e o que apresenta maior ındice de desenvolvimento (IDH 2010 = 0,824)

e maior ındice de desigualdade (GINI 2014 = 0,565). Deve-se ressaltar ainda que a

regiao sul e a que possui valores relativamente altos e uma menor variabilidade do ındice

de desenvolvimento de seus estados, e e a regiao que apresenta os menores ındices de

desigualdade.

11

CO NE N SE S

0.65

0.70

0.75

0.80

Região

Índi

ce

(a) IDH 2010

CO NE N SE S

0.44

0.48

0.52

0.56

Região

Índi

ce

(b) GINI 2014

Figura 2.5: Distribuicao do IDH 2010 (a) e do GINI 2014 (b) para os estados brasileiros de acordo

com as regioes Centro-Oeste (CO), Nordeste (NE), Norte (N), Sudeste (SE) e Sul (S).

A Figura 2.6 apresenta um grafico de dispersao do logaritmo da taxa prisional por

100 mil habitantes e o IDH calculado no ano de 2010 para os estados. Os dados foram

classificados em dois grupos de acordo com o ındice GINI calculado no ano de 2014: o

primeiro grupo engloba os estados que estao abaixo ou na media desse ındice e o outro

grupo engloba os que estao acima da media. Nota-se que, para ambos os grupos de GINI

2014, o logaritmo da taxa prisional cresce a medida que o ındice de desenvolvimento au-

menta. Porem, esse crescimento e mais lento para os estados com ındice de desigualdade

menor, ou seja, estados mais desenvolvidos e mais desiguais tendem a apresentar taxas

mais elevadas de encarceramento (Israel, 2016).

Somando-se a esses ındices, e de grande importancia o estudo de medidas capazes

de aferir sobre a ideologia e orientacao dos partidos polıticos dos governadores dos es-

tados brasileiros, visto que a jurisdicao das unidades prisionais pertence ao governo do

estado. Israel e Bachini (2017) medem o posicionamento polıtico dos governos estaduais

do perıodo de 2003 a 2014 a partir da classificacao dos partidos polıticos dos governadores

dos estados nesse perıodo. Para cada estado, os autores somam -1 se o partido e definido

como de esquerda, 0 se e definido como de centro e 1 se e definido como de direita. O

equivalente vale para a definicao de liberal (-1) e conservador (1).

12

Figura 2.6: Logaritmo da taxa prisional por 100 mil habitantes e o IDH 2010 para os estados brasileiros

classificados pelo ındice GINI 2014.

As medidas de Israel e Bachini (2017) sao baseadas nos trabalhos de Madeira e

da Silva Tarouco (2013) e Braga et al. (2015). O primeiro classifica os partidos polıticos

apenas pelos seus estatutos, enquanto que o segundo mostra-se como uma atualizacao

do primeiro, classificando os partidos a partir dos seus estatutos e do seu grau de fisio-

logismo. A Tabela 2.4 apresenta as medidas polıticas desenvolvidas por Israel e Bachini

(2017) para um perıodo de classificacao de 2003 a 2014.

A Figura 2.7 mostra os box-plots das distribuicoes das medidas de posicionamento

polıtico para os partidos dos governadores dos estados brasileiros de acordo com as res-

pectivas regioes. Constata-se que, as medidas baseadas no trabalho de Braga et al. (2015)

tende a classificar os partidos um pouco mais a esquerda, havendo certa dificuldade de

diferenciar a classificacao entre os partidos.

13

CO NE N SE S

−3

−2

−1

01

23

Região

Pos

icio

nam

ento

pol

ítico

(a) Madeira e da Silva Tarouco (2013)

CO NE N SE S

−3

−2

−1

01

23

Região

Pos

icio

nam

ento

pol

ítico

(b) Braga et al. (2015)

Figura 2.7: Distribuicao das medidas de posicionamento polıtico segundo Madeira e da Silva Tarouco

(2013) (a) e Braga et al. (2015) (b) para os estados brasileiros de acordo com as regioes Centro-Oeste

(CO), Nordeste (NE), Norte (N), Sudeste (SE) e Sul (S).

14

Tabela 2.4: Medidas de posicionamento polıtico para um perıodo de classificacao de 2003

a 2014, segundo criterios de Madeira e da Silva Tarouco (2013) e Braga et al. (2015), em

Israel e Bachini (2017).

EstadosSegundo criterios Segundo criterios

de Madeira e da Silva Tarouco (2013) de Braga et al. (2015)

Acre -3 -3

Alagoas 2 -1

Amapa -2 -3

Amazonas 0 1

Bahia -1 -1

Ceara 1 -2

Distrito Federal 0 0

Espırito Santo 0 -2

Goias 1 1

Maranhao 0 0

Mato Grosso 0 0

Mato Grosso do Sul -1 -1

Minas Gerais 3 0

Para 1 -1

Paraıba 2 -1

Parana 1 0

Pernambuco 0 -2

Piauı -2 -3

Rio de Janeiro 0 -1

Rio Grande do Norte 1 -1

Rio Grande do Sul 0 -1

Rondonia 1 0

Roraima 2 1

Santa Catarina 1 1

Sao Paulo 3 0

Sergipe -1 -1

Tocantins 2 1

15

Capıtulo 3

Revisao metodologica

Conjuntos de dados georreferenciados sao comumente encontrados em diversas areas

da ciencia. Diz-se de dados georreferenciados aqueles que estao relacionados a uma

localizacao e eles podem ser classificados em tres tipos: dados geoestatısticos, dados de

area e padroes de pontos. Conjuntos de dados como por exemplo localizacoes de arvores

de uma determinada especie encontrada na floresta amazonica, focos de dengue em um

estado, ocorrencia de assalto em determinados pontos de um municıpio, sao chamados de

padrao de pontos espaciais e referem as localizacoes como eventos. Ao estudar o padrao

de pontos distribuıdo aleatoriamente no espaco, surgem questionamentos como: existe

algum padrao na distribuicao desses pontos no espaco? E possıvel associar covariaveis

que expliquem esse padrao?

Verificar se os eventos observados apresentam algum tipo de padrao sistematico (agru-

pado ou regular), ao contrario de estarem distribuıdos aleatoriamente, e entender a

formacao desses padroes sao caracterısticas principais da analise estatıstica de padrao

de pontos espaciais.

A Figura 3.1 ilustra tres padroes de pontos espaciais que foram obtidos por meio de

simulacoes. Nota-se que, na Figura 3.1(a), nao ha uma estrutura claramente definida e

pode ser vista como um padrao de pontos completamente aleatorio. Por outro lado, na

Figura 3.1(b), observa-se uma forte estrutura de agrupamento dos pontos. O padrao de

pontos agrupados pode surgir atraves de algum mecanismo de agrupamento ou por meio

de variacoes do meio de estudo levando a concentracoes de eventos relativamente altas

16

em determinadas regioes. Ja na Figura 3.1(c), tem-se uma distribuicao dos pontos mais

ou menos regular sobre toda a area de estudo, indicando que a ocorrencia de um ponto

tende a repelir a existencia de outro ponto em sua vizinhanca.

(a) (b) (c)

Figura 3.1: Simulacao de padroes de pontos aleatorios (a); agrupados (b); e regulares

(c).

Uma breve revisao de literatura sobre processos pontuais espaciais sera exposta a

seguir. Para definicoes mais completas matematicamente, ver por exemplo, Diggle (2003),

Cressie (1991) e Mφller e Waagepetersen (2003).

3.1 Processos pontuais espaciais

Considerando apenas processos pontuais simples em Rr (isto e, ou nenhum evento

ou um unico evento ocorre em qualquer ponto do Rr), Diggle (2003) define um processo

pontual X = {X(s) : s ∈ S} como um processo estocastico que rege as localizacoes dos

eventos {si} em algum conjunto S ⊆ Rr, onde o numero desses eventos em S tambem e

aleatorio. Logo, a aleatoriedade esta nas localizacoes espaciais e nao em caracterısticas

associadas a elas.

Na pratica, somente pontos contidos em uma regiao A ⊂ S limitada serao observados.

Portanto, serao considerados realizacoes de um conjunto finito de localizacoes em S de um

processo pontual. Essas realizacoes sao ditas um padrao de pontos espaciais {s1, ..., sn},

si ∈ S, para i = 1, ..., n e n ≥ 0.

Algumas caracterısticas e propriedades importantes do processo pontual espacial serao

17

revisadas na secao seguinte.

3.1.1 Propriedades de primeira e segunda ordem

Definindo N(A) como sendo o numero de eventos na regiao A ⊂ S limitada, pode-se

calcular a esperanca de N(A), denotada por E(N(A)), em termo da funcao de intensidade

λ(s). A funcao de intensidade λ(s) mensura o potencial para um evento ocorrer em

qualquer localizacao s ∈ S (Cressie e Wikle, 2011), ou ainda, o numero de eventos por

unidade r-dimensional de volume.

Seja ds uma regiao pequena localizada em s com volume |ds|. Entao, a funcao de

intensidade de primeira ordem do processo pontual X e definida por

λ(s) = lim|ds|→0

E(N(ds))

|ds|, s ∈ S, (3.1)

se o limite existe. Assim,

E(N(A)) =

∫A

λ(s)ds, A ⊂ S. (3.2)

O conhecimento de λ(·) nao caracteriza completamente o comportamento espacial do

processo pontual. Propriedades de segunda ordem podem expressar a complexa interacao

espacial, ou seja, a dependencia espacial do processo. Por exemplo, a estrutura de co-

variancia para N(A) e comumente baseada na funcao de intensidade de segunda

ordem λ2(s,x) entre duas regioes infinitesimais |ds| e |dx| contendo s e x, dada como

λ2(s,x) = lim|ds|,|dx|→0

E(N(ds)N(dx))

|ds||dx|, s,x ∈ S. (3.3)

Caracterısticas importantes de um processo pontual espacial X estao diretamente re-

lacionadas com as funcoes de intensidade de primeira e segunda ordens. A seguir, serao

introduzidos os conceitos de estacionariedade e isotropia, que sao hipoteses simplificado-

ras largamente utilizadas.

A estacionariedade de X afirma que a sua distribuicao e invariante sobre translacao

em Rr. Um processo e fracamente estacionario se

λ(s) = λ e λ2(s,x) = λ∗2(s− x), ∀ s,x ∈ A, (3.4)

18

em que λ∗2(·) e a funcao de intensidade de segunda ordem escrita como funcao de um

unico parametro.

Para alguns autores, o termo estacionariedade e usado para processos que tenham

propriedades semelhantes em todos os locais da regiao de interesse. Alem disso, se um

processo estacionario e tambem isotropico, a sua distribuicao e invariante sobre rotacoes

na origem de Rr, isto e,

λ2(s,x) = λ∗2(||s− x||), (3.5)

ou seja, λ2(s,x) e funcao apenas da distancia entre s e x.

As hipoteses de estacionariedade e isotropia sao amplamente utilizadas em mode-

lagens espaciais, pois simplificam as analises de forma consideravel. Essas suposicoes,

entretanto, devem ser consideradas com cautela, apenas ao se verificar apropriadas para

o processo pontual em questao. A seguir sao revisadas algumas analises de processos

pontuais utilizadas para a compreensao de padroes de pontos.

3.1.2 Analisando padroes pontuais no espaco

Segundo Diggle (2003), a hipotese de aleatoriedade espacial completa (CSR - na sigla

em ingles) para um padrao de pontos espacial afirma que: (i) o numero de eventos em

uma regiao A plana com area |A| segue uma distribuicao de Poisson com media λ|A|;

(ii) dado n eventos na regiao A, as localizacoes desses eventos constituem uma amostra

aleatoria independente de uma distribuicao uniforme em A. Essa hipotese tambem pode

ser vista como um processo de Poisson homogeneo, que sera contemplado na Secao 3.1.3.

A seguir, serao apresentadas algumas ferramentas que podem ser uteis na analise da

hipotese de CSR.

Estimador de Kernel

Uma analise preliminar do comportamento do padrao de pontos em estudo pode

ser realizada a partir da estimacao nao parametrica da funcao de intensidade λ(·). O

estimador de Kernel e uma opcao simples para essa tarefa, que tem como objetivo estimar

19

a densidade de probabilidade de uma variavel aleatoria. Baseado em n localizacoes de

eventos {s1, ..., sn} em S, o estimador de intensidade de Kernel e (Cressie e Wikle, 2011)

λ(s) =1

pb(s)

n∑i=1

kb(s− si), s ∈ S, (3.6)

em que kb(·) e uma funcao de densidade de probabilidade (Kernel) simetrica na origem,

b > 0 e o parametro de suavizacao chamado largura da banda, e pb(s) =∫Skb(s − x)dx

e a correcao de borda.

As funcoes de Kernel mais utilizadas sao a uniforme, quartic, triangular, Epanech-

nikov, normal, entre outras. Por exemplo, em R2, considere a escolha de um Kernel

quartic1, kb(x) = ρb(x1)ρb(x2), em que x = (x1, x2)′ e ρb(·) e

ρb(x) =15

16b[1− (x/b)2]2I(|x| ≤ b), (3.7)

sendo I(|x| ≤ b) uma funcao indicadora que assume 1 se em modulo de x for menor ou

igual a b e 0 caso contrario. A escolha do parametro b influencia fortemente o resultado da

estimacao. Valores pequenos de b podem gerar superfıcies muito descontınuas, enquanto

valores grandes geram superfıcies muito suavizadas. A Figura 3.2 mostra a estimativa

da funcao de intensidade para o padrao de pontos agrupados apresentados na Figura

3.1(b) definido em um quadrado [0, 1] × [0, 1], considerando as larguras de bandas 0,04,

0,1 e 0,24. Percebe-se que ha picos da intensidade em locais com grande concentracao de

pontos e a medida que o parametro b aumenta, a funcao intensidade vai sendo suavizada

e apresentando valores mais baixos para essas regioes.

O estimador Kernel, como visto, e adequado para estudar de forma nao parametrica

a distribuicao de primeira ordem do processo pontual. Para explorar propriedades de

segunda ordem do processo, pode-se utilizar as funcoes empıricas F, G e K. Tais funcoes

sao descritas a seguir.

1Funcao Kernel Quartic esta implementada no pacote “splancs” do software R.

20

Figura 3.2: Estimativa da funcao de intensidade utilizando o estimador Kernel com

funcao quartic para uma simulacao do padrao de pontos agrupados.

Funcao F

Ripley (1977) define a funcao F como a funcao de distribuicao acumulada da distancia

entre um ponto aleatorio e o evento mais proximo a este. Um estimador para a funcao

F pode ser dado por:

F (d) =

∑mi=1 I(di ≤ d)

md > 0, (3.8)

em que m e o numero de pontos aleatorios nao observados na regiao de estudo e di a

distancia do i-esimo ponto aleatorio ao ponto mais proximo de n eventos na regiao de

estudo.

Diggle (2003) mostra que a funcao F para a hipotese de CSR e aproximadamente

dada por

F (d) = 1− exp(−πλd2), (3.9)

em que λ = n|A|−1. Para avaliar a hipotese de CSR, e realizada uma analise grafica do

estimador da funcao F avaliada em di, contra a distancia di. Nesse grafico, e possıvel

incluir envelopes inferiores e superiores de simulacoes para um cenario de CSR, definidos

como:

I(d) = min(F (d)) S(d) = max(F (d)). (3.10)

Tais graficos foram construıdos para analisar a hipotese de CSR em cada um dos

padroes de pontos exibidos pelos dados artificiais apresentados anteriormente (Figura

21

3.1). Eles sao mostrados a seguir na Figura 3.3. Percebe-se pela figura que para distancias

maiores, o padrao agrupado difere-se dos demais padroes apresentando um crescimento

um pouco mais lento, uma vez que a probabilidade de um ponto aleatorio estar proximo

de pontos com padrao agrupado e menor do que se o padrao fosse aleatorio ou regular.

Alem disso, identifica-se uma CSR quando os valores estimados da funcao F se aproximam

dos valores aproximados pela funcao sob a hipotese de CSR descrita pela Equacao 3.9.

0.00 0.05 0.10 0.15 0.20 0.25 0.30

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x

)

(a)

0.00 0.05 0.10 0.15 0.20 0.25 0.30

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x

)

(b)

0.00 0.05 0.10 0.15 0.20 0.25 0.30

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x

)

(c)

Figura 3.3: Estimador da funcao F (linha preta solida), funcao F aproximada para

a hipotese de CSR (linha vermelha pontilhada) e envelopes de 99 simulacoes de CSR

(polıgono cinza) para dados artificiais de um padrao de pontos aleatorios (a); agrupados

(b); e regulares (c).

Funcao G

Comumente conhecida na literatura como metodo do vizinho mais proximo, a funcao

G e a distribuicao acumulada da distancia entre um evento e o vizinho mais proximo.

Tambem proposta por Ripley (1977), um estimador para esta pode ser definido por:

G(d) =

∑ni=1 I(di ≤ d)

n, d > 0, (3.11)

em que, para n eventos localizados na regiao de estudo A, di representa a distancia do

i-esimo evento ao evento mais proximo em A. A diferenca entre as funcoes F e G e que

a funcao F usa a distancia de um evento a um ponto aleatorio nao observado enquanto

a funcao G usa a distancia de um evento a um outro evento.

22

Analogamente a funcao F, Diggle (2003) demonstra que a funcao G, sob a hipotese de

CSR, e aproximadamente definida pela Equacao 3.9. Para verificar essa hipotese, analises

graficas equivalentes as realizadas para a funcao F podem ser feitas para a funcao G.

Assim, para os dados artificiais apresentados na Figura 3.1, os graficos das estimativas

da funcao G sao apresentados da Figura 3.4. Nota-se que a estimativa da funcao G cresce

mais rapido para o padrao de pontos agrupados do que para os outros padroes. Isso se

deve ao fato de que a probabilidade de eventos estarem proximos uns dos outros a uma

dada distancia d e maior para padroes agrupados do que para os demais padroes. Ja para

o padrao regular, a estimativa da funcao G cresce bem mais lentamente, pois os eventos

estao bem mais espacados uns dos outros.

0.00 0.05 0.10 0.15 0.20 0.25 0.30

0.0

0.2

0.4

0.6

0.8

1.0

x

G(x

)

(a)

0.00 0.05 0.10 0.15 0.20 0.25 0.30

0.0

0.2

0.4

0.6

0.8

1.0

x

G(x

)

(b)

0.00 0.05 0.10 0.15 0.20 0.25 0.30

0.0

0.2

0.4

0.6

0.8

1.0

x

G(x

)

(c)

Figura 3.4: Estimador da funcao G (linha preta solida), funcao G aproximada para

a hipotese de CSR (linha vermelha pontilhada) e envelopes de 99 simulacoes de CSR

(polıgono cinza) para dados artificiais de um padrao de pontos: aleatorios (a); agrupados

(b); e regulares (c).

Funcao K

A funcao F e mais indicada para a identificacao de agrupamentos de eventos, enquanto

que a funcao G e mais relevante para a identificacao de padroes regulares (Diggle, 2003).

Diante disso, buscando-se uma funcao igualmente capaz de distinguir ambos os padroes,

Ripley (1977) propos a funcao K que leva em conta as funcoes de intensidade de primeira

23

e segunda ordem de um processo estacionario e isotropico, definida como:

K(d) =2π

λ2

∫ d

0

λ∗2(s)sds, (3.12)

ou alternativamente, pode ser definida como:

K(d) = λ−1E(N0(d)) d > 0, (3.13)

em que N0(d) e o numero de eventos a menos de uma distancia d de um evento arbitrario,

e λ e a intensidade do processo.

Um estimador proposto por Ripley (1977) para a funcao K e da foma:

K(d) =|A|n2

n∑i=1

n∑j=1

I(dij < d)

wij, (3.14)

em que I(dij < d) e uma indicadora que assume 1 se a distancia dij entre os eventos i

e j (i 6= j) e menor que d, e 0 caso contrario. |A| e a area da regiao de estudo onde se

localizam os n eventos; e wij e a proporcao da circunferencia ao redor de um evento i,

passando sobre o evento j, que esta dentro da regiao A. Ja sobre a hipotese de CSR, sabe-

se que as funcoes de intensidade mantem-se constantes, ou seja, λ(s) = λ e λ∗2(s) = λ2.

Logo, sob estas condicoes, a funcao K para a hipotese de CSR e

K(d) =2π

λ2

∫ d

0

λ∗2(s)sds

=2π

λ2

∫ d

0

λ2sds

= πd2, (3.15)

e pode ser facilmente calculada para a construcao de graficos semelhantes aos graficos

apresentados para as funcoes F e G, e analise da hipotese de CSR.

Para facilitar a interpretacao, a Figura 3.5 exibe o grafico do estimador da funcao K

menos o seu valor teorico sob a hipotese CSR (ou seja, K(d) = πd2), contra a distancia

d, para os padroes de pontos artificiais apresentados no Figura 3.1.

Nota-se pela Figura 3.5, que para o exemplo com padrao de pontos agrupados, a

estimativa da funcao K posiciona-se acima do envelope superior. Por outro lado, para o

padrao regular, percebe-se uma curvatura para abaixo do envelope inferior em distancias

24

0.00 0.10 0.20 0.30

−0.

15−

0.05

0.05

0.15

x

K(x

)−πx

2

(a)

0.00 0.10 0.20 0.30

−0.

100.

000.

050.

100.

150.

20

xK

(x)−

πx2

(b)

0.00 0.10 0.20 0.30

−0.

20−

0.10

0.00

0.05

x

K(x

)−πx

2

(c)

Figura 3.5: Estimador da funcao K menos πx2 (linha preta solida), linha de referencia

em K(x)− πx2 = 0 para a hipotese de CSR (linha vermelha pontilhada) e envelopes de

99 simulacoes de CSR (polıgono cinza) para dados artificiais de um padrao de pontos

aleatorios (a); agrupados (b); e regulares (c).

pequenas (abaixo de 0,1), enquanto que para o padrao aleatorio a estimativa da funcao

K esta bem proxima a linha de referencia da CSR. Conforme a distancia aumenta, a

estimacao da funcao K para o padrao regular se assemelha a estimacao para o padrao

aleatorio.

Analise exploratoria espacial para os dados prisionais

A seguir sera realizada uma analise exploratoria espacial com base nas estatısticas

apresentadas anteriormente. Com o objetivo de identificar a existencia de padroes de

pontos nos dados das localizacoes das unidades prisionais, primeiramente foi realizado

uma estimacao da intensidade do processo utilizando o estimador de Kernel. Para tal,

baseado nas localizacoes das 1392 unidades prisionais distribuıdas por todo Brasil, o

estimador de Kernel foi calculado para diferentes valores de largura da banda e o resultado

e mostrado na Figura 3.6. Sao perceptıveis fortes evidencias de estrutura espacial na

distribuicao pontual das unidades prisionais e com maior incidencia no sudeste, em torno

da regiao mais urbanizada e desenvolvida do Rio de Janeiro, Sao Paulo e Minhas Gerais,

e no nordeste com centro entre Pernambuco e Ceara. Pode-se observar tambem que ao

25

aumentar o tamanho da largura da banda, a estimativa da intensidade vai sendo suavizada

e fica claro a intensidade crescente da regiao norte em direcao ao litoral brasileiro. Porem,

esse estimador fornece apenas uma analise previa do comportamento do processo. Para

melhor compreender o padrao de pontos da amostra e assim poder classifica-lo entre os

tipos de padroes sistematicos (agrupamento ou regularidade), foi investigado a hipotese

de CSR das unidades aplicando-se as funcoes G, F e K.

A Figura 3.7(a) traz o grafico da funcao de distribuicao empırica da funcao G e

claramente pode-se observar o excesso de pequenas distancia de vizinhos mais proximos

o que caracteriza um padrao de agrupamento. A Figura 3.7(b) mostra o grafico da funcao

de distribuicao empırica da funcao F em que se percebe que a estimativa de F encontra-se

abaixo do limite inferior do envelope de simulacoes de um CSR, indicando um padrao de

pontos agrupados.

O conhecimento da intensidade nao caracteriza completamente o comportamento es-

pacial do processo pontual. Existem medidas de momento de ordem superior que ex-

pressam complexas interacoes espaciais (Diggle, 2003). Alem disso, as funcoes G e F

tratam de apenas contagem de pontos na procura do vizinho mais proximo ou dentro

de uma regiao especıfica de estudo, sendo assim muito simplificadas e havendo perda

de informacao no que diz respeito a interacao dos eventos. A funcao K mostra-se mais

completa e robusta para caracterizar o processo pontual, uma vez que se baseia na funcao

de intensidade de segunda ordem e entao agregando mais informacao a respeito da de-

pendencia espacial. Na Figura 3.7(c) encontra-se a estimativa da funcao K menos o valor

teorico sob um CSR (K(r) = πx2) e nota-se que essa permanece acima do limite superior

do envelope de simulacao, caracterizando um padrao de pontos agrupados.

Dada a descricao dos dados e apresentacao do problema, nos proximos capıtulos, sera

feita uma revisao metodologica com o proposito de aprofundar o estudo do fenomeno

apresentado.

26

Figura 3.6: Estimativas da intensidade pontual das unidades prisionais utilizando a funcao de Quartic

Kernel variando a largura da banda.

0.00 0.01 0.02 0.03 0.04 0.05

0.0

0.2

0.4

0.6

0.8

1.0

x

G(x

)

(a)

0.00 0.01 0.02 0.03 0.04 0.05

0.0

0.2

0.4

0.6

0.8

1.0

x

F(x

)

(b)

0.0 0.1 0.2 0.3 0.4

0.00

0.05

0.10

0.15

0.20

x

K(x

)−πx

2

(c)

Figura 3.7: Estimador das funcoes G (a), F (b) e K-πx2 (c) para as unidades prisionais brasileiras

(linha preta solida), respectivas funcoes teoricas para a hipotese de CSR (linha vermelha pontilhada) e

envelopes de 99 simulacoes de CSR (polıgono cinza).

3.1.3 Modelagem para padroes de pontos espaciais

Nessa subsecao serao apresentados alguns dos modelos mais utilizados para padroes

de pontos espaciais. Esses modelos servirao como base para os modelos propostos nesse

27

trabalho.

O Processo de Poisson desempenha um papel fundamental na modelagem de padroes

de pontos. O processo pontual de Poisson X e definido no espaco S ⊆ Rd e especificado

por uma funcao de intensidade λ : S −→ [0,∞) que e localmente integravel, isto e,∫Aλ(s)ds <∞, A ⊂ S (Mφller e Waagepetersen, 2003).

Tem-se que a intensidade do processo e dada por:

µ(A) =

∫A

λ(s)ds A ⊆ S, (3.16)

em que λ(s)ds e a probabilidade de ocorrencia de um ponto em uma regiao infinitesimal

centrada em s e de area ds. A intensidade do processo de Poisson pode ser interpretada

como o numero esperado de pontos em A, para todo A ⊆ S, ou seja E[N(A))] = µ(A).

Mφller e Waagepetersen (2003) definem o processo pontual de Poisson X com funcao

de intensidade λ(·) como aquele que satisfaz as seguintes propriedades (em que µ e dado

por 3.16):

(i) para qualquer A ⊆ S com µ(A) <∞, N(A) segue uma distribuicao de Poisson com

media µ(A), isto e, N(A) ∼ Poisson(µ(A));

(ii) para qualquer n ∈ N e A ⊆ S com 0 < µ(A) < ∞, condicionado em N(A) =

n, o processo pontual X|N(A) = n, que consiste em n pontos independentes e

identicamente distribuıdos em A com densidade f(s) = λ(s)µ(A)

, e um processo pontual

binomial, ou seja, X|N(A) = n ∼ Binomial(A, n, f).

Denota-se que X segue um processo de Poisson na regiao S e com intensidade λ(·)

por X ∼ Poisson(S, λ(·)).

Se χ = {s1, ..., sn}, si ∈ S e uma realizacao do processo pontual. Condicionalmente ao

numero de eventos em S, as localizacoes si sao independentes e tem distribuicao comum

com densidade λ(s)/µ. Entao, a verossimilhanca para λ(·) baseada no dado χ e

L(λ(·); s1, ..., sn) =n∏i=1

λ(si)exp

{−∫A

λ(s)ds

}. (3.17)

Se a funcao de intensidade e uma constante que nao depende das localizacoes dos

eventos de X, isto e, λ(s) = λ, entao tem-se um processo de Poisson homogeneo; do

28

contrario, se a funcao de intensidade λ(s) varia no espaco S, tem-se um processo de

Poisson nao-homogeneo.

O processo de Poisson homogeneo e o mecanismo estocastico mais simples possıvel

para a geracao de padroes de pontos espaciais e, em aplicacoes, e usado como padrao

idealizado de aleatoriedade espacial completa CSR (Diggle, 2013). Ele e isotropico e

estacionario o que faz com que, para muitos fenomenos, nao seja realista, pois se mostra

muito trivial. Ja o processo nao-homogeneo de Poisson se apresenta nao-estacionario,

porem o mesmo nao possui efeitos de segunda ordem.

Apesar da classe de modelos do processo de Poisson ser muito simplista para dados

reais, ela pode ser utilizada como base para construcao de modelos mais flexıveis, como

por exemplo, processos de Cox. Esses sao modelos geralmente utilizados para padroes de

pontos agregados devido a heterogeneidade aleatoria do espaco ou pelo agrupamento de

pontos de eventos relacionados (Mφller e Waagepetersen, 2003) (Diggle, 2013).

O processo de Cox foi considerado pela primeira vez por Lundberg (1940) e Cox

(1955) e ele e naturalmente uma extensao de um processo de Poisson. O processo de

Cox e conduzido por um processo estocastico nao negativo λ = {λ(s) : s ∈ S}. Se a

distribuicao condicional de X dado λ e um processo de Poisson em S com funcao de

intensidade λ, entao diz-se que X e um processo de Cox conduzido por λ.

3.2 Inferencia sob o enfoque bayesiano

Apos a especificacao do modelo, tornar-se essencial a escolha do metodo de estimacao

dos parametros. A seguir e feito um breve resumo sobre os metodos de inferencia baye-

sianos.

Na inferencia Bayesiana, a principal ferramenta para estimacao dos parametros do

modelo e a distribuicao a posteriori. Essas distribuicoes sao capazes de conter tanto in-

formacoes provindas dos dados, atraves da funcao de verossimilhanca, quanto informacoes

vindas de crencas ou conjecturas do pesquisador a respeito dos parametros desconhecidos.

Assim, diferentemente dos metodos classicos que tratam os parametros como quantida-

des fixas, a inferencia Bayesiana atribui aos parametros uma distribuicao de probabi-

29

lidade chamada de distribuicao a priori. Atraves dessas distribuicoes que tais crencas

sao incorporadas ao modelo. No entanto, quando nao se tem informacoes previas so-

bre os parametros, distribuicoes a priori nao informativas sao utilizadas, fazendo assim,

uma associacao a inferencia classica. Logo, a distribuicao a posteriori dos parametros

e dada como a combinacao da funcao de verossimilhanca e da distribuicao a priori dos

parametros, da seguinte forma:

p(θ|s1, ..., sn) ∝ L(λ(·); s1, ..., sn)p(θ), (3.18)

em que p(θ|s1, ..., sn) e p(θ) sao as distribuicoes a posteriori e a priori, respectivamente,

para o vetor de parametros θ. A expressao 3.18 e fundamentada no teorema de Bayes.

Para obter mais detalhes sobre a teoria da inferencia Bayesiana, consultar Migon et al.

(2014).

O estimador Bayesiano para θ e aquele que minimiza o risco a posteriori de Bayes. No

caso particular da funcao perda quadratica, um estimador para θ e representado por θ

que minimiza E[(θ−θ)2|s], isto e, θ = E(θ|s). Alem de estimadores pontuais, o intervalo

de credibilidade tambem pode ser obtido. No entanto, em muitos casos a distribuicao

a posteriori nao possui forma analıtica conhecida ou os calculos dessas medidas resumo

sao de difıcil resolucao. Para contornar tal problema, metodos iterativos computacionais

sao utilizados, como os metodos de Monte Carlo via cadeias de Markov (MCMC).

Os metodos MCMC permitem obter amostras de uma distribuicao alvo π(.) (no caso

da estimacao bayesiana, a distribuicao alvo e a distribuicao a posteriori) por meio de

simulacao estocastica e entao calcular as estimativas amostrais. O processo e iniciado

em um estado arbitrario θ(0), e apos um numero suficientemente grande de simulacoes, a

distribuicao das observacoes geradas e aproximadamente igual a distribuicao alvo π(θ),

θ ∈ Rr. Para mais detalhes desses metodos, consultar Gamerman e Lopes (2006). Os

dois algoritmos MCMC mais significativos serao apresentados a seguir.

3.2.1 Amostrador de Gibbs

O amostrador de Gibbs gera, de forma iterativa, uma amostra da distribuicao conjunta

de interesse a partir das distribuicoes condicionais completas dos parametros desconhe-

30

cidos do modelo. Seja π(θ) a distribuicao conjunta de todos os parametros que se tem o

interesse de amostrar, onde θ = (θ1, ..., θr). Denote por θ−l o vetor composto por todos

os elementos de θ exceto pelo elemento θl, l = 1, ..., r e π(θl|θ−l) a distribuicao condi-

cional completa do parametro θl. O amostrador de Gibbs gera sucessivamente amostras

das distribuicoes condicionais completas da seguinte forma:

1. Determinar um valor inicial para cada θl, definindo θ(0) = (θ(0)1 , ..., θ

(0)r ).

2. Iniciar o contador de iteracao i = 1.

3. Obter um novo valor para θ(i) = (θ(i)1 , ..., θ

(i)d ) pela geracao sucessiva das distri-

buicoes condicionais completas:

θ(i)1 ∼ π(θ1|θ(i−1)

2 , ..., θ(i−1)r ),

θ(i)2 ∼ π(θ2|θ(i)

1 , θ(i−1)3 , θ

(i−1)4 ..., θ(i−1)

r ),

...

θ(i)r ∼ π(θr|θ(i)

1 , ..., θ(i)r−1)

4. Atualizar o contador i = i+ 1.

5. Repetir os passos 3 e 4 ate que a convergencia seja obtida.

A convergencia da cadeia de Markov acontece depois de um perıodo chamado de

aquecimento. Conforme o numero de iteracoes aumenta a cadeia converge sob algu-

mas condicoes para distribuicao de equilıbrio π e a inferencia e feita levando-se em

consideracao os valores gerados apos a convergencia. E comum usar os valores de

θ(a), θ(a+e), θ(a+2e), ... para compor a amostra de θ sendo a − 1 o numero de iteracoes

iniciais do aquecimento e e o espacamento utilizado para diminuir a autocorrelacao que

pode ocorrer nas cadeias geradas, ou seja, considera-se somente valores a cada e iteracoes.

3.2.2 Metropolis-Hastings

Assim como o amostrador de Gibbs, ha interesse de gerar uma sequencia θ(0), θ(1), ..., a

partir de uma cadeia de Markov, e com distribuicao limite π(θ). Utiliza-se esse algoritmo

31

quando nao se sabe gerar da distribuicao condicional completa de um parametro θl. Sendo

assim, o algoritmo utiliza a ideia de que um valor e gerado de um distribuicao auxiliar

q(.) e aceito ou nao com uma dada probabilidade que depende de π(.) e q(.), desse modo

a convergencia para a distribuicao limite π(θ) e garantida. Abaixo estao os passos do

algoritmo.

1. Determinar um valor inicial para θl, definindo θ(0)l .

2. Iniciar o contador de iteracao i = 1.

3. Gerar ξ ∼ q(ξ|θ(i−1)l ) de uma distribuicao conhecida chamada de funcao de transicao

ou distribuicao proposta.

4. Aceita-se o ponto gerado no passo anterior com probabilidade:

min

{1,

π(ξ)

q(ξ|θ(i−1)l )

q(θ(i−1)l |ξ)

π(θ(i−1)l )

}

Se o ponto for aceito, θ(i)l = ξ, caso contrario, θ

(i)l = θ

(i−1)l e a cadeia nao se move.

5. Atualizar o contador i = i+ 1.

6. Repetir os passos 3, 4 e 5 ate que a convergencia seja obtida.

Nota-se que esse algoritmo so apresenta passos para um determinado θl, cuja dis-

tribuicao condicional completa nao e conhecida. Entao, pode-se utilizar os passos de

Metropolis-Hastings para complementar o algoritmo de Gibbs, quando uma ou mais con-

dicionais completas nao sao conhecidas. Uma amostra de aquecimento e o espacamento

tambem sao tomados neste algoritmo. Em ambos os algoritmos, para determinar o ta-

manho da amostra de aquecimento e o espacamento, comumente se realiza uma analise

grafica das iteracoes das cadeias e das funcoes de autocorrelacao. Entao, os valores de a

e e sao tomados ate que todos os parametros alcancem a convergencia e baixa autocor-

relacao.

Apos a utilizacao desses metodos, torna-se trivial a inferencia dos parametros, visto

que se tem uma amostra das distribuicoes a posteriori dos mesmos.

32

3.3 Criterios de comparacao de modelos

Criterios de comparacao de modelos sao comumente utilizados para quantificar o

quanto o modelo proposto se ajusta aos dados, auxiliando na selecao do melhor modelo

ajustado. Nessa secao serao apresentados brevemente tres medidas de selecao de ajuste,

sao elas:

• Akaike Information Criterion (AIC): proposto por Akaike (1974), o AIC fornece

uma estimativa da informacao perdida no ajuste do modelo. Seja logL(y|θ) o

logaritmo da verossimilhanca, em que y sao os dados e θ e o vetor de parametros

desconhecidos. O AIC pode ser definido como

AIC = 2p− 2logL(y|θ),

em que p e o numero de parametros estimados e θ e um estimador para θ. O

primeiro termo da equacao acima consiste em uma penalizacao referente a quan-

tidade de parametros a serem estimados e o segundo termo mensura a perda de

informacao, o que faz com que o criterio recompense a bondade de ajuste. Desta

forma, dado um conjunto de modelos candidatos para os dados, o modelo preferido

e aquele que apresenta menor criterio AIC.

• Bayesian Information Criterion (BIC): proposto por Schwarz et al. (1978), o BIC

se assemelha ao criterio de Akaike por tambem introduzir um termo de penalidade

para o numero de parametros no modelo. No entanto, a penalidade imposta pelo

BIC e maior que no AIC para valores de n maiores que e2. O BIC e formalmente

definido como

BIC = log(n)p− 2logL(y|θ),

em que p e o numero de parametros estimados, n e o tamanho da amostra de dados

e logL(y|θ) e o maximo do logaritmo da verossimilhanca. Assim como no criterio

AIC, dentre um conjunto finito de modelos, o modelo que apresenta o menor valor

para o BIC e preferıvel.

33

• Deviance Information Criterion (DIC): proposto por Spiegelhalter et al. (2002),

o DIC e uma generalizacao do AIC. Comumente usado para selecao de modelos

bayesianos em que a distribuicao a posteriori foi obtida a partir de simulacoes

MCMC. Definindo a deviance como D(θ) = −2logL(y|θ), em que y sao os dados e

θ e o vetor de parametros desconhecidos, tem-se que o DIC e descrito como

DIC = D + pD = 2D −D(θ),

sendo D a media a posteriori da deviance, pD = D−D(θ) e θ as medias a posteriori

dos elementos do vetor de parametros θ.

Nota-se que o DIC e calculado atraves da soma de duas parcelas. A primeira e

uma medida de qualidade do ajuste representada por D. Ja a segunda, pD, e uma

medida de penalidade e representa o numero efetivo de parametros do modelo.

Nessas condicoes, quanto menor o DIC for, melhor sera o ajuste do modelo.

Vale ressaltar que nenhum dos criterios apresentados nessa secao possuem numeros

absolutos otimos, ou ainda, nao informam a respeito da qualidade do modelo, servindo

apenas para comparacoes entre modelos.

34

Capıtulo 4

Estrutura de mistura normal para a

funcao de intensidade

O modelo proposto, neste capıtulo, leva em consideracao um mistura de normais

para tratar a funcao de intensidade do processo pontual. Essa abordagem tem como

objetivo definir a formacao de conglomerados de pontos. Considere que as localizacoes

das unidades prisionais no Brasil, definidas pelas suas coordenadas geograficas (latitude e

longitude), possam ser representadas por uma distribuicao normal bivariada. No entanto,

uma normal bivariada apenas, provavelmente, nao representaria todo o espaco de estudo,

pois sao observados diferentes padroes de comportamento de pontos. Surge entao, a

necessidade de considerar mais de uma distribuicao normal e o uso de uma mistura se

faz justificavel nesse caso.

Ao ajustar um modelo, e interessante a inclusao de covariaveis que ajudariam a ex-

plicar o comportamento dos dados. As covariaveis no presente modelo proposto serao

introduzidas como uma das dimensoes das distribuicoes normais da mistura, ou seja,

as localizacoes das unidades prisionais passariam do espaco R2 composto pelas suas co-

ordenadas para o espaco Rr composto pelas suas coordenadas mais r − 2 covariaveis.

Fazendo-se isso, as covariaveis ajudariam na formacao de conglomerados constituıdos

por pontos geograficamente proximos e que possuem caracterısticas semelhantes. Por

exemplo, unidades prisionais pertencentes a uma regiao especıfica do espaco tipicamente

poderiam formar um conglomerado. Entretanto, se as unidades dos estados dessa regiao

35

assumissem propriedades distintas, esse conglomerado poderia dar origem a novos con-

glomerados, formados para explicar tal heterogeneidade.

A seguir, serao relatados a construcao do modelo proposto e sua inferencia. Tambem

encontra-se nesse capıtulo um breve estudo simulado para a verificacao da validade do

modelo e a aplicacao nos dados reais.

4.1 O modelo

A hipotese do modelo e de que a localizacao de cada evento e gerada atraves de

uma distribuicao normal r-variada, cujos parametros dependem de qual conglomerado o

evento pertence. Supoe-se um total de k conglomerados, sendo nj, j = 1, ..., k, o numero

de eventos gerados por cada um deles. Logo, a mistura de normais desenvolve o papel

de captar os possıveis k conglomerados (clusters) de pontos, em que k e uma quantidade

predefinida.

Considere um conjunto de localizacoes, s1, ..., sn, tal que si ∈ S, S ⊆ Rr, r ≥ 0 e

i = 1, ..., n. Seja X o processo de Poisson que modela esse padrao de pontos, ou seja,

X ∼ Poisson(S, λ(s)) em que λ(s) e funcao de intensidade dada por

λ(s) = λ0

k∑j=1

wjNDr(s|µj,Σj). (4.1)

Em que, NDr(·|µj,Σj) e a densidade de uma normal r-variada com vetor r × 1 de

medias µj, matriz r × r de covariancias Σj e w e um vetor de pesos w = (w1, ..., wk),

tal que wj ∈ [0, 1] e∑k

j=1wj = 1, sendo k o numero de componentes da mistura. Defina

tambem µ = (µ1, ...,µk), Σ = (Σ1, ...,Σk).

Note que o modelo acima faz uso de um processo de Poisson nao-homogeneo com

funcao de intensidade que possui um parametro de escala λ0 multiplicado a uma com-

ponente estocastica que por sua vez representa uma mistura de k normais r-variadas

ponderadas pelos pesos wj.

A funcao de verossimilhanca para um processo de Poisson nao-homogeneo definida

em 3.17 pode ser reescrita para um processo de Cox conduzido pela funcao de intensidade

36

definida em 4.1, como

L(λ0,µ,Σ,w) =n∏i=1

λ0

k∑j=1

wjNDr(si|µj,Σj) exp

{−λ0

∫S

k∑j=1

wjNDr(s|µj,Σj)ds

}(4.2)

Kottas e Sanso (2007) construıram um modelo de mistura para a intensidade do

processo de Poisson espacial, no qual o padrao espacial era observado em uma regiao

limitada retangular A ⊂ S e, sem perda de generalidade, assumiu-se que A = (0, 1) ×

(0, 1). Com isso, Kottas e Sanso (2007) puderam atribuir uma mistura de distribuicoes

bivariadas com marginais Beta a sua funcao de intensidade. Como o distribuicao Beta

esta bem definida em toda a regiao de estudo, Kottas e Sanso (2007) eliminaram o

problema do efeito de borda. No entanto, nesse trabalho ha o interesse de modelar

padroes de pontos em regioes limitadas irregulares. Ao utilizar a mistura Gaussiana para

a modelagem da funcao de intensidade, depara-se com tal problema. Sabe-se que uma

mistura de normais r-variadas sustenta-se no Rr e portanto, para tratar a integral na

funcao 4.2 e contornar o efeito de borda, fez-se o uso de variaveis latentes para ampliar

o espaco de estudo S para o Rr. Assim, definindo X ′ = sn+1, ..., sn+m como uma colecao

de m pontos latentes em Sc = Rr\S, a funcao de verossimilhanca para o processo de

Poisson definido no Rr e dada por

L(λ0,µ,Σ,w, X′) =

n+m∏i=1

λ0

k∑j=1

wjNDr(si|µj,Σj)

× exp

{−λ0

∫Rr

k∑j=1

wjNDr(s|µj,Σj)ds

}(4.3)

E como∫Rr∑k

j=1wjNDr(s|µj,Σj)ds = 1, e facil perceber que a funcao de verossimi-

lhanca definida acima e equivalente a

L(λ0,µ,Σ,w, X′) = exp {−λ0}λn+m

0

n+m∏i=1

k∑j=1

wjNDr(si|µj,Σj), (4.4)

e tem-se que cada conglomerado j e composto por nj pontos observados mais mj pontos

latentes.

Para identificar quais pontos pertencem a cada conglomerado, considera-se um parametro

indicador d = (dij; i = 1, ...n; j = 1, ..., k) nao observavel, tal que dij = 1 se a loca-

lizacao si pertence ao conglomerado j, e dij = 0 caso contrario. Dessa forma, tem-se que

37

P (si|dij = 1) = NDr(si|µj,Σj) e P (dij = 1|w) = wj. Alem disso, tem-se que P (dij|w)

segue uma distribuicao multinomial de parametros (1,w) e a densidade conjunta para os

dados observados si e o parametro indicador d, condicionada aos parametros µ,Σ, w e

o pontos latentes X ′ e dada por (Dellaportas e Papageorgiou, 2006)

P (s,d|µ,Σ,w, X ′) = P (s|µ,Σ,w, X ′,d)P (d|w) =n+m∏i=1

k∏j=1

[wjNDr(si|µj,Σj)]dij . (4.5)

Introduzir a variavel latente d no modelo facilita a inferencia para o conjunto de parametros

θ = (λ0,w,µ,Σ), uma vez que, condicionado a d, a verossimilhanca definida em 4.4

torna-se

L(λ0,µ,Σ,w, X′,d) = exp {−λ0}λn+m

0

n+m∏i=1

k∏j=1

[wjNDr(si|µj,Σj)]dij . (4.6)

Sob o enfoque bayesiano, distribuicoes a priori sao atribuıdas para os parametros. As

priores adotadas foram:

λ0 ∼ Gama(aλ, bλ), (4.7)

w ∼ Dirichlet(αw), (4.8)

µj ∼ Nr(c,V = σ2µIr), (4.9)

Σj ∼ WishartInversa(Ψ, ν), (4.10)

dij ∼ UniformeDiscreta(0, 1), (4.11)

X ′ ∼ Poisson(Sc, λ(s)) (4.12)

em que aλ, bλ,αw = (αw1, ..., αwk), c, σ2µ,Ψ,ν sao medidas conhecidas chamadas de hi-

perparametros, Ir e a matriz identidade r × r e X ′ e a distribuicao a priori para os m

pontos latentes que devem ser gerados a cada iteracao do algoritmo.

As distribuicoes acima foram definidas de forma independente e, portanto, pode-se

escrever sua conjunta da seguinte forma:

p(θ,d) = p(λ0)p(w)k∏j=1

p(µj)p(Σj)n+m∏i=1

p(dij). (4.13)

Tais resultados apresentados nesta secao permitem a construcao da distribuicao a

posteriori que sera apresentada na secao a seguir.

38

4.1.1 Distribuicao a posteriori

Considerando uma estrutura de mistura de normais r-variadas para a funcao de inten-

sidade, como visto na secao anterior, e prioris para o vetor de parametros desconhecidos

θ definidas em 4.13, define-se a distribuicao a posteriori como:

p(θ,d|s1, ..., sn+m) ∝ L(λ0,µ,Σ,w, X′,d)p(λ0)p(w)

k∏j=1

p(µj)p(Σj)n+m∏i=1

p(dij)

∝ exp {−λ0}λn+m0

n+m∏i=1

k∏j=1

[wjNDr(si|µj,Σj)]dij

× λaλ−10 exp{−bλλ0}

×k∏j=1

wαwj−1j

×k∏j=1

exp

{−1

2(µj − c)′V−1(µj − c)

}

×k∏j=1

|Σj|−ν+r+1

2 exp

{−1

2tr(ΨΣ−1

j )

}

×k∏j=1

n+m∏i=1

1

2. (4.14)

A distribuicao acima nao pode ser tratada analiticamente. Portanto, para poder

inferir sobre os parametros, e necessario a aplicacao de metodos numericos, como os

metodos de Monte Carlo via Cadeias de Markov (MCMC) revisados no capıtulo anterior.

Em particular, o algoritmo amostrador de Gibbs sera utilizado para obter amostras dos

parametros a partir da distribuicao a posteriori definida em 4.14. Para tal, e preciso

obter as distribuicoes condicionais completas para cada parametro de interesse, o que

sera feito a seguir:

39

• Condicional completa para λ0:

p(λ0|·) ∝ L(λ0,µ,Σ,w, X′,d)p(λ0)


n+m∏i=1

k∏j=1

[wjNDr(si|µj,Σj)]dij λaλ−1

0 exp{−bλλ0}

∝ exp {−λ0}λn+m0 λaλ−1

0 exp{−bλλ0}

∝ λn+m+aλ−10 exp{−(bλ + 1)λ0}

λ0|· ∼ Gama(n+m+ aλ, bλ + 1). (4.15)

Entao, a condicional completa de λ0 segue uma distribuicao Gama com parametro

de forma n+m+ aλ e parametro de taxa bλ + 1.

• Condicional completa para w:

p(w|·) ∝ L(λ0,µ,Σ,w, X′,d)p(w)


n+m∏i=1

k∏j=1


k∏j=1

wαwj−1j

∝k∏j=1

wnj+mjj w

αwj−1j

∝k∏j=1

wnj+mj+αwj−1j

w|· ∼ Dirichlet(n1 +m1 + αw1, ..., nk +mk + αwk). (4.16)

Entao, a condicional completa de w segue uma distribuicao Dirichlet de ordem k

com vetor de parametros α∗w = (n1 +m1 + αw1, ..., nk +mk + αwk).

40

• Condicional completa para µj:

p(µj|·) ∝ L(λ0,µ,Σ,w, X′,d)p(µj)


n+m∏i=1

k∏j=1


× exp{−1

2(µj − c)′V−1(µj − c)

}

∝ exp

−1

2

∑∀i:dij=1

[(si − µj)

′Σ−1j (si − µj)

]× exp

{−1

2(µj − c)′V−1(µj − c)

}

∝ exp

−1

2

∑∀i:dij=1

(−s′iΣ−1j µj − µ′jΣ

−1j si + µ′jΣ

−1j µj)

× exp

{−1

2(µ′jV

−1µj − µ′jV−1c− c′V−1µj)

}

∝ exp

−1

2

µ′j ((nj +mj)Σ−1j + V−1

)µj − µ′j

Σ−1j

∑∀i:dij=1

si + V−1c

×exp

−1

2

− ∑∀i:dij=1

s′iΣ−1j + c′V−1

µj

µj|· ∼ Nr (c∗; V∗) (4.17)

Entao, a condicional completa de µj segue uma distribuicao Normal r-variada com

matriz de covariancias V∗ =((nj +mj)Σ

−1j + V−1

)−1e vetor de medias c∗ =(

V∗(Σ−1j

∑∀i:dij=1 si + V−1c

)).

41

• Condicional completa para Σj:

p(Σj|·) ∝ L(λ0,µ,Σ,w, X′,d)p(Σj)


n+m∏i=1

k∏j=1

[wjNDr(si|µj,Σj)]dij |Σj|−

ν+r+12

× exp{−1

2tr(ΨΣ−1

j )

}

∝ |Σj|−nj+mj

2 exp

−1

2

∑∀i:dij=1

[(si − µj)

′Σ−1j (si − µj)

] |Σj|−ν+r+1

2

× exp{−1

2tr(ΨΣ−1

j )

}

∝ |Σj|−ν+nj+mj+r+1

2 exp

−1

2tr

Σ−1j

∑∀i:dij=1

(si − µj)(si − µj)′ + ΨΣ−1

j

Σj|· ∼ WishartInversa

∑∀i:dij=1

(si − µj)(si − µj)′ + Ψ; ν + nj +mj

(4.18)

Entao, a condicional completa de Σj segue uma distribuicao Wishart Inversa com

matriz de escala Ψ∗ =(∑

∀i:di=j(si − µj)(si − µj)′ + Ψ

)e graus de liberdade ν∗ =

ν + nj +mj.

• Condicional completa para dij:

p(dij = 1|·) ∝ L(λ0,µ,Σ,w, X′,d)


n+m∏i=1

k∏j=1


∝ wjNDr(si|µj,Σj). (4.19)

No caso do parametro dij, note que sua condicional completa e uma funcao de

probabilidade, pois d e uma variavel aleatoria discreta. Para obter exatamente

essa funcao de probabilidade, basta achar a constante para que as probabilidades

somem 1. Assim,

p(dij = 1|·) =wjNDr(si|µj,Σj)∑kj=1wjNDr(si|µj,Σj)

.

A ser capaz de amostrar de todas as condicionais completas acima, a inferencia sobre

os parametros para o processo de Cox que envolve misturas de normais em sua funcao de

42

intensidade pode ser realizada. Na secao que procede, sera apresentado um breve estudo

simulado para para a validacao do modelo proposto.

4.2 Estudo simulado

Nesse estudo, valores para os parametros sao fixados para geracao de dados artificiais a

partir dos modelos propostos. Logo apos, o modelo e ajustado para os valores da amostra

gerada e se as estimativas para os parametros se aproximarem dos valores verdadeiros,

pode-se dizer que o modelo e valido. A seguir, sera rapidamente comentado como e feita

a simulacao de um processo de Poisson nao homogeneo. Vale ressaltar que essa simulacao

tambem foi realizada para o modelo do capıtulo que procede.

Para a simulacao de um processo de Poisson nao homogeneo, pode-se supor que

eventos ocorrem segundo um processo de Poisson homogeneo com funcao de intensidade

constante λ, onde nem todos os eventos sao computados. A probabilidade de ocorrencia

de um evento na localizacao s e dada por p(s), independente do processo. Assim, os

eventos considerados formam um processo de Poisson nao homogeneo com funcao de

intensidade λ(s) = λp(s).

A partir desse resultado, os passos para a geracao de um processo de Poisson nao

homogeneo sao: (1) busca-se um valor de λ tal que λ(s) ≤ λ ∀s; (2) obtem-se as proba-

bilidades de aceitacao dos eventos dadas por p(s) = λ(s)λ

, (3) simula-se de um processo

de Poisson homogeneo com funcao de intensidade λ e (4) aceita-se o ponto s com proba-

bilidade p(s).

Nesse momento, sera aplicada a metodologia proposta ao conjunto de dados simula-

dos. Em tal modelo, uma estrutura de mistura de normais foi adotada para compor a

funcao de intensidade do processo, definida na Equacao 4.1. Considere uma superfıcie

plana fictıcia no quadrado [0, 10]× [0, 10] onde observa-se dois conglomerados de pontos.

Serao estudados dois cenarios com diferentes valores para os parametros, dados por

43

→ Cenario 1

λ0 = 500

w1 = 0, 3 w2 = 0, 7

µ1 = (3, 4)′

µ2 = (8, 7)′

Σ1 =

1 −0, 7

−0, 7 1

Σ2 =

2 0, 5

0, 5 2

→ Cenario 2

λ0 = 500

w1 = 0, 2 w2 = 0, 8

µ1 = (4, 5)′

µ2 = (6, 5)′

Σ1 =

1 −0, 7

−0, 7 1

Σ2 =

2 0, 5

0, 5 2

A Figura 4.1 mostra o comportamento da funcao de intensidade referentes a esses

dois cenarios. Percebe-se que, no cenario 2, os conglomerados estao mais proximos, o

que pode fazer com que a estimacao dos parametros seja um pouco mais custosa nesse

caso. No entanto, isso ira ajudar a verificar se o modelo e sensıvel as situacoes em que

os conglomerados de pontos nao estejam tao bem definidos.

(a) (b)

Figura 4.1: Funcao de intensidade simulada considerando o cenario 1 (a) e o cenario 2

(b) para o modelo com mistura de normais.

Os dados simulados para os dois cenarios, representados na Figura 4.2, foram gerados

seguindo os passos para a simulacao de um processo de Poisson nao homogeneo. As

amostras foram compostas por 480 pontos no primeiro cenario e 507 pontos no segundo

cenario. Essa diferenca no tamanho da amostra e explicada pela aleatoriedade que envolve

44

o processo de simulacao, lembrando que os pontos primeiramente sao simulados de um

processo homogeneo e depois aceitos para compor a amostra de acordo com uma dada

probabilidade que depende da funcao de intensidade em cada cenario. Alem disso, ja na

Figura 4.1, percebe-se que a funcao de intensidade assume valores mais altos no cenario

2, fazendo-se aceitavel um tamanho de amostra maior para esse caso.

(a) (b)

Figura 4.2: Pontos simulados considerando o cenario 1 (a) e o cenario 2 (b) para o modelo

com mistura de normais.

Distribuicoes vagas a priori foram consideradas para todos os parametros, sao elas:

λ0 ∼ Gama(2, 1/36),

w ∼ Dirichlet(1k),

µj ∼ N2

0

0

,

100 0

0 100

,Σj ∼ WishartInversa

1 0

0 1

, k + 1

,dij ∼ UniformeDiscreta(0, 1),

em que, 1k e um vetor de k elementos composto apenas pelo numero 1 e k = 2.

Para o ajuste do modelo, foi gerada uma cadeia de parametros com 50.000 iteracoes

e retirada uma amostra de aquecimento de tamanho 2.000. Considera-se iteracoes com

45

espacamento de tamanho 20, totalizando uma amostra final de parametros de 2.401

valores.

Para inferir sobre os parametros, o estimador utilizado foi a moda que pode ser

calculada a partir dos histogramas das cadeias dos respectivos parametros. A escolha da

moda como estimador se da pelo fato de que essa e mais informativa para distribuicoes

assimetricas e nao e influenciada por valores discrepantes. Pela a analise dos histogramas

das amostras a posteriori dos parametros conclui-se que o modelo e eficiente e sensıvel

a identificacao das componentes das misturas. As Figuras 4.3, 4.4 e 4.5 mostram os

histogramas das amostras dos parametros considerando uma estrutura de misturas de

duas normais para a funcao de intensidade no cenario 1. De modo geral, as estimativas

das modas apresentam resultados satisfatorios para todos os parametros. Alem disso,

todos os intervalos de credibilidade de 95% contem os verdadeiros valores dos parametros.

µ11

Den

sida

de

2.6 2.8 3.0 3.2

01

23

4

µ12

Den

sida

de

3.4 3.6 3.8 4.0 4.2

01

23

µ21

Den

sida

de

7.8 8.0 8.2 8.4 8.6 8.8 9.0

0.0

0.5

1.0

1.5

2.0

2.5

µ22

Den

sida

de

6.7 6.8 6.9 7.0 7.1 7.2 7.3

01

23

4

Figura 4.3: Histogramas para as amostras a posteriori para os parametros µ1 (superior)

e µ2 (inferior) no primeiro cenario dos dados simulados. Limites do intervalo de credibi-

lidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada azul), valor

verdadeiro (linha tracejada verde) e distribuicao a priori (linha pontilhada preta).

46

σ11

Den

sida

de

0.6 0.8 1.0 1.2 1.4 1.6 1.8

0.0

0.5

1.0

1.5

2.0

2.5

σ21

Den

sida

de

−1.6 −1.4 −1.2 −1.0 −0.8 −0.6 −0.4

0.0

0.5

1.0

1.5

2.0

2.5

σ22

Den

sida

de

0.5 1.0 1.5 2.0 2.5 3.0

0.0

0.5

1.0

1.5

2.0

σ11

Den

sida

de

1.5 2.0 2.5 3.0 3.5 4.0 4.5

0.0

0.2

0.4

0.6

0.8

1.0

σ21

Den

sida

de

0.0 0.5 1.0 1.5

0.0

0.5

1.0

1.5

2.0

σ22

Den

sida

de

1.2 1.4 1.6 1.8 2.0 2.2 2.4

0.0

0.5

1.0

1.5

2.0

Figura 4.4: Histogramas para as amostras a posteriori para os parametros Σ1 (superior)

e Σ2 (inferior) no primeiro cenario dos dados simulados. Limites do intervalo de credi-

bilidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada azul) e

valor verdadeiro (linha tracejada verde).

λ

Den

sida

de

450 500 550 600 650

0.00

00.

004

0.00

80.

012

w 1

Den

sida

de

0.25 0.30 0.35 0.40

05

1015

w 2

Den

sida

de

0.60 0.65 0.70 0.75

05

1015

Figura 4.5: Histogramas para as amostras a posteriori para os parametros λ0 (esquerda),

w1 (meio) e w2 (direita) no primeiro cenario dos dados simulados. Limites do intervalo

de credibilidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada

azul), valor verdadeiro (linha tracejada verde) e distribuicao a priori (linha pontilhada

preta).

Ja para o cenario 2, analisando as Figuras 4.6, 4.7 e 4.8 percebe-se que as estimativas

47

para as modas tambem apresentam valores satisfatorios e que todos os intervalos de

credibilidade de 95% contem os verdadeiros valores dos parametros. Assim, o modelo

proposto mostra-se eficiente na identificacao das componentes da mistura mesmo quando

os conglomerados estao bem proximos.

µ11

Den

sida

de

3,5 4,0 4,5 5,0 5,5

0,0

0,4

0,8

1,2

µ12

Den

sida

de

4,0 4,5 5,0 5,5

0,0

0,5

1,0

1,5

2,0

µ21

Den

sida

de

5,6 5,8 6,0 6,2 6,4 6,6 6,8

0,0

0,5

1,0

1,5

2,0

2,5

µ22

Den

sida

de

4,6 4,8 5,0 5,2 5,4 5,6 5,8

0,0

0,5

1,0

1,5

2,0

2,5

3,0

Figura 4.6: Histogramas para as amostras a posteriori para os parametros µ1 (superior)

e µ2 (inferior) no segundo cenario dos dados simulados. Limites do intervalo de credibi-

lidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada azul), valor

verdadeiro (linha tracejada verde) e distribuicao a priori (linha pontilhada preta).

48

σ11

Den

sida

de

0 1 2 3 4 5

0,0

0,2

0,4

0,6

σ12

Den

sida

de

−2,5 −2,0 −1,5 −1,0 −0,5 0,0 0,5

0,0

0,2

0,4

0,6

0,8

1,0

1,2

σ22

Den

sida

de

0,0 0,5 1,0 1,5 2,0 2,5 3,0

0,0

0,2

0,4

0,6

0,8

1,0

σ11

Den

sida

de

1,0 1,5 2,0 2,5 3,0 3,5 4,0

0,0

0,2

0,4

0,6

0,8

1,0

σ12

Den

sida

de

−0,5 0,0 0,5 1,0 1,5 2,0

0,0

0,5

1,0

1,5

σ22

Den

sida

de

1 2 3 4 5

0,0

0,2

0,4

0,6

0,8

1,0

1,2

Figura 4.7: Histogramas para as amostras a posteriori para os parametros Σ1 (superior)

e Σ2 (inferior) no segundo cenario dos dados simulados. Limites do intervalo de credi-

bilidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada azul) e

valor verdadeiro (linha tracejada verde).

λ

Den

sida

de

450 500 550 600

0,00

00,

005

0,01

00,

015

w 1

Den

sida

de

0,1 0,2 0,3 0,4 0,5 0,6 0,7

01

23

45

w 2

Den

sida

de

0,3 0,4 0,5 0,6 0,7 0,8 0,9

01

23

45

Figura 4.8: Histogramas para as amostras a posteriori para os parametros λ0 (esquerda),

w1 (meio) e w2 (direita) no segundo cenario dos dados simulados. Limites do intervalo

de credibilidade de 95% (linha tracejada vermelha), moda a posteriori (linha tracejada

azul), valor verdadeiro (linha tracejada verde) e distribuicao a priori (linha pontilhada

preta).

49

Por fim, na Figura 4.9 estao representadas as funcoes de intensidade estimadas para

os dados simulados de acordo com cada cenario. Nota-se que a funcao de intensidade

para o cenario 2 foi um pouco superestimada, ja que ela apresenta valores ajustados

mais altos. Quanto a estrutura das funcoes, ha pouca diferenca, sendo mais nıtida as

diferencas no cenario 2.

(a) (b)

Figura 4.9: Funcoes de intensidade ajustada para os dados simulados referentes ao cenario

1 (a) e cenario 2 (b) para o modelo com mistura de normais.

4.3 Aplicacao

Neste momento, serao apresentadas quatro modelos ajustados para os dados das uni-

dades prisionais no Brasil. Todos os modelos consideram uma estrutura de mistura de

normais para a funcao de intensidade do processo discutida nesse capıtulo.

Na primeira abordagem, as dimensoes de cada normal da mistura correspondem ape-

nas as coordenadas (longitude e latitude) das localizacoes das unidades prisionais. Tais

coordenadas estao em formato de graus decimais aproximadas com 5 casas decimais. Elas

foram obtidas a partir da funcao “geocode” do pacote “ggmap” no Software estatıstico

R, utilizando os enderecos contendo pelo menos o CEP das unidades. Neste ajuste, o

objetivo e analisar o comportamento espacial das unidades, verificando como os pontos

estao dispostos no territorio brasileiro para identificar padroes.

Nos tres ajustes seguintes, introduz-se covariaveis nas dimensoes das normais da mis-

tura. Sao analisadas a inclusao do logaritmo da taxa de ocupacao prisional; logaritmo

50

da capacidade prisional; e logaritmo da taxa de ocupacao prisional conjuntamente com o

logaritmo da capacidade prisional. Para esses ajustes, o objetivo e analisar o comporta-

mento espacial das unidades associando uma ou duas covariaveis referentes as unidades

e identificar novos padroes de pontos.

4.3.1 Mistura de normais em duas dimensoes

Foram observadas 1392 coordenadas das localizacoes das unidades prisionais. Para o

ajuste do modelo, as distribuicoes a priori para os parametros foram:

λ0 ∼ Gama(2, 1/36), (4.20)

w ∼ Dirichlet(4k), (4.21)

µj ∼ N2

0

0

,

100 0

0 100

, (4.22)

Σj ∼ WishartInversa

1 0

0 1

, k + 1

, (4.23)

dij ∼ UniformeDiscreta(0, 1), (4.24)

em que 4k e um vetor de k elementos composto apenas pelo numero 4 e k = 2, 3, 4, 5, 6.

Note a escolha de distribuicoes nao informativas para a maioria dos parametros e uma

distribuicao Dirichlet para o parametro w com variancia um pouco mais restrita para

evitar pesos muito proximos de zero.

Para a obtencao de uma amostra a posteriori para os parametros, um cadeia foi gerada

com 50.000 iteracoes e tomados uma amostra de aquecimento de tamanho 2.500 e um

espacamento de tamanho 50. A amostra final de cada parametro foi composta por 951

valores.

Com o objetivo de verificar qual o melhor valor k de componentes na mistura, foram

ajustados modelos para varios valores de k e analisados os criterios de comparacao de

modelos, como mostra a Tabela 4.1.

51

Tabela 4.1: Criterios de comparacao para os modelos com mistura de normais conside-

rando apenas as coordenadas na dimensao.

Criterios k = 2 k = 3 k = 4 k = 5 k = 6

DIC 4537,974 2653,186 2074,393 1295,708 1829,758

BIC 4484,297 2750,911 2021,457 1437,275 2023,089

AIC 4421,435 2656,618 1895,733 1280,120 1834,503

Note que o modelo que melhor ajusta os dados, segundo todos os criterios considera-

dos, e o modelo que considera uma mistura de cinco normais bivariadas para a funcao de

intensidade do processo. A seguir, sao mostrados os resultados das amostras a posteriori

para os parametros referentes a esse ajuste.

Tabela 4.2: Moda e intervalo de credibilidade de 95% a posteriori para os parametros

do modelo com mistura de 5 normais com dimensoes compostas pelas coordenadas das

unidades prisionais no Brasil.

Parametros Moda 95% Parametros Moda 95%

λ0 2522,826 (2256,392; 2838,296) σ21,11 10,440 (7,721; 13,559)

w1 0,180 (0,139; 0,224) σ21,12 16,744 (11,906; 24,332)

w2 0,058 (0,042; 0,083) σ21,22 57,857 (42,497; 84,561)

w3 0,098 (0,057; 0,164) σ22,11 23,388 (12,842; 41,999)

w4 0,317 (0,261; 0,378) σ22,12 -8,121 (-17,690; -3,737)

w5 0,316 (0,268; 0,400) σ22,22 7,415 (4,639; 13,279)

µ1,1 -51,241 (-51,731; -50,637) σ23,11 80,000 (45,888; 132,252)

µ1,2 -21,227 (-22,816; -19,626) σ23,12 2,403 (-5,554; 10,086)

µ2,1 -60,789 (-62,527; -58,673) σ23,22 3,756 (2,397; 6,078)

µ2,2 -12,972 (-14,403; -12,195) σ24,11 10,527 (7,720; 14,570)

µ3,1 -42,208 (-46,283; -36,261) σ24,12 9,750 (6,595; 13,820)

µ3,2 -0,986 (-1,982 ; 0,290) σ24,22 15,759 (12,131; 20,874)

µ4,1 -45,270 (-45,763; -44,754) σ25,11 9,525 (6,889; 15,000)

µ4,2 -24,105 (-24,889; -23,302) σ25,12 -6,296 (-11,209; -3,202)

µ5,1 -36,476 (-37,102; -35,502) σ25,22 10,494 (6,467; 17,779)

µ5,2 -6,397 (-7,302 ; -5,450)

52

A Tabela 4.2 mostra a estimativa da moda a posteriori para os parametros do modelo

e pode-se observar que existem dois conglomerados de pontos com maior peso (w4 =

0, 317 e w5 = 0, 316). Esses conglomerados possuem suas respectivas medias centradas

aproximadamente entre os estados de Sao Paulo e Rio de Janeiro e o outro entre os

estados do Rio Grande do Norte e Paraıba. Pode-se ressaltar ainda que as estimativas

para as variancias e covariancias das normais da mistura apresentam menor precisao com

intervalos de credibilidade de amplitudes maiores.

A Figura 4.10 mostra a funcao de intensidade ajustada para os dados. No mapa

a esquerda, os pontos recebem cores diferentes segundo os conglomerados estimados a

partir da moda a posteriori para o parametro d. Note que o modelo acomoda os pontos

em cada conglomerado tomando distribuicoes normais dispostas em diferentes direcoes

de acordo com a estrutura geografica. Picos de intensidade podem ser observados nas

regioes sudeste e nordeste.

(a)

(b)

Figura 4.10: Contorno da funcao de intensidade ajustada (a) e Mapa de calor para a

funcao de intensidade ajustada (b) para o modelo com estrutura de mistura normal com

coordenadas das unidades prisionais nas dimensoes.

Os proximos modelos que serao apresentados incorporam covariaveis ligadas aos pon-

53

tos nas dimensoes das normais da mistura. Assim, o espaco de estudo passa do plano R2

para o espaco com tres dimensoes R3 ou quatro dimensoes R4.

4.3.2 Mistura de normais em tres dimensoes

Com o objetivo de entender o fenomeno do encarceramento no Brasil, serao incorpo-

radas ao modelo covariaveis como a taxa de ocupacao prisional. Essa taxa e de grande

importancia, pois, remete o valor percentual da quantidade de presos por vagas. Por

meio dessa, pode-se verificar a situacao de alocacao dos presos em cada unidade. Alem

disso, sera analisado se unidades proximas apresentam taxas de ocupacao semelhantes.

Para esse ajuste, as distribuicoes a priori permanecem as mesmas descritas nas Equacoes

de 4.20 a 4.24. Tambem foi gerada uma cadeia com 50.000 iteracoes e tomados uma amos-

tra de aquecimento de tamanho 2.500 e um espacamento de tamanho 50. A amostra final

de cada parametro foi composta por 951 valores.

A Tabela 4.3 mostra o resultado dos criterios de comparacao de modelos para o ajuste

dos modelos com estrutura de mistura normal para diversos valores k de componentes na

mistura considerando que as dimensoes sao compostas pelas coordenadas e o logaritmo

da taxa de ocupacao das unidades prisionais no Brasil.


rando coordenadas e logaritmo da taxa de ocupacao prisional na dimensao.

Criterios k = 2 k = 3 k = 4 k = 5 k = 6

DIC 6955,435 5312,433 4531,929 3260,174 4625,383

BIC 6984,563 5317,971 4644,310 4822,505 5035,927

AIC 6880,053 5161,206 4435,291 4561,231 4722,399

De acordo com os criterios de comparacao, os modelos que melhor ajustam os dados

sao os que possuem uma mistura de quatro normais e mistura de cinco normais. Como

os criterios para esses dois modelos nao diferem muito, optou-se por mostrar os resulta-

dos da mistura com quatro normais, ja que quatro conglomerados formados em ambos

os modelos sao bem parecidos e o quinto conglomerado nao apresenta muito ganho de

54

informacao. Alem disso, sera priorizado modelos com menos parametros. Segue a Tabela

4.3 para os resultados do ajuste do modelo com mistura de quatro normais.


do modelo com mistura de 4 normais com dimensoes compostas pelas coordenadas e

logaritmo da taxa de ocupacao das unidades prisionais no Brasil.


λ0 2854,630 (2599,684; 3147,078) σ21,23 -0,832 (-4,050; 1,144)

w1 0,114 (0,079; 0,160) σ21,33 0,210 (0,155; 0,281)

w2 0,324 (0,273; 0,392) σ22,11 17,556 (12,088; 27,180)

w3 0,309 (0,242; 0,365) σ22,12 -11,571 (-18,507; -6,805)

w4 0,243 (0,201; 0,303) σ22,13 -0,255 (-0,867; 0,399)

µ1,1 -48,626 (-48,947; -48,271) σ22,22 12,681 (8,687; 19,411)

µ1,2 -14,562 (-19,801; -8,540) σ22,23 0,823 (0,323; 1,473)

µ1,3 0,314 (0,218; 0,411) σ22,33 0,616 (0,527; 0,732)

µ2,1 -36,194 (-37,043; -34,834) σ23,11 53,208 (37,865; 80,305)

µ2,2 -6,628 (-7,776; -5,842) σ23,12 -34,796 (-59,631; -22,541)

µ2,3 0,390 (0,276; 0,516) σ23,13 0,090 (-0,814; 1,156)

µ3,1 -54,441 (-56,345; -51,628) σ23,22 96,131 (70,818; 125,314)

µ3,2 -24,228 (-26,722; -22,001) σ23,23 1,343 (0,422; 2,390)

µ3,3 0,124 (0,014; 0,222) σ23,33 0,465 (0,396; 0,551)

µ4,1 -44,816 (-45,289; -44,118) σ24,11 11,282 (8,438; 17,110)

µ4,2 -23,637 (-24,525; -22,718) σ24,12 10,951 (7,436; 15,653)

µ4,3 0,260 (0,165; 0,335) σ24,13 -0,164 (-0,427; 0,080)

σ21,11 1,405 (0,866; 2,056) σ2

4,22 17,441 (13,877; 23,469)

σ21,12 -1,137 (-10,316; 8,570) σ2

4,23 0,146 (-0,157; 0,578)

σ21,13 0,085 (-0,044; 0,228) σ2

4,33 0,210 (0,174; 0,260)

σ21,22 178,693 (84,881; 399,125)

A maioria das estimativas dos parametros mostram-se bem precisas com amplitudes

pequenas nos intervalos de credibilidade de 95%. A maior estimativa para a media da

terceira coordenada da localizacao dos pontos (relativa ao logaritmo da taxa de ocupacao

55

– 0, 390) e referente ao conglomerado que cobre a maioria dos estados do nordeste (con-

glomerado 2), a segunda maior (0, 314) e referente ao conglomerado centrado no estado

de Goias (conglomerado 1).

A Figura 4.11(a) mostra a identificacao dos conglomerados estimados de pontos e a

Figura 4.11(b) mostra a distribuicao do logaritmo da taxa de ocupacao das unidades de

acordo com os conglomerados identificados — as cores das caixas correspondem as cores

dos pontos no mapa e a linha tracejada vermelha indica a taxa de ocupacao igual a 100%

(logaritmo da taxa de ocupacao igual a zero). Repare que a diferenca sutil entre os box-

plots de cada conglomerado sugere que a formacao dos conglomerados esta sendo mais

influenciada pelas localizacoes dos pontos do que pela covariavel taxa de ocupacao. A

maioria das unidades em cada conglomerado possuem taxas de ocupacao altas, sendo que

em torno de 75% das unidades ultrapassa o numero de presos por vaga. Aparentemente,

o modelo nao identificou conglomerados de pontos tao marcantes em relacao a taxa de

ocupacao. Vale ressaltar que o conglomerado 3 apresenta a menor mediana da taxa de

ocupacao e tambem possui muitos pontos discrepantes.

(a)

1 2 3 4

−3

−2

−1

01

2

(b)

Figura 4.11: Localizacoes das unidades prisionais com cores representando cada conglo-

merado de pontos para o modelo com coordenadas e logaritmo da taxa de ocupacao (a).

Box-plot do logaritmo da taxa de ocupacao de acordo com os conglomerados de pontos

(b), logaritmo da taxa de ocupacao igual a zero (linha tracejada vermelha).

56

Para a analise da funcao de intensidade, a Figura 4.12 mostra a funcao de intensidade

estimada para cada unidade. As cores e as areas dos cırculos nesse grafico representam

a funcao de intensidade estimada pelo modelo com mistura de quatro normais para os

pontos tridimensionais compostos pelas coordenadas e logaritmo da taxa de ocupacao.

Percebe-se uma alta intensidade nas regioes sudeste e nordeste. Esses resultados nao

diferem muito da funcao de intensidade estimada para o modelo que considerava apenas

as coordenadas nas dimensoes.

Figura 4.12: Funcao de intensidade estimada para o modelo com mistura de 4 normais

para cada coordenada e logaritmo da taxa de ocupacao das unidades prisionais. Cor e

area dos cırculos representam a funcao de intensidade estimada.

Outra covariavel que sera estudada e inclusa no modelo e a capacidade prisional das

unidades. Com essa variavel e possıvel analisar o tamanho das unidades, percebendo se

ha diferenca na estrutura das unidades em regioes distintas do Brasil. Assim, foi proposto

tambem um modelo com mistura de normais em que as dimensoes sao compostas pelas

coordenadas e o logaritmo da capacidade prisional das unidades do Brasil.

Para esse ajuste, as distribuicoes a priori permanecem as mesmas descritas nas Equacoes

de 4.20 a 4.24. Uma cadeia com 50.000 iteracoes foi gerada e a convergencia foi alcancada

apos um perıodo de aquecimento de 12.000. Para tratar a autocorrelacao dos valores da

cadeia, um espacamento de tamanho 30 foi tomado e a amostra final de cada parametro

57

foi composta por 1.267 valores.

A Tabela 4.5 mostra os resultados dos criterios de comparacao de modelos para

o ajuste dos modelos para esse caso, novamente considerando diversos valores para o

numero k de componentes da mistura.


rando coordenadas e logaritmo da capacidade prisional na dimensao.

Criterios k = 2 k = 3 k = 4 k = 5 k = 6

DIC 8963,047 7796,827 7490,150 6039,056 6894,625

BIC 8995,631 7800,168 7657,984 6146,365 7205,871

AIC 8890,861 7643,013 7448,444 5884,441 6891,561

Segundo os criterios de comparacao de modelos, aquele que melhor ajusta o conjunto

de dados e o que tem uma mistura de cinco normais. Sendo assim, sao apresentados os

resultados das amostras a posteriori para os parametros referentes a esse modelo.

A Tabela 4.5 mostra as modas e os intervalos de credibilidade de 95% a posteriori

para as amostras dos parametros do modelo proposto com a inclusao do logaritmo da

capacidade prisional. Para a maioria dos parametros, seus intervalos de credibilidade

mostram-se com amplitude pequena indicando uma maior precisao na estimacao desses

parametros. Constata-se que o conglomerado 1 possui a maior estimativa para a media

da terceira coordenada da localizacao dos pontos (relativa ao logaritmo da capacidade

prisional – 6,723) e aquele que cobre a maioria das unidades do estado de Sao Paulo. Por

outro lado, a menor estimativa para tal media (3,949) e correspondente ao conglomerado

2 que representa as unidades da maioria dos estados do nordeste.

A Figura 4.13 (a) marca os conglomerados de pontos identificados no modelo com

a inclusao do logaritmo da capacidade e a Figura 4.13 (b) mostra as distribuicoes do

logaritmo da capacidade para cada conglomerado identificado. Em ambas as figuras, as

cores de cada conglomerado estao de acordo. Ao acrescentar o logaritmo da capacidade

prisional nas dimensoes das normais da mistura, marcas da polıtica carceraria dos estados

aparecem, como e o caso do estado de Sao Paulo que representa em sua maioria unidades

maiores. O conglomerado formado no nordeste possui a menor mediana para o logaritmo

58

da capacidade prisional contendo tambem as menores unidades. De modo geral, os

conglomerados formados nas regioes sudeste e sul sao os que possuem as maiores unidades.


do modelo com mistura de 4 normais com dimensoes compostas pelas coordenadas e

logaritmo da taxa de ocupacao das unidades prisionais no Brasil.


λ0 2815,789 (2564,049; 3146,029) σ21,33 0,095 (0,071; 0,134)

w1 0,114 (0,080; 0,172) σ22,11 7,984 (5,948; 11,514)

w2 0,227 (0,186; 0,279) σ22,12 -5,596 (-8,809; -3,396)

w3 0,034 (0,024; 0,046) σ22,13 2,051 (1,148; 3,059)

w4 0,251 (0,198; 0,314) σ22,22 7,552 (5,362; 11,547)

w5 0,363 (0,298; 0,434) σ22,23 -1,667 (-2,815; -0,743)

µ1,1 -44,214 (-45,957; -42,292) σ22,33 1,810 (1,450; 2,307)

µ1,2 -23,762 (-24,451; -23,286) σ23,11 1,381 (0,822; 2,166)

µ1,3 6,723 (6,583; 6,835) σ23,12 0,404 (-0,232; 1,358)

µ2,1 -36,631 (-37,205; -35,865) σ23,13 0,381 (-0,052; 0,716)

µ2,2 -6,447 (-7,183; -5,730) σ23,22 2,336 (0,544; 6,083)

µ2,3 3,949 (3,736; 4,200) σ23,23 -0,264 (-1,382; 0,251)

µ3,1 -49,065 (-49,437; -48,783) σ23,33 1,070 (0,371; 1,510)

µ3,2 -16,603 (-17,057; -16,058) σ24,11 170,922 (99,240; 271,353)

µ3,3 4,360 (3,930; 4,613) σ24,12 111,282 (63,886; 206,871)

µ4,1 -53,700 (-57,130; -49,372) σ24,13 3,581 (-0,658; 9,266)

µ4,2 -11,056 (-13,927; -5,790) σ24,22 140,000 (96,367; 240,448)

µ4,3 4,443 (4,235; 4,650) σ24,23 5,086 (1,117; 10,624)

µ5,1 -44,804 (-46,012; -43,480) σ24,33 1,196 (0,954; 1,635)

µ5,2 -23,541 (-24,672; -22,374) σ25,11 48,009 (32,985; 69,988)

µ5,3 5,277 (5,153; 5,449) σ25,12 33,974 (21,046; 50,944)

σ21,11 15,543 (10,255; 23,594) σ2

5,13 0,864 (-0,290; 2,003)

σ21,12 -4,278 (-6,828; -2,798) σ2

5,22 36,036 (26,147; 50,587)

σ21,13 -0,256 (-0,680; 0,180) σ2

5,23 0,500 (-0,356 ; 1,334)

σ21,22 1,730 (1,196; 2,670) σ2

5,33 0,974 (0,847; 1,140)

σ21,23 0,076 (-0,062; 0,205)

59

(a)

1 2 3 4 5

23

45

67

8

(b)


merado de pontos para o modelo com coordenadas e logaritmo da capacidade prisional

(a). Box-plot do logaritmo da capacidade prisional de acordo com os conglomerados de

pontos (b).


para cada coordenada e logaritmo da capacidade prisional das unidades prisionais. Cor

e area dos cırculos representam a funcao de intensidade estimada.

60

A Figura 4.14 mostra a funcao de intensidade estimada para o modelo em questao.

Ha uma intensidade maior e mais marcada nos estados de Sao Paulo e Goias e em grande

parte dos estados do nordeste.

4.3.3 Mistura de normais em quatro dimensoes

Nessa secao sera estudado a inclusao das duas covariaveis anteriormente apresentadas

nas dimensoes das normais da mistura. Isso sera util para perceber a interacao entre elas

na formacao dos conglomerados de pontos. Por exemplo, ha interesse em saber se uni-

dades proximas que ofertam muitas vagas estao apresentando quadro de superpopulacao

ou nao.

Nesse caso, tambem optou-se por permanecer com as distribuicoes a priori descritas

nas Equacoes de 4.20 a 4.24. Tambem foi gerada uma cadeia com 50.000 iteracoes e

tomados uma amostra de aquecimento de tamanho 12.000 e um espacamento de tamanho

30. A amostra final de cada parametro foi composta por 1.267 valores.

A Tabela 4.7 mostra o resultado dos criterios de comparacao de modelos para o ajuste

dos modelos com estrutura de mistura normal para diversos valores k de componentes na

mistura considerando que as dimensoes sao compostas pelas coordenadas, o logaritmo da

taxa de ocupacao e logaritmo da capacidade prisional das unidades prisionais do Brasil.


rando coordenadas, logaritmo da taxa de ocupacao e logaritmo da capacidade prisional

na dimensao.

Criterios k = 2 k = 3 k = 4 k = 5 k = 6

DIC 11.499,83 10.616,92 8.879,049 8.302,310 8.469,527

BIC 11.408,18 10.881,7 8.930,315 8.600,913 8.846,896

AIC 11.251,42 10.646,55 8.616,786 8.209,002 8.376,602

Segundo os criterios de comparacao de modelos, o melhor ajuste para os dados e o

modelo que considera uma mistura de cinco normais. Logo, os resultados seguintes sao

referentes a esse modelo. A Tabela 4.8 traz as modas e os intervalos de credibilidade de

95% a posteriori das amostras dos parametros do modelo.

61

A Figura 4.15 (a) marca os conglomerados de pontos para o modelo proposto. Ja as

Figuras 4.15 (b) e 4.15 (c) apresentam a distribuicao do logaritmo da taxa de ocupacao

e logaritmo da capacidade prisional, respectivamente, de acordo com os conglomerados

identificados. As cores nos tres graficos estao de acordo.

A segunda maior estimativa para a media da terceira coordenada da localizacao dos

pontos (relativa ao logaritmo da taxa de ocupacao – 0,603) e a maior estimativa para a

media da quarta coordenada da localizacao de pontos (relativa ao logaritmo da capaci-

dade prisional – 6,746) sao referentes ao conglomerado 1 que representa grande parte do

estado de Sao Paulo. Isso indica que o estado de Sao Paulo possui as maiores unidades

e encontra-se em situacao de superpopulacao de presos.

Os dois conglomerados que cobrem a maior parte dos estados do nordeste (conglo-

merados verde e rosa) apresentam as menores medias estimadas para o logaritmo da

capacidade (3,705 e 4,255), indicando que esses sao constituıdos de unidades pequenas.

Porem, no nordeste percebe-se uma heterogeneidade quanto a taxa de ocupacao. O

conglomerado verde apresenta a maior estimativa da media do logaritmo da taxa de

ocupacao (0,670) distanciando-se da media estimada para o conglomerado rosa (0,269).

Corrobora com esse resultado a covariancia estimada entre os logaritmos da taxa de

ocupacao e capacidade prisional para o conglomerado verde (-0,480), indicando que essas

duas covariaveis tem uma relacao inversamente proporcional para as unidades do con-

glomerado em questao, e como as respectivas variancias estimadas para essas covariaveis

sao pequenas (0,372 e 2,270), pode-se dizer que essa relacao e moderada.

A Figura 4.16 traz a funcao de intensidade estimada a partir do modelo proposto

para cada coordenada, logaritmo da taxa de ocupacao e logaritmo da capacidade das

unidades. Com a inclusao dessas duas covariaveis nas dimensoes do espaco de estudo,

percebe-se que o estado de Sao Paulo destaca-se dentre as outras areas do mapa e ha

uma intensidade moderada para os estados da regiao sul, sudeste e nordeste.

62

Tabela 4.8: Moda e intervalo de credibilidade de 95% a posteriori para os parametros do

modelo com mistura de 5 normais com dimensoes compostas pelas coordenadas, logaritmo

da taxa de ocupacao e logaritmo da capacidade das unidades prisionais no Brasil.


λ0 2800,962 (2539,865; 3148,887) σ22,13 1,585 (0,383; 3,180)

w1 0,106 (0,069; 0,159) σ22,14 -5,137 (-10,120; -2,311)

w2 0,109 (0,067; 0,167) σ22,22 3,804 (2,024; 7,108)

w3 0,275 (0,227; 0,352) σ22,23 -0,370 (-0,892; -0,047)

w4 0,314 (0,242; 0,383) σ22,24 1,461 (0,500; 2,850)

w5 0,173 (0,133; 0,233) σ22,33 0,372 (0,265; 0,531)

µ1,1 -44,652 (-46,226; -42,373) σ22,34 -0,480 (-0,874; -0,228)

µ1,2 -23,850 (-24,504; -23,244) σ22,44 2,270 (1,429; 3,247)

µ1,3 0,603 (0,491; 0,751) σ23,11 82,895 (62,194; 114,108)

µ1,4 6,746 (6,631; 6,846) σ23,12 -11,296 (-29,488; 8,278)

µ2,1 -37,907 (-40,914; -33,600) σ23,13 0,035 (-0,899; 0,930)

µ2,2 -4,090 (-5,392; -3,164) σ23,14 -1,688 (-3,328; -0,366)

µ2,3 0,670 (0,430; 0,950) σ23,22 73,592 (55,030; 101,989)

µ2,4 3,705 (2,952; 4,295) σ23,23 0,194 (-0,492; 1,105)

µ3,1 -52,262 (-54,549; -49,977) σ23,24 -0,640 (-2,038; 0,584)

µ3,2 -18,814 (-20,970; -16,655) σ23,33 0,457 (0,396; 0,522)

µ3,3 0,248 (0,168; 0,331) σ23,34 -0,109 (-0,185; -0,045)

µ3,4 4,363 (4,226; 4,507) σ23,44 0,867 (0,744; 1,038)

µ4,1 -44,244 (-45,536; -42,568) σ24,11 45,588 (27,781; 70,284)

µ4,2 -23,476 (-24,732; -21,937) σ24,12 32,732 (18,791; 54,249)

µ4,3 0,149 (0,059; 0,217) σ24,13 0,582 (-0,035; 1,282)

µ4,4 5,504 (5,324; 5,689) σ24,14 0,480 (-0,808; 1,955)

µ5,1 -35,280 (-36,164; -34,136) σ24,22 38,273 (27,018; 59,055)

µ5,2 -7,614 (-8,068; -7,077) σ24,23 0,900 (0,430; 1,610)

Continua na proxima pagina

63

Tabela 4.8 – continuacao da pagina anterior


µ5,3 0,269 (0,124; 0,458) σ24,24 0,673 (-0,384; 1,869)

µ5,4 4,255 (3,912; 4,594) σ24,33 0,167 (0,138; 0,212)

σ21,11 14,761 (9,054; 22,723) σ2

4,34 -0,012 (-0,068; 0,050)

σ21,12 -4,267 (-6,874; -2,636) σ2

4,44 0,887 (0,733; 1,061)

σ21,13 0,097 (-0,292; 0,614) σ2

5,11 8,356 (5,890; 11,496)

σ21,14 -0,149 (-0,561; 0,157) σ2

5,12 -2,455 (-4,418; -0,843)

σ21,22 1,844 (1,167; 2,840) σ2

5,13 0,225 (-0,310; 0,846)

σ21,23 -0,075 (-0,239; 0,071) σ2

5,14 1,791 (1,067; 2,942)

σ21,24 0,072 (-0,036; 0,215) σ2

5,22 2,592 (1,017; 4,593)

σ21,33 0,123 (0,096; 0,162) σ2

5,23 0,285 (-0,010; 0,734)

σ21,34 -0,057 (-0,089; -0,036) σ2

5,24 -0,969 (-1,770; -0,430)

σ21,44 0,095 (0,069; 0,128) σ2

5,33 0,652 (0,551; 0,809)

σ22,11 45,198 (22,133; 77,450) σ2

5,34 0,040 (-0,205; 0,240)

σ22,12 -12,638 (-22,988; -6,156) σ2

5,44 1,697 (1,318; 2,164)

64

(a)

1 2 3 4 5

−3

−2

−1

01

2

(b)

1 2 3 4 5

23

45

67

8

(c)


merado de pontos para o modelo com coordenadas, logaritmo da taxa de ocupacao e

logaritmo da capacidade prisional (a). Box-plots do logaritmo da taxa de ocupacao (b)

e do logaritmo da capacidade prisional (c) de acordo com os conglomerados de pontos.

65


para cada coordenada, logaritmo da taxa de ocupacao e logaritmo da capacidade prisional

das unidades prisionais. Cor e area dos cırculos representam a funcao de intensidade

estimada.

No primeiro ajuste apresentado nesse capıtulo, pode-se verificar a distribuicao das

unidades prisionais no Brasil e entender melhor como essas estao alocadas por todo o

territorio. As regioes nordeste e sudeste apresentam grande quantidade de unidades, o

que fez com que se identificasse alta intensidade nessas areas em todos os ajustes.

No Apendice A estao os graficos animados em tres dimensoes dos modelos que envol-

vem coordenadas das unidades prisionais e suas covariaveis. Nesses graficos e possıvel

visualizar melhor a distribuicao das unidades no Brasil, alem de verificar os diferentes

valores dessas covariaveis para cada conglomerado identificado em cada modelo proposto.

Ao acrescentar as covariaveis no modelo, novos conglomerados de pontos foram for-

mados. Ha uma heterogeneidade quanto a capacidade das unidades no Brasil. As regioes

sul e sudeste sao as que possuem as maiores unidades prisionais. Por outro lado, a si-

tuacao de superpopulacao esta presente na maioria das unidades prisionais, sendo elas

unidades grandes ou pequenas.

66

Capıtulo 5

Fontes de pontos para a funcao de

intensidade

Neste capıtulo, sera proposta uma nova abordagem baseada no modelo desenvolvido

por Diggle et al. (1997). Nesse artigo, os autores descrevem uma classe de modelos

para investigar o possıvel aumento de risco de uma doenca ao redor de fontes de po-

luicao ambiental. Eles consideram um processo de Poisson nao homogeneo governado

por uma funcao de intensidade que leva em consideracao as distancias das localizacoes

de ocorrencia da doenca as fontes de poluicao, alem de covariaveis espaciais.

Fazendo uma associacao ao presente trabalho, pode-se considerar que as unidades

prisionais estao alocadas em volta de fontes pontuais. Tais fontes serao selecionadas

com base nas analises dos conglomerados identificados na proposta do capıtulo anterior.

O objetivo principal e buscar uma nova alternativa de associar covariaveis ao processo

pontual para entender quais os fatores que poderiam explicar o padrao de pontos obser-

vados, ou ainda, explicar o aglomeramento de pontos ao redor de fontes de influencias.

Entao, diferentemente da proposta anterior em que as covariaveis eram inclusas de modo

a contribuir com a formacao de conglomerados de pontos, aqui elas sao inclusas com a

finalidade de explicar os conglomerados ja identificados.

Nas secoes seguintes, serao apresentados o modelo proposto e sua inferencia. Um

breve estudo simulado e conduzido para a validacao da metodologia proposta para ajuste

do modelo e, por fim, e apresentada a aplicacao aos dados reais.

67

5.1 O modelo

Seja um processo espacial X em uma dada regiao S, S ⊆ R2 e o padrao de pontos

s1, ..., sn, tal que si ∈ S e i = 1, ..., n, como uma observacao desse processo. Seguindo Dig-

gle et al. (1997), assume-se que a distribuicao espacial das observacoes pode ser descrita

por um processo de Cox governado por uma funcao de intensidade assim definida:

λ(s) = λ0exp {Z′(s)β}k∏j=1

fj(s). (5.1)

A funcao de intensidade definida acima leva em consideracao k fontes pontuais locali-

zadas em s0j, s0j ∈ S e j = 1, ..., k. Tais fontes podem ser interpretadas, nesse trabalho,

como centro de alta incidencia de pontos. Ademais, Diggle et al. (1997) permitiram o

ajuste de q covariaveis espaciais Z(s) = (Z1(s), ..., Zq(s))′ atraves de um termo log-linear

e com efeitos representados por β = (β1, ..., βq)′.

A funcao fj(·) depende da distancia entre s e s0j, ou seja, fj(s) = f(||s − s0j||).

Denotando essa distancia como Dj(s), Diggle et al. (1997) sugerem definir tal funcao

como sendo:

fj(s) =

1 + α, se Dj(s) ≤ δ

1 + αexp

[−(Dj(s)−δ

φ

)2], se Dj(s) > δ

(5.2)

em que, 1 + α indica a elevacao proporcional da intensidade na fonte, ou seja, se α = 1

corresponde a uma duplicacao da intensidade na fonte; δ e o raio do disco em volta da

fonte onde a intensidade permanece constante; φ representa a distancia da borda do disco

em que a intensidade decresce um fator de exp(−1) ≈ 0, 36 (Diggle et al., 1997).

Assim como no modelo da secao anterior, a funcao de verossimilhanca de um processo

de Poisson nao-homogeneo descrita em 3.17 pode ser reescrita para um processo de Cox

conduzido pela funcao de intensidade definida em 5.1, como

L(λ0,β, α, φ, δ) =n∏i=1

[λ0exp {Z′(si)β}

k∏j=1

fj(si)

]

× exp

{−λ0

∫S

exp {Z′(s)β}k∏j=1

fj(s)ds

}. (5.3)

68

Nota-se que a equacao descrita acima possui uma integral que depende de quanti-

dades desconhecidas e nao enumeraveis, uma vez que λ(s) esta definida em um espaco

contınuo. Para tratar essa integral, foi considerada uma aproximacao para a funcao de

verossimilhanca 5.3. Tal aproximacao consiste em repartir a regiao de estudo S em N

sub-regioes Sl centradas em s∗l , tal que⋃Nl=1 Sl = S. Essa discretizacao do espaco de

estudo facilita a inferencia sobre os parametros, pois a verossimilhanca em 5.3 pode ser

aproximada para

L(λ0,β, α, φ, δ) ≈n∏i=1


k∏j=1

fj(si)

]

× exp

{−λ0

N∑l=1

exp {Z′(s∗l )β}k∏j=1

fj(s∗l )|Sl|

}, (5.4)

em que, Z′(s∗l ) sao as covariaveis espaciais para o centro s∗l da sub-regiao Sl, fj(s∗l ) e a

funcao 5.2 aplicada a distancia entre s∗l e s0j e |Sl| e a area da sub-regiao Sl. Desse modo,

e possıvel realizar inferencia para o modelo proposto.

O vetor θ de parametros do modelo e basicamente composto por tres conjuntos: o

parametro de escala λ0, os parametros dos efeitos das covariaveis β e os parametros

referentes as fontes (α, φ, δ). Entao, a partir da abordagem bayesiana, e conveniente

adotar distribuicoes a priori independentes para as componentes do vetor parametrico

θ = (λ0, β1, ..., βq, α, φ, δ). Assim, sao propostas as seguintes prioris:

λ0 ∼ Gama(aλ, bλ) (5.5)

βh ∼ N(ηh, ξ2h) (5.6)

α ∼ Gama(aα, bα) (5.7)

φ ∼ Gama(aφ, bφ) (5.8)

δ ∼ Gama(aδ, bδ) (5.9)

em que, aλ, bλ, ηh, ξ2h, aα, bα, aφ, bφ, aδ e bδ sao constantes conhecidas e, finalmente, a dis-

tribuicao a priori para θ e dada por

p(θ) = p(λ0)p(α)p(φ)p(δ)

q∏h=1

p(βh). (5.10)

69

Como visto, para a realizacao dos metodos de inferencia, a distribuicao a posteriori deve

ser obtida. A proxima secao relata os calculos necessarios para essa etapa.

5.1.1 Distribuicao a posteriori

Para o processo de Cox conduzido pela intensidade definida em 5.1, ter o conhecimento

da funcao de verossimilhanca 5.4 e da distribuicao a priori 5.10 torna a obtencao da

distribuicao a posteriori para o vetor de parametros θ trivial, como sendo a combinacao

dessas duas. Assim, tem-se:

p(θ|s1, ..., sn) ∝ L(λ0,β, α, φ, δ)p(λ0)p(α)p(φ)p(δ)

q∏h=1

p(βh) (5.11)

∝n∏i=1


k∏j=1

fj(si)

]

× exp

{−λ0

N∑l=1


fj(s∗l )|Sl|

}× λaλ−1

0 exp{−bλλ0}

× αaα−1exp{−bαα}

× φaφ−1exp{−bφφ}

× δaδ−1exp{−bδδ}

×q∏

h=1

exp

{− 1

2ξ2h

(βh − ηh)2

}A distribuicao a posteriori acima nao pode ser tratada analiticamente e metodos de

Monte Carlo serao aplicados para amostrar dessa distribuicao e, entao, medidas resumos

que servirao como estimativas para os parametros poderao ser calculadas. Para isso, os

calculos das condicionais completas dos parametros estao desenvolvidos abaixo.

70

• Condicional completa para λ0:

p(λ0|·) ∝ L(λ0,β, α, φ, δ)p(λ0)

∝n∏i=1


k∏j=1

fj(si)

]

× exp

{−λ0

N∑l=1


fj(s∗l )|Sl|

}× λaλ−1

0 exp{−bλλ0}

∝ λn0exp

{−λ0

N∑l=1


fj(s∗l )|Sl|

}λaλ−1

0 exp{−bλλ0}

∝ λn+aλ−10 exp

{−

(N∑l=1


fj(s∗l )|Sl|+ bλ

)λ0

}(5.12)

Entao, a condicional completa de λ0 segue uma distribuicao Gama com parametro

de forma n+ aλ e parametro de taxa∑N

l=1 exp {Z′(s∗l )β}∏k

j=1 fj(s∗l )|Sl|+ bλ.

• Condicional completa para (β, α, φ, δ):

p(β, α, φ, δ|·) ∝ L(λ0,β, α, φ, δ)p(α)p(φ)p(δ)

q∏h=1

p(βh)

∝n∏i=1


k∏j=1

fj(si)

]

× exp

{−λ0

N∑l=1


fj(s∗l )|Sl|

}× αaα−1exp{−bαα}

× φaφ−1exp{−bφφ}

× δaδ−1exp{−bδδ}

×q∏

h=1

exp

{− 1

2ξ2h

(βh − ηh)2

}. (5.13)

Observa-se que a condicional completa para (β, α, φ, δ) nao apresenta forma analıtica

conhecida. Portanto, faz-se necessario a utilizacao de um passo do algoritmo de

Metropolis-Hasting. Sabendo-se que os efeitos β das covariaveis espaciais podem

assumir qualquer valor na reta real e os parametros α, φ e δ sao reais positivos, uma

71

proposta passeio aleatorio com distribuicao normal truncada multivariada foi ado-

tada para esses parametros, considerando os truncamentos nos respectivos domınios

de cada parametro.

A partir das condicionais completas para todos os parametros do modelo, a inferencia

pode ser realizada. A seguir, sera realizado um breve estudo simulado para a validacao

do modelo acima discutido.

5.2 Estudo simulado

Nesse momento, sugere-se valores fictıcios para os parametros e a partir de simulacoes

de um processo de Poisson nao homogeneo, dados artificiais sao gerados. A simulacao

de um processo de Poisson nao homogeneo tem suporte na geracao de um processo de

Poisson homogeneo. Os passos para essa simulacao podem ser encontrados na Secao 4.2

do Capıtulo 4. Entao, ajusta-se o modelo para essa amostra gerada e se as estimativas

para os parametros ficarem proximas dos respectivos valores sugeridos no inıcio, diz-se

que a metodologia proposta e eficaz.

Para o modelo proposto que considera fontes pontuais na funcao de intensidade do

processo, definida pela Equacao 5.1, considere uma superfıcie plana fictıcia no quadrado

[0, 10]× [0, 10] onde observam-se duas fontes pontuais. Sera estudado o efeito de apenas

uma covariavel para esse modelo. Ao tentar ajustar modelos com mais de uma covariavel,

obteve-se problemas de convergencia nas cadeias de MCMC, e, sendo assim, optou-se

por nao apresenta-los aqui. Os valores sugeridos para os parametros foram: λ0 = 10;

β1 = 0, 2; α = 3; φ = 0, 9 e δ = 2.

A Figura 5.1 (a) mostra o comportamento da funcao de intensidade a partir dos

parametros sugeridos. Foi considerado o eixo das abscissas como covariavel com efeito

positivo, fazendo com que a funcao de intensidade aumente da esquerda para a direita.

Os pontos simulados estao apresentados na Figura 5.1(b). Os dados foram compostos

por 6.550 pontos. A disposicao dos pontos estao de acordo com o comportamento da

funcao de intensidade, indicando que a simulacao foi bem sucedida.

72

(a) (b)

Figura 5.1: Funcao de intensidade simulada (a) e pontos simulados (b) para o modelo

com fontes pontuais.

Distribuicoes a priori vagas foram tomadas para todos os parametros, sao elas:

λ0 ∼ Gama(0, 01; 0, 01),

β1 ∼ N(0, 100),

α ∼ Gama(0, 01; 0, 01),

φ ∼ Gama(0, 01; 0, 01),

δ ∼ Gama(0, 01; 0, 01).

Um cadeia de parametros foi gerada para o ajuste do modelo. Essa foi composta por

50.000 iteracoes e uma amostra de aquecimento de tamanho 2.000 foi retirada. Como

os valores eram autocorrelacionados, um espacamento de tamanho 30 foi tomado e a

amostra final de cada parametro foi composta por 1.601 valores.

A Figura 5.2 mostra os histogramas das amostras a posteriori para os parametros

do modelo proposto. Nota-se que as estimativas das modas (linhas tracejadas azuis)

estao bem proximas dos valores verdadeiros (linhas tracejadas verdes) para todos os

parametros. A estimacao mostra-se bem precisa com amplitudes pequenas para os in-

tervalos de credibilidade de 95%. Alem disso, os intervalos contem todos os valores

verdadeiros dos parametros, indicando que foi possıvel estima-los de forma adequada.

73

λ

Den

sida

de

9,0 9,5 10,0 10,5 11,0 11,5

0,0

0,2

0,4

0,6

0,8

1,0

β1

Den

sida

de

0,175 0,180 0,185 0,190 0,195 0,200 0,205

020

4060

80α

Den

sida

de

2,6 2,8 3,0 3,2 3,4 3,6

0,0

0,5

1,0

1,5

2,0

2,5

3,0

φ

Den

sida

de

0,8 0,9 1,0 1,1 1,2 1,3 1,4

01

23

4

δ

Den

sida

de

1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2

01

23

4

Figura 5.2: Histogramas para as amostras a posteriori para os parametros λ0 (superior

esquerda), β1 (superior direita), α (inferior esquerda), φ (inferior meio) e δ (inferior

direito) para o dados simulados. Limites do intervalo de credibilidade de 95% (linha

tracejada vermelha), moda a posteriori (linha tracejada azul), valor verdadeiro (linha

tracejada verde) e distribuicao a priori (linha pontilhada preta).

Por fim, na Figura 5.3 esta representada a funcao de intensidade estimada e observa-

se pouca diferenca da funcao de intensidade simulada na Figura 5.1, corroborando para

confirmar a validacao da metodologia proposta.

74

Figura 5.3: Funcao de intensidade ajustada para os dados simulados considerando o

modelo com fontes pontuais.

5.3 Aplicacao

Apos obter bons resultados na aplicacao do modelo aos dados simulados, a aplicacao

aos dados das unidades prisionais no Brasil sera realizada.

Para isso, na funcao de intensidade definida na Equacao 5.1, considera-se distancias

geodesicas entre os pontos de coordenadas das localizacoes das unidades e os centros das

fontes pontuais. A vantagem de usar a distancia geodesica e que leva em consideracao

a curvatura da terra e o calculo das distancias torna-se mais realista do que se fosse

calculado distancias euclidianas.

A escolha dos centros das fontes pontuais foi feita com base na analise da funcao de

intensidade estimada no modelo apresentado na Secao 4.3.1 em que a funcao de intensi-

dade conta com uma mistura de normais de dimensoes compostas pelas coordenadas das

unidades prisionais. Essas fontes foram escolhidas com o objetivo de associar covariaveis

as estruturas de pontos identificadas quando ainda nao ha a adicao de covariaveis nas

dimensoes da mistura. A Figura 5.4(a) traz novamente a funcao de intensidade estimada

na abordagem anterior (figura a esquerda).

75

(a)

050

100

150

núm

ero

de u

nida

des

pris

iona

is

050

100

150

190

DF

GO

MT

MS AL

BA

CE

MA

PB

PE PI

RN

SE

AC

AP

AM PA RO

RR

TO ES

MG RJ

SP

PR

RS

SC

(b)

Figura 5.4: Funcao de intensidade estimada para o modelo com mistura de normais de

dimensoes compostas pelas coordenadas (a). Numero de unidades prisionais em cada

estado do Brasil (b). Cores das barras indicam a regiao dos estados: Centro-Oeste

(vermelho); Nordeste (verde); Norte (azul escuro); Sudeste (azul claro); Sul (rosa).

Repare que na Figura 5.4(a), ha marcas de picos de intensidade em todas as regioes

do Brasil. Claramente algumas regioes sao mais marcadas do que outras, entao a escolha

das fontes foi pensada de forma a representar cada uma dessas regioes. Alem disso,

observa-se que esses picos coincidem com os estados que apresentam maior numero de

unidades dentro de cada uma das regioes como mostra a Figura 5.4(b), e assim a escolha

das fontes tambem e justificada por esses estados.

Portanto, em conformidade com a analise da Figura 5.4, optou-se por alocar 5 fontes

pontuais: uma no estado de Goias; uma no estado do Ceara perto das fronteiras entre os

estados da Paraıba e Pernambuco; uma em Rondonia; uma em Minas Gerais perto das

fronteiras entre os estados de Sao Paulo e Rio de Janeiro; e uma no Rio Grande do Sul.

A Figura 5.5 ilustra a localizacao dessas fontes selecionadas.

76

Figura 5.5: Localizacao das unidades prisionais com a identificacao das fontes pontuais

(cırculos vermelhos) .

Como serao considerados apenas modelos com a inclusao de uma covariavel por vez,

quatro modelos serao ajustados. As covariaveis consideradas em cada um deles serao:

IDH calculado no ano de 2010, GINI referente ao ano de 2014 e duas medidas polıticas.

Os nomes “Polıtica I” e “Polıtica II” serao atribuıdos as covariaveis referentes as medidas

polıticas propostas por Israel e Bachini (2017) com base em Madeira e da Silva Tarouco

(2013) e Braga et al. (2015), respectivamente.

Para a todos os parametros, foram atribuıdas distribuicoes vagas a priori, sao elas:

λ0 ∼ Gama(1; 0, 01), β1 ∼ N(0, 100), α ∼ Gama(1; 0, 01), φ ∼ Gama(1; 0, 01), e δ ∼

Gama(1; 0, 01). No entanto, houve a necessidade de adotar uma distribuicao a priori

um pouco mais informativa para o parametro λ0 no modelo com a covariavel IDH, visto

que esse convergia para valores proximos de zero e, entao foi considerado que λ0 ∼

Gama(1; 0, 1) para esse caso.

Uma cadeia de 50.000 iteracoes foi gerada para cada um dos parametros em cada

modelo. Amostras de aquecimento de tamanho 4.000 foram consideradas, e espacamentos

de tamanho 100 foram tomados para tratar a autocorrelacao nas cadeias dos parametros.

As amostras finais a posteriori para os parametros dos modelos foram compostas por 461

valores. Os resultados dos ajustes dos modelos estao expostos na Tabela 5.1.

77

Tabela 5.1: Resultados dos ajustes dos modelos com fontes pontuais na funcao de inten-

sidade do processo.

ParametrosIDH GINI Polıtica I Polıtica II

Moda 95% Moda 95% Moda 95% Moda 95%

λ0 0,030 (0,005; 0,113) 0,039 (0,014; 0,167) 0,802 (0,707; 0,897) 0,485 (0,408; 0,553)

β1 4,353 (2,399; 6,630) 4,697 (2,873; 7,790) 0,153 (0,109; 0,208) -0,330 (-0,372; -0,281)

α 4,409 (3,731; 5,210) 5,620 (4,753; 6,460) 4,133 (3,547; 4,934) 5,667 (4,921; 6,631)

φ 388,750 (347,706; 434,508) 431,613 (401,976; 465,162) 384,935 (327,846; 428,771) 480,323 (452,923; 504,136)

δ 6,447 (0,042; 37,735) 3,806 (0,002; 27,192) 3,909 (0,061; 33,249) 6,175 (0,014; 32,419)

DIC 123.306,100 67.079,820 77,094 944,928

BIC 56.290,750 28.004,890 47,672 786,535

AIC 56.264,560 27.978,700 21,479 760,342

Com base na tabela acima, nota-se que para todos modelos ajustados, os interva-

los de credibilidade de 95% nao contem o valor zero para o parametro β1 de efeito das

covariaveis. Desta forma, pode-se dizer que, em cada um dos modelos, a respectiva

covariavel considerada e estatisticamente significativa para explicar a disposicao de uni-

dades prisionais no Brasil.

As covariaveis IDH, GINI e Polıtica I apresentam efeitos positivos, indicando que es-

tados mais desenvolvidos ou com maior desigualdade ou que possuem um posicionamento

polıtico mais a direita estao propensos a possuırem mais unidades prisionais. Ressalva

que o efeito da covariavel Polıtica II e negativo (-0,330), indicando que estados que apre-

sentam partidos polıticos de seus governadores com um posicionamento mais a esquerda

tendem a possuir mais unidades prisionais. Porem, como antes visto, a medida Polıtica

II e calculada com base no trabalho de Braga et al. (2015) que tende a classificar os

partidos um pouco mais a esquerda. Esse resultado, portanto, pode ser um reflexo da

metodologia utilizada pelos autores na classificacao partidaria.

De acordo com os criterios de comparacao de modelos, os modelos que possuem

covariaveis polıticas sao preferıveis frente aos modelos que possuem covariaveis sociais.

Destaca-se o modelo com a covariavel Polıtica I, que apresenta os menores valores para

todos os criterios.

A Figura 5.6 traz as funcoes de intensidade estimadas para cada um dos modelos

apresentados acima. Percebe-se que as funcoes de intensidade para os modelos com as

variaveis sociais (IDH e GINI) nao delimitam tanto os estados quanto as funcoes para

os modelos com as covariaveis polıticas, fazendo com que o efeito das fontes destaque-se

78

mais. No entanto, o Distrito Federal e destacado nos modelos com as covariaveis sociais,

indicando uma alta intensidade relacionada aos seus altos ındices de desenvolvimento e

desigualdade.

2

4

6

8

(a)

1

2

3

4

5

(b)

2

4

6

8

10

(c)

2

4

6

8

10

(d)

Figura 5.6: Funcoes de intensidade estimadas com fontes pontuais para os modelos com

a covariavel: IDH (a); GINI (b); Polıtica I (c); Polıtica II (d).

Nota-se tambem que as duas fontes localizadas no sudeste e centro-oeste formam

um grande pico de intensidade em todos os modelos estimados. Isso pode ser explicado

pela alta incidencia de pontos representados por essas fontes. Alem disso, os estados

do sudeste e centro-oeste apresentam altos ındices de desenvolvimento e desigualdade,

e os partidos dos seus governadores foram classificados, em sua maioria, como sendo de

direita pela medida Polıtica I ou como sendo de esquerda pela medida Polıtica II.

79

Capıtulo 6

Conclusoes

Neste trabalho foram apresentadas duas abordagens para modelar o padrao pontual

das localizacoes das unidades prisionais no Brasil. Previamente, o problema foi explorado

e analisado por meio de estatısticas descritivas com o objetivo de compreender melhor

as informacoes disponıveis sobre o cenario de encarceramento no Brasil. Foi constatado

grandes preocupacoes a respeito do efetivo de presos e numero de vagas oferecidas nas

unidades prisionais, observando peculiaridades pontuais e presenca de uma variabilidade

espacial nas localizacoes dessas unidades. A vista disso, o objetivo principal desse traba-

lho e estudar a disposicao das unidades prisionais no territorio brasileiro com o interesse

de identificar padroes e regularidades e associar possıveis covariaveis que justificassem

tais comportamentos.

A primeira proposta apresentada trata-se de um processo pontual de Cox conduzido

por uma funcao de intensidade composta por uma mistura de normais multivariadas.

As covariaveis nesse modelo foram impostas nas dimensoes das normais da mistura,

ampliando o espaco geografico para um espaco social. Isso permitiu a identificacao de

unidades proximas que apresentam caracterısticas semelhantes.

Ao analisar os modelos ajustados com mistura de normais de dimensoes compostas

pelas coordenadas das unidades, dois grandes conglomerados foram identificados e um

dos seus focos esta situado entre os estados de Sao Paulo, Minas Gerais e Rio de Janeiro;

e o outro esta entre os estados do Rio Grande do Norte e Paraıba. De modo geral, as

regioes sudeste e nordeste possuem grande quantitativo de unidades e aparentemente esse

80

quantitativo esta agrupado em locais especıficos.

A primeira abordagem tambem conta com a introducao de duas covariaveis referen-

tes as unidades prisionais: taxa de ocupacao e capacidade prisional. Ao incorporar essas

covariaveis novos conglomerados sao formados. Conclui-se que existe uma heterogenei-

dade quanto a capacidade prisional das unidades no Brasil, destacando-se Sao Paulo

como o estado com as maiores unidades, e as menores unidades sendo localizadas em

grande parte na regiao nordeste. Por outro lado, parece existir uma certa homogenei-

dade quanto a taxa de ocupacao. A maioria das unidades prisionais apresentam situacao

de superlotacao, o que pode ser constatado pelo fato de que nao houve grandes mudancas

na disposicao dos conglomerados quando comparado ao modelo que considera apenas o

espaco geografico.

A segunda proposta surge do interesse de associar novas covariaveis a estrutura de

pontos identificada. O modelo apresentado se baseia no trabalho realizado por Diggle

et al. (1997) e trabalha com um processo pontual de Cox conduzido por uma funcao

de intensidade que leva em consideracao distancia dos pontos a fontes pontuais. Essas

fontes foram previamente escolhidas com base nas analises dos conglomerados formados

na primeira modelagem proposta nesse trabalho. Foram analisadas covariaveis espaciais

como: IDH, GINI e duas medidas de posicionamento polıtico dos partidos dos governados

dos respectivos estados. Nessa proposta, as covariaveis sao introduzidas no modelo com o

objetivo de analisar suas significancias em explicar a distribuicao de pontos identificada.

Conclui-se, a partir dos criterios de comparacao de modelos que o melhor modelo,

dentre os modelos ajustados, e aquele com a covariavel Polıtica I. Alem disso, em todos

os modelos ajustados os parametros de efeito das covariaveis mostraram-se significativos

para explicar a distribuicao de pontos. Conclui-se tambem que estados mais desenvolvidos

ou mais desiguais ou com um posicionamento polıtico mais a direita sao propensos a

possuırem mais unidades prisionais.

Apesar das contribuicoes significativas apresentadas pela segunda proposta, esse mo-

delo mostrou-se complexo para estimar funcoes de intensidade com mais de uma co-

variavel. Sendo assim, nao foi apresentada nesse trabalho a associacao de mais de uma

covariavel para explicar a distribuicao dos pontos. Sugere-se, portanto, a realizacao de

81

um estudo mais refinado para a relacao de covariaveis em modelos com fontes pontuais.

Outro ponto importante e que deve ser melhor explorado, e considerar o efeito da

densidade populacional como causa indireta na quantidade de unidades prisionais. A

densidade populacional pode ser incorporada ao parametro λ0, como se parte da varia-

bilidade desse parametro fosse explicada por essa constante conhecida. Como o poder

da maioria das prisoes e conferido ao estado, deve-se considerar a densidade populaci-

onal estadual. No entanto, isso faz com que os modelos percam a escala, inflando a

funcao de intensidade em estados com uma densidade muito baixa, e assim, perdendo a

sensibilidade dos modelos em identificar padroes de pontos.

Assim, em concordancia com Goldthorpe (2016), regularidades como o destaque dado

ao estado de Sao Paulo e grande parte da regiao nordeste podem ser visıveis. Alem

disso, ficam transparentes essas regularidades pelo fato dessas localidades presentarem

as maiores e as menores unidades prisionais, respectivamente. Outra questao importante

salientada nesse trabalho e a significancia do posicionamento polıtico dos governadores

dos estados como fator explicativo para a distribuicao de ponto das unidades prisionais.

Os modelos apresentados nesse trabalho mostram-se de grande importancia para o

estudo do encarceramento no Brasil, impulsionando a utilizacao de estatısticas e mo-

delos mais robustos em pesquisas sociais. Os resultados podem ser melhorados com a

avaliacao de outras variaveis relacionadas ao fenomeno e propoe-se estudos para dados

geoestatıstico ou dados de area das taxas de encarceramento de forma a compreender

melhor a variacao espacial. Para estudos voltados a analise de espacos sociais, cabe a

exploracao de modelos espaciais que considerem a hipotese de anisotropia.

82

Referencias Bibliograficas

Adorno, S. (2002) Crise no sistema de justica criminal. Ciencia e cultura, 54, 50–51.

Akaike, H. (1974) A new look at the statistical model identification. IEEE transactions

on automatic control, 19, 716–723.

Braga, S., Rocha, L. C. e Carlomagno, M. C. (2015) A internet e os partidos polıticos

brasileiros. Cadernos Adenauer, 16, 47–74.

Cox, D. (1955) Some statistical methods related with series of event. Em J. Roy. Soc.

B, vol. 17.

Cressie, N. e Wikle, C. (2011) Statistics for Spatial-Temporal Data. John Wiley e Sons.

Cressie, N. A. C. (1991) Statistics for Spatial Data. John Wiley e Sons.

Dellaportas, P. e Papageorgiou, I. (2006) Multivariate mixtures of normals with unknown

number of components. Statistics and Computing, 16, 57–68.

Diggle, P., Morris, S., Elliott, P. e Shaddick, G. (1997) Regression modelling of disease

risk in relation to point sources. Journal of the Royal Statistical Society: Series A

(Statistics in Society), 160, 491–505.

Diggle, P. J. (2003) Statistical Analysis of Spatial Point Patterns. Arnold.

— (2013) Statistical Analysis of Spatial and Spatio-Temporal Point Patterns. CRC Press.

Gamerman, D. e Lopes, H. F. (2006) Markov chain Monte Carlo: stochastic simulation

for Bayesian inference. CRC Press.

83

Goldthorpe, J. H. (2016) Sociology as a population science. Cambridge University Press.

Israel, V. P. (2016) Macrossociologia sobre relacoes causais de encarceramento: com-

paracoes entre paıses e estados brasileiros. Em 10o Encontro da Associacao Brasileira

de Ciencia Polıtica. Belo Horizonte, Brasil.

Israel, V. P. e Bachini, N. (2017) Estudo sobre a distribuicao das taxas de encarceramento

nos estados brasileiros e principais variaveis associadas. Em 9o Congresso Latino-

americano de Ciencia Polıtica. Montevideu, Uruguai.

Jacobson, J., Heard, C. e Fair, H. (2017) Prison: evidence of its use and over-use from

around the world. Institute for Criminal Policy Research & Fair Trials.

Junior, P., Arrais, J., Gamerman, D., Paez, M. S. e Fonseca Alves, R. H. (2015) Point

pattern analysis with spatially varying covariate effects, applied to the study of cere-

brovascular deaths. Statistics in medicine, 34, 1214–1226.

Kottas, A. e Sanso, B. (2007) Bayesian mixture modeling for spatial poisson process

intensities, with applications to extreme value analysis. Journal of Statistical Planning

and Inference, 137, 3151–3163.

Lundberg, O. (1940) On random processes and their application to sickness and accident

statistics. Tese de Doutorado, Almqvist & Wiksell.

Madeira, R. M. e da Silva Tarouco, G. (2013) Esquerda e direita no sistema partidario bra-

sileiro: analise de conteudo de documentos programaticos. Revista Debates (UFRGS).

Migon, H. S., Gamerman, D. e Louzada, F. (2014) Statistical inference: an integrated

approach. CRC press.

Milgram, A. (2012) Moneyballing criminal justice. Atlantic Monthly.

Miraglia, P. (2015) Drugs and drug trafficking in brazil: Trends and policies. Cen-

ter for 21st Century Security and Intelligence Latin America Initiative. Retrieved

from: http://www. brookings. edu/˜/media/Research/Files/Papers/2015/04/global-

drug policy/Miraglia–Brazil-final. pdf.

84

Mφller, J. e Waagepetersen, R. P. (2003) Statistical Inference and Simulation for Spatial

Point Processes. Chapman & Hall/CRC.

Paez, M. S. e Diggle, P. J. (2009) Cox processes for estimating temporal variation in

disease risk. Environmetrics, 20, 981–1003.

Ripley, B. D. (1977) Modelling spatial patterns. Journal of the Royal Statistical Society.

Series B (Methodological), 172–212.

Schwarz, G. et al. (1978) Estimating the dimension of a model. The annals of statistics,

6, 461–464.

Spiegelhalter, D. J., Best, N. G., Carlin, B. P. e Van Der Linde, A. (2002) Bayesian

measures of model complexity and fit. Journal of the Royal Statistical Society: Series

B (Statistical Methodology), 64, 583–639.

Walmsley, R. (2016) World prison population list. Institute for Criminal Policy Research

& Fair Trials.

85

Apendice A

Graficos animados para os modelos

de mistura

Figura A.1: Grafico de dispersao da longitude contra latitude contra logaritmo da taxa de ocupacao

marcados com os conglomerados para o modelo que considera as coordenadas e o logaritmo da taxa de

ocupacao.

86

Figura A.2: Grafico de dispersao da longitude contra latitude contra logaritmo da capa-

cidade marcados com os conglomerados para o modelo que considera as coordenadas e o

logaritmo da capacidade.

87

Figura A.3: Grafico de dispersao da longitude contra latitude contra logaritmo da taxa de

ocupacao marcados com os conglomerados para o modelo que considera as coordenadas,

logaritmo da taxa de ocupacao e logaritmo da capacidade.

88

Figura A.4: Grafico de dispersao da longitude contra latitude contra logaritmo da ca-

pacidade marcados com os conglomerados para o modelo que considera as coordenadas,

logaritmo da taxa de ocupacao e logaritmo da capacidade.

89

Documents

Processos Pontuais Espaciais para dados das unidades ... · rando coordenadas e logaritmo da taxa de ocupa˘c~ao prisional na dimens~ao.54 4.4 Moda e intervalo de credibilidade de