Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
UNIVERSIDADE DE LISBOAFACULDADE DE CIENCIAS
DEPARTAMENTO DE ESTATISTICA E INVESTIGACAO OPERACIONAL
Modelacao de dadosespaco-temporais em seguranca
rodoviaria
Maria da Conceicao Rodrigues Ribeiro
Doutoramento em Estatıstica e Investigacao Operacional(Especialidade de Probabilidades e Estatıstica)
2012
2
UNIVERSIDADE DE LISBOAFACULDADE DE CIENCIAS
DEPARTAMENTO DE ESTATISTICA E INVESTIGACAO OPERACIONAL
Modelacao de dadosespaco-temporais em seguranca
rodoviaria
Maria da Conceicao Rodrigues Ribeiro
Tese orientada pela Professora Doutora Maria Antonia Amaral Turkman epelo Professor Doutor Joao Paulo Lourenco Cardoso especialmente
elaborada para a obtencao do grau de doutor em Estatıstica e InvestigacaoOperacional (Especialidade de Probabilidades e Estatıstica)
2012
Resumo
Os acidentes rodoviarios sao um grave problema de saude publica mundial com con-
sequencias socio-economicas devastadoras Apesar dos enormes esforcos efetuados nos
ultimos anos os valores de sinistralidade rodoviaria ainda sao inadmissıveis As es-
tatısticas registadas suscitaram o interesse de investigadores e de polıticos como peca
fundamental para no sentido de compreender melhor a complexidade de fatores relacio-
nados com os acidentes rodoviarios e determinar que aspetos do problema de seguranca
rodoviaria sao locais (nacional ou regional) e quais sao os partilhados por varios paıses
Assim tem havido uma consideravel investigacao direcionada para o desenvolvimento de
modelacao estatıstica de dados de acidentes rodoviarios ocorridos em areas geograficas
correspondentes a orgaos de administracao publica ou gestao de infraestruturas de trans-
porte com o objectivo de encontrar modelos que possam servir como referencia na imple-
mentacao de acoes corretivas destinadas a diminuir o numero de acidentes rodoviarios
A estimacao do numero esperado de acidentes continua a ser um problema em aberto
nao existindo um metodo que possa ser considerado otimo No entanto e generalizada
a referencia a superioridade dos metodos bayesianos Esta tese foca-se na aplicacao de
modelos hierarquicos bayesianos a dados espaco-temporais em seguranca rodoviaria
No que diz respeito a metodologia de inferencia foi utilizada uma abordagem recente
proposta em Rue et al (2009) que consiste na inferencia bayesiana aproximada via INLA
(Integrated Nested Laplace Approximations) e que e uma alternativa determinıstica aos
metodos de simulacao MCMC habitualmente usados Assim explorou-se no R atraves
do R-INLA a implementacao desta metodologia que torna o uso dos modelos bayesianos
hierarquicos mais acessıvel sendo uma alternativa muito competitiva relativamente ao
WinBUGS para situacoes em que a distribuicao da variavel dependente pertence a famılia
exponencial
Com a implementacao desses modelos foi possıvel reduzir a variabilidade das estimati-
vas dos riscos de acidentes em areas pequenas e simultaneamente revelar padroes de
dependencia espacial tendencias temporais e interacoes espaco-temporais Conseguiu-se
assim uma suavizacao espacial dos dados ainda que as regioes sob estudo possuam areas
pequenas Para alem disso foi possıvel fazer a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao Espera-se que esta metodologia possa vir a
permitir efetuar uma comparacao no que respeita a seguranca rodoviaria nao so ao nıvel
nacional ou regional mas tambem ao nıvel internacional
Palavras chave seguranca rodoviaria modelos bayesianos hierarquicos risco relativo
INLA
Abstract
Road accidents are a serious public health problem worldwide with devastating socio-
economic consequences Despite the enormous efforts made in recent years the road
fatalities values are still unacceptable Statistics recorded caught the interest of resear-
chers and politicians as a key to better understand the complexity of factors related to
road accidents and to determine which aspects of the problem of road safety are local
(national or regional) and which are shared by several countries Thus there has been
considerable research directed towards the development of statistical modeling of road
accident data in geographic areas corresponding to organs of public administration or
management of transport infrasctruture with the aim of finding models that can serve
as reference to the implementation of corrective actions aimed to reduce the number of
road accidents
The estimation of the expected number of accidents remains an open problem and there
is no method that can be considered optimal However there is a general reference to
the superiority of Bayesian methods This thesis focuses on the application of Bayesian
hierarchical models with spatio-temporal data in road safety
Regarding to inference methodology a recent approach proposed in Rue et al (2009)
which is the approximate Bayesian inference via INLA (Integrated Nested Laplace Appro-
ximations) was used which is a deterministic alternative to the simulation methods
MCMC commonly used Thus we explored in R through R-INLA the implementation of
this methodology which makes the use of Bayesian hierarchical models more accessible
being a very competitive alternative for the WinBUGS for situations where the depedent
variable distribution belongs to the exponential family
With the implementation of these models it was possible to reduce the estimates va-
riability of the risks of accidents in small areas and simultaneously to reveal patterns
of spatial dependence trends and spatio-temporal interactions In this way a spatial
smoothing of the data was obtained despite of the regions under study having small
areas Furthermore it was possible to identify the counties of Portugal at higher risk
relatively to the country and to analyze association of the district council with potential
risk factors or exposure It is hoped that this methodology will allow comparisons with
regard to road safety not only at national or regional level but also at international level
Keywords road safety hierarchical Bayesian models relative risk INLA
Agradecimentos
Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-
pressar o meu profundo agradecimento
A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-
mente pela sua compreensao
A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao
devido acima de tudo pela grande admiracao que tenho por ela
Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima
de tudo pelo seu entusiasmo por esta tese
Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo
Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA
e pelo incentivo
Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a
minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha
de conhecimentos importantes para a realizacao do meu doutoramento
Ao Professor Rune Elvik pelo interesse demostrado
Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-
ciado pela bolsa de doutoramento SFRHPROTEC492262008
A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de
Portugal Continental
Ao Dr Rui Pereira pela prontidao e pelo interesse
A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do
Instituto Superior de Engenharia
Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram
em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao
Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas
A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-
balho
Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha
espera
Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho
a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa
os quais me ajudaram cada um a sua maneira
A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude
partilhar muitos momentos de alegria e descontracao
Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira
A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre
em mim a Mariana e a Rita por me seguirem como exemplo
A minha mae
Siglas e Acronimos
A Area geografica
AE Autoestrada
ANSR Autoridade Nacional de Seguranca Rodoviaria
BN Binomial Negativo
BT Brigada de Transito
BOA An R Package for MCMC Output Convergence
Assessment and Posterior Inference
BUGS Bayesian Using Gibbs Sampling
C Comprimento de estrada
CARE Community database on accidents on the roads in Europe
CE Codigo de Estrada
CODA Convergence Diagnosis and Output Analysis for MCMC
CPO Conditional Predictive Ordinates
DIC Deviance Information Criterion
DP Densidade populacional
EN Estrada Nacional
ENSR Estrategia Nacional de Seguranca Rodoviaria
GNR Guarda Nacional Republicana
HPD Highest Probability Density
IC Itinerario Complementar
INLA Integrated Nested Laplace Approximations
IP Itinerario Principal
MCMC Markov Chains Monte Carlo
mls Mean logarithmic score
OMS Organizacao Mundial de Saude
ONU Organizacao das Nacoes Unidas
OSEPU Ocupacao do solo com equipamentos e parques urbanos
OSI Ocupacao industrial do solo
OST Ocupacao do solo com equipamento turıstico
OSU Ocupacao urbana do solo
pD Numero efetivo de parametros
PIT Probability Integral Transformation
PMOT Plano Municipal de Ordenamento do Territorio
PMSR Planos Municipais de Seguranca Rodoviaria
PSP Polıcia de Seguranca Publica
R A Language and Environment for Statistical Computing
SafetyNET Projeto europeu European Traffic Information System -
Data Colletion and Analysis Tools for Policy Making
SMR Standard Morbility Ratio
UE Uniao Europeia
WinBUGS versao em ambiente Windows do programa BUGS
VC Quantidade de combustıvel vendido
Conteudo
Lista de Tabelas xiv
Lista de Figuras xv
Introducao 1
1 Nocoes sobre seguranca rodoviaria 9
11 Risco em seguranca rodoviaria 9
12 Caracterizacao dos dados de acidentes 10
13 Caracterizacao da medida de exposicao 14
2 Modelacao estatıstica de acidentes rodoviarios 19
21 Modelos bayesianos hierarquicos 21
22 Modelos nao espaciais 24
23 Modelos espaciais 27
24 Modelos espaco-temporais 28
25 Modelos multivariados 30
26 Metodos de inferencia 32
261 INLA 32
27 Ajustamento e medidas preditivas 36
3 Aplicacoes 39
31 Associacao espacial 40
32 Modelos 43
33 Modelos espaco-temporais 45
331 Associacao regional 46
332 Selecao dos modelos 47
333 Modelos para acidentes do tipo 1 48
334 Validacao dos modelos para acidentes do tipo 1 49
335 Resultados obtidos com modelos para acidentes do tipo 1 49
xii Conteudos
336 Modelos para acidentes do tipo 2 61
337 Validacao dos modelos para acidentes do tipo 2 62
338 Resultados obtidos com modelos para acidentes do tipo 2 62
339 Modelos para acidentes do tipo 3 73
3310 Validacao dos modelos para acidentes do tipo 3 73
3311 Resultados obtidos com modelos para acidentes do tipo 3 74
34 Modelos multivariados 83
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
351 Modelo para acidentes do tipo 1 89
352 Validacao do modelo para acidentes do tipo 1 89
353 Resultados obtidos com o modelo para acidentes do tipo 1 90
354 Modelo para acidentes do tipo 2 92
355 Validacao do modelo para acidentes do tipo 2 92
356 Resultados obtidos com o modelo para acidentes do tipo 2 93
357 Modelos para acidentes do tipo 3 95
358 Validacao do modelo para acidentes do tipo 3 95
359 Resultados obtidos com o modelo para acidentes do tipo 3 96
4 Discussao e conclusoes 99
A Caracterizacao da regiao de estudo 103
A1 Portugal Continental 103
A2 Numero de acidentes 108
A3 Covariaveis 110
A4 15 concelhos 115
Referencias Bibliograficas 119
Lista de Tabelas
11 Numero total de cada tipo de acidentes rodoviarios por ano 11
12 Estatısticas resumo do numero de veıculos com seguro em milhares 14
21 Modelos univariados 30
31 Valores do ındice EBI para cada tipo de acidente por ano 43
32 Valores DIC e mls dos modelos Poisson sem covariaveis 44
33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44
34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45
35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem
covariaveis 46
36 DIC pD e mls para cada tipo de acidente 47
37 DIC pD e mls para acidentes tipo 1 48
38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50
39 Estatısticas resumo dos parametros do modelo P 1 8 1 53
310 Estatısticas resumo dos parametros do modelo P 1 8 16 54
311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55
312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55
313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57
314 DIC pD e mls para acidentes tipo 2 61
315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63
316 Estatısticas resumo para os parametros do modelo P 2 9 1 66
317 Estatısticas resumo para os parametros do modelo P 2 9 16 67
318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67
319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68
320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69
321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71
322 DIC pD e mls para acidentes tipo 3 73
323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74
xiv Lista de Tabelas
324 Estatısticas resumo dos parametros do modelo P 3 6 1 78
325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78
326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78
327 Modelos univariados 82
328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-
tivariado e dos modelos univariados 83
329 Correlacoes dos modelos multivariados com interacao e sem interacao
espaco-temporal 84
330 Vıtimas a 24 horas e vıtimas a 30 dias 84
331 Numero total de cada tipo de acidentes rodoviarios por ano 87
332 DIC pD e mls para cada tipo de acidente 89
333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90
334 DIC pD e mls 92
335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93
336 Estatısticas resumo dos parametros do modelo P 3 6 30 96
337 Comparacao entre a abordagem local e a global 98
A1 Estatısticas resumo de acidentes tipo 1 108
A2 Estatısticas resumo de acidentes tipo 2 108
A3 Estatısticas resumo de acidentes tipo 3 108
A4 Estatısticas resumo de acidentes tipo 1 109
A5 Estatısticas resumo de acidentes tipo 2 109
A6 Estatısticas resumo de acidentes tipo 3 109
A7 Estatısticas resumo da covariavel populacao 110
A8 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 1 115
A9 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 2 116
A10 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 3 117
A11 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 118
Lista de Figuras
1 Dez principais causas de morte no mundo 2
2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4
11 Numero de acidentes tipo 1 por concelho 12
12 Numero de acidentes tipo 2 por concelho 12
13 Numero de acidentes tipo 3 por concelho 13
14 Numero de veıculos com seguro em milhares por concelho e por ano 14
15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15
16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16
17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16
31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de
acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano
2000 41
32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de
veıculos com seguro no ano 2000 41
33 Valores estimados dos SMR1 e respetivos intervalos de confianca para
cada concelho no ano 2000 42
34 Histograma dos valores de EBI simulados e valor de EBI observado para
acidentes tipo 1 e para ano 2000 43
35 Histograma das diferencas entre as medias dos logscores 48
36 Histograma dos valores PIT ajustados para acidentes tipo 1 49
37 Box plot dos valores estimados para acidentes tipo 1 50
38 Amplitude dos intervalos para acidentes tipo 1 51
39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 1 51
310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o
ano 2000 52
xvi Lista de Figuras
311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52
312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53
313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo P 1 8 16 56
314 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo
P 1 8 16 56
315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo P 1 8 16 57
316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 6 172 58
317 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58
318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-
dos com o modelo BN 1 6 172 59
319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com
o modelo BN 1 6 172 60
320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 6 172 60
321 Histograma das diferencas entre as medias dos logscores 61
322 Histograma dos valores PIT ajustados para acidentes tipo 2 62
323 Box plot dos valores estimados para acidentes tipo 2 63
324 Amplitude dos intervalos para acidentes tipo 2 64
325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori dos acidentes tipo 2 64
326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o
ano 2000 65
327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65
328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66
329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo P 2 9 16 68
330 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
P 2 9 16 69
Lista de Figuras xvii
331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2
de 2000 a 2007 obtidos com o modelo P 2 9 16 70
332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 4 71
333 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
BN 2 9 4 71
334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 4 72
335 Histograma dos valores PIT ajustados para acidentes tipo 3 74
336 Box plot dos valores estimados para acidentes tipo 3 75
337 Amplitude dos intervalos para acidentes tipo 3 75
338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76
339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o
ano 2000 76
340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77
341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77
342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 1 79
343 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79
344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3
de 2000 a 2007 obtidos com o modelo P 3 6 1 80
345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo BN 3 6 6 81
346 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81
347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo BN 3 6 6 82
348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos univariados e com os modelos multivariados 85
349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos multivariados 86
350 Numero de acidentes tipo 1 por concelho 87
351 Numero de acidentes tipo 2 por concelho 88
xviii Lista de Figuras
352 Numero de acidentes tipo 3 por concelho 88
353 Histograma dos valores PIT ajustados para acidentes tipo 1 89
354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 9 42 90
355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 9 42 91
356 Histograma dos valores PIT justados para acidentes tipo 2 92
357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 86 94
358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 86 94
359 Histograma dos valores PIT ajustados para acidentes tipo 3 95
360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 30 96
361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo P 3 6 30 97
A1 ID dos concelhos do Norte de Portugal Continental 104
A2 ID dos concelhos do Sul de Portugal Continental 105
A3 Numero de habitantes por concelho e por ano 110
A4 Area por concelho 111
A5 Densidade populacional por concelho 111
A6 Quilometros de estrada por concelho 112
A7 Quantidade de combustıvel vendido por concelho 112
A8 Superfıcie de ocupacao urbana do solo por concelho 113
A9 Superfıcie de ocupacao industrial do solo por concelho 113
A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por
concelho 114
A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114
ldquoThe road to wisdom - Well itacutes plain and simple to express
Err and err and err again but less and less and lessrdquo
Piet Hein (1996)
Introducao
A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora
de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo
automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se
tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao
ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o
Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009
OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes
rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso
entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as
tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa
na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas
etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do
PIB mundial
A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas
necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004
para a quinta causa de morte em 2030
2 Introducao
2004
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Infecoes respiratorias
4 Doencas pulmonares
5 Diarreias
6 HIVAIDS
7 Tuberculose
8Cancro do pulmao
dos bronquios e da traqueia
9 Acidentes rodoviarios
10Recem-nascidos prematuros
e de peso baixo
HH
2030
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Doencas pulmonares
4 Infecoes respiratorias
5 Acidentes rodoviarios
6Cancro do pulmao
dos bronquios e da traqueia
7 Diabetes mellitus
8 Doencas do coracao hipertensas
9 Cancro do estomago
10 HIVAIDS
Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)
No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a
decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-
ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem
disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao
forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes
rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida
No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de
Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-
dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos
socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a
sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario
e Santos 2012)
O sistema de trafego rodoviario um subsistema do sistema de transportes e formado
por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-
fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes
rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos
correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada
e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a
deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos
Introducao 3
(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de
pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se
por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma
qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena
de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do
sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-
guranca deste sistema complexo tem consequencias devastadoras em termos humanos
sociais e economicos (Cardoso 2007)
Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta
consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos
consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-
vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma
descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-
tadas a nıvel mundial
minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-
doviaria
minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios
como um problema de saude publica
minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da
seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial
minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria
minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das
Nacoes Unidas
minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca
Rodoviaria
minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de
Acao para a Seguranca Rodoviaria
Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria
Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-
dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade
responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para
uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos
veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica
sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste
flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area
da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e
tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha
uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes
4 Introducao
projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do
trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para
veıculos tambem designada por sistemas inteligentes de transportes
A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-
volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos
30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-
tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi
progressivamente modernizado tendo sido acompanhado por um aumento do numero
de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal
terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de
toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu
aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver
na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada
a implementacao de algumas medidas especıficas
Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)
As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para
compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios
e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou
regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma
consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica
de dados de acidentes rodoviarios
Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo
pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e
Introducao 5
do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda
lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util
domınio para desenvolvimento de atividades de investigacao O ambito desta tese e
portanto a modelacao estatıstica de dados de acidentes rodoviarios
Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-
retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar
progressivamente a execucao dessas acoes foram identificados varios fatores capazes de
melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em
particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas
com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados
As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma
melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de
intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-
vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada
em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-
dos na UE (CARE - Community database on accidents on the roads in Europe) No
projeto integrado SafetyNET (European Traffic Information System - Data Colletion
and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de
informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas
principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco
e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como
ponto de partida para a modelacao estatıstica usada nesta tese
A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-
nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-
ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos
desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-
cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes
o que facilita a identificacao dos fatores causais e de intervencoes corretivas
As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-
tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial
como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy
A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-
tatıstica Em geral foram detetados varios problemas na estimacao dos parametros
de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou
desconhecidas dependencia espacial e depedencia temporal que continuam a constituir
objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-
blemas como por exemplo
1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm
6 Introducao
minus modelos lineares generalizados baseados na distribuicao de Poisson
minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia
de sobredispersao
minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado
para analisar dados de acidentes com sobredispersao e excesso de zeros
minus modelos de nıveis multiplos estruturados
minus modelos bayesianos hierarquicos
minus incorporacao de correlacao espacial e dependencia temporal nos modelos
A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao
existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada
a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre
os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos
hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem
podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li
et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar
a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais
e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais
atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004)
O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da
estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a
problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior
barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua
formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains
Monte Carlo) na computacao bayesiana
A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se
nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que
envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas
O seu crescimento ao nıvel das aplicacoes tem sido extraordinario
O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using
Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o
GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao
Introducao 7
CODA Plummer et al (2006) e ao BOA Smith (2007)
Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de
pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)
o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em
particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-
tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas
Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana
aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa
determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas
limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes
de concordancia
Todas as analises envolvidas no metodo INLA estao implementadas num programa que
pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser
descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos
hierarquicos complexos tornou-se muito mais acessıvel
Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA
Objetivos
Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-
los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca
rodoviaria em areas geograficas diferentes
Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse
tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-
pacial e depedencia temporal
Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao
Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes
nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional
Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-
place Approximations atraves da exploracao do pacote R-INLA
8 Introducao
Estrutura da tese
No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a
caracterizacao dos dados usados nesta tese
No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos
No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais
de sinistralidade rodoviaria registados em Portugal Continental
No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido
de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros
No Anexo A faz-se a caracterizacao da regiao de estudo
No CD em anexo encontram-se todos os codigos usados nesta tese
1Nocoes sobre seguranca rodoviaria
11 Risco em seguranca rodoviaria
O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores
de seguranca informativos muito importantes No entanto quando se pretende fazer
comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de
acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca
rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de
acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja
risco=numero esperado de acidentesmedida de exposicao
A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-
responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel
ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-
teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a
melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-
cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos
proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens
e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego
10 Capıtulo 1 Nocoes sobre seguranca rodoviaria
atraves do comprimento de estrada do numero de veıculos ou preferencialmente da
distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode
estar associada a populacao de risco atraves do numero de habitantes do numero de
condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas
times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco
de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia
de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-
cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o
numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para
a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande
disponibilidade de informacao desagregada o que permite analisar as especificidades de
varios grupos populacionais As restantes medidas indicadas apresentam atualmente
muitas limitacoes1
Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se
deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido
e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a
relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata
de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes
e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-
se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de
veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se
a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho
12 Caracterizacao dos dados de acidentes
Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito
e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas
sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela
gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de
exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-
tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao
usada e sobre as covariaveis usadas
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-
ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez
1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2
205-v3_finalpdf
12 Caracterizacao dos dados de acidentes 11
agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho
A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos
se encontram no litoral norte sendo consequentemente mais proximos uns dos outros
Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz
respeito a caracterizacao dos concelhos2
Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311
Total 279644 28844 8890 317378
Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR
minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo
menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT
e PSP) e da qual resultem vıtimas ou danos materiais
minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais
minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do
acidente ou no seu percurso ate a unidade de saude No perıodo em analise para
obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)
aplica-se um coeficiente multiplicativo de 114 ao numero de mortos
minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo
de hospitalizacao superior a 24 horas
minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave
minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima
minus Acidente mortal Acidente do qual resulte pelo menos um morto
minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido
grave nao tendo ocorrido qualquer morte
minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido
leve e em que nao se tenham registado mortos nem feridos graves
2ver Anexo A
12 Capıtulo 1 Nocoes sobre seguranca rodoviaria
Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes
com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes
do tipo 3 os acidentes mortais
Figura 11 Numero de acidentes tipo 1 por concelho
Figura 12 Numero de acidentes tipo 2 por concelho
12 Caracterizacao dos dados de acidentes 13
Figura 13 Numero de acidentes tipo 3 por concelho
Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero
de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de
acidentes
Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor
risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao
entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria
muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos
mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278
concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado
o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de
cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes
decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para
permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no
espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes
Isto e especialmente importante porque apesar do numero de acidentes ser relacionado
com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria
que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de
3ver Anexo A
14 Capıtulo 1 Nocoes sobre seguranca rodoviaria
trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a
variabilidade da medida de exposicao em funcao do espaco ou do tempo
13 Caracterizacao da medida de exposicao - numero
de veıculos com seguro
Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares
Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730
Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)
13 Caracterizacao da medida de exposicao 15
O numero de veıculos com seguro varia bastante de concelho para concelho como se pode
verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo
por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que
cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media
inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo
Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho
i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o
numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =
100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de
acidente rodoviario para acidentes do tipo 1ndash3
Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por
concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes
e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos
sugerindo a existencia de correlacao espacial
Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na
faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas
mais baixas
Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007
Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-
se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se
mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas
muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a
16 Capıtulo 1 Nocoes sobre seguranca rodoviaria
nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos
com taxas mais baixas
Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007
Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007
No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas
usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer
mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-
petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao
13 Caracterizacao da medida de exposicao 17
ocorre com muita frequencia com dados de contagem com muitos valores escassos e
ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou
unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas
pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes
associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso
nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando
as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante
afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e
Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas
dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem
como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-
tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de
forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e
Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004) descritos no Capıtulo 2
2Modelacao estatıstica de acidentes rodoviarios
Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram
baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados
normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido
que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-
doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia
de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma
probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre
os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-
dos de contagens sao modelos mais apropriados para este tipo de estudos
Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo
constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo
et al 2007 Cardoso 1996)
Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo
caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala
espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais
desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais
como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel
explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-
20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como
uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade
espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias
ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao
apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo
muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao
verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos
com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao
de riscos relativos em areas pequenas
No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-
dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade
de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto
deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-
mas na alocacao de fundos governamentais e no planeamento regional Determinados
atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-
cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para
areas pequenas e esta tendencia ira provavelmente continuar
Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-
vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco
relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario
num determinado concelho relativamente ao risco no paıs (Portugal Continental)
As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e
consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem
acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999
Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os
metodos tradicionais para investigar questoes importantes relacionadas com estimacao de
riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia
temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis
nao observaveis tais como clima determinadas caracterısticas da populacao entre outras
Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser
pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a
construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios
ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al
2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-
tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes
21 Modelos bayesianos hierarquicos 21
espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e
temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a
suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos
pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos
dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-
doviarios
A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma
serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia
em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-
dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes
rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem
ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade
existente no dados Noland e Quddus (2004) Elvik (2011)
A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-
melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio
que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-
blema atribuıdo a comportamentos inadequados dos condutores associados a falencias
da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de
acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA
constitui a covariavel com maior poder explicativo da variacao observada No entanto
nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas
do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por
exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de
servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel
vendido e um indicador do volume de trafego e a densidade populacional um indicador de
urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais
o numero de habitantes a area geografica a densidade populacional o comprimento de
estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao
industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao
do solo com equipamento turıstico como sera abordado no Capıtulo 4
21 Modelos bayesianos hierarquicos
O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que
o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro
θ e o segundo traduz a distribuicao a priori para o parametro θ
22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica
na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-
delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-
nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo
que p(θ) =
intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =
1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa
estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-
formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros
Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade
associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-
tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia
a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori
nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-
tribuicao a priori padrao p(θ) (Paulino et al 2003)
Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte
estrutura
1o nıvel f(y|θ) funcao de verosimilhanca
2o nıvel p(θ|φ) distribuicao a priori dos parametros
3o nıvel p(φ) distribuicao a priori dos hiperparametros
Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e
evoluindo para modelos cada vez mais complexos
O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-
creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-
vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de
acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar
esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-
dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se
Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou
sejaYit|θit sim Poisson(Eitθit)
f(yit|θit) =(Eitθit)
yiteminusEitθit
yit
Eit = nitr = nit
sumij
Yitsumij
nit
21 Modelos bayesianos hierarquicos 23
onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit
representa o numero de veıculos com seguro e θit representa o risco relativo de acidente
rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja
se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia
de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de
acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)
A funcao de versimilhanca e dada por
L(θ|y) =prodit
f(yit|θit) =prodit
(Eitθit)yiteminusEitθit
yitpropprod
θyitit e
minussumit
Eitθit
e l(θ|y) = lnL(θ|y) propsumit
yit ln θitminussumit
Eitθit O estimador de maxima verosimilhanca
do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-
dardized Mortality Ratio1 - SMR) e dado por
θit = SMRit =YitEit
(211)
Note-se que V ar(SMRit) =V ar(Yit)
E2it
=θitEit
podendo-se fazer V ar(SMRit) =θitEit
=YitE2it
Um procedimento classico usual para identificar regioes de maior risco consiste na cons-
trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR
Apesar de util este procedimento tem algumas desvantagens Note-se que em areas
com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero
de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR
podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com
muita frequencia com dados desta natureza quando as unidades espaciais de analise sao
concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao
das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit
associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser
grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram
ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de
tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida
em que a respetiva variabilidade pode ser muito grande A variancia destes valores e
1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso
24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao
grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro
estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-
minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992
Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR
tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores
estimados com menos precisao As maiores variacoes do risco relativo nao estarao em
geral associadas com variacoes do risco subjacente a medida de exposicao mas serao
apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)
Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se
que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-
dade teorica subjacente ao modelo Poisson
A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados
(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do
modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado
que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al
2008 2005)
Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-
mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos
tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao
de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das
flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto
dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se
usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico
medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial
entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao
mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)
22 Modelos nao espaciais
Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh
e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis
atraves da funcao de ligacao usada para modelar a media
ln(θit) = α+
nβsump=1
βpxitp (221)
22 Modelos nao espaciais 25
onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel
e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um
nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual
considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a
priori p = 1 2 nβ i = 1 2 N e t = 1 2 T
No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-
adequadamente capturada pelas variaveis explicativas na funcao da media condicional
Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser
distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-
tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como
ln θit = α+
nβsump=1
βpxitp + vit (222)
onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p
Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que
foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-
los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares
generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)
Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-
dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao
a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo
Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples
de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma
fechada dado que esta mistura resulta de um modelo conjugado
Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao
Poisson e na distribuicao Binomial Negativa
O modelo Poisson Lognormal surge quando se admite que
vit sim Normal(0 σ2v) (223)
A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por
f(yit θNit σ
2v) =
1
σ2v
radic2π
EitθNit
y
int infin0
eminusEitθNit e
v
(ev)yminus1eminus v2
2σ2v dev
nao havendo forma explicıta com
26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
ln θNit = α+
nβsump=1
βpxitp (224)
E[Yit] = microNit eσ2v2 = Eitθ
Nit e
σ2v2 e V ar[Yit] = microNit e
σ2v2(
1 + (eσ2v minus 1)microNit e
minusσ2v2)
O modelo Poisson-Gama ou Binomial Negativo surge quando
exp(vit) sim Gama(φ φ) (225)
A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por
f(yit θBNit φ) =
Γ(yit + φ)
Γ(φ)yit
(φ
microBNit + φ
)φ(microBNit
microBNit + φ
)yitou seja
Yit|θBNit sim BN(EitθBNit φ)
com
ln θBNit = α+
nβsump=1
βpxitp (226)
E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit
(1 +
microBNitφ
) Note-se que quando φrarrinfin o
modelo Binomial Negativo reduz-se ao modelo Poisson
Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo
podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais
um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com
av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O
parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de
dispersao
O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-
plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre
unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-
quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito
afectadas (Miranda-Moreno et al 2007 Lord et al 2008)
Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)
A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-
pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os
23 Modelos espaciais 27
riscos relativos conjuntamente como um processo espacial atraves de uma especificacao
a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-
lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco
relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados
observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada
area e a soma de duas componentes que representam fatores espaciais e nao espaciais
No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica
de interesse em cada area tem distribuicao Poisson com media especıfica de cada area
As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre
a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento
das variaveis nao-observadas como em Bernardinelli et al (1995ab)
23 Modelos espaciais
Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia
espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos
mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao
associados uma distribuicao a priori conveniente
log(θit) = α+
nβsump=1
βpxitp + si (231)
Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de
notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario
quer para os modelos baseados na distribuicao de Poisson abreviadamente designados
de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa
abreviadamente designados de modelos BN com os devidos significados
Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que
representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos
atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori
associada
log(θit) = α+
nβsump=1
βpxitp + si + vi (232)
onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-
turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e
si sao mutuamente independentes viiidsim Normal(0 σ2
v) e si|sminusi sim Normal(si σ2smi)
28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
onde o sminusi indica o vetor s com o elemento si removido si =1
mi
sumi 6=j
wijsj e a media
dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e
wij = 0 caso contrario Deste modo mi =sumi 6=j
wij e o respetivo numero de vizinhos e
σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma
s tem distribuicao conjunta
f(s) prop (σ2s)minusn2 exp
minus 1
2σ2s
sumi6=j
(si minus sj)2wij
e (σ2v)minus1 sim Gama(av bv) (σ2
s)minus1 sim Gama(as bs) com av bv as e bs conhecidos
Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial
local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo
gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991
Banerjee et al 2004)
24 Modelos espaco-temporais
Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-
tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a
aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios
e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos
com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se
definiu na seccao anterior
Modelos espaco-temporais sem interacao
Nestes modelos tem-se log(θit) = α+
nβsump=1
βpxitp + si + vi + ψt
onde se considera
ψt sim Normal(0 σ2ψ) (241)
ou
ψt sim RW (1 σ2ψ) (242)
e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ
2s σ
2v σ
2ψ mutuamente
independentes
24 Modelos espaco-temporais 29
Alternativamente log(θit) = α+
nβsump=1
βpxitp + si + vi + γt
onde se considera
γ sim Normal(0 cγ) (243)
sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ
2v mutuamente
independentes (Knorr-Held 2000)
Modelos espaco-temporais com interacao
Neste caso log(θit) = α+
nβsump=1
βpxitp + si + vi + (γ + δi)t
onde se considera alternativamente
δi sim Normal(0 σ2δ ) (244)
ou
δi sim CAR(σ2δ ) (245)
e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com
aδ bδ conhecidos e α βp σ2s σ2
v σ2δ mutuamente independentes (Bernardinelli et al
1995b)
A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando
um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de
acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de
risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia
e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de
cada area e a media global α e δi representa a diferenca entre a tendencia temporal
local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0
a tendencia temporal local da area i e menos acentuada do que a tendencia temporal
global enquanto que quando δi gt 0 e mais acentuada
Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados
neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo
nao se encontra definida uma distribuicao a priori para um parametro considera-se a
distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior
30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Tabela 21 Modelos univariados
M log(θit) Distribuicao a priori Distribuicao a priori
dos parametros dos hiperparametros
1 α+
nβsump=1
βpxitp α sim Normal(0 cα)
βp sim Normal(0 cβ)
2 α+
nβsump=1
βpxitp + vi vi sim Normal(0 σ2v) σminus2
v sim Gama(av bv)
3 α+
nβsump=1
βpxitp + si si sim CAR(σ2s) σminus2
s sim Gama(as bs)
4 α+
nβsump=1
βpxitp + vi + si
5 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2
ψ sim Gama(aψ bψ)
6 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim RW (σ2ψ)
7 α+
nβsump=1
βpxitp + vi + si + γt γ sim Normal(0 cγ)
8 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2
δ sim Gama(aδ bδ)
9 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )
25 Modelos multivariados
Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-
mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes
modelos nao consideram a interdependencia que pode existir entre os riscos relativos
dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na
variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia
para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico
tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-
son capazes de considerar a relacao entre diferentes processos de contagem tais como
contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-
25 Modelos multivariados 31
son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta
abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de
diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o
numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo
k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit
condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou
seja
Ykit|θkit sim Poisson(Ekitθkit)
Modelos espaciais multivariados
1)log θkit = αk +
nβsump=1
βpxitp + ski
com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs
conhecidos
Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)
e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios
ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K
tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-
bilidade assume que a estrutura de associacao se separa numa componente nao espacial
e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta
de s e
s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)
Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)
D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de
vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK
definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre
os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao
espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se
o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo
improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou
modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin
et al (2005) Lawson (2009) Waller e Carlin (2010)
Para alem do modelo 1 foram implementados os modelos multivariados seguintes no
WinBUGS
32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)
3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)
4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e
dδ Rδ conhecidos
mas apenas se obteve convergencia para os modelos 1 e 4
Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =
bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =
001 0 0
0 001 0
0 0 001
26 Metodos de inferencia
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e
computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas
abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)
consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-
ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino
e Rue (2010a)
261 INLA
O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-
siana aproximada numa subclasse de modelos de regressao estruturados aditivamente
nomeadamente em modelos latentes gaussianos
Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z
que representa todas as componentes nao observaveis com distribuicao a priori Normal
Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-
mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-
buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia
exponencial A media microi de cada componente e relacionada com um preditor aditivo
estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor
incorpora aditivamente os efeitos de varias componentes
26 Metodos de inferencia 33
ηi = α+
nfsumj=1
f (j)(uij) +
nβsump=1
βpxip + εi (261)
onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-
cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u
podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis
contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-
torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos
podem ser representados atraves das funcoes f (j)()
Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-
mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por
suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a
priori dos hiperparametros nao tem de ser gaussianas
Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-
dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto
de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF
Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel
aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e
Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6
embora possa haver excecoes
Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro
nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos
parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-
sume que os dados observados sao condicionalmente independentes dado o campo latente
z tem-se que
f(y|xφ) =prodi
f(yi|ziφ)
Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca
do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos
φ
A distribuicao a posteriori e dada por
p(zφ|y) prop p(φ)p(z|φ)prodi
f(yi|ziφ) (262)
Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e
analiticamente tratavel
Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao
34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao
analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e
possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa
pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como
tempo computacional longo possibilidade de as amostras simuladas dos parametros se-
rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte
Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser
particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori
entre as componentes espacial ou espaco-temporal do campo latente
Em contraste o metodo de aproximacao INLA e apresentado como um metodo que
fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-
vamente pouco tempo
No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes
marginais a posteriori dos parametros de interesse
As distribuicoes marginais a posteriori pretendidas sao
p(zi|y) =
intφ
p(zi|φy)p(φ|y) dφ (263)
e
p(φj |y) =
intφj
p(φ|y) dφminusj (264)
A aproximacao de p(zi|y) e determinada usando a soma finita
p(zi|y) =sumk
p(zi|φky)p(φk|y)∆k (265)
onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-
vamente Esta soma e calculada por integracao numerica em pontos suporte φk com
pesos apropriados ∆k
A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e
obtida atraves da aproximacao de Laplace
p(φ|y) prop p(zφy)
pG(z|φy)
∣∣z=zlowast(φ) (266)
onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-
cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao
corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)
De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade
a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes
26 Metodos de inferencia 35
pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste
basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior
quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste
em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a
estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)
Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a
estrategia CCD a estrategia por omissao no R-INLA
Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a
aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace
simplificada
A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter
a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))
onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia
marginal Os autores referem que apesar de muito conveniente ao nıvel computacional
pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de
simetria das distribuicoes a posteriori marginais quer a ambos nıveis
Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais
demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-
place semelhante a 266 a p(zi|φy)
pLA(zi|φy) prop p(zφy)
pGG(zminusi|ziφy)
∣∣∣zminusi=zlowastminusi(ziφ) (267)
No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-
nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes
numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de
Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo
menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada
uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-
trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e
simetria Para mais detalhes ver Rue et al (2009)
Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre
os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao
de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos
O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-
parametros entre outras No entanto o seu potencial e reconhecidamente enorme e
encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-
tensoes com muita frequencia
36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
27 Ajustamento e medidas preditivas
Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o
criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio
combina uma medida de adequabilidade a media a posteriori da desvianca D com
uma medida de complexidade o numero efetivo de parametros pD sendo dado por
DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-
promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no
WinBUGS quer no R-INLA
No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos
aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-
vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive
Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-
tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle
e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-
delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para
detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)
As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)
p(yminusi)=
intf(yi|θyminusi)p(θ|yminusi) dθ
e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores
CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para
efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de
calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou
grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito
diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de
dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem
uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este
problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim
pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =
yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma
forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem
ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)
Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a
0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa
por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira
a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da
concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de
27 Ajustamento e medidas preditivas 37
referencia
Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls
(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))
ntimes T Esta medida e muito
utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os
valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo
3Aplicacoes
Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios
ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os
resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo
de aproximacao INLA atraves do R-INLA
Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-
sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel
usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos
no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao
apresentados os resultados obtidos no WinBUGS
Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a
analise individual de cada ano comparando-se os varios modelos e os resultados obtidos
no WinBUGS e no R-INLA tendo havido concordancia
Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial
40 Capıtulo 3 Aplicacoes
31 Associacao espacial
A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-
doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco
como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter
uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas
determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes
entre areas de maior risco e potenciais fatores
Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-
racterısticas que revelam alguns dos seus problemas Para alem da concentracao de
concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito
diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de
veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a
uma pequena mudanca no numero de acidentes
Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-
rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa
global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com
feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0
e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes
valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no
de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida
ao acaso pois os concelhos possuem condicoes identicas
Tendo em conta que o numero de veıculos com seguro varia muito por concelho este
comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-
ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem
medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito
instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis
ja que possuem variancias muito diferentes
A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura
31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero
de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro
para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas
versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em
2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho
da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com
tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que
assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se
31 Associacao espacial 41
ter uma percecao dessa variabilidade em cada concelho
Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000
Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000
42 Capıtulo 3 Aplicacoes
Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000
A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem
a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir
uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de
contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz
de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma
fronteira e wij = 0 caso contrario
As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e
o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em
areas pequenas em que o tamanho da medida de exposicao e diferente de area para
area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta
questao foram desenvolvidas diversas propostas alternativas para dados com populacoes
heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em
conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se
o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por
EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma
estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa
os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes
empırica da media marginal padronizado pela estimativa do desvio padrao da taxa
Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros
sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI
tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao
32 Modelos 43
do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao
aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de
EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado
no R atraves do pacote spdep e da funcao EBImoranmc()
Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano
Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859
Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000
Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente
por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos
testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo
p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na
Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para
acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao
espacial
32 Modelos
Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais
espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos
modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo
uma vez que forneceram melhores resultados como se pode verificar comparando os
valores das Tabelas 32mdash35
Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA
44 Capıtulo 3 Aplicacoes
No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo
da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo
A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos
de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente
pela analise dos resultados com o programa CODA do R (Plummer et al 2006)
No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-
tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada
computacionalmente menos intensa
Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266
P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205
P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204
P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204
Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 1 2063493 188 464 1351516 170 304 988082 169 222
BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201
BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201
BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201
As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos
espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos
com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo
Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial
Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3
1referente a Tabela 21
33 Modelos espaco-temporais 45
Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior
a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a
diferenca entre o numero de parametros e muito grande
No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos
os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero
correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se
pode ver mais adiante quando se usam os modelos espaco-temporais este problema e
ultrapassado
Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao
menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos
os tipos de acidentes
33 Modelos espaco-temporais
De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para
estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-
mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se
reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre
muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21
Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191
P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191
P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192
P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192
P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192
Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor
modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para
2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso
46 Capıtulo 3 Aplicacoes
o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela
35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo
1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash
e para o tipo 3 o modelo 6 mdash BN 3 6
Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191
BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191
BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192
BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193
BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193
Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e
do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores
sao os modelos Poisson
331 Associacao regional
Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao
geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar
informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-
plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos
nos riscos de acidentes
Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes
em milhares de habitantes P a area em centenas de km2 A a densidade populacional em
centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade
de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU
a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques
urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do
solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se
valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST
os valores sao por concelho e iguais em todos os anos
33 Modelos espaco-temporais 47
332 Selecao dos modelos
Foram implementados todos os modelos com todas as combinacoes entre as covariaveis
mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de
acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram
escolhidos os seguintes modelos
Tabela 36 DIC pD e mls para cada tipo de acidente
Tipo P DIC pD mls BN DIC pD mls
1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418
2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260
3 3 6 4 846237 20562 191 3 6 6 852362 19267 191
Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais
P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e
Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU
e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash
modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP
mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI
e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash
modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6
com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos
Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para
cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e
nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao
relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os
valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921
e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo
sao relativamente pequenas 961 594 e 076 respetivamente
Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao
contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis
covariaveis significativas e respetiva contribuicao para os resultados Assim fica para
trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais
significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em
48 Capıtulo 3 Aplicacoes
particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)
e uma covariavel considerada muito importante na modelacao estatıstica de acidentes
rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao
nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica
designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos
hoteleiros
333 Modelos para acidentes do tipo 1
Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172
log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t
e
log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t
No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente
para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos
de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem
o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o
zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor
HPD que contem o zero considera-se que a covariavel nao contribui significativamente
para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso
contrario considera-se que a covariavel contribui significativamente para a explicacao
da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado
que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124
obtendo-se o modelo Poisson 1 8 16 ou seja
log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t
Tabela 37 DIC pD e mls para acidentes tipo 1
Modelo DIC pD mls
P 1 8 1 1940548 47786 458
P 1 8 16 1939877 47789 458
BN 1 6 1 1861278 25154 419
BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
33 Modelos espaco-temporais 49
No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as
covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se
manter as covariaveis no modelo
334 Validacao dos modelos para acidentes do tipo 1
Validacao do modelo P 1 8 16 e do modelo BN 1 6 172
Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172
Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do
que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela
37 O valor da media do logscore tambem e significativamente menor de acordo com
o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores
PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O
valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo
BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes
sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do
tipo 1
335 Resultados obtidos com modelos para acidentes do tipo 1
Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172
A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um
efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma
50 Capıtulo 3 Aplicacoes
diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo
1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16
e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo
BN 1 6 172
Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172
Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max
SMR1 00000 07512 09656 10020 12360 32610
RR1 8 1 02290 07728 09663 09989 11870 28890
RR1 8 16 02274 07722 09628 09979 11860 28770
RR1 6 1 02886 07807 09599 10010 11890 24480
RR1 6 172 02852 07798 09589 09999 11870 24400
Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de
33 Modelos espaco-temporais 51
confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-
bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com
os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-
nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172
Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172
Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados
52 Capıtulo 3 Aplicacoes
os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo
P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000
Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para
o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312
se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de
33 Modelos espaco-temporais 53
suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos
erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais
Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000
Relativamente a introducao das covariaveis comprimento de estrada e quantidade de
combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia
dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis
explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao
explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados
espacialmente
Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1
Efeitos fixosmedia dp 0025q 0975q
α1 00580 00074 00435 00723
γ1 -00263 00030 -00321 -00204
Variancia dos efeitos aleatorios
σ2s1 05816 00591 04706 07001
σ2δ1
00019 00002 00015 00023
Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1
54 Capıtulo 3 Aplicacoes
mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-
plicacao da variacao associada aos efeitos temporais
Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel
vendido influenciam significativamente a variacao geografica dos riscos relativos sao
consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem
de forma positiva para a variacao os riscos o que significa que em regioes com maior
comprimento de estrada e em regioes com maior quantidade de combustıvel vendido
esta associado um aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16
Efeitos fixosmedia dp 0025q 0975q
α1 -00898 00354 -01595 -00207
b1C 00016 00004 00008 00024
b1V C 00003 00001 00002 00005
γ1 -00257 00030 -00315 -00198
Variancia dos efeitos aleatorios
σ2s1 05492 00560 04440 06615
σ2δ1
00019 00002 00015 00023
No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada
do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da
ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos
espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-
buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou
efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves
dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos
temporais σ2ψ1
se mantem o que implica que as covariaveis nao contribuem para a ex-
plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o
modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao
e significativa
Mais uma vez as covariaveis que influenciam significativamente a variacao geografica
dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-
variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que
33 Modelos espaco-temporais 55
regioes com maior comprimento de estrada regioes com maior ocupacao de solo com
equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento
turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos
os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-
mente para a estimacao dos riscos o que significa que em regioes com maior numero de
habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo
fixos todos os restantes efeitos
Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1
Efeitos fixosmedia dp 0025q 0975q
α1 -00429 00052 -00595 -00389
Parametro de dispersao φminus11 00298 00017 00267 00332
Variancia dos efeitos aleatorios
σ2s1 02603 00266 02108 03142
σ2ψ1
00090 00057 00029 00237
Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172
Efeitos fixosmedia dp 0025q 0975q
α1 -01348 00243 -01826 -00872
b1C 00013 00003 00007 00019
b1P -00135 00044 -00221 -00049
b1OSEUP 00001 000008 -000005 00003
b1OST 00001 000006 -0000003 00002
Parametro de dispersao φminus11 00300 00017 00269 00334
Variancia dos efeitos aleatorios
σ2s1 02438 00254 01966 02951
σ2ψ1
00090 00056 00029 00235
Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente
56 Capıtulo 3 Aplicacoes
espacial contribui fortemente para a variacao geografica do risco relativo O padrao e
muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes
com maior risco relativo estimado correspondem as regioes em que as estimativas dos
efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-
dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo
proximo de um correspondem as regioes em que as estimativas de si sao proximas de
zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade
HPD nao contem o zero e 633 para o modelo P 1 4 16
Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16
Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16
33 Modelos espaco-temporais 57
A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0
eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao
longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio
anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta
tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores
correspondente a diminuicao das estimativas dos riscos ao longo dos anos
Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16
Min 1oQ Mediana Media 3oQ Max
δ1 -00919 -00254 -00476 00768 00197 00133
eδ1 09125 09751 09954 10010 10200 11420
Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16
Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de
credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1
a tendencia temporal local e maior que a tendencia global sendo o decrescimento do
numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia
58 Capıtulo 3 Aplicacoes
temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia
temporal local e menor do que a global sendo o decrescimento mais acentuado No
mapa da Figura 315 pode ver-se a distribuicao destes concelhos
Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um
sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada
na Tabela A8 do Anexo A
Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172
Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172
Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos
mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial
33 Modelos espaco-temporais 59
contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado
e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com
menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si
sao proximas de zero Para este modelo a percentagem de estimativas dos valores de
s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente
a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos
seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais
acentuado nos cinco anos seguintes
Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172
Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo
BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um
aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os
restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-
gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos
estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel
contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i
no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54
Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a
percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento
turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como
os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de
60 Capıtulo 3 Aplicacoes
(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo
da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel
OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com
equipamentos turısticos vai de 0 a 038
Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172
Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172
Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior
33 Modelos espaco-temporais 61
que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos
com risco relativo significativamente maior que um
336 Modelos para acidentes do tipo 2
Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192
log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +
b2DPDP2it + s2i + (γ2 + δ2i)t
e
log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t
No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente
das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519
pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo
Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o
modelo P 2 9 16 ou seja
log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t
No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-
variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e
pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-
delo BN 2 9 4 ou seja
log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t
Tabela 314 DIC pD e mls para acidentes tipo 2
modelo DIC pD mls
P 2 9 1 1170386 35334 270
P 2 9 16 1169631 35476 270
BN 2 9 1 1156921 29101 261
BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
62 Capıtulo 3 Aplicacoes
337 Validacao dos modelos para acidentes do tipo 2
Validacao do modelo P 2 9 16 e do modelo BN 2 9 4
Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4
Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-
ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual
a 13956 O valor da media do logscore tambem e significativamente menor de acordo
com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos
valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura
322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para
o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes
sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do
tipo 2
338 Resultados obtidos com modelos para acidentes do tipo 2
Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4
A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as
estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre
um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das
estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados
a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores
esperados a posteriori obtidos com o modelo BN 2 9 4
33 Modelos espaco-temporais 63
Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4
Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os
modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max
SMR2 00000 05062 09180 11830 15740 87830
RR2 9 1 02237 06553 09651 11910 14980 77550
RR2 9 16 02218 06547 09624 11860 14970 77060
RR2 9 1 nb 02391 06636 09751 11870 14960 59240
RR2 9 4 nb 02363 06630 09720 11810 14850 59030
64 Capıtulo 3 Aplicacoes
Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo
P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes
33 Modelos espaco-temporais 65
do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000
Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000
66 Capıtulo 3 Aplicacoes
Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000
Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das
covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo
Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja
as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos
sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito
espacial
Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03511 00191 03135 03883
γ2 -00844 00037 -00918 -00771
Variancia dos efeitos aleatorios
σ2s2 09474 01054 07554 11648
σ2δ2
00099 00016 00070 00133
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-
plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao
33 Modelos espaco-temporais 67
para a variacao geografica das estimativas dos riscos e positiva em regioes com maior
comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao
para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos
Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16
Efeitos fixosmedia dp 0025q 0975q
α2 01790 00530 00741 02822
b2C 00020 00005 00009 00031
b2V C -00004 00003 -00010 00003
γ2 -00833 00038 -00906 -00759
Variancia dos efeitos aleatorios
σ2s2 09162 01019 07325 11282
σ2δ2
00099 00016 00015 00135
Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com
a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos
efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma
efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam
incluıdos no modelo P 2 9 1 atraves do efeito espacial
Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03529 00223 03090 03965
γ2 -00819 00044 -00906 -00733
Parametro de dispersao φminus11 00577 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07824 00925 06156 09748
σ2δ2
00051 00012 00031 00079
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
68 Capıtulo 3 Aplicacoes
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao
associada aos efeitos temporais Para alem disso como a contribuicao para a variacao
geografica das estimativas dos riscos e positiva em regioes com maior comprimento de
estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos
os restantes efeitos
Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4
Efeitos fixosmedia dp 0025q 0975q
α2 01961 00530 00741 02822
b2C 00017 00005 00008 00027
γ2 -00814 00044 -00900 -00727
Parametro de dispersao φminus11 00576 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07516 00894 05914 09385
σ2δ2
00052 00013 00031 00080
Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16
33 Modelos espaco-temporais 69
Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode
verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o
padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado
correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as
regioes com menor risco relativo estimado correspondem as regioes em que as estimativas
de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes
em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem
de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero
e 608
Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era
esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou
seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem
de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295
Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16
Min 1oQ Mediana Media 3oQ Max
δ2 -01805 -00411 00082 00003 00485 01532
eδ2 08358 09604 10090 10030 10500 11660
No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se
que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia
70 Capıtulo 3 Aplicacoes
temporal local maior do que a global e um decrescimento no numero de acidentes do tipo
2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local
menor que a global e um decrescimento mais acentuado
Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16
E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um
obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um que permite complementar esta informacao
Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-
temente para a variacao geografica do risco relativo como se pode observar no mapa da
Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-
mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes
com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao
proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i
cujo intervalo de credibilidade HPD nao contem o zero e 5665
33 Modelos espaco-temporais 71
Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4
Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4
Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4
Min 1oQ Mediana Media 3oQ Max
δ1 -01530 -00368 00052 00001 00402 01140
eδ1 08592 09646 10060 10020 10420 11210
72 Capıtulo 3 Aplicacoes
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca
no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de
78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de
valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa
da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a
global sendo o seu decrescimento menos acentuado que o decrescimento global havendo
uma minoria onde se passa o contrario
Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4
Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior
que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao
com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista
ordenada dos primeiros quinze concelhos
33 Modelos espaco-temporais 73
339 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6
log(θ3ij) = α3 + b3CCi + s3i + ψ3t
e
log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t
No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a
covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo
P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1
log(θ3ij) = α3 + s3i + ψ3t
No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade
populacional nao contem o zero por isso o modelo mantem-se
Tabela 322 DIC pD e mls para acidentes tipo 3
modelo DIC pD mls
P 3 6 1 846290 20551 191
P 3 6 4 846237 20562 191
BN 3 6 1 852438 19770 191
BN 3 6 6 852362 19267 191
3310 Validacao dos modelos para acidentes do tipo 3
Validacao do modelo P 3 6 1 e do modelo BN 3 6 6
Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e
menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072
Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos
valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia
preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo
74 Capıtulo 3 Aplicacoes
ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se
que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3
Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6
3311 Resultados obtidos com modelos para acidentes do tipo 3
Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6
Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max
SMR3 00000 04639 11050 15100 20490 156700
RR3 6 1 01363 08869 13050 14900 18430 95400
RR3 6 6 bn 01247 09020 13170 14850 18370 87310
Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo
obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-
vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores
esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos
valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e
Tabela 323
33 Modelos espaco-temporais 75
Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6
Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6
Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-
76 Capıtulo 3 Aplicacoes
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os
modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6
Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000
Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo
P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
33 Modelos espaco-temporais 77
Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000
Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem
comentarios acerca de associacao regional para este modelo
78 Capıtulo 3 Aplicacoes
No modelo BN observa-se que com a introducao da covariavel densidade populacional o
valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da
variancia dos efeitos temporais σ2ψ1t
se mantem Tabelas 325 e 326
Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02114 00152 01815 02410
Variancia dos efeitos aleatorios
σ2s3 06817 00802 05383 08499
σ2ψ3
00255 00157 00082 00660
Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02155 00158 01842 02464
Parametro de dispersao ψminus11 00455 00061 00348 00584
Variancia dos efeitos aleatorios
σ2s3 06497 00800 05070 08174
σ2ψ3
00255 00161 00081 00672
Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6
Efeitos fixosmedia dp 0025q 0975q
α3 02791 00217 02362 03215
bDP -00199 00048 -00294 -00105
Parametro de dispersao φminus11 00459 00061 00350 00588
Variancia dos efeitos aleatorios
σ2s3 05855 00749 04532 07440
σ2ψ3
00255 00161 00081 00672
Tal significa que a covariavel densidade populacional contribui para a explicacao da
33 Modelos espaco-temporais 79
variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao
da variacao temporal A contribuicao da covariavel densidade populacional e negativa
o que indica que em regioes com maior densidade populacional ocorre a contribuicao
para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos
No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a
sobredispersao nao e significativa
Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1
Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1
80 Capıtulo 3 Aplicacoes
O padrao espacial das estimativas do risco relativo e das estimativas da componente
espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras
342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao
positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos
efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem
o zero e 439 para o modelo P 3 6 1
No que respeita a componente temporal observa-se um decrescimento nos dois primeiros
anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento
nos ultimos cinco anos
Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1
Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco
relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a
lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-
tivamente maior que um na Tabela A9 do Anexo A
33 Modelos espaco-temporais 81
Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6
Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6
Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os
padroes revelados pelos mapas As regioes com maior contribuicao da componente es-
pacial para o aumento do risco relativo correspondem em geral a regioes com maiores
estimativas de risco relativo Tal significa que a componente espacial explica grande parte
da variacao das estimativas do risco relativo A percentagem de estimativas dos valores
de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1
82 Capıtulo 3 Aplicacoes
Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6
A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo
modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode
ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se
pode encontrar uma lista ordenada dos primeiros quinze concelhos
Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se
apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista
o tipo de interacao espaco-temporal
Tabela 327 Modelos univariados
Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal
1 BN 1 6 172 C+P+OSEPU+OST RW mdash
2 BN 2 9 4 C fixo CAR
3 P 3 6 1 mdash RW mdash
34 Modelos multivariados 83
34 Modelos multivariados
Os modelos multivariados usados foram
log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)
log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)
Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-
tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito
complexos nao parece haver um ganho substancial em usa-los
Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados
Modelos multivariados Modelos univariados
Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q
α1 00565 00181 00214 00914 00580 00074 00435 00723
α2 03423 00344 02735 04083 03511 00191 03135 03883
α3 05993 00331 05340 06644 06633 00247 06147 07115
γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204
γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771
γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907
Σu =
05551 03843 05519
03843 1042 05864
05519 05864 09113
Σδ =
00074 00035 00061
00035 00111 00059
00061 00059 00081
No entanto e interessante verificar que em termos de correlacao entre as estimativas
dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo
2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao
que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios
nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e
tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no
numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330
84 Capıtulo 3 Aplicacoes
Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal
Modelos com interacao Modelos sem interacao
media dp 0025q 0975q media dp 0025q 0975q
ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669
ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879
ρ23(θ) 06793 00242 06304 07252 06831 002647 07326
ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196
ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941
ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976
ρ12(δ) 03823 00894 01960 05465
ρ13(δ) 07979 00634 06487 08998
ρ23(δ) 06203 00938 04153 07829
Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias
AnoVıtimas mortais Feridos graves Feridos leves
24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif
2010 741 937 196 2637 2475 -162 43924 43890 -34
2011 689 891 202 2436 2265 -171 39726 39695 -31
34 Modelos multivariados 85
Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados
86 Capıtulo 3 Aplicacoes
Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
35 Aplicacao para acidentes rodoviarios nas estradas
secundarias
Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-
cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram
retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-
damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior
risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do
poder local
Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840
Total 175741 16909 3471 196121
Figura 350 Numero de acidentes tipo 1 por concelho
88 Capıtulo 3 Aplicacoes
Figura 351 Numero de acidentes tipo 2 por concelho
Figura 352 Numero de acidentes tipo 3 por concelho
No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados
Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89
de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos
Tabela 332 DIC pD e mls para cada tipo de acidente
Modelo DIC pD mls
BN 1 9 42 1614530 32359 363
BN 2 9 246 924765 27530 208
P 3 6 30 581058 11747 131
351 Modelo para acidentes do tipo 1
Modelo Binomial Negativo 1 9 42
log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t
Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a
variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do
modelo
352 Validacao do modelo para acidentes do tipo 1
Validacao do modelo BN 1 9 42
Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42
O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-
pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O
90 Capıtulo 3 Aplicacoes
valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem
um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-
ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42
e o melhor modelo para acidentes do tipo 1
353 Resultados obtidos com o modelo para acidentes do tipo 1
Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42
Efeitos fixosmedia dp 0025q 0975q
α1 -03518 00346 -04202 -02843
b1C 00012 00004 00005 00019
b1OST 00001 000007 -000005 00002
γ1 -00128 00026 -00179 -00077
Parametro de dispersao φminus11 00287 00021 00248 00328
Variancia dos efeitos aleatorios
σ2s1 03982 00445 03180 04909
σ2δ1
00026 00007 00015 00040
Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91
As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico
influenciam significativamente a variacao geografica dos riscos relativos e portanto sao
consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de
forma positiva para a variacao dos riscos o que significa que em regioes com maior
comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma
contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes
efeitos
Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-
derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura
temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao
envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial
se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de
risco relativo Figuras 354 e 316
Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42
Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco
relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um
92 Capıtulo 3 Aplicacoes
354 Modelo para acidentes do tipo 2
Modelo Binomial Negativo 2 9 246
log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +
s2i + (γ2 + δ2i)t2
Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de
todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938
pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e
manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja
log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2
Tabela 334 DIC pD e mls
Modelo DIC pD mls
BN 2 9 86 924868 24786 208
355 Validacao do modelo para acidentes do tipo 2
Validacao do modelo BN 2 9 86
Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86
O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo
Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93
do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto
proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e
95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor
modelo para acidentes do tipo 2
356 Resultados obtidos com o modelo para acidentes do tipo 2
Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86
Efeitos fixosmedia dp 0025q 0975q
α2 -01198 00480 -02147 -00266
b1OSI 00002 000008 000007 00004
b1OSEPU 00003 00002 000001 00006
b1DP 00084 00066 -00046 00215
γ1 -01198 00480 -02147 -00266
Parametro de dispersao
φminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 10557 01336 08161 13345
σ2δ1
00094 00023 00057 00147
A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-
nos e a densidade populacional influenciam significativamente a variacao geografica dos
riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-
variaveis contribuem de forma positiva para a variacao dos riscos o que significa que
em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo
com equipamentos e parques urbanos e a regioes com maior densidade populacional ha
contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes
do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a
mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao
Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que
os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos
94 Capıtulo 3 Aplicacoes
concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns
conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas
do risco relativo sao os mesmos
Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86
Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95
A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com
o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que
consta na Tabela A11
357 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 30
log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt
Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU
contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo
358 Validacao do modelo para acidentes do tipo 3
Validacao do modelo P 3 6 30
Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30
Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da
distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-
mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores
igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva
e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para
acidentes do tipo 3
96 Capıtulo 3 Aplicacoes
359 Resultados obtidos com o modelo para acidentes do tipo 3
Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30
Efeitos fixosmedia dp 0025q 0975q
α2 00104 00520 -00923 01117
b3A 00258 00116 00031 00049
b3OSEPU -00001 00001 -00004 000006
Parametro de dispersao
ψminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 03598 00687 02422 05084
σ2ψ1
00246 00163 0007 00666
Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30
A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam
significativamente a variacao geografica dos riscos relativos sendo consideradas na es-
timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97
a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial
em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes
com maior area geografica ha uma contribuicao para o aumento das estimativas do risco
relativo mantendo fixos todos os restantes efeitos
O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de
trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-
trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico
mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No
entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos
Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30
E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo
modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que
consta na Tabela A11
Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-
mente a abordagem global e a abordagem local
98 Capıtulo 3 Aplicacoes
Tabela 337 Comparacao entre a abordagem local e a global
Abordagem Tipo Melhor Covariaveis Efeito Interacao
Modelo temporal espaco-temporal
Local 1 BN 1 9 42 C+OST fixo CAR
Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash
Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR
Gloal 2 BN 2 9 4 C fixo CAR
Local 3 P 3 6 30 A+OSEUP aleatorio mdash
Global 3 P 3 6 1 mdash aleatorio mdash
4Discussao e conclusoes
Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia
de dependencia espacial de tendencia temporal e de associacao regional em dados de
acidentes rodoviarios
Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-
delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por
areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar
diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao
espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel
recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados
com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de
trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de sobredispersao de associacao posi-
tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-
mentos e parques urbanos e uma associacao regional negativa com a populacao
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
100 Capıtulo 4 Discussao e conclusoes
bredispersao e de associacao regional positiva com o comprimento de estrada
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente
Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com o comprimento de estrada e com
a area de ocupacao do solo para turismo
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com a area de ocupacao de solo para
a industria com a area de ocupacao do solo com equipamentos e parques urbanos
e com a densidade populacional
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente de associacao regional
positiva com a area e de associacao regional negativa com a area de ocupacao de
solo com equipamentos e parques urbanos
Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-
se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas
Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com
interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao
do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido
o modelo Poisson com efeito temporal aleatorio
Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos
modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-
tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se
capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes
espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-
formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que
as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto
e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas
as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de
valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais
elevados diminuiram ou seja os valores extremos foram suavizados
101
Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos
dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-
gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi
possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia
temporal global Este e um tipo de resultado muito importante na fase de aplicacao
pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter
exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas
Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-
minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as
covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam
incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-
fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal
Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores
usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal
considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para
todos os anos em estudo
Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos
mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-
pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a
ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-
cativamente maior que um bem como as dos concelhos com valores consideravelmente
menores do que a unidade
Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-
timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises
por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-
pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de
estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-
nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o
TDMA de modo a introduzi-las no modelo
Os modelos multivariados constituiram um esforco computacional elevado nao tendo
havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises
comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi
possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes
tipos de acidentes
Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves
do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo
uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-
ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA
102 Capıtulo 4 Discussao e conclusoes
pela extrema concordancia de resultados pela facilidade de implementacao dos modelos
pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez
de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem
duvida muito mais acessıvel
Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-
dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de
um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-
patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de
recolha e definicao das variaveis de interesse A implementacao estes modelos tambem
pode ser efetuada atraves do R-INLA
Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir
como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-
dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite
efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-
gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade
dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas
geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios
constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel
mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-
sabilidade de todosrdquo
ACaracterizacao da regiao de estudo
A1 Portugal Continental
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes
administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados
em 18 distritos
O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a
partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na
pagina do Instituto Geografico Portugues - httpwwwigeopt
A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o
map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-
hancas no WinBUGS
104 Apendice A Caracterizacao da regiao de estudo
Figura A1 ID dos concelhos do Norte de Portugal Continental
A1 Portugal Continental 105
Figura A2 ID dos concelhos do Sul de Portugal Continental
106 Apendice A Caracterizacao da regiao de estudo
A1 Portugal Continental 107
108 Apendice A Caracterizacao da regiao de estudo
A2 Numero de acidentes
Tabela A1 Estatısticas resumo de acidentes tipo 1
Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200
Tabela A2 Estatısticas resumo de acidentes tipo 2
Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800
Tabela A3 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100
A2 Numero de acidentes 109
Numero de acidentes que ocorreram nas estradas secundarias
Tabela A4 Estatısticas resumo de acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900
Tabela A5 Estatısticas resumo de acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800
Tabela A6 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700
110 Apendice A Caracterizacao da regiao de estudo
A3 Covariaveis
bull Populacao - P
Tabela A7 Estatısticas resumo da covariavel populacao
Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700
Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)
A3 Covariaveis 111
bull Area - A
Figura A4 Area em centenas de km2 por concelho (Fonte INE)
bull Densidade Populacional - DP
Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)
112 Apendice A Caracterizacao da regiao de estudo
bull Comprimento de Estrada - C
Figura A6 Quilometros de estrada por concelho (Fonte EP)
bull Quantidade de combustıvel vendido - VC
Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)
A3 Covariaveis 113
bull Ocupacao urbana do solo - OSU
Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
bull Ocupacao industrial do solo - OSI
Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)
114 Apendice A Caracterizacao da regiao de estudo
bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU
Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)
bull Ocupacao do solo com equipamento turıstico - OST
Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
A4 15 concelhos 115A
415
con
celh
os
Tab
ela
A8
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o1
Mold
elo
P1
816
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alb
ergaria
-a-V
elh
a3
Castro
Marim
Alc
acer
do
Sal
Grandola
Castro
Marim
Castro
Marim
Castro
Marim
Alb
ergaria
-a-V
elh
aV
ouzela
4A
lcacer
do
Sal
Castro
Marim
Castro
Marim
Grandola
Grandola
Alb
ergaria
-a-V
elh
aC
astro
Marim
Alc
acer
do
Sal
5V
izela
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
Vila
Velh
ade
Rodao
Pedrogao
Grande
6C
ondeix
a-a
-Nova
Azam
buja
Azam
buja
Azam
buja
Obid
os
Penela
Penela
Vila
Velh
ade
Rodao
7A
zam
buja
Viz
ela
Alj
ezur
Obid
os
Penela
Obid
os
Alj
ezur
Penela
8Silves
Alj
ezur
Obid
os
Condeix
a-a
-Nova
Azam
buja
Grandola
Obid
os
Alj
ezur
9A
lbufe
ira
Silves
Pom
bal
Pom
bal
Pom
bal
Vila
Velh
ade
Rodao
Pedrogao
Grande
Obid
os
10
Alj
ezur
Obid
os
Palm
ela
Penela
Alb
ergaria
-a-V
elh
aP
om
bal
Vouzela
Castro
Marim
11
Palm
ela
Pom
bal
Benavente
Palm
ela
Condeix
a-a
-Nova
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oE
sposende
12
Benavente
Benavente
Silves
Benavente
Vila
Velh
ade
Rodao
Azam
buja
Pom
bal
Montem
or-o
-Velh
o13
Pom
bal
Palm
ela
Penela
Vagos
Benavente
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
Tabua
14
Obid
os
Alb
ufe
ira
Olh
ao
Silves
Palm
ela
Condeix
a-a
-Nova
Esposende
Oliveir
ado
Bair
ro
15
Marin
ha
Grande
Olh
ao
Vagos
Olh
ao
Montem
or-o
-Velh
oP
edrogao
Grande
Tabua
Cham
usca
Mold
elo
BN
16
172
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
3C
astro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
4G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
5O
bid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
6C
ondeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
7A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
8P
om
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
9B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
10
Penela
Penela
Penela
Penela
Penela
Penela
Penela
Penela
11
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
12
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
13
Palm
ela
Alb
ergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
a14
Alb
ergaria
-a-V
elh
aP
alm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
15
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
o
116 Apendice A Caracterizacao da regiao de estudo
Tab
ela
A9
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o2
Modelo
P2
916
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ouriq
ue
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Alj
ustrel
4A
lcacer
do
Sal
Alc
acer
do
Sal
Avis
Nis
aO
urem
Nis
aA
ljustrel
Avis
5A
vis
Avis
Alc
acer
do
Sal
Rio
Maio
rN
isa
Alj
ustrel
Nis
aM
ourao
6C
ham
usca
Nis
aN
isa
Alj
ezur
Alc
acer
do
Sal
Mourao
Mourao
Nis
a7
Santarem
Cham
usca
Alj
ezur
Alc
acer
do
Sal
Alj
ustrel
Pedrogao
Grande
Pedrogao
Grande
Pedrogao
Grande
8V
ila
Nova
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rA
lcacer
do
Sal
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
da
Barquin
ha
da
Barquin
ha
9N
isa
Santarem
Vila
Nova
Pedrogao
Grande
Mourao
Ourem
Alc
acer
do
Sal
Proenca-a
-Nova
da
Barquin
ha
10
Alm
eir
imV
endas
Novas
Pedrogao
Grande
Mourao
Pedrogao
Grande
Ferreir
ado
Ale
ntejo
Proenca-a
-Nova
Alc
acer
do
Sal
11
Gole
ga
Montem
or-o
-Novo
Alj
ustrel
Vila
Nova
Ferreir
ado
Ale
ntejo
Rio
Maio
rG
randola
Idanha-a
-Nova
da
Barquin
ha
12
Vendas
Novas
Alj
ezur
Santarem
Cham
usca
Montem
or-o
-Novo
Montem
or-o
-Novo
Rio
Maio
rG
randola
13
Gavia
oG
avia
oM
ontem
or-o
-Novo
Montem
or-o
-Novo
Vila
Nova
Grandola
Ourem
Alm
odovar
da
Barquin
ha
14
Palm
ela
Gole
ga
Mourao
Ferreir
ado
Ale
ntejo
Grandola
Proenca-a
-Nova
Montem
or-o
-Novo
Montem
or-o
-Novo
15
Montem
or-o
-Novo
Alm
eir
imV
endas
Novas
Grandola
Cham
usca
Vila
Nova
Vila
Velh
ade
Rodao
Celo
ric
oda
Beir
ada
Barquin
ha
Modelo
BN
29
4
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ourem
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Avis
Alj
ustrel
4A
vis
Avis
Rio
Maio
rA
ljezur
Ourem
Nis
aA
ljustrel
Avis
5A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Nis
aN
isa
Alj
ustrel
Nis
aN
isa
6C
ham
usca
Nis
aN
isa
Alc
acer
do
Sal
Alc
acer
do
Sal
Ourem
Mourao
Mourao
7V
ila
Nova
Cham
usca
Alj
ezur
Rio
Maio
rA
ljustrel
Alc
acer
do
Sal
Alc
acer
do
Sal
Pedrogao
Grande
da
Barquin
ha
8Santarem
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rM
ourao
Pedrogao
Grande
Alc
acer
do
Sal
9N
isa
Santarem
Vila
Nova
Mourao
Mourao
Pedrogao
Grande
Ferreir
aFerreir
ada
Barquin
ha
do
Ale
ntejo
do
Ale
ntejo
10
Montem
or-o
-Novo
Alj
ezur
Alj
ustrel
Vila
Nova
Pedrogao
Grande
Rio
Maio
rO
urem
Proenca-a
-Nova
da
Barquin
ha
11
Vendas
Novas
Montem
or-o
-Novo
Santarem
Cham
usca
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
Rio
Maio
rC
elo
ric
oda
Beir
a12
Gole
ga
Alj
ustrel
Montem
or-o
-Novo
Pedrogao
Grande
Montem
or-o
-Novo
Montem
or-o
-Novo
Proenca-a
-Nova
Ourem
13
Salv
aterra
de
Magos
Vendas
Novas
Mourao
Montem
or-o
-Novo
Vila
Nova
Grandola
Montem
or-o
-Novo
Grandola
da
Barquin
ha
14
Alm
eir
imM
ourao
Pedrogao
Grande
Ferreir
aC
ham
usca
Vila
Nova
Grandola
Idanha-a
-Nova
do
Ale
ntejo
da
Barquin
ha
15
Alj
ezur
Salv
aterra
de
Magos
Ferreir
ado
Ale
ntejo
Grandola
Grandola
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aM
ontem
or-o
-Novo
A4 15 concelhos 117
Tab
ela
A1
015
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o3
Modelo
P3
61
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
Ferreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9C
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a10
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
11
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
12
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
13
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Modelo
BN
36
6
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9A
zam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
10
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
11
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a12
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
13
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
118 Apendice A Caracterizacao da regiao de estudoT
abel
aA
11
15co
nce
lhos
com
esti
mati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
Acid
entes
tip
o1
-M
odelo
BN
19
42
2000
2001
2002
2003
2004
2005
2006
2007
1M
arin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Ilhavo
Ilhavo
Ilhavo
Ilhavo
2Il
havo
Ilhavo
Ilhavo
Ilhavo
Marin
ha
Grande
Marin
ha
Grande
Vagos
Vagos
3A
lbufe
ira
Alb
ufe
ira
Vagos
Vagos
Vagos
Vagos
Marin
ha
Grande
Ferreir
ado
Zezere
4P
ortim
ao
Portim
ao
Alb
ufe
ira
Portim
ao
Portim
ao
Ferreir
ado
Zezere
Ferreir
ado
Zezere
Marin
ha
Grande
5V
agos
Vagos
Portim
ao
Porto
Porto
Portim
ao
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
6P
orto
Porto
Porto
Alb
ufe
ira
Ferreir
ado
Zezere
Porto
Porto
Montem
or-o
-Velh
o7
Faro
Penic
he
Penic
he
Penic
he
Penic
he
Penic
he
Portim
ao
Alp
iarca
8L
oule
Faro
Faro
Faro
Alb
ufe
ira
Oliveir
ado
Bair
ro
Montem
or-o
-Velh
oP
orto
9P
enic
he
Loule
Viz
ela
Ferreir
ado
Zezere
Coim
bra
Montem
or-o
-Velh
oP
enic
he
Penic
he
10
Odiv
ela
sO
div
ela
sC
oim
bra
Coim
bra
Faro
Coim
bra
Coim
bra
Coim
bra
11
Viz
ela
Viz
ela
Odiv
ela
sV
izela
Montem
or-o
-Velh
oA
lbufe
ira
Alp
iarca
Portim
ao
12
Olh
ao
Coim
bra
Loule
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Faro
Pom
bal
Pom
bal
13
Nazare
Olh
ao
Ferreir
ado
Zezere
Odiv
ela
sV
izela
Aveir
oA
veir
oA
veir
o14
Coim
bra
Setubal
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Aveir
oP
om
bal
Faro
Vis
eu
15
Setubal
Cantanhede
Setubal
Aveir
oP
om
bal
Viz
ela
Murtosa
Lis
boa
Acid
entes
tip
o2
-M
odelo
BN
29
86
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ourem
Ourem
Ourem
Ourem
Ourem
S
J
Madeir
a2
Rio
Maio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rFerreir
aZ
O
dem
ira
Odem
ira
3A
lmeir
imFerreir
aZ
Ferreir
aZ
Ferreir
aZ
Ferreir
aZ
R
ioM
aio
rFerreir
aZ
Ferreir
aZ
4
Ferreir
ado
Zezere
Alm
eir
imB
raganca
Braganca
Braganca
Odem
ira
S
J
Madeir
aV
izela
5Santarem
Braganca
Avis
Odem
ira
Odem
ira
Mourao
Braganca
Braganca
6L
isboa
Lis
boa
Odem
ira
Mourao
Mourao
Braganca
Rio
Maio
rO
urem
7C
ham
usca
Santarem
Lis
boa
Avis
Avis
S
J
Madeir
aA
lmodovar
Alm
odovar
8B
raganca
Cham
usca
Mourao
Lis
boa
Vim
ioso
Avis
Viz
ela
Tondela
9P
alm
ela
Avis
Santarem
Cham
usca
Ala
ndroal
Vim
ioso
Tondela
Chaves
10
Salv
aterra
de
Magos
Palm
ela
Cham
usca
Palm
ela
S
J
Madeir
aA
lmodovar
Chaves
Rio
Maio
r11
Avis
Salv
aterra
de
Magos
Alm
eir
imSantarem
Alm
odovar
Chaves
Elv
as
Guim
araes
12
Ilhavo
Odem
ira
Palm
ela
Ala
ndroal
Elv
as
Ala
ndroal
Serta
13
Vila
Nova
da
Barquin
ha
Mourao
Salv
aterra
de
Magos
Elv
as
Palm
ela
Tondela
Palm
ela
14
Nazare
Vila
Nova
da
Barquin
ha
Ala
ndroal
Alm
eir
imC
ham
usca
Elv
as
Portim
ao
15
Abrantes
Ala
ndroal
Lagos
Salv
aterra
de
Magos
Lis
boa
Palm
ela
Loule
Acid
entes
tip
o3
-M
odelo
P3
630
2000
2001
2002
2003
2004
2005
2006
2007
1O
dem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
2M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
3V
imio
so
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Cantanhede
4F
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
o5
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
6M
iranda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
7A
lmodovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
8Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
9A
lcoutim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
10
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
11
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
12
Alc
ochete
Alc
ochete
Alc
ochete
Macedo
de
Cavale
iros
Alc
ochete
Alc
ochete
13
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Vagos
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
14
Vagos
Vagos
Vagos
Cantanhede
Vagos
Vagos
15
Cantanhede
Cantanhede
Cantanhede
Alc
ochete
Cantanhede
Cantanhede
Referencias Bibliograficas
Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes
in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625
ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt
Defaultaspxtabid=220amplanguage=pt-PT
ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx
fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT
Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population
density Statistics in Medicine 18(16) 2147ndash2162
Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety
performance indicators by using a multivariate generalized linear mixed model Journal
of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517
Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis
for Spatial Data Chapman amp Hall
Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease
maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431
Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini
M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med
14(21-22) 2433ndash2443
Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis
of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007
Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems
Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236
Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-
tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20
101007BF00116466
120 Referencias bibliograficas
Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis
with R Springer
Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed
Models Journal of the American Statistical Association 88(421) 9ndash25
Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane
roads Accident Analysis amp Prevention 39(4) 657 ndash 670
Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a
velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos
PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico
Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em
Seguranca Rodoviaria Technical report IST and LNEC
Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-
Temporally Correlated Survival Data In Bayesian Statistics 7
Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data
Analysis Chapman amp Hall
Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative
Risks for Use in Disease Mapping Biometrics 43 671ndash681
Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data
Biometrics 65 1254ndash1261
Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao
em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo
20economico20e20social20dos20acidentes_versao20para20internet
Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in
Europe Applied Spatial Analysis 1 133ndash150
Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level
Example of Belgium Journal of Safety Research 39(4) 417 ndash 427
El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate
Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828
Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety
Accident Analysis amp Prevention 40(6) 1964 ndash 1969
Referencias bibliograficas 121
Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis
and Prevention 43 253ndash264
Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall
Gelfand A E (1996) Model determination using sampling-based methods In W
Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice
chapter 9 (pp 145ndash161) Chapman amp
Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive
models for spatial data analysis Biostatistics 4(1) 11ndash15
Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis
Chapman amp Hall
Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for
the analysis of spatial data An application to disease mapping Journal of Statistical
Planning and Inference 75(2) 305 ndash 318
Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and
Estimation Journal of the American Statistical Association 102(477) 359ndash378
Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical
Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808
Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps
with Application to German Mortality Data httpepububuni-muenchende
Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive
Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical
Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD
Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR
Models for Areal Data Biometrics 61(4) 950ndash961
Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease
risk Statistics In Medicine 19(17-18) 2555ndash2567
Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space
Statistics in Medicine 17(18) 2045ndash2060
Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-
demiology CRC Press Taylor amp Francis
122 Referencias bibliograficas
Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-
mann P e Divino F (2000) Disease mapping models an empirical evaluation
Statistics in Medicine 19(17-18) 2217ndash2241
Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-
temporal patterns of intra-city motor vehicle craches Journal of Transport Geography
15 274ndash285
Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical
models in road safety countermeasure effectiveness studies in Iowa Accident Analysis
amp Prevention 40(4) 1531 ndash 1542
Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-
Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis
amp Prevention 40(3) 1123 ndash 1134
Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small
sample size on the estimation of the fixed dispersion parameter of Poisson-gamma
models for modeling motor vehicle crashes A Bayesian perspective Safety Science
46(5) 751 ndash 770
Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-
persion parameters of Poisson-gamma models on empirical Bayes estimates Accident
Analysis amp Prevention 40(4) 1441 ndash 1457
Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-
inflated regression models of motor vehicle crashes balancing statistical fit and theory
Accident Analysis amp Prevention 37(1) 35 ndash 46
Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal
regression model for prediction of crash counts by severity using Bayesian methods
Accident Analysis amp Prevention 40(3) 964 ndash 975
MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident
and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028
Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P
Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive
Statistical Methods (pp 99ndash114) Springer
Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-
tent Gaussian models using integrated nested Laplace approximations A manual for
Referencias bibliograficas 123
the inla program Technical report Norwegian University of Science and Technology
Trondheim
McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall
Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-
provements Decision parameter treatability concept statistical criterion and spatial
dependence Accident Analysis amp Prevention 37(4) 699 ndash 720
Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A
Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57
Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures
for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201
Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle
crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468
Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties
in england Accident Analysis amp Prevention 36(6) 973 ndash 984
OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications
world_health_statistics2008en
OMS (2009) Global status report on road safety httpwhqlibdocwhoint
publications20099789241563840_engpdf
Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao
Calouste Gubenkian
Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes
factors Biometrika 77(3) 455ndash466
Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-
tistics 9(3) 523ndash539
Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis
and output analysis for MCMC R News 6(1) 7ndash11
Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and
heterogeneity An analysis of London crash data Accident Analysis amp Prevention
40(4) 1486 ndash 1497
124 Referencias bibliograficas
R Development Core Team (2008) R A Language and Environment for Statistical
Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-
07-0
Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology
Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications
Chapman amp HallCRC
Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent
gaussian models by using integrated nested laplace approximations Journal of the
Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392
Schrodle B e Held L (2011) A primer on disease mapping and ecological regression
using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2
Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment
and Posterior Inference Journal of Statistical Software 21(11) 1ndash37
Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial
models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)
246 ndash 273
Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian
measures of model complexity and fit J R Statist Soc B 64 583ndash639
Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and
Marginal Densities Journal of the American Statistical Association 81 82ndash86
Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian
Journal of Statistics 31 221ndash229
Wakefield J (2007) Disease mapping and spatial regression with count data Biostat
8(2) 158ndash183
Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press
Taylor amp Francis
2
UNIVERSIDADE DE LISBOAFACULDADE DE CIENCIAS
DEPARTAMENTO DE ESTATISTICA E INVESTIGACAO OPERACIONAL
Modelacao de dadosespaco-temporais em seguranca
rodoviaria
Maria da Conceicao Rodrigues Ribeiro
Tese orientada pela Professora Doutora Maria Antonia Amaral Turkman epelo Professor Doutor Joao Paulo Lourenco Cardoso especialmente
elaborada para a obtencao do grau de doutor em Estatıstica e InvestigacaoOperacional (Especialidade de Probabilidades e Estatıstica)
2012
Resumo
Os acidentes rodoviarios sao um grave problema de saude publica mundial com con-
sequencias socio-economicas devastadoras Apesar dos enormes esforcos efetuados nos
ultimos anos os valores de sinistralidade rodoviaria ainda sao inadmissıveis As es-
tatısticas registadas suscitaram o interesse de investigadores e de polıticos como peca
fundamental para no sentido de compreender melhor a complexidade de fatores relacio-
nados com os acidentes rodoviarios e determinar que aspetos do problema de seguranca
rodoviaria sao locais (nacional ou regional) e quais sao os partilhados por varios paıses
Assim tem havido uma consideravel investigacao direcionada para o desenvolvimento de
modelacao estatıstica de dados de acidentes rodoviarios ocorridos em areas geograficas
correspondentes a orgaos de administracao publica ou gestao de infraestruturas de trans-
porte com o objectivo de encontrar modelos que possam servir como referencia na imple-
mentacao de acoes corretivas destinadas a diminuir o numero de acidentes rodoviarios
A estimacao do numero esperado de acidentes continua a ser um problema em aberto
nao existindo um metodo que possa ser considerado otimo No entanto e generalizada
a referencia a superioridade dos metodos bayesianos Esta tese foca-se na aplicacao de
modelos hierarquicos bayesianos a dados espaco-temporais em seguranca rodoviaria
No que diz respeito a metodologia de inferencia foi utilizada uma abordagem recente
proposta em Rue et al (2009) que consiste na inferencia bayesiana aproximada via INLA
(Integrated Nested Laplace Approximations) e que e uma alternativa determinıstica aos
metodos de simulacao MCMC habitualmente usados Assim explorou-se no R atraves
do R-INLA a implementacao desta metodologia que torna o uso dos modelos bayesianos
hierarquicos mais acessıvel sendo uma alternativa muito competitiva relativamente ao
WinBUGS para situacoes em que a distribuicao da variavel dependente pertence a famılia
exponencial
Com a implementacao desses modelos foi possıvel reduzir a variabilidade das estimati-
vas dos riscos de acidentes em areas pequenas e simultaneamente revelar padroes de
dependencia espacial tendencias temporais e interacoes espaco-temporais Conseguiu-se
assim uma suavizacao espacial dos dados ainda que as regioes sob estudo possuam areas
pequenas Para alem disso foi possıvel fazer a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao Espera-se que esta metodologia possa vir a
permitir efetuar uma comparacao no que respeita a seguranca rodoviaria nao so ao nıvel
nacional ou regional mas tambem ao nıvel internacional
Palavras chave seguranca rodoviaria modelos bayesianos hierarquicos risco relativo
INLA
Abstract
Road accidents are a serious public health problem worldwide with devastating socio-
economic consequences Despite the enormous efforts made in recent years the road
fatalities values are still unacceptable Statistics recorded caught the interest of resear-
chers and politicians as a key to better understand the complexity of factors related to
road accidents and to determine which aspects of the problem of road safety are local
(national or regional) and which are shared by several countries Thus there has been
considerable research directed towards the development of statistical modeling of road
accident data in geographic areas corresponding to organs of public administration or
management of transport infrasctruture with the aim of finding models that can serve
as reference to the implementation of corrective actions aimed to reduce the number of
road accidents
The estimation of the expected number of accidents remains an open problem and there
is no method that can be considered optimal However there is a general reference to
the superiority of Bayesian methods This thesis focuses on the application of Bayesian
hierarchical models with spatio-temporal data in road safety
Regarding to inference methodology a recent approach proposed in Rue et al (2009)
which is the approximate Bayesian inference via INLA (Integrated Nested Laplace Appro-
ximations) was used which is a deterministic alternative to the simulation methods
MCMC commonly used Thus we explored in R through R-INLA the implementation of
this methodology which makes the use of Bayesian hierarchical models more accessible
being a very competitive alternative for the WinBUGS for situations where the depedent
variable distribution belongs to the exponential family
With the implementation of these models it was possible to reduce the estimates va-
riability of the risks of accidents in small areas and simultaneously to reveal patterns
of spatial dependence trends and spatio-temporal interactions In this way a spatial
smoothing of the data was obtained despite of the regions under study having small
areas Furthermore it was possible to identify the counties of Portugal at higher risk
relatively to the country and to analyze association of the district council with potential
risk factors or exposure It is hoped that this methodology will allow comparisons with
regard to road safety not only at national or regional level but also at international level
Keywords road safety hierarchical Bayesian models relative risk INLA
Agradecimentos
Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-
pressar o meu profundo agradecimento
A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-
mente pela sua compreensao
A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao
devido acima de tudo pela grande admiracao que tenho por ela
Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima
de tudo pelo seu entusiasmo por esta tese
Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo
Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA
e pelo incentivo
Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a
minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha
de conhecimentos importantes para a realizacao do meu doutoramento
Ao Professor Rune Elvik pelo interesse demostrado
Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-
ciado pela bolsa de doutoramento SFRHPROTEC492262008
A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de
Portugal Continental
Ao Dr Rui Pereira pela prontidao e pelo interesse
A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do
Instituto Superior de Engenharia
Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram
em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao
Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas
A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-
balho
Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha
espera
Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho
a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa
os quais me ajudaram cada um a sua maneira
A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude
partilhar muitos momentos de alegria e descontracao
Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira
A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre
em mim a Mariana e a Rita por me seguirem como exemplo
A minha mae
Siglas e Acronimos
A Area geografica
AE Autoestrada
ANSR Autoridade Nacional de Seguranca Rodoviaria
BN Binomial Negativo
BT Brigada de Transito
BOA An R Package for MCMC Output Convergence
Assessment and Posterior Inference
BUGS Bayesian Using Gibbs Sampling
C Comprimento de estrada
CARE Community database on accidents on the roads in Europe
CE Codigo de Estrada
CODA Convergence Diagnosis and Output Analysis for MCMC
CPO Conditional Predictive Ordinates
DIC Deviance Information Criterion
DP Densidade populacional
EN Estrada Nacional
ENSR Estrategia Nacional de Seguranca Rodoviaria
GNR Guarda Nacional Republicana
HPD Highest Probability Density
IC Itinerario Complementar
INLA Integrated Nested Laplace Approximations
IP Itinerario Principal
MCMC Markov Chains Monte Carlo
mls Mean logarithmic score
OMS Organizacao Mundial de Saude
ONU Organizacao das Nacoes Unidas
OSEPU Ocupacao do solo com equipamentos e parques urbanos
OSI Ocupacao industrial do solo
OST Ocupacao do solo com equipamento turıstico
OSU Ocupacao urbana do solo
pD Numero efetivo de parametros
PIT Probability Integral Transformation
PMOT Plano Municipal de Ordenamento do Territorio
PMSR Planos Municipais de Seguranca Rodoviaria
PSP Polıcia de Seguranca Publica
R A Language and Environment for Statistical Computing
SafetyNET Projeto europeu European Traffic Information System -
Data Colletion and Analysis Tools for Policy Making
SMR Standard Morbility Ratio
UE Uniao Europeia
WinBUGS versao em ambiente Windows do programa BUGS
VC Quantidade de combustıvel vendido
Conteudo
Lista de Tabelas xiv
Lista de Figuras xv
Introducao 1
1 Nocoes sobre seguranca rodoviaria 9
11 Risco em seguranca rodoviaria 9
12 Caracterizacao dos dados de acidentes 10
13 Caracterizacao da medida de exposicao 14
2 Modelacao estatıstica de acidentes rodoviarios 19
21 Modelos bayesianos hierarquicos 21
22 Modelos nao espaciais 24
23 Modelos espaciais 27
24 Modelos espaco-temporais 28
25 Modelos multivariados 30
26 Metodos de inferencia 32
261 INLA 32
27 Ajustamento e medidas preditivas 36
3 Aplicacoes 39
31 Associacao espacial 40
32 Modelos 43
33 Modelos espaco-temporais 45
331 Associacao regional 46
332 Selecao dos modelos 47
333 Modelos para acidentes do tipo 1 48
334 Validacao dos modelos para acidentes do tipo 1 49
335 Resultados obtidos com modelos para acidentes do tipo 1 49
xii Conteudos
336 Modelos para acidentes do tipo 2 61
337 Validacao dos modelos para acidentes do tipo 2 62
338 Resultados obtidos com modelos para acidentes do tipo 2 62
339 Modelos para acidentes do tipo 3 73
3310 Validacao dos modelos para acidentes do tipo 3 73
3311 Resultados obtidos com modelos para acidentes do tipo 3 74
34 Modelos multivariados 83
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
351 Modelo para acidentes do tipo 1 89
352 Validacao do modelo para acidentes do tipo 1 89
353 Resultados obtidos com o modelo para acidentes do tipo 1 90
354 Modelo para acidentes do tipo 2 92
355 Validacao do modelo para acidentes do tipo 2 92
356 Resultados obtidos com o modelo para acidentes do tipo 2 93
357 Modelos para acidentes do tipo 3 95
358 Validacao do modelo para acidentes do tipo 3 95
359 Resultados obtidos com o modelo para acidentes do tipo 3 96
4 Discussao e conclusoes 99
A Caracterizacao da regiao de estudo 103
A1 Portugal Continental 103
A2 Numero de acidentes 108
A3 Covariaveis 110
A4 15 concelhos 115
Referencias Bibliograficas 119
Lista de Tabelas
11 Numero total de cada tipo de acidentes rodoviarios por ano 11
12 Estatısticas resumo do numero de veıculos com seguro em milhares 14
21 Modelos univariados 30
31 Valores do ındice EBI para cada tipo de acidente por ano 43
32 Valores DIC e mls dos modelos Poisson sem covariaveis 44
33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44
34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45
35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem
covariaveis 46
36 DIC pD e mls para cada tipo de acidente 47
37 DIC pD e mls para acidentes tipo 1 48
38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50
39 Estatısticas resumo dos parametros do modelo P 1 8 1 53
310 Estatısticas resumo dos parametros do modelo P 1 8 16 54
311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55
312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55
313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57
314 DIC pD e mls para acidentes tipo 2 61
315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63
316 Estatısticas resumo para os parametros do modelo P 2 9 1 66
317 Estatısticas resumo para os parametros do modelo P 2 9 16 67
318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67
319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68
320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69
321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71
322 DIC pD e mls para acidentes tipo 3 73
323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74
xiv Lista de Tabelas
324 Estatısticas resumo dos parametros do modelo P 3 6 1 78
325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78
326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78
327 Modelos univariados 82
328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-
tivariado e dos modelos univariados 83
329 Correlacoes dos modelos multivariados com interacao e sem interacao
espaco-temporal 84
330 Vıtimas a 24 horas e vıtimas a 30 dias 84
331 Numero total de cada tipo de acidentes rodoviarios por ano 87
332 DIC pD e mls para cada tipo de acidente 89
333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90
334 DIC pD e mls 92
335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93
336 Estatısticas resumo dos parametros do modelo P 3 6 30 96
337 Comparacao entre a abordagem local e a global 98
A1 Estatısticas resumo de acidentes tipo 1 108
A2 Estatısticas resumo de acidentes tipo 2 108
A3 Estatısticas resumo de acidentes tipo 3 108
A4 Estatısticas resumo de acidentes tipo 1 109
A5 Estatısticas resumo de acidentes tipo 2 109
A6 Estatısticas resumo de acidentes tipo 3 109
A7 Estatısticas resumo da covariavel populacao 110
A8 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 1 115
A9 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 2 116
A10 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 3 117
A11 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 118
Lista de Figuras
1 Dez principais causas de morte no mundo 2
2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4
11 Numero de acidentes tipo 1 por concelho 12
12 Numero de acidentes tipo 2 por concelho 12
13 Numero de acidentes tipo 3 por concelho 13
14 Numero de veıculos com seguro em milhares por concelho e por ano 14
15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15
16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16
17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16
31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de
acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano
2000 41
32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de
veıculos com seguro no ano 2000 41
33 Valores estimados dos SMR1 e respetivos intervalos de confianca para
cada concelho no ano 2000 42
34 Histograma dos valores de EBI simulados e valor de EBI observado para
acidentes tipo 1 e para ano 2000 43
35 Histograma das diferencas entre as medias dos logscores 48
36 Histograma dos valores PIT ajustados para acidentes tipo 1 49
37 Box plot dos valores estimados para acidentes tipo 1 50
38 Amplitude dos intervalos para acidentes tipo 1 51
39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 1 51
310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o
ano 2000 52
xvi Lista de Figuras
311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52
312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53
313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo P 1 8 16 56
314 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo
P 1 8 16 56
315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo P 1 8 16 57
316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 6 172 58
317 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58
318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-
dos com o modelo BN 1 6 172 59
319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com
o modelo BN 1 6 172 60
320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 6 172 60
321 Histograma das diferencas entre as medias dos logscores 61
322 Histograma dos valores PIT ajustados para acidentes tipo 2 62
323 Box plot dos valores estimados para acidentes tipo 2 63
324 Amplitude dos intervalos para acidentes tipo 2 64
325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori dos acidentes tipo 2 64
326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o
ano 2000 65
327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65
328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66
329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo P 2 9 16 68
330 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
P 2 9 16 69
Lista de Figuras xvii
331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2
de 2000 a 2007 obtidos com o modelo P 2 9 16 70
332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 4 71
333 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
BN 2 9 4 71
334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 4 72
335 Histograma dos valores PIT ajustados para acidentes tipo 3 74
336 Box plot dos valores estimados para acidentes tipo 3 75
337 Amplitude dos intervalos para acidentes tipo 3 75
338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76
339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o
ano 2000 76
340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77
341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77
342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 1 79
343 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79
344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3
de 2000 a 2007 obtidos com o modelo P 3 6 1 80
345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo BN 3 6 6 81
346 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81
347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo BN 3 6 6 82
348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos univariados e com os modelos multivariados 85
349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos multivariados 86
350 Numero de acidentes tipo 1 por concelho 87
351 Numero de acidentes tipo 2 por concelho 88
xviii Lista de Figuras
352 Numero de acidentes tipo 3 por concelho 88
353 Histograma dos valores PIT ajustados para acidentes tipo 1 89
354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 9 42 90
355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 9 42 91
356 Histograma dos valores PIT justados para acidentes tipo 2 92
357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 86 94
358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 86 94
359 Histograma dos valores PIT ajustados para acidentes tipo 3 95
360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 30 96
361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo P 3 6 30 97
A1 ID dos concelhos do Norte de Portugal Continental 104
A2 ID dos concelhos do Sul de Portugal Continental 105
A3 Numero de habitantes por concelho e por ano 110
A4 Area por concelho 111
A5 Densidade populacional por concelho 111
A6 Quilometros de estrada por concelho 112
A7 Quantidade de combustıvel vendido por concelho 112
A8 Superfıcie de ocupacao urbana do solo por concelho 113
A9 Superfıcie de ocupacao industrial do solo por concelho 113
A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por
concelho 114
A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114
ldquoThe road to wisdom - Well itacutes plain and simple to express
Err and err and err again but less and less and lessrdquo
Piet Hein (1996)
Introducao
A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora
de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo
automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se
tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao
ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o
Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009
OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes
rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso
entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as
tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa
na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas
etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do
PIB mundial
A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas
necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004
para a quinta causa de morte em 2030
2 Introducao
2004
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Infecoes respiratorias
4 Doencas pulmonares
5 Diarreias
6 HIVAIDS
7 Tuberculose
8Cancro do pulmao
dos bronquios e da traqueia
9 Acidentes rodoviarios
10Recem-nascidos prematuros
e de peso baixo
HH
2030
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Doencas pulmonares
4 Infecoes respiratorias
5 Acidentes rodoviarios
6Cancro do pulmao
dos bronquios e da traqueia
7 Diabetes mellitus
8 Doencas do coracao hipertensas
9 Cancro do estomago
10 HIVAIDS
Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)
No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a
decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-
ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem
disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao
forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes
rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida
No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de
Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-
dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos
socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a
sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario
e Santos 2012)
O sistema de trafego rodoviario um subsistema do sistema de transportes e formado
por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-
fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes
rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos
correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada
e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a
deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos
Introducao 3
(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de
pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se
por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma
qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena
de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do
sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-
guranca deste sistema complexo tem consequencias devastadoras em termos humanos
sociais e economicos (Cardoso 2007)
Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta
consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos
consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-
vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma
descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-
tadas a nıvel mundial
minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-
doviaria
minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios
como um problema de saude publica
minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da
seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial
minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria
minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das
Nacoes Unidas
minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca
Rodoviaria
minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de
Acao para a Seguranca Rodoviaria
Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria
Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-
dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade
responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para
uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos
veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica
sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste
flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area
da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e
tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha
uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes
4 Introducao
projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do
trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para
veıculos tambem designada por sistemas inteligentes de transportes
A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-
volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos
30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-
tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi
progressivamente modernizado tendo sido acompanhado por um aumento do numero
de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal
terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de
toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu
aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver
na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada
a implementacao de algumas medidas especıficas
Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)
As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para
compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios
e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou
regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma
consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica
de dados de acidentes rodoviarios
Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo
pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e
Introducao 5
do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda
lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util
domınio para desenvolvimento de atividades de investigacao O ambito desta tese e
portanto a modelacao estatıstica de dados de acidentes rodoviarios
Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-
retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar
progressivamente a execucao dessas acoes foram identificados varios fatores capazes de
melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em
particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas
com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados
As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma
melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de
intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-
vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada
em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-
dos na UE (CARE - Community database on accidents on the roads in Europe) No
projeto integrado SafetyNET (European Traffic Information System - Data Colletion
and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de
informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas
principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco
e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como
ponto de partida para a modelacao estatıstica usada nesta tese
A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-
nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-
ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos
desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-
cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes
o que facilita a identificacao dos fatores causais e de intervencoes corretivas
As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-
tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial
como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy
A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-
tatıstica Em geral foram detetados varios problemas na estimacao dos parametros
de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou
desconhecidas dependencia espacial e depedencia temporal que continuam a constituir
objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-
blemas como por exemplo
1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm
6 Introducao
minus modelos lineares generalizados baseados na distribuicao de Poisson
minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia
de sobredispersao
minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado
para analisar dados de acidentes com sobredispersao e excesso de zeros
minus modelos de nıveis multiplos estruturados
minus modelos bayesianos hierarquicos
minus incorporacao de correlacao espacial e dependencia temporal nos modelos
A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao
existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada
a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre
os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos
hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem
podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li
et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar
a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais
e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais
atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004)
O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da
estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a
problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior
barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua
formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains
Monte Carlo) na computacao bayesiana
A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se
nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que
envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas
O seu crescimento ao nıvel das aplicacoes tem sido extraordinario
O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using
Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o
GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao
Introducao 7
CODA Plummer et al (2006) e ao BOA Smith (2007)
Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de
pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)
o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em
particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-
tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas
Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana
aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa
determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas
limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes
de concordancia
Todas as analises envolvidas no metodo INLA estao implementadas num programa que
pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser
descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos
hierarquicos complexos tornou-se muito mais acessıvel
Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA
Objetivos
Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-
los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca
rodoviaria em areas geograficas diferentes
Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse
tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-
pacial e depedencia temporal
Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao
Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes
nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional
Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-
place Approximations atraves da exploracao do pacote R-INLA
8 Introducao
Estrutura da tese
No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a
caracterizacao dos dados usados nesta tese
No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos
No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais
de sinistralidade rodoviaria registados em Portugal Continental
No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido
de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros
No Anexo A faz-se a caracterizacao da regiao de estudo
No CD em anexo encontram-se todos os codigos usados nesta tese
1Nocoes sobre seguranca rodoviaria
11 Risco em seguranca rodoviaria
O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores
de seguranca informativos muito importantes No entanto quando se pretende fazer
comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de
acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca
rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de
acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja
risco=numero esperado de acidentesmedida de exposicao
A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-
responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel
ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-
teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a
melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-
cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos
proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens
e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego
10 Capıtulo 1 Nocoes sobre seguranca rodoviaria
atraves do comprimento de estrada do numero de veıculos ou preferencialmente da
distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode
estar associada a populacao de risco atraves do numero de habitantes do numero de
condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas
times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco
de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia
de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-
cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o
numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para
a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande
disponibilidade de informacao desagregada o que permite analisar as especificidades de
varios grupos populacionais As restantes medidas indicadas apresentam atualmente
muitas limitacoes1
Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se
deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido
e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a
relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata
de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes
e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-
se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de
veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se
a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho
12 Caracterizacao dos dados de acidentes
Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito
e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas
sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela
gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de
exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-
tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao
usada e sobre as covariaveis usadas
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-
ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez
1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2
205-v3_finalpdf
12 Caracterizacao dos dados de acidentes 11
agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho
A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos
se encontram no litoral norte sendo consequentemente mais proximos uns dos outros
Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz
respeito a caracterizacao dos concelhos2
Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311
Total 279644 28844 8890 317378
Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR
minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo
menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT
e PSP) e da qual resultem vıtimas ou danos materiais
minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais
minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do
acidente ou no seu percurso ate a unidade de saude No perıodo em analise para
obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)
aplica-se um coeficiente multiplicativo de 114 ao numero de mortos
minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo
de hospitalizacao superior a 24 horas
minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave
minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima
minus Acidente mortal Acidente do qual resulte pelo menos um morto
minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido
grave nao tendo ocorrido qualquer morte
minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido
leve e em que nao se tenham registado mortos nem feridos graves
2ver Anexo A
12 Capıtulo 1 Nocoes sobre seguranca rodoviaria
Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes
com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes
do tipo 3 os acidentes mortais
Figura 11 Numero de acidentes tipo 1 por concelho
Figura 12 Numero de acidentes tipo 2 por concelho
12 Caracterizacao dos dados de acidentes 13
Figura 13 Numero de acidentes tipo 3 por concelho
Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero
de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de
acidentes
Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor
risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao
entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria
muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos
mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278
concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado
o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de
cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes
decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para
permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no
espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes
Isto e especialmente importante porque apesar do numero de acidentes ser relacionado
com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria
que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de
3ver Anexo A
14 Capıtulo 1 Nocoes sobre seguranca rodoviaria
trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a
variabilidade da medida de exposicao em funcao do espaco ou do tempo
13 Caracterizacao da medida de exposicao - numero
de veıculos com seguro
Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares
Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730
Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)
13 Caracterizacao da medida de exposicao 15
O numero de veıculos com seguro varia bastante de concelho para concelho como se pode
verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo
por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que
cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media
inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo
Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho
i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o
numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =
100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de
acidente rodoviario para acidentes do tipo 1ndash3
Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por
concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes
e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos
sugerindo a existencia de correlacao espacial
Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na
faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas
mais baixas
Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007
Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-
se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se
mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas
muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a
16 Capıtulo 1 Nocoes sobre seguranca rodoviaria
nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos
com taxas mais baixas
Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007
Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007
No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas
usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer
mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-
petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao
13 Caracterizacao da medida de exposicao 17
ocorre com muita frequencia com dados de contagem com muitos valores escassos e
ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou
unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas
pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes
associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso
nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando
as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante
afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e
Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas
dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem
como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-
tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de
forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e
Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004) descritos no Capıtulo 2
2Modelacao estatıstica de acidentes rodoviarios
Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram
baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados
normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido
que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-
doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia
de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma
probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre
os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-
dos de contagens sao modelos mais apropriados para este tipo de estudos
Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo
constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo
et al 2007 Cardoso 1996)
Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo
caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala
espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais
desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais
como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel
explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-
20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como
uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade
espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias
ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao
apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo
muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao
verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos
com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao
de riscos relativos em areas pequenas
No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-
dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade
de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto
deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-
mas na alocacao de fundos governamentais e no planeamento regional Determinados
atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-
cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para
areas pequenas e esta tendencia ira provavelmente continuar
Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-
vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco
relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario
num determinado concelho relativamente ao risco no paıs (Portugal Continental)
As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e
consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem
acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999
Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os
metodos tradicionais para investigar questoes importantes relacionadas com estimacao de
riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia
temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis
nao observaveis tais como clima determinadas caracterısticas da populacao entre outras
Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser
pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a
construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios
ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al
2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-
tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes
21 Modelos bayesianos hierarquicos 21
espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e
temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a
suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos
pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos
dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-
doviarios
A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma
serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia
em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-
dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes
rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem
ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade
existente no dados Noland e Quddus (2004) Elvik (2011)
A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-
melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio
que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-
blema atribuıdo a comportamentos inadequados dos condutores associados a falencias
da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de
acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA
constitui a covariavel com maior poder explicativo da variacao observada No entanto
nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas
do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por
exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de
servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel
vendido e um indicador do volume de trafego e a densidade populacional um indicador de
urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais
o numero de habitantes a area geografica a densidade populacional o comprimento de
estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao
industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao
do solo com equipamento turıstico como sera abordado no Capıtulo 4
21 Modelos bayesianos hierarquicos
O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que
o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro
θ e o segundo traduz a distribuicao a priori para o parametro θ
22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica
na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-
delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-
nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo
que p(θ) =
intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =
1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa
estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-
formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros
Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade
associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-
tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia
a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori
nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-
tribuicao a priori padrao p(θ) (Paulino et al 2003)
Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte
estrutura
1o nıvel f(y|θ) funcao de verosimilhanca
2o nıvel p(θ|φ) distribuicao a priori dos parametros
3o nıvel p(φ) distribuicao a priori dos hiperparametros
Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e
evoluindo para modelos cada vez mais complexos
O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-
creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-
vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de
acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar
esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-
dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se
Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou
sejaYit|θit sim Poisson(Eitθit)
f(yit|θit) =(Eitθit)
yiteminusEitθit
yit
Eit = nitr = nit
sumij
Yitsumij
nit
21 Modelos bayesianos hierarquicos 23
onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit
representa o numero de veıculos com seguro e θit representa o risco relativo de acidente
rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja
se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia
de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de
acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)
A funcao de versimilhanca e dada por
L(θ|y) =prodit
f(yit|θit) =prodit
(Eitθit)yiteminusEitθit
yitpropprod
θyitit e
minussumit
Eitθit
e l(θ|y) = lnL(θ|y) propsumit
yit ln θitminussumit
Eitθit O estimador de maxima verosimilhanca
do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-
dardized Mortality Ratio1 - SMR) e dado por
θit = SMRit =YitEit
(211)
Note-se que V ar(SMRit) =V ar(Yit)
E2it
=θitEit
podendo-se fazer V ar(SMRit) =θitEit
=YitE2it
Um procedimento classico usual para identificar regioes de maior risco consiste na cons-
trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR
Apesar de util este procedimento tem algumas desvantagens Note-se que em areas
com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero
de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR
podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com
muita frequencia com dados desta natureza quando as unidades espaciais de analise sao
concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao
das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit
associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser
grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram
ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de
tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida
em que a respetiva variabilidade pode ser muito grande A variancia destes valores e
1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso
24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao
grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro
estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-
minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992
Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR
tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores
estimados com menos precisao As maiores variacoes do risco relativo nao estarao em
geral associadas com variacoes do risco subjacente a medida de exposicao mas serao
apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)
Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se
que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-
dade teorica subjacente ao modelo Poisson
A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados
(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do
modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado
que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al
2008 2005)
Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-
mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos
tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao
de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das
flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto
dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se
usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico
medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial
entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao
mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)
22 Modelos nao espaciais
Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh
e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis
atraves da funcao de ligacao usada para modelar a media
ln(θit) = α+
nβsump=1
βpxitp (221)
22 Modelos nao espaciais 25
onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel
e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um
nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual
considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a
priori p = 1 2 nβ i = 1 2 N e t = 1 2 T
No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-
adequadamente capturada pelas variaveis explicativas na funcao da media condicional
Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser
distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-
tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como
ln θit = α+
nβsump=1
βpxitp + vit (222)
onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p
Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que
foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-
los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares
generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)
Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-
dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao
a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo
Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples
de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma
fechada dado que esta mistura resulta de um modelo conjugado
Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao
Poisson e na distribuicao Binomial Negativa
O modelo Poisson Lognormal surge quando se admite que
vit sim Normal(0 σ2v) (223)
A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por
f(yit θNit σ
2v) =
1
σ2v
radic2π
EitθNit
y
int infin0
eminusEitθNit e
v
(ev)yminus1eminus v2
2σ2v dev
nao havendo forma explicıta com
26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
ln θNit = α+
nβsump=1
βpxitp (224)
E[Yit] = microNit eσ2v2 = Eitθ
Nit e
σ2v2 e V ar[Yit] = microNit e
σ2v2(
1 + (eσ2v minus 1)microNit e
minusσ2v2)
O modelo Poisson-Gama ou Binomial Negativo surge quando
exp(vit) sim Gama(φ φ) (225)
A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por
f(yit θBNit φ) =
Γ(yit + φ)
Γ(φ)yit
(φ
microBNit + φ
)φ(microBNit
microBNit + φ
)yitou seja
Yit|θBNit sim BN(EitθBNit φ)
com
ln θBNit = α+
nβsump=1
βpxitp (226)
E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit
(1 +
microBNitφ
) Note-se que quando φrarrinfin o
modelo Binomial Negativo reduz-se ao modelo Poisson
Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo
podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais
um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com
av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O
parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de
dispersao
O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-
plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre
unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-
quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito
afectadas (Miranda-Moreno et al 2007 Lord et al 2008)
Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)
A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-
pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os
23 Modelos espaciais 27
riscos relativos conjuntamente como um processo espacial atraves de uma especificacao
a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-
lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco
relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados
observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada
area e a soma de duas componentes que representam fatores espaciais e nao espaciais
No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica
de interesse em cada area tem distribuicao Poisson com media especıfica de cada area
As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre
a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento
das variaveis nao-observadas como em Bernardinelli et al (1995ab)
23 Modelos espaciais
Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia
espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos
mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao
associados uma distribuicao a priori conveniente
log(θit) = α+
nβsump=1
βpxitp + si (231)
Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de
notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario
quer para os modelos baseados na distribuicao de Poisson abreviadamente designados
de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa
abreviadamente designados de modelos BN com os devidos significados
Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que
representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos
atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori
associada
log(θit) = α+
nβsump=1
βpxitp + si + vi (232)
onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-
turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e
si sao mutuamente independentes viiidsim Normal(0 σ2
v) e si|sminusi sim Normal(si σ2smi)
28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
onde o sminusi indica o vetor s com o elemento si removido si =1
mi
sumi 6=j
wijsj e a media
dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e
wij = 0 caso contrario Deste modo mi =sumi 6=j
wij e o respetivo numero de vizinhos e
σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma
s tem distribuicao conjunta
f(s) prop (σ2s)minusn2 exp
minus 1
2σ2s
sumi6=j
(si minus sj)2wij
e (σ2v)minus1 sim Gama(av bv) (σ2
s)minus1 sim Gama(as bs) com av bv as e bs conhecidos
Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial
local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo
gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991
Banerjee et al 2004)
24 Modelos espaco-temporais
Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-
tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a
aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios
e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos
com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se
definiu na seccao anterior
Modelos espaco-temporais sem interacao
Nestes modelos tem-se log(θit) = α+
nβsump=1
βpxitp + si + vi + ψt
onde se considera
ψt sim Normal(0 σ2ψ) (241)
ou
ψt sim RW (1 σ2ψ) (242)
e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ
2s σ
2v σ
2ψ mutuamente
independentes
24 Modelos espaco-temporais 29
Alternativamente log(θit) = α+
nβsump=1
βpxitp + si + vi + γt
onde se considera
γ sim Normal(0 cγ) (243)
sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ
2v mutuamente
independentes (Knorr-Held 2000)
Modelos espaco-temporais com interacao
Neste caso log(θit) = α+
nβsump=1
βpxitp + si + vi + (γ + δi)t
onde se considera alternativamente
δi sim Normal(0 σ2δ ) (244)
ou
δi sim CAR(σ2δ ) (245)
e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com
aδ bδ conhecidos e α βp σ2s σ2
v σ2δ mutuamente independentes (Bernardinelli et al
1995b)
A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando
um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de
acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de
risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia
e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de
cada area e a media global α e δi representa a diferenca entre a tendencia temporal
local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0
a tendencia temporal local da area i e menos acentuada do que a tendencia temporal
global enquanto que quando δi gt 0 e mais acentuada
Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados
neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo
nao se encontra definida uma distribuicao a priori para um parametro considera-se a
distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior
30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Tabela 21 Modelos univariados
M log(θit) Distribuicao a priori Distribuicao a priori
dos parametros dos hiperparametros
1 α+
nβsump=1
βpxitp α sim Normal(0 cα)
βp sim Normal(0 cβ)
2 α+
nβsump=1
βpxitp + vi vi sim Normal(0 σ2v) σminus2
v sim Gama(av bv)
3 α+
nβsump=1
βpxitp + si si sim CAR(σ2s) σminus2
s sim Gama(as bs)
4 α+
nβsump=1
βpxitp + vi + si
5 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2
ψ sim Gama(aψ bψ)
6 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim RW (σ2ψ)
7 α+
nβsump=1
βpxitp + vi + si + γt γ sim Normal(0 cγ)
8 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2
δ sim Gama(aδ bδ)
9 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )
25 Modelos multivariados
Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-
mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes
modelos nao consideram a interdependencia que pode existir entre os riscos relativos
dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na
variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia
para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico
tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-
son capazes de considerar a relacao entre diferentes processos de contagem tais como
contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-
25 Modelos multivariados 31
son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta
abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de
diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o
numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo
k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit
condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou
seja
Ykit|θkit sim Poisson(Ekitθkit)
Modelos espaciais multivariados
1)log θkit = αk +
nβsump=1
βpxitp + ski
com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs
conhecidos
Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)
e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios
ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K
tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-
bilidade assume que a estrutura de associacao se separa numa componente nao espacial
e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta
de s e
s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)
Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)
D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de
vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK
definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre
os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao
espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se
o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo
improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou
modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin
et al (2005) Lawson (2009) Waller e Carlin (2010)
Para alem do modelo 1 foram implementados os modelos multivariados seguintes no
WinBUGS
32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)
3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)
4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e
dδ Rδ conhecidos
mas apenas se obteve convergencia para os modelos 1 e 4
Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =
bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =
001 0 0
0 001 0
0 0 001
26 Metodos de inferencia
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e
computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas
abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)
consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-
ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino
e Rue (2010a)
261 INLA
O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-
siana aproximada numa subclasse de modelos de regressao estruturados aditivamente
nomeadamente em modelos latentes gaussianos
Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z
que representa todas as componentes nao observaveis com distribuicao a priori Normal
Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-
mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-
buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia
exponencial A media microi de cada componente e relacionada com um preditor aditivo
estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor
incorpora aditivamente os efeitos de varias componentes
26 Metodos de inferencia 33
ηi = α+
nfsumj=1
f (j)(uij) +
nβsump=1
βpxip + εi (261)
onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-
cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u
podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis
contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-
torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos
podem ser representados atraves das funcoes f (j)()
Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-
mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por
suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a
priori dos hiperparametros nao tem de ser gaussianas
Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-
dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto
de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF
Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel
aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e
Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6
embora possa haver excecoes
Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro
nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos
parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-
sume que os dados observados sao condicionalmente independentes dado o campo latente
z tem-se que
f(y|xφ) =prodi
f(yi|ziφ)
Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca
do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos
φ
A distribuicao a posteriori e dada por
p(zφ|y) prop p(φ)p(z|φ)prodi
f(yi|ziφ) (262)
Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e
analiticamente tratavel
Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao
34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao
analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e
possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa
pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como
tempo computacional longo possibilidade de as amostras simuladas dos parametros se-
rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte
Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser
particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori
entre as componentes espacial ou espaco-temporal do campo latente
Em contraste o metodo de aproximacao INLA e apresentado como um metodo que
fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-
vamente pouco tempo
No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes
marginais a posteriori dos parametros de interesse
As distribuicoes marginais a posteriori pretendidas sao
p(zi|y) =
intφ
p(zi|φy)p(φ|y) dφ (263)
e
p(φj |y) =
intφj
p(φ|y) dφminusj (264)
A aproximacao de p(zi|y) e determinada usando a soma finita
p(zi|y) =sumk
p(zi|φky)p(φk|y)∆k (265)
onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-
vamente Esta soma e calculada por integracao numerica em pontos suporte φk com
pesos apropriados ∆k
A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e
obtida atraves da aproximacao de Laplace
p(φ|y) prop p(zφy)
pG(z|φy)
∣∣z=zlowast(φ) (266)
onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-
cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao
corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)
De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade
a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes
26 Metodos de inferencia 35
pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste
basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior
quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste
em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a
estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)
Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a
estrategia CCD a estrategia por omissao no R-INLA
Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a
aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace
simplificada
A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter
a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))
onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia
marginal Os autores referem que apesar de muito conveniente ao nıvel computacional
pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de
simetria das distribuicoes a posteriori marginais quer a ambos nıveis
Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais
demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-
place semelhante a 266 a p(zi|φy)
pLA(zi|φy) prop p(zφy)
pGG(zminusi|ziφy)
∣∣∣zminusi=zlowastminusi(ziφ) (267)
No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-
nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes
numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de
Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo
menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada
uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-
trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e
simetria Para mais detalhes ver Rue et al (2009)
Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre
os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao
de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos
O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-
parametros entre outras No entanto o seu potencial e reconhecidamente enorme e
encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-
tensoes com muita frequencia
36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
27 Ajustamento e medidas preditivas
Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o
criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio
combina uma medida de adequabilidade a media a posteriori da desvianca D com
uma medida de complexidade o numero efetivo de parametros pD sendo dado por
DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-
promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no
WinBUGS quer no R-INLA
No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos
aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-
vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive
Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-
tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle
e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-
delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para
detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)
As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)
p(yminusi)=
intf(yi|θyminusi)p(θ|yminusi) dθ
e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores
CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para
efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de
calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou
grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito
diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de
dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem
uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este
problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim
pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =
yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma
forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem
ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)
Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a
0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa
por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira
a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da
concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de
27 Ajustamento e medidas preditivas 37
referencia
Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls
(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))
ntimes T Esta medida e muito
utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os
valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo
3Aplicacoes
Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios
ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os
resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo
de aproximacao INLA atraves do R-INLA
Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-
sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel
usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos
no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao
apresentados os resultados obtidos no WinBUGS
Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a
analise individual de cada ano comparando-se os varios modelos e os resultados obtidos
no WinBUGS e no R-INLA tendo havido concordancia
Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial
40 Capıtulo 3 Aplicacoes
31 Associacao espacial
A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-
doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco
como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter
uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas
determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes
entre areas de maior risco e potenciais fatores
Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-
racterısticas que revelam alguns dos seus problemas Para alem da concentracao de
concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito
diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de
veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a
uma pequena mudanca no numero de acidentes
Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-
rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa
global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com
feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0
e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes
valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no
de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida
ao acaso pois os concelhos possuem condicoes identicas
Tendo em conta que o numero de veıculos com seguro varia muito por concelho este
comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-
ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem
medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito
instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis
ja que possuem variancias muito diferentes
A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura
31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero
de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro
para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas
versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em
2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho
da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com
tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que
assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se
31 Associacao espacial 41
ter uma percecao dessa variabilidade em cada concelho
Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000
Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000
42 Capıtulo 3 Aplicacoes
Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000
A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem
a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir
uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de
contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz
de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma
fronteira e wij = 0 caso contrario
As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e
o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em
areas pequenas em que o tamanho da medida de exposicao e diferente de area para
area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta
questao foram desenvolvidas diversas propostas alternativas para dados com populacoes
heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em
conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se
o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por
EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma
estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa
os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes
empırica da media marginal padronizado pela estimativa do desvio padrao da taxa
Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros
sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI
tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao
32 Modelos 43
do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao
aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de
EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado
no R atraves do pacote spdep e da funcao EBImoranmc()
Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano
Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859
Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000
Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente
por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos
testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo
p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na
Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para
acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao
espacial
32 Modelos
Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais
espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos
modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo
uma vez que forneceram melhores resultados como se pode verificar comparando os
valores das Tabelas 32mdash35
Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA
44 Capıtulo 3 Aplicacoes
No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo
da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo
A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos
de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente
pela analise dos resultados com o programa CODA do R (Plummer et al 2006)
No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-
tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada
computacionalmente menos intensa
Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266
P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205
P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204
P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204
Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 1 2063493 188 464 1351516 170 304 988082 169 222
BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201
BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201
BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201
As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos
espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos
com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo
Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial
Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3
1referente a Tabela 21
33 Modelos espaco-temporais 45
Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior
a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a
diferenca entre o numero de parametros e muito grande
No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos
os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero
correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se
pode ver mais adiante quando se usam os modelos espaco-temporais este problema e
ultrapassado
Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao
menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos
os tipos de acidentes
33 Modelos espaco-temporais
De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para
estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-
mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se
reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre
muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21
Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191
P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191
P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192
P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192
P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192
Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor
modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para
2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso
46 Capıtulo 3 Aplicacoes
o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela
35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo
1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash
e para o tipo 3 o modelo 6 mdash BN 3 6
Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191
BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191
BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192
BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193
BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193
Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e
do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores
sao os modelos Poisson
331 Associacao regional
Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao
geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar
informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-
plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos
nos riscos de acidentes
Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes
em milhares de habitantes P a area em centenas de km2 A a densidade populacional em
centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade
de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU
a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques
urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do
solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se
valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST
os valores sao por concelho e iguais em todos os anos
33 Modelos espaco-temporais 47
332 Selecao dos modelos
Foram implementados todos os modelos com todas as combinacoes entre as covariaveis
mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de
acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram
escolhidos os seguintes modelos
Tabela 36 DIC pD e mls para cada tipo de acidente
Tipo P DIC pD mls BN DIC pD mls
1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418
2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260
3 3 6 4 846237 20562 191 3 6 6 852362 19267 191
Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais
P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e
Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU
e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash
modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP
mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI
e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash
modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6
com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos
Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para
cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e
nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao
relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os
valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921
e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo
sao relativamente pequenas 961 594 e 076 respetivamente
Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao
contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis
covariaveis significativas e respetiva contribuicao para os resultados Assim fica para
trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais
significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em
48 Capıtulo 3 Aplicacoes
particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)
e uma covariavel considerada muito importante na modelacao estatıstica de acidentes
rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao
nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica
designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos
hoteleiros
333 Modelos para acidentes do tipo 1
Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172
log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t
e
log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t
No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente
para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos
de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem
o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o
zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor
HPD que contem o zero considera-se que a covariavel nao contribui significativamente
para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso
contrario considera-se que a covariavel contribui significativamente para a explicacao
da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado
que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124
obtendo-se o modelo Poisson 1 8 16 ou seja
log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t
Tabela 37 DIC pD e mls para acidentes tipo 1
Modelo DIC pD mls
P 1 8 1 1940548 47786 458
P 1 8 16 1939877 47789 458
BN 1 6 1 1861278 25154 419
BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
33 Modelos espaco-temporais 49
No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as
covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se
manter as covariaveis no modelo
334 Validacao dos modelos para acidentes do tipo 1
Validacao do modelo P 1 8 16 e do modelo BN 1 6 172
Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172
Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do
que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela
37 O valor da media do logscore tambem e significativamente menor de acordo com
o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores
PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O
valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo
BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes
sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do
tipo 1
335 Resultados obtidos com modelos para acidentes do tipo 1
Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172
A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um
efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma
50 Capıtulo 3 Aplicacoes
diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo
1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16
e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo
BN 1 6 172
Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172
Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max
SMR1 00000 07512 09656 10020 12360 32610
RR1 8 1 02290 07728 09663 09989 11870 28890
RR1 8 16 02274 07722 09628 09979 11860 28770
RR1 6 1 02886 07807 09599 10010 11890 24480
RR1 6 172 02852 07798 09589 09999 11870 24400
Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de
33 Modelos espaco-temporais 51
confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-
bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com
os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-
nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172
Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172
Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados
52 Capıtulo 3 Aplicacoes
os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo
P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000
Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para
o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312
se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de
33 Modelos espaco-temporais 53
suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos
erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais
Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000
Relativamente a introducao das covariaveis comprimento de estrada e quantidade de
combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia
dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis
explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao
explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados
espacialmente
Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1
Efeitos fixosmedia dp 0025q 0975q
α1 00580 00074 00435 00723
γ1 -00263 00030 -00321 -00204
Variancia dos efeitos aleatorios
σ2s1 05816 00591 04706 07001
σ2δ1
00019 00002 00015 00023
Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1
54 Capıtulo 3 Aplicacoes
mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-
plicacao da variacao associada aos efeitos temporais
Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel
vendido influenciam significativamente a variacao geografica dos riscos relativos sao
consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem
de forma positiva para a variacao os riscos o que significa que em regioes com maior
comprimento de estrada e em regioes com maior quantidade de combustıvel vendido
esta associado um aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16
Efeitos fixosmedia dp 0025q 0975q
α1 -00898 00354 -01595 -00207
b1C 00016 00004 00008 00024
b1V C 00003 00001 00002 00005
γ1 -00257 00030 -00315 -00198
Variancia dos efeitos aleatorios
σ2s1 05492 00560 04440 06615
σ2δ1
00019 00002 00015 00023
No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada
do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da
ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos
espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-
buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou
efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves
dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos
temporais σ2ψ1
se mantem o que implica que as covariaveis nao contribuem para a ex-
plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o
modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao
e significativa
Mais uma vez as covariaveis que influenciam significativamente a variacao geografica
dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-
variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que
33 Modelos espaco-temporais 55
regioes com maior comprimento de estrada regioes com maior ocupacao de solo com
equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento
turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos
os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-
mente para a estimacao dos riscos o que significa que em regioes com maior numero de
habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo
fixos todos os restantes efeitos
Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1
Efeitos fixosmedia dp 0025q 0975q
α1 -00429 00052 -00595 -00389
Parametro de dispersao φminus11 00298 00017 00267 00332
Variancia dos efeitos aleatorios
σ2s1 02603 00266 02108 03142
σ2ψ1
00090 00057 00029 00237
Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172
Efeitos fixosmedia dp 0025q 0975q
α1 -01348 00243 -01826 -00872
b1C 00013 00003 00007 00019
b1P -00135 00044 -00221 -00049
b1OSEUP 00001 000008 -000005 00003
b1OST 00001 000006 -0000003 00002
Parametro de dispersao φminus11 00300 00017 00269 00334
Variancia dos efeitos aleatorios
σ2s1 02438 00254 01966 02951
σ2ψ1
00090 00056 00029 00235
Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente
56 Capıtulo 3 Aplicacoes
espacial contribui fortemente para a variacao geografica do risco relativo O padrao e
muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes
com maior risco relativo estimado correspondem as regioes em que as estimativas dos
efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-
dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo
proximo de um correspondem as regioes em que as estimativas de si sao proximas de
zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade
HPD nao contem o zero e 633 para o modelo P 1 4 16
Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16
Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16
33 Modelos espaco-temporais 57
A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0
eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao
longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio
anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta
tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores
correspondente a diminuicao das estimativas dos riscos ao longo dos anos
Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16
Min 1oQ Mediana Media 3oQ Max
δ1 -00919 -00254 -00476 00768 00197 00133
eδ1 09125 09751 09954 10010 10200 11420
Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16
Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de
credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1
a tendencia temporal local e maior que a tendencia global sendo o decrescimento do
numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia
58 Capıtulo 3 Aplicacoes
temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia
temporal local e menor do que a global sendo o decrescimento mais acentuado No
mapa da Figura 315 pode ver-se a distribuicao destes concelhos
Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um
sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada
na Tabela A8 do Anexo A
Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172
Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172
Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos
mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial
33 Modelos espaco-temporais 59
contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado
e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com
menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si
sao proximas de zero Para este modelo a percentagem de estimativas dos valores de
s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente
a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos
seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais
acentuado nos cinco anos seguintes
Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172
Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo
BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um
aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os
restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-
gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos
estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel
contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i
no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54
Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a
percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento
turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como
os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de
60 Capıtulo 3 Aplicacoes
(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo
da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel
OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com
equipamentos turısticos vai de 0 a 038
Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172
Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172
Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior
33 Modelos espaco-temporais 61
que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos
com risco relativo significativamente maior que um
336 Modelos para acidentes do tipo 2
Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192
log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +
b2DPDP2it + s2i + (γ2 + δ2i)t
e
log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t
No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente
das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519
pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo
Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o
modelo P 2 9 16 ou seja
log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t
No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-
variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e
pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-
delo BN 2 9 4 ou seja
log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t
Tabela 314 DIC pD e mls para acidentes tipo 2
modelo DIC pD mls
P 2 9 1 1170386 35334 270
P 2 9 16 1169631 35476 270
BN 2 9 1 1156921 29101 261
BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
62 Capıtulo 3 Aplicacoes
337 Validacao dos modelos para acidentes do tipo 2
Validacao do modelo P 2 9 16 e do modelo BN 2 9 4
Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4
Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-
ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual
a 13956 O valor da media do logscore tambem e significativamente menor de acordo
com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos
valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura
322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para
o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes
sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do
tipo 2
338 Resultados obtidos com modelos para acidentes do tipo 2
Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4
A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as
estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre
um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das
estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados
a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores
esperados a posteriori obtidos com o modelo BN 2 9 4
33 Modelos espaco-temporais 63
Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4
Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os
modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max
SMR2 00000 05062 09180 11830 15740 87830
RR2 9 1 02237 06553 09651 11910 14980 77550
RR2 9 16 02218 06547 09624 11860 14970 77060
RR2 9 1 nb 02391 06636 09751 11870 14960 59240
RR2 9 4 nb 02363 06630 09720 11810 14850 59030
64 Capıtulo 3 Aplicacoes
Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo
P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes
33 Modelos espaco-temporais 65
do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000
Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000
66 Capıtulo 3 Aplicacoes
Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000
Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das
covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo
Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja
as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos
sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito
espacial
Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03511 00191 03135 03883
γ2 -00844 00037 -00918 -00771
Variancia dos efeitos aleatorios
σ2s2 09474 01054 07554 11648
σ2δ2
00099 00016 00070 00133
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-
plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao
33 Modelos espaco-temporais 67
para a variacao geografica das estimativas dos riscos e positiva em regioes com maior
comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao
para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos
Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16
Efeitos fixosmedia dp 0025q 0975q
α2 01790 00530 00741 02822
b2C 00020 00005 00009 00031
b2V C -00004 00003 -00010 00003
γ2 -00833 00038 -00906 -00759
Variancia dos efeitos aleatorios
σ2s2 09162 01019 07325 11282
σ2δ2
00099 00016 00015 00135
Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com
a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos
efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma
efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam
incluıdos no modelo P 2 9 1 atraves do efeito espacial
Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03529 00223 03090 03965
γ2 -00819 00044 -00906 -00733
Parametro de dispersao φminus11 00577 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07824 00925 06156 09748
σ2δ2
00051 00012 00031 00079
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
68 Capıtulo 3 Aplicacoes
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao
associada aos efeitos temporais Para alem disso como a contribuicao para a variacao
geografica das estimativas dos riscos e positiva em regioes com maior comprimento de
estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos
os restantes efeitos
Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4
Efeitos fixosmedia dp 0025q 0975q
α2 01961 00530 00741 02822
b2C 00017 00005 00008 00027
γ2 -00814 00044 -00900 -00727
Parametro de dispersao φminus11 00576 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07516 00894 05914 09385
σ2δ2
00052 00013 00031 00080
Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16
33 Modelos espaco-temporais 69
Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode
verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o
padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado
correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as
regioes com menor risco relativo estimado correspondem as regioes em que as estimativas
de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes
em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem
de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero
e 608
Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era
esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou
seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem
de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295
Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16
Min 1oQ Mediana Media 3oQ Max
δ2 -01805 -00411 00082 00003 00485 01532
eδ2 08358 09604 10090 10030 10500 11660
No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se
que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia
70 Capıtulo 3 Aplicacoes
temporal local maior do que a global e um decrescimento no numero de acidentes do tipo
2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local
menor que a global e um decrescimento mais acentuado
Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16
E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um
obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um que permite complementar esta informacao
Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-
temente para a variacao geografica do risco relativo como se pode observar no mapa da
Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-
mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes
com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao
proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i
cujo intervalo de credibilidade HPD nao contem o zero e 5665
33 Modelos espaco-temporais 71
Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4
Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4
Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4
Min 1oQ Mediana Media 3oQ Max
δ1 -01530 -00368 00052 00001 00402 01140
eδ1 08592 09646 10060 10020 10420 11210
72 Capıtulo 3 Aplicacoes
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca
no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de
78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de
valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa
da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a
global sendo o seu decrescimento menos acentuado que o decrescimento global havendo
uma minoria onde se passa o contrario
Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4
Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior
que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao
com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista
ordenada dos primeiros quinze concelhos
33 Modelos espaco-temporais 73
339 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6
log(θ3ij) = α3 + b3CCi + s3i + ψ3t
e
log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t
No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a
covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo
P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1
log(θ3ij) = α3 + s3i + ψ3t
No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade
populacional nao contem o zero por isso o modelo mantem-se
Tabela 322 DIC pD e mls para acidentes tipo 3
modelo DIC pD mls
P 3 6 1 846290 20551 191
P 3 6 4 846237 20562 191
BN 3 6 1 852438 19770 191
BN 3 6 6 852362 19267 191
3310 Validacao dos modelos para acidentes do tipo 3
Validacao do modelo P 3 6 1 e do modelo BN 3 6 6
Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e
menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072
Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos
valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia
preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo
74 Capıtulo 3 Aplicacoes
ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se
que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3
Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6
3311 Resultados obtidos com modelos para acidentes do tipo 3
Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6
Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max
SMR3 00000 04639 11050 15100 20490 156700
RR3 6 1 01363 08869 13050 14900 18430 95400
RR3 6 6 bn 01247 09020 13170 14850 18370 87310
Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo
obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-
vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores
esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos
valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e
Tabela 323
33 Modelos espaco-temporais 75
Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6
Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6
Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-
76 Capıtulo 3 Aplicacoes
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os
modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6
Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000
Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo
P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
33 Modelos espaco-temporais 77
Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000
Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem
comentarios acerca de associacao regional para este modelo
78 Capıtulo 3 Aplicacoes
No modelo BN observa-se que com a introducao da covariavel densidade populacional o
valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da
variancia dos efeitos temporais σ2ψ1t
se mantem Tabelas 325 e 326
Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02114 00152 01815 02410
Variancia dos efeitos aleatorios
σ2s3 06817 00802 05383 08499
σ2ψ3
00255 00157 00082 00660
Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02155 00158 01842 02464
Parametro de dispersao ψminus11 00455 00061 00348 00584
Variancia dos efeitos aleatorios
σ2s3 06497 00800 05070 08174
σ2ψ3
00255 00161 00081 00672
Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6
Efeitos fixosmedia dp 0025q 0975q
α3 02791 00217 02362 03215
bDP -00199 00048 -00294 -00105
Parametro de dispersao φminus11 00459 00061 00350 00588
Variancia dos efeitos aleatorios
σ2s3 05855 00749 04532 07440
σ2ψ3
00255 00161 00081 00672
Tal significa que a covariavel densidade populacional contribui para a explicacao da
33 Modelos espaco-temporais 79
variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao
da variacao temporal A contribuicao da covariavel densidade populacional e negativa
o que indica que em regioes com maior densidade populacional ocorre a contribuicao
para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos
No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a
sobredispersao nao e significativa
Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1
Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1
80 Capıtulo 3 Aplicacoes
O padrao espacial das estimativas do risco relativo e das estimativas da componente
espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras
342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao
positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos
efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem
o zero e 439 para o modelo P 3 6 1
No que respeita a componente temporal observa-se um decrescimento nos dois primeiros
anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento
nos ultimos cinco anos
Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1
Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco
relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a
lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-
tivamente maior que um na Tabela A9 do Anexo A
33 Modelos espaco-temporais 81
Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6
Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6
Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os
padroes revelados pelos mapas As regioes com maior contribuicao da componente es-
pacial para o aumento do risco relativo correspondem em geral a regioes com maiores
estimativas de risco relativo Tal significa que a componente espacial explica grande parte
da variacao das estimativas do risco relativo A percentagem de estimativas dos valores
de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1
82 Capıtulo 3 Aplicacoes
Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6
A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo
modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode
ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se
pode encontrar uma lista ordenada dos primeiros quinze concelhos
Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se
apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista
o tipo de interacao espaco-temporal
Tabela 327 Modelos univariados
Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal
1 BN 1 6 172 C+P+OSEPU+OST RW mdash
2 BN 2 9 4 C fixo CAR
3 P 3 6 1 mdash RW mdash
34 Modelos multivariados 83
34 Modelos multivariados
Os modelos multivariados usados foram
log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)
log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)
Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-
tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito
complexos nao parece haver um ganho substancial em usa-los
Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados
Modelos multivariados Modelos univariados
Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q
α1 00565 00181 00214 00914 00580 00074 00435 00723
α2 03423 00344 02735 04083 03511 00191 03135 03883
α3 05993 00331 05340 06644 06633 00247 06147 07115
γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204
γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771
γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907
Σu =
05551 03843 05519
03843 1042 05864
05519 05864 09113
Σδ =
00074 00035 00061
00035 00111 00059
00061 00059 00081
No entanto e interessante verificar que em termos de correlacao entre as estimativas
dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo
2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao
que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios
nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e
tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no
numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330
84 Capıtulo 3 Aplicacoes
Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal
Modelos com interacao Modelos sem interacao
media dp 0025q 0975q media dp 0025q 0975q
ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669
ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879
ρ23(θ) 06793 00242 06304 07252 06831 002647 07326
ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196
ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941
ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976
ρ12(δ) 03823 00894 01960 05465
ρ13(δ) 07979 00634 06487 08998
ρ23(δ) 06203 00938 04153 07829
Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias
AnoVıtimas mortais Feridos graves Feridos leves
24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif
2010 741 937 196 2637 2475 -162 43924 43890 -34
2011 689 891 202 2436 2265 -171 39726 39695 -31
34 Modelos multivariados 85
Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados
86 Capıtulo 3 Aplicacoes
Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
35 Aplicacao para acidentes rodoviarios nas estradas
secundarias
Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-
cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram
retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-
damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior
risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do
poder local
Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840
Total 175741 16909 3471 196121
Figura 350 Numero de acidentes tipo 1 por concelho
88 Capıtulo 3 Aplicacoes
Figura 351 Numero de acidentes tipo 2 por concelho
Figura 352 Numero de acidentes tipo 3 por concelho
No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados
Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89
de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos
Tabela 332 DIC pD e mls para cada tipo de acidente
Modelo DIC pD mls
BN 1 9 42 1614530 32359 363
BN 2 9 246 924765 27530 208
P 3 6 30 581058 11747 131
351 Modelo para acidentes do tipo 1
Modelo Binomial Negativo 1 9 42
log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t
Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a
variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do
modelo
352 Validacao do modelo para acidentes do tipo 1
Validacao do modelo BN 1 9 42
Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42
O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-
pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O
90 Capıtulo 3 Aplicacoes
valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem
um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-
ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42
e o melhor modelo para acidentes do tipo 1
353 Resultados obtidos com o modelo para acidentes do tipo 1
Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42
Efeitos fixosmedia dp 0025q 0975q
α1 -03518 00346 -04202 -02843
b1C 00012 00004 00005 00019
b1OST 00001 000007 -000005 00002
γ1 -00128 00026 -00179 -00077
Parametro de dispersao φminus11 00287 00021 00248 00328
Variancia dos efeitos aleatorios
σ2s1 03982 00445 03180 04909
σ2δ1
00026 00007 00015 00040
Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91
As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico
influenciam significativamente a variacao geografica dos riscos relativos e portanto sao
consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de
forma positiva para a variacao dos riscos o que significa que em regioes com maior
comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma
contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes
efeitos
Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-
derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura
temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao
envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial
se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de
risco relativo Figuras 354 e 316
Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42
Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco
relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um
92 Capıtulo 3 Aplicacoes
354 Modelo para acidentes do tipo 2
Modelo Binomial Negativo 2 9 246
log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +
s2i + (γ2 + δ2i)t2
Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de
todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938
pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e
manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja
log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2
Tabela 334 DIC pD e mls
Modelo DIC pD mls
BN 2 9 86 924868 24786 208
355 Validacao do modelo para acidentes do tipo 2
Validacao do modelo BN 2 9 86
Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86
O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo
Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93
do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto
proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e
95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor
modelo para acidentes do tipo 2
356 Resultados obtidos com o modelo para acidentes do tipo 2
Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86
Efeitos fixosmedia dp 0025q 0975q
α2 -01198 00480 -02147 -00266
b1OSI 00002 000008 000007 00004
b1OSEPU 00003 00002 000001 00006
b1DP 00084 00066 -00046 00215
γ1 -01198 00480 -02147 -00266
Parametro de dispersao
φminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 10557 01336 08161 13345
σ2δ1
00094 00023 00057 00147
A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-
nos e a densidade populacional influenciam significativamente a variacao geografica dos
riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-
variaveis contribuem de forma positiva para a variacao dos riscos o que significa que
em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo
com equipamentos e parques urbanos e a regioes com maior densidade populacional ha
contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes
do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a
mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao
Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que
os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos
94 Capıtulo 3 Aplicacoes
concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns
conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas
do risco relativo sao os mesmos
Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86
Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95
A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com
o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que
consta na Tabela A11
357 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 30
log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt
Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU
contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo
358 Validacao do modelo para acidentes do tipo 3
Validacao do modelo P 3 6 30
Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30
Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da
distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-
mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores
igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva
e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para
acidentes do tipo 3
96 Capıtulo 3 Aplicacoes
359 Resultados obtidos com o modelo para acidentes do tipo 3
Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30
Efeitos fixosmedia dp 0025q 0975q
α2 00104 00520 -00923 01117
b3A 00258 00116 00031 00049
b3OSEPU -00001 00001 -00004 000006
Parametro de dispersao
ψminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 03598 00687 02422 05084
σ2ψ1
00246 00163 0007 00666
Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30
A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam
significativamente a variacao geografica dos riscos relativos sendo consideradas na es-
timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97
a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial
em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes
com maior area geografica ha uma contribuicao para o aumento das estimativas do risco
relativo mantendo fixos todos os restantes efeitos
O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de
trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-
trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico
mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No
entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos
Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30
E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo
modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que
consta na Tabela A11
Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-
mente a abordagem global e a abordagem local
98 Capıtulo 3 Aplicacoes
Tabela 337 Comparacao entre a abordagem local e a global
Abordagem Tipo Melhor Covariaveis Efeito Interacao
Modelo temporal espaco-temporal
Local 1 BN 1 9 42 C+OST fixo CAR
Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash
Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR
Gloal 2 BN 2 9 4 C fixo CAR
Local 3 P 3 6 30 A+OSEUP aleatorio mdash
Global 3 P 3 6 1 mdash aleatorio mdash
4Discussao e conclusoes
Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia
de dependencia espacial de tendencia temporal e de associacao regional em dados de
acidentes rodoviarios
Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-
delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por
areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar
diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao
espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel
recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados
com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de
trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de sobredispersao de associacao posi-
tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-
mentos e parques urbanos e uma associacao regional negativa com a populacao
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
100 Capıtulo 4 Discussao e conclusoes
bredispersao e de associacao regional positiva com o comprimento de estrada
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente
Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com o comprimento de estrada e com
a area de ocupacao do solo para turismo
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com a area de ocupacao de solo para
a industria com a area de ocupacao do solo com equipamentos e parques urbanos
e com a densidade populacional
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente de associacao regional
positiva com a area e de associacao regional negativa com a area de ocupacao de
solo com equipamentos e parques urbanos
Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-
se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas
Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com
interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao
do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido
o modelo Poisson com efeito temporal aleatorio
Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos
modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-
tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se
capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes
espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-
formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que
as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto
e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas
as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de
valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais
elevados diminuiram ou seja os valores extremos foram suavizados
101
Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos
dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-
gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi
possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia
temporal global Este e um tipo de resultado muito importante na fase de aplicacao
pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter
exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas
Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-
minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as
covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam
incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-
fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal
Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores
usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal
considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para
todos os anos em estudo
Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos
mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-
pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a
ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-
cativamente maior que um bem como as dos concelhos com valores consideravelmente
menores do que a unidade
Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-
timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises
por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-
pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de
estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-
nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o
TDMA de modo a introduzi-las no modelo
Os modelos multivariados constituiram um esforco computacional elevado nao tendo
havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises
comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi
possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes
tipos de acidentes
Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves
do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo
uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-
ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA
102 Capıtulo 4 Discussao e conclusoes
pela extrema concordancia de resultados pela facilidade de implementacao dos modelos
pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez
de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem
duvida muito mais acessıvel
Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-
dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de
um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-
patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de
recolha e definicao das variaveis de interesse A implementacao estes modelos tambem
pode ser efetuada atraves do R-INLA
Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir
como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-
dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite
efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-
gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade
dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas
geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios
constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel
mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-
sabilidade de todosrdquo
ACaracterizacao da regiao de estudo
A1 Portugal Continental
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes
administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados
em 18 distritos
O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a
partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na
pagina do Instituto Geografico Portugues - httpwwwigeopt
A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o
map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-
hancas no WinBUGS
104 Apendice A Caracterizacao da regiao de estudo
Figura A1 ID dos concelhos do Norte de Portugal Continental
A1 Portugal Continental 105
Figura A2 ID dos concelhos do Sul de Portugal Continental
106 Apendice A Caracterizacao da regiao de estudo
A1 Portugal Continental 107
108 Apendice A Caracterizacao da regiao de estudo
A2 Numero de acidentes
Tabela A1 Estatısticas resumo de acidentes tipo 1
Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200
Tabela A2 Estatısticas resumo de acidentes tipo 2
Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800
Tabela A3 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100
A2 Numero de acidentes 109
Numero de acidentes que ocorreram nas estradas secundarias
Tabela A4 Estatısticas resumo de acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900
Tabela A5 Estatısticas resumo de acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800
Tabela A6 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700
110 Apendice A Caracterizacao da regiao de estudo
A3 Covariaveis
bull Populacao - P
Tabela A7 Estatısticas resumo da covariavel populacao
Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700
Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)
A3 Covariaveis 111
bull Area - A
Figura A4 Area em centenas de km2 por concelho (Fonte INE)
bull Densidade Populacional - DP
Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)
112 Apendice A Caracterizacao da regiao de estudo
bull Comprimento de Estrada - C
Figura A6 Quilometros de estrada por concelho (Fonte EP)
bull Quantidade de combustıvel vendido - VC
Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)
A3 Covariaveis 113
bull Ocupacao urbana do solo - OSU
Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
bull Ocupacao industrial do solo - OSI
Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)
114 Apendice A Caracterizacao da regiao de estudo
bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU
Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)
bull Ocupacao do solo com equipamento turıstico - OST
Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
A4 15 concelhos 115A
415
con
celh
os
Tab
ela
A8
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o1
Mold
elo
P1
816
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alb
ergaria
-a-V
elh
a3
Castro
Marim
Alc
acer
do
Sal
Grandola
Castro
Marim
Castro
Marim
Castro
Marim
Alb
ergaria
-a-V
elh
aV
ouzela
4A
lcacer
do
Sal
Castro
Marim
Castro
Marim
Grandola
Grandola
Alb
ergaria
-a-V
elh
aC
astro
Marim
Alc
acer
do
Sal
5V
izela
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
Vila
Velh
ade
Rodao
Pedrogao
Grande
6C
ondeix
a-a
-Nova
Azam
buja
Azam
buja
Azam
buja
Obid
os
Penela
Penela
Vila
Velh
ade
Rodao
7A
zam
buja
Viz
ela
Alj
ezur
Obid
os
Penela
Obid
os
Alj
ezur
Penela
8Silves
Alj
ezur
Obid
os
Condeix
a-a
-Nova
Azam
buja
Grandola
Obid
os
Alj
ezur
9A
lbufe
ira
Silves
Pom
bal
Pom
bal
Pom
bal
Vila
Velh
ade
Rodao
Pedrogao
Grande
Obid
os
10
Alj
ezur
Obid
os
Palm
ela
Penela
Alb
ergaria
-a-V
elh
aP
om
bal
Vouzela
Castro
Marim
11
Palm
ela
Pom
bal
Benavente
Palm
ela
Condeix
a-a
-Nova
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oE
sposende
12
Benavente
Benavente
Silves
Benavente
Vila
Velh
ade
Rodao
Azam
buja
Pom
bal
Montem
or-o
-Velh
o13
Pom
bal
Palm
ela
Penela
Vagos
Benavente
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
Tabua
14
Obid
os
Alb
ufe
ira
Olh
ao
Silves
Palm
ela
Condeix
a-a
-Nova
Esposende
Oliveir
ado
Bair
ro
15
Marin
ha
Grande
Olh
ao
Vagos
Olh
ao
Montem
or-o
-Velh
oP
edrogao
Grande
Tabua
Cham
usca
Mold
elo
BN
16
172
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
3C
astro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
4G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
5O
bid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
6C
ondeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
7A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
8P
om
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
9B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
10
Penela
Penela
Penela
Penela
Penela
Penela
Penela
Penela
11
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
12
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
13
Palm
ela
Alb
ergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
a14
Alb
ergaria
-a-V
elh
aP
alm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
15
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
o
116 Apendice A Caracterizacao da regiao de estudo
Tab
ela
A9
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o2
Modelo
P2
916
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ouriq
ue
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Alj
ustrel
4A
lcacer
do
Sal
Alc
acer
do
Sal
Avis
Nis
aO
urem
Nis
aA
ljustrel
Avis
5A
vis
Avis
Alc
acer
do
Sal
Rio
Maio
rN
isa
Alj
ustrel
Nis
aM
ourao
6C
ham
usca
Nis
aN
isa
Alj
ezur
Alc
acer
do
Sal
Mourao
Mourao
Nis
a7
Santarem
Cham
usca
Alj
ezur
Alc
acer
do
Sal
Alj
ustrel
Pedrogao
Grande
Pedrogao
Grande
Pedrogao
Grande
8V
ila
Nova
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rA
lcacer
do
Sal
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
da
Barquin
ha
da
Barquin
ha
9N
isa
Santarem
Vila
Nova
Pedrogao
Grande
Mourao
Ourem
Alc
acer
do
Sal
Proenca-a
-Nova
da
Barquin
ha
10
Alm
eir
imV
endas
Novas
Pedrogao
Grande
Mourao
Pedrogao
Grande
Ferreir
ado
Ale
ntejo
Proenca-a
-Nova
Alc
acer
do
Sal
11
Gole
ga
Montem
or-o
-Novo
Alj
ustrel
Vila
Nova
Ferreir
ado
Ale
ntejo
Rio
Maio
rG
randola
Idanha-a
-Nova
da
Barquin
ha
12
Vendas
Novas
Alj
ezur
Santarem
Cham
usca
Montem
or-o
-Novo
Montem
or-o
-Novo
Rio
Maio
rG
randola
13
Gavia
oG
avia
oM
ontem
or-o
-Novo
Montem
or-o
-Novo
Vila
Nova
Grandola
Ourem
Alm
odovar
da
Barquin
ha
14
Palm
ela
Gole
ga
Mourao
Ferreir
ado
Ale
ntejo
Grandola
Proenca-a
-Nova
Montem
or-o
-Novo
Montem
or-o
-Novo
15
Montem
or-o
-Novo
Alm
eir
imV
endas
Novas
Grandola
Cham
usca
Vila
Nova
Vila
Velh
ade
Rodao
Celo
ric
oda
Beir
ada
Barquin
ha
Modelo
BN
29
4
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ourem
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Avis
Alj
ustrel
4A
vis
Avis
Rio
Maio
rA
ljezur
Ourem
Nis
aA
ljustrel
Avis
5A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Nis
aN
isa
Alj
ustrel
Nis
aN
isa
6C
ham
usca
Nis
aN
isa
Alc
acer
do
Sal
Alc
acer
do
Sal
Ourem
Mourao
Mourao
7V
ila
Nova
Cham
usca
Alj
ezur
Rio
Maio
rA
ljustrel
Alc
acer
do
Sal
Alc
acer
do
Sal
Pedrogao
Grande
da
Barquin
ha
8Santarem
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rM
ourao
Pedrogao
Grande
Alc
acer
do
Sal
9N
isa
Santarem
Vila
Nova
Mourao
Mourao
Pedrogao
Grande
Ferreir
aFerreir
ada
Barquin
ha
do
Ale
ntejo
do
Ale
ntejo
10
Montem
or-o
-Novo
Alj
ezur
Alj
ustrel
Vila
Nova
Pedrogao
Grande
Rio
Maio
rO
urem
Proenca-a
-Nova
da
Barquin
ha
11
Vendas
Novas
Montem
or-o
-Novo
Santarem
Cham
usca
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
Rio
Maio
rC
elo
ric
oda
Beir
a12
Gole
ga
Alj
ustrel
Montem
or-o
-Novo
Pedrogao
Grande
Montem
or-o
-Novo
Montem
or-o
-Novo
Proenca-a
-Nova
Ourem
13
Salv
aterra
de
Magos
Vendas
Novas
Mourao
Montem
or-o
-Novo
Vila
Nova
Grandola
Montem
or-o
-Novo
Grandola
da
Barquin
ha
14
Alm
eir
imM
ourao
Pedrogao
Grande
Ferreir
aC
ham
usca
Vila
Nova
Grandola
Idanha-a
-Nova
do
Ale
ntejo
da
Barquin
ha
15
Alj
ezur
Salv
aterra
de
Magos
Ferreir
ado
Ale
ntejo
Grandola
Grandola
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aM
ontem
or-o
-Novo
A4 15 concelhos 117
Tab
ela
A1
015
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o3
Modelo
P3
61
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
Ferreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9C
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a10
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
11
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
12
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
13
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Modelo
BN
36
6
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9A
zam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
10
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
11
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a12
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
13
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
118 Apendice A Caracterizacao da regiao de estudoT
abel
aA
11
15co
nce
lhos
com
esti
mati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
Acid
entes
tip
o1
-M
odelo
BN
19
42
2000
2001
2002
2003
2004
2005
2006
2007
1M
arin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Ilhavo
Ilhavo
Ilhavo
Ilhavo
2Il
havo
Ilhavo
Ilhavo
Ilhavo
Marin
ha
Grande
Marin
ha
Grande
Vagos
Vagos
3A
lbufe
ira
Alb
ufe
ira
Vagos
Vagos
Vagos
Vagos
Marin
ha
Grande
Ferreir
ado
Zezere
4P
ortim
ao
Portim
ao
Alb
ufe
ira
Portim
ao
Portim
ao
Ferreir
ado
Zezere
Ferreir
ado
Zezere
Marin
ha
Grande
5V
agos
Vagos
Portim
ao
Porto
Porto
Portim
ao
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
6P
orto
Porto
Porto
Alb
ufe
ira
Ferreir
ado
Zezere
Porto
Porto
Montem
or-o
-Velh
o7
Faro
Penic
he
Penic
he
Penic
he
Penic
he
Penic
he
Portim
ao
Alp
iarca
8L
oule
Faro
Faro
Faro
Alb
ufe
ira
Oliveir
ado
Bair
ro
Montem
or-o
-Velh
oP
orto
9P
enic
he
Loule
Viz
ela
Ferreir
ado
Zezere
Coim
bra
Montem
or-o
-Velh
oP
enic
he
Penic
he
10
Odiv
ela
sO
div
ela
sC
oim
bra
Coim
bra
Faro
Coim
bra
Coim
bra
Coim
bra
11
Viz
ela
Viz
ela
Odiv
ela
sV
izela
Montem
or-o
-Velh
oA
lbufe
ira
Alp
iarca
Portim
ao
12
Olh
ao
Coim
bra
Loule
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Faro
Pom
bal
Pom
bal
13
Nazare
Olh
ao
Ferreir
ado
Zezere
Odiv
ela
sV
izela
Aveir
oA
veir
oA
veir
o14
Coim
bra
Setubal
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Aveir
oP
om
bal
Faro
Vis
eu
15
Setubal
Cantanhede
Setubal
Aveir
oP
om
bal
Viz
ela
Murtosa
Lis
boa
Acid
entes
tip
o2
-M
odelo
BN
29
86
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ourem
Ourem
Ourem
Ourem
Ourem
S
J
Madeir
a2
Rio
Maio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rFerreir
aZ
O
dem
ira
Odem
ira
3A
lmeir
imFerreir
aZ
Ferreir
aZ
Ferreir
aZ
Ferreir
aZ
R
ioM
aio
rFerreir
aZ
Ferreir
aZ
4
Ferreir
ado
Zezere
Alm
eir
imB
raganca
Braganca
Braganca
Odem
ira
S
J
Madeir
aV
izela
5Santarem
Braganca
Avis
Odem
ira
Odem
ira
Mourao
Braganca
Braganca
6L
isboa
Lis
boa
Odem
ira
Mourao
Mourao
Braganca
Rio
Maio
rO
urem
7C
ham
usca
Santarem
Lis
boa
Avis
Avis
S
J
Madeir
aA
lmodovar
Alm
odovar
8B
raganca
Cham
usca
Mourao
Lis
boa
Vim
ioso
Avis
Viz
ela
Tondela
9P
alm
ela
Avis
Santarem
Cham
usca
Ala
ndroal
Vim
ioso
Tondela
Chaves
10
Salv
aterra
de
Magos
Palm
ela
Cham
usca
Palm
ela
S
J
Madeir
aA
lmodovar
Chaves
Rio
Maio
r11
Avis
Salv
aterra
de
Magos
Alm
eir
imSantarem
Alm
odovar
Chaves
Elv
as
Guim
araes
12
Ilhavo
Odem
ira
Palm
ela
Ala
ndroal
Elv
as
Ala
ndroal
Serta
13
Vila
Nova
da
Barquin
ha
Mourao
Salv
aterra
de
Magos
Elv
as
Palm
ela
Tondela
Palm
ela
14
Nazare
Vila
Nova
da
Barquin
ha
Ala
ndroal
Alm
eir
imC
ham
usca
Elv
as
Portim
ao
15
Abrantes
Ala
ndroal
Lagos
Salv
aterra
de
Magos
Lis
boa
Palm
ela
Loule
Acid
entes
tip
o3
-M
odelo
P3
630
2000
2001
2002
2003
2004
2005
2006
2007
1O
dem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
2M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
3V
imio
so
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Cantanhede
4F
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
o5
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
6M
iranda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
7A
lmodovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
8Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
9A
lcoutim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
10
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
11
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
12
Alc
ochete
Alc
ochete
Alc
ochete
Macedo
de
Cavale
iros
Alc
ochete
Alc
ochete
13
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Vagos
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
14
Vagos
Vagos
Vagos
Cantanhede
Vagos
Vagos
15
Cantanhede
Cantanhede
Cantanhede
Alc
ochete
Cantanhede
Cantanhede
Referencias Bibliograficas
Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes
in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625
ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt
Defaultaspxtabid=220amplanguage=pt-PT
ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx
fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT
Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population
density Statistics in Medicine 18(16) 2147ndash2162
Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety
performance indicators by using a multivariate generalized linear mixed model Journal
of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517
Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis
for Spatial Data Chapman amp Hall
Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease
maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431
Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini
M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med
14(21-22) 2433ndash2443
Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis
of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007
Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems
Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236
Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-
tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20
101007BF00116466
120 Referencias bibliograficas
Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis
with R Springer
Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed
Models Journal of the American Statistical Association 88(421) 9ndash25
Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane
roads Accident Analysis amp Prevention 39(4) 657 ndash 670
Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a
velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos
PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico
Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em
Seguranca Rodoviaria Technical report IST and LNEC
Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-
Temporally Correlated Survival Data In Bayesian Statistics 7
Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data
Analysis Chapman amp Hall
Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative
Risks for Use in Disease Mapping Biometrics 43 671ndash681
Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data
Biometrics 65 1254ndash1261
Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao
em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo
20economico20e20social20dos20acidentes_versao20para20internet
Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in
Europe Applied Spatial Analysis 1 133ndash150
Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level
Example of Belgium Journal of Safety Research 39(4) 417 ndash 427
El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate
Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828
Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety
Accident Analysis amp Prevention 40(6) 1964 ndash 1969
Referencias bibliograficas 121
Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis
and Prevention 43 253ndash264
Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall
Gelfand A E (1996) Model determination using sampling-based methods In W
Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice
chapter 9 (pp 145ndash161) Chapman amp
Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive
models for spatial data analysis Biostatistics 4(1) 11ndash15
Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis
Chapman amp Hall
Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for
the analysis of spatial data An application to disease mapping Journal of Statistical
Planning and Inference 75(2) 305 ndash 318
Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and
Estimation Journal of the American Statistical Association 102(477) 359ndash378
Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical
Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808
Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps
with Application to German Mortality Data httpepububuni-muenchende
Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive
Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical
Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD
Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR
Models for Areal Data Biometrics 61(4) 950ndash961
Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease
risk Statistics In Medicine 19(17-18) 2555ndash2567
Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space
Statistics in Medicine 17(18) 2045ndash2060
Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-
demiology CRC Press Taylor amp Francis
122 Referencias bibliograficas
Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-
mann P e Divino F (2000) Disease mapping models an empirical evaluation
Statistics in Medicine 19(17-18) 2217ndash2241
Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-
temporal patterns of intra-city motor vehicle craches Journal of Transport Geography
15 274ndash285
Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical
models in road safety countermeasure effectiveness studies in Iowa Accident Analysis
amp Prevention 40(4) 1531 ndash 1542
Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-
Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis
amp Prevention 40(3) 1123 ndash 1134
Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small
sample size on the estimation of the fixed dispersion parameter of Poisson-gamma
models for modeling motor vehicle crashes A Bayesian perspective Safety Science
46(5) 751 ndash 770
Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-
persion parameters of Poisson-gamma models on empirical Bayes estimates Accident
Analysis amp Prevention 40(4) 1441 ndash 1457
Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-
inflated regression models of motor vehicle crashes balancing statistical fit and theory
Accident Analysis amp Prevention 37(1) 35 ndash 46
Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal
regression model for prediction of crash counts by severity using Bayesian methods
Accident Analysis amp Prevention 40(3) 964 ndash 975
MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident
and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028
Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P
Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive
Statistical Methods (pp 99ndash114) Springer
Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-
tent Gaussian models using integrated nested Laplace approximations A manual for
Referencias bibliograficas 123
the inla program Technical report Norwegian University of Science and Technology
Trondheim
McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall
Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-
provements Decision parameter treatability concept statistical criterion and spatial
dependence Accident Analysis amp Prevention 37(4) 699 ndash 720
Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A
Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57
Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures
for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201
Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle
crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468
Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties
in england Accident Analysis amp Prevention 36(6) 973 ndash 984
OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications
world_health_statistics2008en
OMS (2009) Global status report on road safety httpwhqlibdocwhoint
publications20099789241563840_engpdf
Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao
Calouste Gubenkian
Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes
factors Biometrika 77(3) 455ndash466
Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-
tistics 9(3) 523ndash539
Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis
and output analysis for MCMC R News 6(1) 7ndash11
Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and
heterogeneity An analysis of London crash data Accident Analysis amp Prevention
40(4) 1486 ndash 1497
124 Referencias bibliograficas
R Development Core Team (2008) R A Language and Environment for Statistical
Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-
07-0
Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology
Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications
Chapman amp HallCRC
Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent
gaussian models by using integrated nested laplace approximations Journal of the
Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392
Schrodle B e Held L (2011) A primer on disease mapping and ecological regression
using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2
Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment
and Posterior Inference Journal of Statistical Software 21(11) 1ndash37
Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial
models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)
246 ndash 273
Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian
measures of model complexity and fit J R Statist Soc B 64 583ndash639
Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and
Marginal Densities Journal of the American Statistical Association 81 82ndash86
Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian
Journal of Statistics 31 221ndash229
Wakefield J (2007) Disease mapping and spatial regression with count data Biostat
8(2) 158ndash183
Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press
Taylor amp Francis
UNIVERSIDADE DE LISBOAFACULDADE DE CIENCIAS
DEPARTAMENTO DE ESTATISTICA E INVESTIGACAO OPERACIONAL
Modelacao de dadosespaco-temporais em seguranca
rodoviaria
Maria da Conceicao Rodrigues Ribeiro
Tese orientada pela Professora Doutora Maria Antonia Amaral Turkman epelo Professor Doutor Joao Paulo Lourenco Cardoso especialmente
elaborada para a obtencao do grau de doutor em Estatıstica e InvestigacaoOperacional (Especialidade de Probabilidades e Estatıstica)
2012
Resumo
Os acidentes rodoviarios sao um grave problema de saude publica mundial com con-
sequencias socio-economicas devastadoras Apesar dos enormes esforcos efetuados nos
ultimos anos os valores de sinistralidade rodoviaria ainda sao inadmissıveis As es-
tatısticas registadas suscitaram o interesse de investigadores e de polıticos como peca
fundamental para no sentido de compreender melhor a complexidade de fatores relacio-
nados com os acidentes rodoviarios e determinar que aspetos do problema de seguranca
rodoviaria sao locais (nacional ou regional) e quais sao os partilhados por varios paıses
Assim tem havido uma consideravel investigacao direcionada para o desenvolvimento de
modelacao estatıstica de dados de acidentes rodoviarios ocorridos em areas geograficas
correspondentes a orgaos de administracao publica ou gestao de infraestruturas de trans-
porte com o objectivo de encontrar modelos que possam servir como referencia na imple-
mentacao de acoes corretivas destinadas a diminuir o numero de acidentes rodoviarios
A estimacao do numero esperado de acidentes continua a ser um problema em aberto
nao existindo um metodo que possa ser considerado otimo No entanto e generalizada
a referencia a superioridade dos metodos bayesianos Esta tese foca-se na aplicacao de
modelos hierarquicos bayesianos a dados espaco-temporais em seguranca rodoviaria
No que diz respeito a metodologia de inferencia foi utilizada uma abordagem recente
proposta em Rue et al (2009) que consiste na inferencia bayesiana aproximada via INLA
(Integrated Nested Laplace Approximations) e que e uma alternativa determinıstica aos
metodos de simulacao MCMC habitualmente usados Assim explorou-se no R atraves
do R-INLA a implementacao desta metodologia que torna o uso dos modelos bayesianos
hierarquicos mais acessıvel sendo uma alternativa muito competitiva relativamente ao
WinBUGS para situacoes em que a distribuicao da variavel dependente pertence a famılia
exponencial
Com a implementacao desses modelos foi possıvel reduzir a variabilidade das estimati-
vas dos riscos de acidentes em areas pequenas e simultaneamente revelar padroes de
dependencia espacial tendencias temporais e interacoes espaco-temporais Conseguiu-se
assim uma suavizacao espacial dos dados ainda que as regioes sob estudo possuam areas
pequenas Para alem disso foi possıvel fazer a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao Espera-se que esta metodologia possa vir a
permitir efetuar uma comparacao no que respeita a seguranca rodoviaria nao so ao nıvel
nacional ou regional mas tambem ao nıvel internacional
Palavras chave seguranca rodoviaria modelos bayesianos hierarquicos risco relativo
INLA
Abstract
Road accidents are a serious public health problem worldwide with devastating socio-
economic consequences Despite the enormous efforts made in recent years the road
fatalities values are still unacceptable Statistics recorded caught the interest of resear-
chers and politicians as a key to better understand the complexity of factors related to
road accidents and to determine which aspects of the problem of road safety are local
(national or regional) and which are shared by several countries Thus there has been
considerable research directed towards the development of statistical modeling of road
accident data in geographic areas corresponding to organs of public administration or
management of transport infrasctruture with the aim of finding models that can serve
as reference to the implementation of corrective actions aimed to reduce the number of
road accidents
The estimation of the expected number of accidents remains an open problem and there
is no method that can be considered optimal However there is a general reference to
the superiority of Bayesian methods This thesis focuses on the application of Bayesian
hierarchical models with spatio-temporal data in road safety
Regarding to inference methodology a recent approach proposed in Rue et al (2009)
which is the approximate Bayesian inference via INLA (Integrated Nested Laplace Appro-
ximations) was used which is a deterministic alternative to the simulation methods
MCMC commonly used Thus we explored in R through R-INLA the implementation of
this methodology which makes the use of Bayesian hierarchical models more accessible
being a very competitive alternative for the WinBUGS for situations where the depedent
variable distribution belongs to the exponential family
With the implementation of these models it was possible to reduce the estimates va-
riability of the risks of accidents in small areas and simultaneously to reveal patterns
of spatial dependence trends and spatio-temporal interactions In this way a spatial
smoothing of the data was obtained despite of the regions under study having small
areas Furthermore it was possible to identify the counties of Portugal at higher risk
relatively to the country and to analyze association of the district council with potential
risk factors or exposure It is hoped that this methodology will allow comparisons with
regard to road safety not only at national or regional level but also at international level
Keywords road safety hierarchical Bayesian models relative risk INLA
Agradecimentos
Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-
pressar o meu profundo agradecimento
A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-
mente pela sua compreensao
A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao
devido acima de tudo pela grande admiracao que tenho por ela
Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima
de tudo pelo seu entusiasmo por esta tese
Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo
Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA
e pelo incentivo
Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a
minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha
de conhecimentos importantes para a realizacao do meu doutoramento
Ao Professor Rune Elvik pelo interesse demostrado
Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-
ciado pela bolsa de doutoramento SFRHPROTEC492262008
A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de
Portugal Continental
Ao Dr Rui Pereira pela prontidao e pelo interesse
A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do
Instituto Superior de Engenharia
Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram
em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao
Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas
A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-
balho
Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha
espera
Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho
a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa
os quais me ajudaram cada um a sua maneira
A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude
partilhar muitos momentos de alegria e descontracao
Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira
A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre
em mim a Mariana e a Rita por me seguirem como exemplo
A minha mae
Siglas e Acronimos
A Area geografica
AE Autoestrada
ANSR Autoridade Nacional de Seguranca Rodoviaria
BN Binomial Negativo
BT Brigada de Transito
BOA An R Package for MCMC Output Convergence
Assessment and Posterior Inference
BUGS Bayesian Using Gibbs Sampling
C Comprimento de estrada
CARE Community database on accidents on the roads in Europe
CE Codigo de Estrada
CODA Convergence Diagnosis and Output Analysis for MCMC
CPO Conditional Predictive Ordinates
DIC Deviance Information Criterion
DP Densidade populacional
EN Estrada Nacional
ENSR Estrategia Nacional de Seguranca Rodoviaria
GNR Guarda Nacional Republicana
HPD Highest Probability Density
IC Itinerario Complementar
INLA Integrated Nested Laplace Approximations
IP Itinerario Principal
MCMC Markov Chains Monte Carlo
mls Mean logarithmic score
OMS Organizacao Mundial de Saude
ONU Organizacao das Nacoes Unidas
OSEPU Ocupacao do solo com equipamentos e parques urbanos
OSI Ocupacao industrial do solo
OST Ocupacao do solo com equipamento turıstico
OSU Ocupacao urbana do solo
pD Numero efetivo de parametros
PIT Probability Integral Transformation
PMOT Plano Municipal de Ordenamento do Territorio
PMSR Planos Municipais de Seguranca Rodoviaria
PSP Polıcia de Seguranca Publica
R A Language and Environment for Statistical Computing
SafetyNET Projeto europeu European Traffic Information System -
Data Colletion and Analysis Tools for Policy Making
SMR Standard Morbility Ratio
UE Uniao Europeia
WinBUGS versao em ambiente Windows do programa BUGS
VC Quantidade de combustıvel vendido
Conteudo
Lista de Tabelas xiv
Lista de Figuras xv
Introducao 1
1 Nocoes sobre seguranca rodoviaria 9
11 Risco em seguranca rodoviaria 9
12 Caracterizacao dos dados de acidentes 10
13 Caracterizacao da medida de exposicao 14
2 Modelacao estatıstica de acidentes rodoviarios 19
21 Modelos bayesianos hierarquicos 21
22 Modelos nao espaciais 24
23 Modelos espaciais 27
24 Modelos espaco-temporais 28
25 Modelos multivariados 30
26 Metodos de inferencia 32
261 INLA 32
27 Ajustamento e medidas preditivas 36
3 Aplicacoes 39
31 Associacao espacial 40
32 Modelos 43
33 Modelos espaco-temporais 45
331 Associacao regional 46
332 Selecao dos modelos 47
333 Modelos para acidentes do tipo 1 48
334 Validacao dos modelos para acidentes do tipo 1 49
335 Resultados obtidos com modelos para acidentes do tipo 1 49
xii Conteudos
336 Modelos para acidentes do tipo 2 61
337 Validacao dos modelos para acidentes do tipo 2 62
338 Resultados obtidos com modelos para acidentes do tipo 2 62
339 Modelos para acidentes do tipo 3 73
3310 Validacao dos modelos para acidentes do tipo 3 73
3311 Resultados obtidos com modelos para acidentes do tipo 3 74
34 Modelos multivariados 83
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
351 Modelo para acidentes do tipo 1 89
352 Validacao do modelo para acidentes do tipo 1 89
353 Resultados obtidos com o modelo para acidentes do tipo 1 90
354 Modelo para acidentes do tipo 2 92
355 Validacao do modelo para acidentes do tipo 2 92
356 Resultados obtidos com o modelo para acidentes do tipo 2 93
357 Modelos para acidentes do tipo 3 95
358 Validacao do modelo para acidentes do tipo 3 95
359 Resultados obtidos com o modelo para acidentes do tipo 3 96
4 Discussao e conclusoes 99
A Caracterizacao da regiao de estudo 103
A1 Portugal Continental 103
A2 Numero de acidentes 108
A3 Covariaveis 110
A4 15 concelhos 115
Referencias Bibliograficas 119
Lista de Tabelas
11 Numero total de cada tipo de acidentes rodoviarios por ano 11
12 Estatısticas resumo do numero de veıculos com seguro em milhares 14
21 Modelos univariados 30
31 Valores do ındice EBI para cada tipo de acidente por ano 43
32 Valores DIC e mls dos modelos Poisson sem covariaveis 44
33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44
34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45
35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem
covariaveis 46
36 DIC pD e mls para cada tipo de acidente 47
37 DIC pD e mls para acidentes tipo 1 48
38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50
39 Estatısticas resumo dos parametros do modelo P 1 8 1 53
310 Estatısticas resumo dos parametros do modelo P 1 8 16 54
311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55
312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55
313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57
314 DIC pD e mls para acidentes tipo 2 61
315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63
316 Estatısticas resumo para os parametros do modelo P 2 9 1 66
317 Estatısticas resumo para os parametros do modelo P 2 9 16 67
318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67
319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68
320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69
321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71
322 DIC pD e mls para acidentes tipo 3 73
323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74
xiv Lista de Tabelas
324 Estatısticas resumo dos parametros do modelo P 3 6 1 78
325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78
326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78
327 Modelos univariados 82
328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-
tivariado e dos modelos univariados 83
329 Correlacoes dos modelos multivariados com interacao e sem interacao
espaco-temporal 84
330 Vıtimas a 24 horas e vıtimas a 30 dias 84
331 Numero total de cada tipo de acidentes rodoviarios por ano 87
332 DIC pD e mls para cada tipo de acidente 89
333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90
334 DIC pD e mls 92
335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93
336 Estatısticas resumo dos parametros do modelo P 3 6 30 96
337 Comparacao entre a abordagem local e a global 98
A1 Estatısticas resumo de acidentes tipo 1 108
A2 Estatısticas resumo de acidentes tipo 2 108
A3 Estatısticas resumo de acidentes tipo 3 108
A4 Estatısticas resumo de acidentes tipo 1 109
A5 Estatısticas resumo de acidentes tipo 2 109
A6 Estatısticas resumo de acidentes tipo 3 109
A7 Estatısticas resumo da covariavel populacao 110
A8 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 1 115
A9 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 2 116
A10 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 3 117
A11 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 118
Lista de Figuras
1 Dez principais causas de morte no mundo 2
2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4
11 Numero de acidentes tipo 1 por concelho 12
12 Numero de acidentes tipo 2 por concelho 12
13 Numero de acidentes tipo 3 por concelho 13
14 Numero de veıculos com seguro em milhares por concelho e por ano 14
15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15
16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16
17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16
31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de
acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano
2000 41
32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de
veıculos com seguro no ano 2000 41
33 Valores estimados dos SMR1 e respetivos intervalos de confianca para
cada concelho no ano 2000 42
34 Histograma dos valores de EBI simulados e valor de EBI observado para
acidentes tipo 1 e para ano 2000 43
35 Histograma das diferencas entre as medias dos logscores 48
36 Histograma dos valores PIT ajustados para acidentes tipo 1 49
37 Box plot dos valores estimados para acidentes tipo 1 50
38 Amplitude dos intervalos para acidentes tipo 1 51
39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 1 51
310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o
ano 2000 52
xvi Lista de Figuras
311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52
312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53
313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo P 1 8 16 56
314 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo
P 1 8 16 56
315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo P 1 8 16 57
316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 6 172 58
317 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58
318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-
dos com o modelo BN 1 6 172 59
319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com
o modelo BN 1 6 172 60
320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 6 172 60
321 Histograma das diferencas entre as medias dos logscores 61
322 Histograma dos valores PIT ajustados para acidentes tipo 2 62
323 Box plot dos valores estimados para acidentes tipo 2 63
324 Amplitude dos intervalos para acidentes tipo 2 64
325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori dos acidentes tipo 2 64
326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o
ano 2000 65
327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65
328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66
329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo P 2 9 16 68
330 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
P 2 9 16 69
Lista de Figuras xvii
331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2
de 2000 a 2007 obtidos com o modelo P 2 9 16 70
332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 4 71
333 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
BN 2 9 4 71
334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 4 72
335 Histograma dos valores PIT ajustados para acidentes tipo 3 74
336 Box plot dos valores estimados para acidentes tipo 3 75
337 Amplitude dos intervalos para acidentes tipo 3 75
338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76
339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o
ano 2000 76
340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77
341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77
342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 1 79
343 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79
344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3
de 2000 a 2007 obtidos com o modelo P 3 6 1 80
345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo BN 3 6 6 81
346 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81
347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo BN 3 6 6 82
348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos univariados e com os modelos multivariados 85
349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos multivariados 86
350 Numero de acidentes tipo 1 por concelho 87
351 Numero de acidentes tipo 2 por concelho 88
xviii Lista de Figuras
352 Numero de acidentes tipo 3 por concelho 88
353 Histograma dos valores PIT ajustados para acidentes tipo 1 89
354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 9 42 90
355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 9 42 91
356 Histograma dos valores PIT justados para acidentes tipo 2 92
357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 86 94
358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 86 94
359 Histograma dos valores PIT ajustados para acidentes tipo 3 95
360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 30 96
361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo P 3 6 30 97
A1 ID dos concelhos do Norte de Portugal Continental 104
A2 ID dos concelhos do Sul de Portugal Continental 105
A3 Numero de habitantes por concelho e por ano 110
A4 Area por concelho 111
A5 Densidade populacional por concelho 111
A6 Quilometros de estrada por concelho 112
A7 Quantidade de combustıvel vendido por concelho 112
A8 Superfıcie de ocupacao urbana do solo por concelho 113
A9 Superfıcie de ocupacao industrial do solo por concelho 113
A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por
concelho 114
A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114
ldquoThe road to wisdom - Well itacutes plain and simple to express
Err and err and err again but less and less and lessrdquo
Piet Hein (1996)
Introducao
A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora
de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo
automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se
tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao
ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o
Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009
OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes
rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso
entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as
tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa
na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas
etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do
PIB mundial
A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas
necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004
para a quinta causa de morte em 2030
2 Introducao
2004
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Infecoes respiratorias
4 Doencas pulmonares
5 Diarreias
6 HIVAIDS
7 Tuberculose
8Cancro do pulmao
dos bronquios e da traqueia
9 Acidentes rodoviarios
10Recem-nascidos prematuros
e de peso baixo
HH
2030
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Doencas pulmonares
4 Infecoes respiratorias
5 Acidentes rodoviarios
6Cancro do pulmao
dos bronquios e da traqueia
7 Diabetes mellitus
8 Doencas do coracao hipertensas
9 Cancro do estomago
10 HIVAIDS
Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)
No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a
decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-
ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem
disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao
forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes
rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida
No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de
Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-
dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos
socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a
sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario
e Santos 2012)
O sistema de trafego rodoviario um subsistema do sistema de transportes e formado
por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-
fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes
rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos
correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada
e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a
deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos
Introducao 3
(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de
pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se
por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma
qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena
de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do
sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-
guranca deste sistema complexo tem consequencias devastadoras em termos humanos
sociais e economicos (Cardoso 2007)
Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta
consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos
consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-
vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma
descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-
tadas a nıvel mundial
minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-
doviaria
minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios
como um problema de saude publica
minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da
seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial
minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria
minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das
Nacoes Unidas
minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca
Rodoviaria
minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de
Acao para a Seguranca Rodoviaria
Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria
Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-
dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade
responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para
uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos
veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica
sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste
flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area
da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e
tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha
uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes
4 Introducao
projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do
trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para
veıculos tambem designada por sistemas inteligentes de transportes
A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-
volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos
30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-
tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi
progressivamente modernizado tendo sido acompanhado por um aumento do numero
de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal
terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de
toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu
aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver
na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada
a implementacao de algumas medidas especıficas
Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)
As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para
compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios
e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou
regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma
consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica
de dados de acidentes rodoviarios
Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo
pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e
Introducao 5
do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda
lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util
domınio para desenvolvimento de atividades de investigacao O ambito desta tese e
portanto a modelacao estatıstica de dados de acidentes rodoviarios
Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-
retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar
progressivamente a execucao dessas acoes foram identificados varios fatores capazes de
melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em
particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas
com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados
As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma
melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de
intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-
vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada
em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-
dos na UE (CARE - Community database on accidents on the roads in Europe) No
projeto integrado SafetyNET (European Traffic Information System - Data Colletion
and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de
informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas
principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco
e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como
ponto de partida para a modelacao estatıstica usada nesta tese
A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-
nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-
ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos
desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-
cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes
o que facilita a identificacao dos fatores causais e de intervencoes corretivas
As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-
tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial
como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy
A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-
tatıstica Em geral foram detetados varios problemas na estimacao dos parametros
de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou
desconhecidas dependencia espacial e depedencia temporal que continuam a constituir
objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-
blemas como por exemplo
1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm
6 Introducao
minus modelos lineares generalizados baseados na distribuicao de Poisson
minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia
de sobredispersao
minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado
para analisar dados de acidentes com sobredispersao e excesso de zeros
minus modelos de nıveis multiplos estruturados
minus modelos bayesianos hierarquicos
minus incorporacao de correlacao espacial e dependencia temporal nos modelos
A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao
existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada
a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre
os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos
hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem
podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li
et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar
a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais
e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais
atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004)
O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da
estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a
problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior
barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua
formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains
Monte Carlo) na computacao bayesiana
A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se
nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que
envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas
O seu crescimento ao nıvel das aplicacoes tem sido extraordinario
O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using
Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o
GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao
Introducao 7
CODA Plummer et al (2006) e ao BOA Smith (2007)
Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de
pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)
o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em
particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-
tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas
Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana
aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa
determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas
limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes
de concordancia
Todas as analises envolvidas no metodo INLA estao implementadas num programa que
pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser
descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos
hierarquicos complexos tornou-se muito mais acessıvel
Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA
Objetivos
Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-
los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca
rodoviaria em areas geograficas diferentes
Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse
tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-
pacial e depedencia temporal
Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao
Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes
nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional
Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-
place Approximations atraves da exploracao do pacote R-INLA
8 Introducao
Estrutura da tese
No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a
caracterizacao dos dados usados nesta tese
No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos
No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais
de sinistralidade rodoviaria registados em Portugal Continental
No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido
de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros
No Anexo A faz-se a caracterizacao da regiao de estudo
No CD em anexo encontram-se todos os codigos usados nesta tese
1Nocoes sobre seguranca rodoviaria
11 Risco em seguranca rodoviaria
O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores
de seguranca informativos muito importantes No entanto quando se pretende fazer
comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de
acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca
rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de
acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja
risco=numero esperado de acidentesmedida de exposicao
A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-
responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel
ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-
teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a
melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-
cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos
proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens
e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego
10 Capıtulo 1 Nocoes sobre seguranca rodoviaria
atraves do comprimento de estrada do numero de veıculos ou preferencialmente da
distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode
estar associada a populacao de risco atraves do numero de habitantes do numero de
condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas
times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco
de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia
de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-
cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o
numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para
a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande
disponibilidade de informacao desagregada o que permite analisar as especificidades de
varios grupos populacionais As restantes medidas indicadas apresentam atualmente
muitas limitacoes1
Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se
deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido
e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a
relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata
de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes
e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-
se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de
veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se
a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho
12 Caracterizacao dos dados de acidentes
Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito
e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas
sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela
gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de
exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-
tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao
usada e sobre as covariaveis usadas
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-
ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez
1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2
205-v3_finalpdf
12 Caracterizacao dos dados de acidentes 11
agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho
A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos
se encontram no litoral norte sendo consequentemente mais proximos uns dos outros
Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz
respeito a caracterizacao dos concelhos2
Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311
Total 279644 28844 8890 317378
Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR
minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo
menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT
e PSP) e da qual resultem vıtimas ou danos materiais
minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais
minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do
acidente ou no seu percurso ate a unidade de saude No perıodo em analise para
obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)
aplica-se um coeficiente multiplicativo de 114 ao numero de mortos
minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo
de hospitalizacao superior a 24 horas
minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave
minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima
minus Acidente mortal Acidente do qual resulte pelo menos um morto
minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido
grave nao tendo ocorrido qualquer morte
minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido
leve e em que nao se tenham registado mortos nem feridos graves
2ver Anexo A
12 Capıtulo 1 Nocoes sobre seguranca rodoviaria
Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes
com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes
do tipo 3 os acidentes mortais
Figura 11 Numero de acidentes tipo 1 por concelho
Figura 12 Numero de acidentes tipo 2 por concelho
12 Caracterizacao dos dados de acidentes 13
Figura 13 Numero de acidentes tipo 3 por concelho
Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero
de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de
acidentes
Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor
risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao
entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria
muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos
mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278
concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado
o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de
cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes
decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para
permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no
espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes
Isto e especialmente importante porque apesar do numero de acidentes ser relacionado
com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria
que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de
3ver Anexo A
14 Capıtulo 1 Nocoes sobre seguranca rodoviaria
trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a
variabilidade da medida de exposicao em funcao do espaco ou do tempo
13 Caracterizacao da medida de exposicao - numero
de veıculos com seguro
Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares
Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730
Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)
13 Caracterizacao da medida de exposicao 15
O numero de veıculos com seguro varia bastante de concelho para concelho como se pode
verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo
por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que
cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media
inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo
Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho
i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o
numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =
100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de
acidente rodoviario para acidentes do tipo 1ndash3
Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por
concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes
e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos
sugerindo a existencia de correlacao espacial
Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na
faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas
mais baixas
Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007
Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-
se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se
mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas
muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a
16 Capıtulo 1 Nocoes sobre seguranca rodoviaria
nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos
com taxas mais baixas
Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007
Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007
No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas
usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer
mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-
petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao
13 Caracterizacao da medida de exposicao 17
ocorre com muita frequencia com dados de contagem com muitos valores escassos e
ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou
unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas
pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes
associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso
nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando
as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante
afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e
Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas
dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem
como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-
tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de
forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e
Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004) descritos no Capıtulo 2
2Modelacao estatıstica de acidentes rodoviarios
Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram
baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados
normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido
que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-
doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia
de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma
probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre
os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-
dos de contagens sao modelos mais apropriados para este tipo de estudos
Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo
constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo
et al 2007 Cardoso 1996)
Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo
caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala
espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais
desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais
como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel
explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-
20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como
uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade
espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias
ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao
apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo
muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao
verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos
com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao
de riscos relativos em areas pequenas
No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-
dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade
de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto
deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-
mas na alocacao de fundos governamentais e no planeamento regional Determinados
atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-
cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para
areas pequenas e esta tendencia ira provavelmente continuar
Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-
vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco
relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario
num determinado concelho relativamente ao risco no paıs (Portugal Continental)
As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e
consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem
acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999
Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os
metodos tradicionais para investigar questoes importantes relacionadas com estimacao de
riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia
temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis
nao observaveis tais como clima determinadas caracterısticas da populacao entre outras
Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser
pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a
construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios
ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al
2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-
tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes
21 Modelos bayesianos hierarquicos 21
espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e
temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a
suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos
pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos
dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-
doviarios
A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma
serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia
em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-
dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes
rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem
ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade
existente no dados Noland e Quddus (2004) Elvik (2011)
A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-
melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio
que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-
blema atribuıdo a comportamentos inadequados dos condutores associados a falencias
da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de
acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA
constitui a covariavel com maior poder explicativo da variacao observada No entanto
nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas
do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por
exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de
servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel
vendido e um indicador do volume de trafego e a densidade populacional um indicador de
urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais
o numero de habitantes a area geografica a densidade populacional o comprimento de
estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao
industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao
do solo com equipamento turıstico como sera abordado no Capıtulo 4
21 Modelos bayesianos hierarquicos
O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que
o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro
θ e o segundo traduz a distribuicao a priori para o parametro θ
22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica
na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-
delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-
nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo
que p(θ) =
intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =
1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa
estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-
formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros
Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade
associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-
tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia
a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori
nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-
tribuicao a priori padrao p(θ) (Paulino et al 2003)
Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte
estrutura
1o nıvel f(y|θ) funcao de verosimilhanca
2o nıvel p(θ|φ) distribuicao a priori dos parametros
3o nıvel p(φ) distribuicao a priori dos hiperparametros
Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e
evoluindo para modelos cada vez mais complexos
O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-
creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-
vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de
acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar
esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-
dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se
Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou
sejaYit|θit sim Poisson(Eitθit)
f(yit|θit) =(Eitθit)
yiteminusEitθit
yit
Eit = nitr = nit
sumij
Yitsumij
nit
21 Modelos bayesianos hierarquicos 23
onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit
representa o numero de veıculos com seguro e θit representa o risco relativo de acidente
rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja
se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia
de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de
acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)
A funcao de versimilhanca e dada por
L(θ|y) =prodit
f(yit|θit) =prodit
(Eitθit)yiteminusEitθit
yitpropprod
θyitit e
minussumit
Eitθit
e l(θ|y) = lnL(θ|y) propsumit
yit ln θitminussumit
Eitθit O estimador de maxima verosimilhanca
do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-
dardized Mortality Ratio1 - SMR) e dado por
θit = SMRit =YitEit
(211)
Note-se que V ar(SMRit) =V ar(Yit)
E2it
=θitEit
podendo-se fazer V ar(SMRit) =θitEit
=YitE2it
Um procedimento classico usual para identificar regioes de maior risco consiste na cons-
trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR
Apesar de util este procedimento tem algumas desvantagens Note-se que em areas
com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero
de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR
podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com
muita frequencia com dados desta natureza quando as unidades espaciais de analise sao
concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao
das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit
associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser
grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram
ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de
tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida
em que a respetiva variabilidade pode ser muito grande A variancia destes valores e
1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso
24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao
grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro
estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-
minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992
Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR
tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores
estimados com menos precisao As maiores variacoes do risco relativo nao estarao em
geral associadas com variacoes do risco subjacente a medida de exposicao mas serao
apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)
Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se
que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-
dade teorica subjacente ao modelo Poisson
A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados
(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do
modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado
que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al
2008 2005)
Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-
mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos
tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao
de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das
flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto
dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se
usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico
medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial
entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao
mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)
22 Modelos nao espaciais
Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh
e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis
atraves da funcao de ligacao usada para modelar a media
ln(θit) = α+
nβsump=1
βpxitp (221)
22 Modelos nao espaciais 25
onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel
e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um
nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual
considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a
priori p = 1 2 nβ i = 1 2 N e t = 1 2 T
No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-
adequadamente capturada pelas variaveis explicativas na funcao da media condicional
Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser
distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-
tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como
ln θit = α+
nβsump=1
βpxitp + vit (222)
onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p
Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que
foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-
los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares
generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)
Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-
dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao
a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo
Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples
de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma
fechada dado que esta mistura resulta de um modelo conjugado
Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao
Poisson e na distribuicao Binomial Negativa
O modelo Poisson Lognormal surge quando se admite que
vit sim Normal(0 σ2v) (223)
A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por
f(yit θNit σ
2v) =
1
σ2v
radic2π
EitθNit
y
int infin0
eminusEitθNit e
v
(ev)yminus1eminus v2
2σ2v dev
nao havendo forma explicıta com
26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
ln θNit = α+
nβsump=1
βpxitp (224)
E[Yit] = microNit eσ2v2 = Eitθ
Nit e
σ2v2 e V ar[Yit] = microNit e
σ2v2(
1 + (eσ2v minus 1)microNit e
minusσ2v2)
O modelo Poisson-Gama ou Binomial Negativo surge quando
exp(vit) sim Gama(φ φ) (225)
A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por
f(yit θBNit φ) =
Γ(yit + φ)
Γ(φ)yit
(φ
microBNit + φ
)φ(microBNit
microBNit + φ
)yitou seja
Yit|θBNit sim BN(EitθBNit φ)
com
ln θBNit = α+
nβsump=1
βpxitp (226)
E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit
(1 +
microBNitφ
) Note-se que quando φrarrinfin o
modelo Binomial Negativo reduz-se ao modelo Poisson
Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo
podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais
um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com
av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O
parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de
dispersao
O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-
plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre
unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-
quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito
afectadas (Miranda-Moreno et al 2007 Lord et al 2008)
Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)
A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-
pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os
23 Modelos espaciais 27
riscos relativos conjuntamente como um processo espacial atraves de uma especificacao
a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-
lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco
relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados
observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada
area e a soma de duas componentes que representam fatores espaciais e nao espaciais
No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica
de interesse em cada area tem distribuicao Poisson com media especıfica de cada area
As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre
a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento
das variaveis nao-observadas como em Bernardinelli et al (1995ab)
23 Modelos espaciais
Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia
espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos
mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao
associados uma distribuicao a priori conveniente
log(θit) = α+
nβsump=1
βpxitp + si (231)
Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de
notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario
quer para os modelos baseados na distribuicao de Poisson abreviadamente designados
de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa
abreviadamente designados de modelos BN com os devidos significados
Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que
representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos
atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori
associada
log(θit) = α+
nβsump=1
βpxitp + si + vi (232)
onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-
turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e
si sao mutuamente independentes viiidsim Normal(0 σ2
v) e si|sminusi sim Normal(si σ2smi)
28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
onde o sminusi indica o vetor s com o elemento si removido si =1
mi
sumi 6=j
wijsj e a media
dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e
wij = 0 caso contrario Deste modo mi =sumi 6=j
wij e o respetivo numero de vizinhos e
σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma
s tem distribuicao conjunta
f(s) prop (σ2s)minusn2 exp
minus 1
2σ2s
sumi6=j
(si minus sj)2wij
e (σ2v)minus1 sim Gama(av bv) (σ2
s)minus1 sim Gama(as bs) com av bv as e bs conhecidos
Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial
local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo
gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991
Banerjee et al 2004)
24 Modelos espaco-temporais
Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-
tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a
aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios
e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos
com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se
definiu na seccao anterior
Modelos espaco-temporais sem interacao
Nestes modelos tem-se log(θit) = α+
nβsump=1
βpxitp + si + vi + ψt
onde se considera
ψt sim Normal(0 σ2ψ) (241)
ou
ψt sim RW (1 σ2ψ) (242)
e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ
2s σ
2v σ
2ψ mutuamente
independentes
24 Modelos espaco-temporais 29
Alternativamente log(θit) = α+
nβsump=1
βpxitp + si + vi + γt
onde se considera
γ sim Normal(0 cγ) (243)
sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ
2v mutuamente
independentes (Knorr-Held 2000)
Modelos espaco-temporais com interacao
Neste caso log(θit) = α+
nβsump=1
βpxitp + si + vi + (γ + δi)t
onde se considera alternativamente
δi sim Normal(0 σ2δ ) (244)
ou
δi sim CAR(σ2δ ) (245)
e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com
aδ bδ conhecidos e α βp σ2s σ2
v σ2δ mutuamente independentes (Bernardinelli et al
1995b)
A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando
um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de
acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de
risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia
e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de
cada area e a media global α e δi representa a diferenca entre a tendencia temporal
local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0
a tendencia temporal local da area i e menos acentuada do que a tendencia temporal
global enquanto que quando δi gt 0 e mais acentuada
Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados
neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo
nao se encontra definida uma distribuicao a priori para um parametro considera-se a
distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior
30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Tabela 21 Modelos univariados
M log(θit) Distribuicao a priori Distribuicao a priori
dos parametros dos hiperparametros
1 α+
nβsump=1
βpxitp α sim Normal(0 cα)
βp sim Normal(0 cβ)
2 α+
nβsump=1
βpxitp + vi vi sim Normal(0 σ2v) σminus2
v sim Gama(av bv)
3 α+
nβsump=1
βpxitp + si si sim CAR(σ2s) σminus2
s sim Gama(as bs)
4 α+
nβsump=1
βpxitp + vi + si
5 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2
ψ sim Gama(aψ bψ)
6 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim RW (σ2ψ)
7 α+
nβsump=1
βpxitp + vi + si + γt γ sim Normal(0 cγ)
8 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2
δ sim Gama(aδ bδ)
9 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )
25 Modelos multivariados
Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-
mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes
modelos nao consideram a interdependencia que pode existir entre os riscos relativos
dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na
variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia
para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico
tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-
son capazes de considerar a relacao entre diferentes processos de contagem tais como
contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-
25 Modelos multivariados 31
son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta
abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de
diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o
numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo
k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit
condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou
seja
Ykit|θkit sim Poisson(Ekitθkit)
Modelos espaciais multivariados
1)log θkit = αk +
nβsump=1
βpxitp + ski
com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs
conhecidos
Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)
e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios
ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K
tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-
bilidade assume que a estrutura de associacao se separa numa componente nao espacial
e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta
de s e
s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)
Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)
D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de
vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK
definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre
os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao
espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se
o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo
improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou
modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin
et al (2005) Lawson (2009) Waller e Carlin (2010)
Para alem do modelo 1 foram implementados os modelos multivariados seguintes no
WinBUGS
32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)
3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)
4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e
dδ Rδ conhecidos
mas apenas se obteve convergencia para os modelos 1 e 4
Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =
bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =
001 0 0
0 001 0
0 0 001
26 Metodos de inferencia
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e
computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas
abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)
consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-
ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino
e Rue (2010a)
261 INLA
O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-
siana aproximada numa subclasse de modelos de regressao estruturados aditivamente
nomeadamente em modelos latentes gaussianos
Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z
que representa todas as componentes nao observaveis com distribuicao a priori Normal
Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-
mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-
buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia
exponencial A media microi de cada componente e relacionada com um preditor aditivo
estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor
incorpora aditivamente os efeitos de varias componentes
26 Metodos de inferencia 33
ηi = α+
nfsumj=1
f (j)(uij) +
nβsump=1
βpxip + εi (261)
onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-
cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u
podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis
contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-
torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos
podem ser representados atraves das funcoes f (j)()
Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-
mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por
suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a
priori dos hiperparametros nao tem de ser gaussianas
Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-
dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto
de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF
Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel
aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e
Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6
embora possa haver excecoes
Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro
nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos
parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-
sume que os dados observados sao condicionalmente independentes dado o campo latente
z tem-se que
f(y|xφ) =prodi
f(yi|ziφ)
Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca
do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos
φ
A distribuicao a posteriori e dada por
p(zφ|y) prop p(φ)p(z|φ)prodi
f(yi|ziφ) (262)
Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e
analiticamente tratavel
Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao
34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao
analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e
possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa
pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como
tempo computacional longo possibilidade de as amostras simuladas dos parametros se-
rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte
Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser
particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori
entre as componentes espacial ou espaco-temporal do campo latente
Em contraste o metodo de aproximacao INLA e apresentado como um metodo que
fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-
vamente pouco tempo
No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes
marginais a posteriori dos parametros de interesse
As distribuicoes marginais a posteriori pretendidas sao
p(zi|y) =
intφ
p(zi|φy)p(φ|y) dφ (263)
e
p(φj |y) =
intφj
p(φ|y) dφminusj (264)
A aproximacao de p(zi|y) e determinada usando a soma finita
p(zi|y) =sumk
p(zi|φky)p(φk|y)∆k (265)
onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-
vamente Esta soma e calculada por integracao numerica em pontos suporte φk com
pesos apropriados ∆k
A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e
obtida atraves da aproximacao de Laplace
p(φ|y) prop p(zφy)
pG(z|φy)
∣∣z=zlowast(φ) (266)
onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-
cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao
corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)
De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade
a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes
26 Metodos de inferencia 35
pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste
basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior
quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste
em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a
estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)
Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a
estrategia CCD a estrategia por omissao no R-INLA
Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a
aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace
simplificada
A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter
a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))
onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia
marginal Os autores referem que apesar de muito conveniente ao nıvel computacional
pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de
simetria das distribuicoes a posteriori marginais quer a ambos nıveis
Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais
demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-
place semelhante a 266 a p(zi|φy)
pLA(zi|φy) prop p(zφy)
pGG(zminusi|ziφy)
∣∣∣zminusi=zlowastminusi(ziφ) (267)
No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-
nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes
numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de
Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo
menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada
uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-
trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e
simetria Para mais detalhes ver Rue et al (2009)
Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre
os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao
de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos
O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-
parametros entre outras No entanto o seu potencial e reconhecidamente enorme e
encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-
tensoes com muita frequencia
36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
27 Ajustamento e medidas preditivas
Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o
criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio
combina uma medida de adequabilidade a media a posteriori da desvianca D com
uma medida de complexidade o numero efetivo de parametros pD sendo dado por
DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-
promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no
WinBUGS quer no R-INLA
No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos
aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-
vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive
Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-
tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle
e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-
delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para
detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)
As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)
p(yminusi)=
intf(yi|θyminusi)p(θ|yminusi) dθ
e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores
CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para
efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de
calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou
grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito
diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de
dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem
uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este
problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim
pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =
yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma
forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem
ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)
Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a
0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa
por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira
a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da
concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de
27 Ajustamento e medidas preditivas 37
referencia
Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls
(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))
ntimes T Esta medida e muito
utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os
valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo
3Aplicacoes
Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios
ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os
resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo
de aproximacao INLA atraves do R-INLA
Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-
sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel
usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos
no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao
apresentados os resultados obtidos no WinBUGS
Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a
analise individual de cada ano comparando-se os varios modelos e os resultados obtidos
no WinBUGS e no R-INLA tendo havido concordancia
Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial
40 Capıtulo 3 Aplicacoes
31 Associacao espacial
A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-
doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco
como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter
uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas
determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes
entre areas de maior risco e potenciais fatores
Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-
racterısticas que revelam alguns dos seus problemas Para alem da concentracao de
concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito
diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de
veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a
uma pequena mudanca no numero de acidentes
Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-
rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa
global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com
feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0
e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes
valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no
de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida
ao acaso pois os concelhos possuem condicoes identicas
Tendo em conta que o numero de veıculos com seguro varia muito por concelho este
comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-
ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem
medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito
instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis
ja que possuem variancias muito diferentes
A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura
31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero
de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro
para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas
versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em
2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho
da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com
tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que
assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se
31 Associacao espacial 41
ter uma percecao dessa variabilidade em cada concelho
Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000
Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000
42 Capıtulo 3 Aplicacoes
Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000
A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem
a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir
uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de
contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz
de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma
fronteira e wij = 0 caso contrario
As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e
o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em
areas pequenas em que o tamanho da medida de exposicao e diferente de area para
area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta
questao foram desenvolvidas diversas propostas alternativas para dados com populacoes
heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em
conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se
o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por
EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma
estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa
os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes
empırica da media marginal padronizado pela estimativa do desvio padrao da taxa
Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros
sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI
tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao
32 Modelos 43
do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao
aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de
EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado
no R atraves do pacote spdep e da funcao EBImoranmc()
Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano
Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859
Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000
Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente
por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos
testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo
p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na
Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para
acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao
espacial
32 Modelos
Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais
espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos
modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo
uma vez que forneceram melhores resultados como se pode verificar comparando os
valores das Tabelas 32mdash35
Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA
44 Capıtulo 3 Aplicacoes
No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo
da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo
A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos
de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente
pela analise dos resultados com o programa CODA do R (Plummer et al 2006)
No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-
tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada
computacionalmente menos intensa
Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266
P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205
P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204
P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204
Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 1 2063493 188 464 1351516 170 304 988082 169 222
BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201
BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201
BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201
As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos
espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos
com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo
Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial
Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3
1referente a Tabela 21
33 Modelos espaco-temporais 45
Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior
a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a
diferenca entre o numero de parametros e muito grande
No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos
os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero
correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se
pode ver mais adiante quando se usam os modelos espaco-temporais este problema e
ultrapassado
Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao
menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos
os tipos de acidentes
33 Modelos espaco-temporais
De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para
estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-
mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se
reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre
muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21
Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191
P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191
P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192
P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192
P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192
Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor
modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para
2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso
46 Capıtulo 3 Aplicacoes
o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela
35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo
1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash
e para o tipo 3 o modelo 6 mdash BN 3 6
Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191
BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191
BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192
BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193
BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193
Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e
do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores
sao os modelos Poisson
331 Associacao regional
Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao
geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar
informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-
plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos
nos riscos de acidentes
Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes
em milhares de habitantes P a area em centenas de km2 A a densidade populacional em
centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade
de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU
a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques
urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do
solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se
valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST
os valores sao por concelho e iguais em todos os anos
33 Modelos espaco-temporais 47
332 Selecao dos modelos
Foram implementados todos os modelos com todas as combinacoes entre as covariaveis
mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de
acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram
escolhidos os seguintes modelos
Tabela 36 DIC pD e mls para cada tipo de acidente
Tipo P DIC pD mls BN DIC pD mls
1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418
2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260
3 3 6 4 846237 20562 191 3 6 6 852362 19267 191
Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais
P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e
Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU
e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash
modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP
mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI
e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash
modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6
com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos
Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para
cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e
nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao
relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os
valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921
e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo
sao relativamente pequenas 961 594 e 076 respetivamente
Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao
contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis
covariaveis significativas e respetiva contribuicao para os resultados Assim fica para
trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais
significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em
48 Capıtulo 3 Aplicacoes
particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)
e uma covariavel considerada muito importante na modelacao estatıstica de acidentes
rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao
nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica
designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos
hoteleiros
333 Modelos para acidentes do tipo 1
Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172
log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t
e
log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t
No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente
para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos
de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem
o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o
zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor
HPD que contem o zero considera-se que a covariavel nao contribui significativamente
para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso
contrario considera-se que a covariavel contribui significativamente para a explicacao
da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado
que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124
obtendo-se o modelo Poisson 1 8 16 ou seja
log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t
Tabela 37 DIC pD e mls para acidentes tipo 1
Modelo DIC pD mls
P 1 8 1 1940548 47786 458
P 1 8 16 1939877 47789 458
BN 1 6 1 1861278 25154 419
BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
33 Modelos espaco-temporais 49
No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as
covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se
manter as covariaveis no modelo
334 Validacao dos modelos para acidentes do tipo 1
Validacao do modelo P 1 8 16 e do modelo BN 1 6 172
Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172
Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do
que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela
37 O valor da media do logscore tambem e significativamente menor de acordo com
o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores
PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O
valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo
BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes
sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do
tipo 1
335 Resultados obtidos com modelos para acidentes do tipo 1
Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172
A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um
efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma
50 Capıtulo 3 Aplicacoes
diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo
1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16
e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo
BN 1 6 172
Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172
Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max
SMR1 00000 07512 09656 10020 12360 32610
RR1 8 1 02290 07728 09663 09989 11870 28890
RR1 8 16 02274 07722 09628 09979 11860 28770
RR1 6 1 02886 07807 09599 10010 11890 24480
RR1 6 172 02852 07798 09589 09999 11870 24400
Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de
33 Modelos espaco-temporais 51
confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-
bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com
os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-
nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172
Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172
Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados
52 Capıtulo 3 Aplicacoes
os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo
P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000
Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para
o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312
se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de
33 Modelos espaco-temporais 53
suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos
erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais
Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000
Relativamente a introducao das covariaveis comprimento de estrada e quantidade de
combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia
dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis
explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao
explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados
espacialmente
Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1
Efeitos fixosmedia dp 0025q 0975q
α1 00580 00074 00435 00723
γ1 -00263 00030 -00321 -00204
Variancia dos efeitos aleatorios
σ2s1 05816 00591 04706 07001
σ2δ1
00019 00002 00015 00023
Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1
54 Capıtulo 3 Aplicacoes
mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-
plicacao da variacao associada aos efeitos temporais
Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel
vendido influenciam significativamente a variacao geografica dos riscos relativos sao
consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem
de forma positiva para a variacao os riscos o que significa que em regioes com maior
comprimento de estrada e em regioes com maior quantidade de combustıvel vendido
esta associado um aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16
Efeitos fixosmedia dp 0025q 0975q
α1 -00898 00354 -01595 -00207
b1C 00016 00004 00008 00024
b1V C 00003 00001 00002 00005
γ1 -00257 00030 -00315 -00198
Variancia dos efeitos aleatorios
σ2s1 05492 00560 04440 06615
σ2δ1
00019 00002 00015 00023
No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada
do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da
ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos
espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-
buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou
efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves
dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos
temporais σ2ψ1
se mantem o que implica que as covariaveis nao contribuem para a ex-
plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o
modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao
e significativa
Mais uma vez as covariaveis que influenciam significativamente a variacao geografica
dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-
variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que
33 Modelos espaco-temporais 55
regioes com maior comprimento de estrada regioes com maior ocupacao de solo com
equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento
turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos
os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-
mente para a estimacao dos riscos o que significa que em regioes com maior numero de
habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo
fixos todos os restantes efeitos
Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1
Efeitos fixosmedia dp 0025q 0975q
α1 -00429 00052 -00595 -00389
Parametro de dispersao φminus11 00298 00017 00267 00332
Variancia dos efeitos aleatorios
σ2s1 02603 00266 02108 03142
σ2ψ1
00090 00057 00029 00237
Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172
Efeitos fixosmedia dp 0025q 0975q
α1 -01348 00243 -01826 -00872
b1C 00013 00003 00007 00019
b1P -00135 00044 -00221 -00049
b1OSEUP 00001 000008 -000005 00003
b1OST 00001 000006 -0000003 00002
Parametro de dispersao φminus11 00300 00017 00269 00334
Variancia dos efeitos aleatorios
σ2s1 02438 00254 01966 02951
σ2ψ1
00090 00056 00029 00235
Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente
56 Capıtulo 3 Aplicacoes
espacial contribui fortemente para a variacao geografica do risco relativo O padrao e
muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes
com maior risco relativo estimado correspondem as regioes em que as estimativas dos
efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-
dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo
proximo de um correspondem as regioes em que as estimativas de si sao proximas de
zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade
HPD nao contem o zero e 633 para o modelo P 1 4 16
Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16
Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16
33 Modelos espaco-temporais 57
A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0
eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao
longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio
anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta
tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores
correspondente a diminuicao das estimativas dos riscos ao longo dos anos
Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16
Min 1oQ Mediana Media 3oQ Max
δ1 -00919 -00254 -00476 00768 00197 00133
eδ1 09125 09751 09954 10010 10200 11420
Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16
Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de
credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1
a tendencia temporal local e maior que a tendencia global sendo o decrescimento do
numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia
58 Capıtulo 3 Aplicacoes
temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia
temporal local e menor do que a global sendo o decrescimento mais acentuado No
mapa da Figura 315 pode ver-se a distribuicao destes concelhos
Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um
sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada
na Tabela A8 do Anexo A
Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172
Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172
Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos
mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial
33 Modelos espaco-temporais 59
contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado
e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com
menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si
sao proximas de zero Para este modelo a percentagem de estimativas dos valores de
s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente
a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos
seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais
acentuado nos cinco anos seguintes
Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172
Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo
BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um
aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os
restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-
gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos
estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel
contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i
no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54
Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a
percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento
turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como
os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de
60 Capıtulo 3 Aplicacoes
(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo
da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel
OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com
equipamentos turısticos vai de 0 a 038
Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172
Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172
Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior
33 Modelos espaco-temporais 61
que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos
com risco relativo significativamente maior que um
336 Modelos para acidentes do tipo 2
Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192
log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +
b2DPDP2it + s2i + (γ2 + δ2i)t
e
log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t
No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente
das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519
pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo
Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o
modelo P 2 9 16 ou seja
log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t
No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-
variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e
pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-
delo BN 2 9 4 ou seja
log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t
Tabela 314 DIC pD e mls para acidentes tipo 2
modelo DIC pD mls
P 2 9 1 1170386 35334 270
P 2 9 16 1169631 35476 270
BN 2 9 1 1156921 29101 261
BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
62 Capıtulo 3 Aplicacoes
337 Validacao dos modelos para acidentes do tipo 2
Validacao do modelo P 2 9 16 e do modelo BN 2 9 4
Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4
Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-
ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual
a 13956 O valor da media do logscore tambem e significativamente menor de acordo
com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos
valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura
322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para
o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes
sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do
tipo 2
338 Resultados obtidos com modelos para acidentes do tipo 2
Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4
A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as
estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre
um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das
estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados
a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores
esperados a posteriori obtidos com o modelo BN 2 9 4
33 Modelos espaco-temporais 63
Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4
Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os
modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max
SMR2 00000 05062 09180 11830 15740 87830
RR2 9 1 02237 06553 09651 11910 14980 77550
RR2 9 16 02218 06547 09624 11860 14970 77060
RR2 9 1 nb 02391 06636 09751 11870 14960 59240
RR2 9 4 nb 02363 06630 09720 11810 14850 59030
64 Capıtulo 3 Aplicacoes
Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo
P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes
33 Modelos espaco-temporais 65
do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000
Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000
66 Capıtulo 3 Aplicacoes
Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000
Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das
covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo
Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja
as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos
sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito
espacial
Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03511 00191 03135 03883
γ2 -00844 00037 -00918 -00771
Variancia dos efeitos aleatorios
σ2s2 09474 01054 07554 11648
σ2δ2
00099 00016 00070 00133
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-
plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao
33 Modelos espaco-temporais 67
para a variacao geografica das estimativas dos riscos e positiva em regioes com maior
comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao
para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos
Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16
Efeitos fixosmedia dp 0025q 0975q
α2 01790 00530 00741 02822
b2C 00020 00005 00009 00031
b2V C -00004 00003 -00010 00003
γ2 -00833 00038 -00906 -00759
Variancia dos efeitos aleatorios
σ2s2 09162 01019 07325 11282
σ2δ2
00099 00016 00015 00135
Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com
a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos
efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma
efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam
incluıdos no modelo P 2 9 1 atraves do efeito espacial
Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03529 00223 03090 03965
γ2 -00819 00044 -00906 -00733
Parametro de dispersao φminus11 00577 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07824 00925 06156 09748
σ2δ2
00051 00012 00031 00079
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
68 Capıtulo 3 Aplicacoes
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao
associada aos efeitos temporais Para alem disso como a contribuicao para a variacao
geografica das estimativas dos riscos e positiva em regioes com maior comprimento de
estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos
os restantes efeitos
Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4
Efeitos fixosmedia dp 0025q 0975q
α2 01961 00530 00741 02822
b2C 00017 00005 00008 00027
γ2 -00814 00044 -00900 -00727
Parametro de dispersao φminus11 00576 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07516 00894 05914 09385
σ2δ2
00052 00013 00031 00080
Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16
33 Modelos espaco-temporais 69
Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode
verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o
padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado
correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as
regioes com menor risco relativo estimado correspondem as regioes em que as estimativas
de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes
em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem
de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero
e 608
Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era
esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou
seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem
de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295
Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16
Min 1oQ Mediana Media 3oQ Max
δ2 -01805 -00411 00082 00003 00485 01532
eδ2 08358 09604 10090 10030 10500 11660
No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se
que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia
70 Capıtulo 3 Aplicacoes
temporal local maior do que a global e um decrescimento no numero de acidentes do tipo
2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local
menor que a global e um decrescimento mais acentuado
Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16
E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um
obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um que permite complementar esta informacao
Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-
temente para a variacao geografica do risco relativo como se pode observar no mapa da
Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-
mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes
com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao
proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i
cujo intervalo de credibilidade HPD nao contem o zero e 5665
33 Modelos espaco-temporais 71
Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4
Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4
Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4
Min 1oQ Mediana Media 3oQ Max
δ1 -01530 -00368 00052 00001 00402 01140
eδ1 08592 09646 10060 10020 10420 11210
72 Capıtulo 3 Aplicacoes
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca
no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de
78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de
valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa
da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a
global sendo o seu decrescimento menos acentuado que o decrescimento global havendo
uma minoria onde se passa o contrario
Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4
Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior
que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao
com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista
ordenada dos primeiros quinze concelhos
33 Modelos espaco-temporais 73
339 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6
log(θ3ij) = α3 + b3CCi + s3i + ψ3t
e
log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t
No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a
covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo
P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1
log(θ3ij) = α3 + s3i + ψ3t
No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade
populacional nao contem o zero por isso o modelo mantem-se
Tabela 322 DIC pD e mls para acidentes tipo 3
modelo DIC pD mls
P 3 6 1 846290 20551 191
P 3 6 4 846237 20562 191
BN 3 6 1 852438 19770 191
BN 3 6 6 852362 19267 191
3310 Validacao dos modelos para acidentes do tipo 3
Validacao do modelo P 3 6 1 e do modelo BN 3 6 6
Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e
menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072
Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos
valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia
preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo
74 Capıtulo 3 Aplicacoes
ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se
que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3
Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6
3311 Resultados obtidos com modelos para acidentes do tipo 3
Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6
Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max
SMR3 00000 04639 11050 15100 20490 156700
RR3 6 1 01363 08869 13050 14900 18430 95400
RR3 6 6 bn 01247 09020 13170 14850 18370 87310
Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo
obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-
vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores
esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos
valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e
Tabela 323
33 Modelos espaco-temporais 75
Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6
Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6
Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-
76 Capıtulo 3 Aplicacoes
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os
modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6
Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000
Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo
P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
33 Modelos espaco-temporais 77
Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000
Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem
comentarios acerca de associacao regional para este modelo
78 Capıtulo 3 Aplicacoes
No modelo BN observa-se que com a introducao da covariavel densidade populacional o
valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da
variancia dos efeitos temporais σ2ψ1t
se mantem Tabelas 325 e 326
Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02114 00152 01815 02410
Variancia dos efeitos aleatorios
σ2s3 06817 00802 05383 08499
σ2ψ3
00255 00157 00082 00660
Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02155 00158 01842 02464
Parametro de dispersao ψminus11 00455 00061 00348 00584
Variancia dos efeitos aleatorios
σ2s3 06497 00800 05070 08174
σ2ψ3
00255 00161 00081 00672
Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6
Efeitos fixosmedia dp 0025q 0975q
α3 02791 00217 02362 03215
bDP -00199 00048 -00294 -00105
Parametro de dispersao φminus11 00459 00061 00350 00588
Variancia dos efeitos aleatorios
σ2s3 05855 00749 04532 07440
σ2ψ3
00255 00161 00081 00672
Tal significa que a covariavel densidade populacional contribui para a explicacao da
33 Modelos espaco-temporais 79
variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao
da variacao temporal A contribuicao da covariavel densidade populacional e negativa
o que indica que em regioes com maior densidade populacional ocorre a contribuicao
para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos
No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a
sobredispersao nao e significativa
Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1
Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1
80 Capıtulo 3 Aplicacoes
O padrao espacial das estimativas do risco relativo e das estimativas da componente
espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras
342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao
positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos
efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem
o zero e 439 para o modelo P 3 6 1
No que respeita a componente temporal observa-se um decrescimento nos dois primeiros
anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento
nos ultimos cinco anos
Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1
Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco
relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a
lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-
tivamente maior que um na Tabela A9 do Anexo A
33 Modelos espaco-temporais 81
Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6
Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6
Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os
padroes revelados pelos mapas As regioes com maior contribuicao da componente es-
pacial para o aumento do risco relativo correspondem em geral a regioes com maiores
estimativas de risco relativo Tal significa que a componente espacial explica grande parte
da variacao das estimativas do risco relativo A percentagem de estimativas dos valores
de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1
82 Capıtulo 3 Aplicacoes
Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6
A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo
modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode
ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se
pode encontrar uma lista ordenada dos primeiros quinze concelhos
Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se
apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista
o tipo de interacao espaco-temporal
Tabela 327 Modelos univariados
Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal
1 BN 1 6 172 C+P+OSEPU+OST RW mdash
2 BN 2 9 4 C fixo CAR
3 P 3 6 1 mdash RW mdash
34 Modelos multivariados 83
34 Modelos multivariados
Os modelos multivariados usados foram
log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)
log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)
Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-
tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito
complexos nao parece haver um ganho substancial em usa-los
Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados
Modelos multivariados Modelos univariados
Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q
α1 00565 00181 00214 00914 00580 00074 00435 00723
α2 03423 00344 02735 04083 03511 00191 03135 03883
α3 05993 00331 05340 06644 06633 00247 06147 07115
γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204
γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771
γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907
Σu =
05551 03843 05519
03843 1042 05864
05519 05864 09113
Σδ =
00074 00035 00061
00035 00111 00059
00061 00059 00081
No entanto e interessante verificar que em termos de correlacao entre as estimativas
dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo
2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao
que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios
nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e
tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no
numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330
84 Capıtulo 3 Aplicacoes
Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal
Modelos com interacao Modelos sem interacao
media dp 0025q 0975q media dp 0025q 0975q
ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669
ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879
ρ23(θ) 06793 00242 06304 07252 06831 002647 07326
ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196
ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941
ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976
ρ12(δ) 03823 00894 01960 05465
ρ13(δ) 07979 00634 06487 08998
ρ23(δ) 06203 00938 04153 07829
Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias
AnoVıtimas mortais Feridos graves Feridos leves
24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif
2010 741 937 196 2637 2475 -162 43924 43890 -34
2011 689 891 202 2436 2265 -171 39726 39695 -31
34 Modelos multivariados 85
Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados
86 Capıtulo 3 Aplicacoes
Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
35 Aplicacao para acidentes rodoviarios nas estradas
secundarias
Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-
cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram
retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-
damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior
risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do
poder local
Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840
Total 175741 16909 3471 196121
Figura 350 Numero de acidentes tipo 1 por concelho
88 Capıtulo 3 Aplicacoes
Figura 351 Numero de acidentes tipo 2 por concelho
Figura 352 Numero de acidentes tipo 3 por concelho
No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados
Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89
de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos
Tabela 332 DIC pD e mls para cada tipo de acidente
Modelo DIC pD mls
BN 1 9 42 1614530 32359 363
BN 2 9 246 924765 27530 208
P 3 6 30 581058 11747 131
351 Modelo para acidentes do tipo 1
Modelo Binomial Negativo 1 9 42
log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t
Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a
variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do
modelo
352 Validacao do modelo para acidentes do tipo 1
Validacao do modelo BN 1 9 42
Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42
O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-
pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O
90 Capıtulo 3 Aplicacoes
valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem
um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-
ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42
e o melhor modelo para acidentes do tipo 1
353 Resultados obtidos com o modelo para acidentes do tipo 1
Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42
Efeitos fixosmedia dp 0025q 0975q
α1 -03518 00346 -04202 -02843
b1C 00012 00004 00005 00019
b1OST 00001 000007 -000005 00002
γ1 -00128 00026 -00179 -00077
Parametro de dispersao φminus11 00287 00021 00248 00328
Variancia dos efeitos aleatorios
σ2s1 03982 00445 03180 04909
σ2δ1
00026 00007 00015 00040
Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91
As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico
influenciam significativamente a variacao geografica dos riscos relativos e portanto sao
consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de
forma positiva para a variacao dos riscos o que significa que em regioes com maior
comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma
contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes
efeitos
Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-
derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura
temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao
envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial
se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de
risco relativo Figuras 354 e 316
Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42
Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco
relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um
92 Capıtulo 3 Aplicacoes
354 Modelo para acidentes do tipo 2
Modelo Binomial Negativo 2 9 246
log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +
s2i + (γ2 + δ2i)t2
Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de
todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938
pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e
manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja
log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2
Tabela 334 DIC pD e mls
Modelo DIC pD mls
BN 2 9 86 924868 24786 208
355 Validacao do modelo para acidentes do tipo 2
Validacao do modelo BN 2 9 86
Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86
O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo
Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93
do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto
proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e
95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor
modelo para acidentes do tipo 2
356 Resultados obtidos com o modelo para acidentes do tipo 2
Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86
Efeitos fixosmedia dp 0025q 0975q
α2 -01198 00480 -02147 -00266
b1OSI 00002 000008 000007 00004
b1OSEPU 00003 00002 000001 00006
b1DP 00084 00066 -00046 00215
γ1 -01198 00480 -02147 -00266
Parametro de dispersao
φminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 10557 01336 08161 13345
σ2δ1
00094 00023 00057 00147
A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-
nos e a densidade populacional influenciam significativamente a variacao geografica dos
riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-
variaveis contribuem de forma positiva para a variacao dos riscos o que significa que
em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo
com equipamentos e parques urbanos e a regioes com maior densidade populacional ha
contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes
do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a
mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao
Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que
os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos
94 Capıtulo 3 Aplicacoes
concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns
conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas
do risco relativo sao os mesmos
Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86
Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95
A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com
o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que
consta na Tabela A11
357 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 30
log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt
Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU
contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo
358 Validacao do modelo para acidentes do tipo 3
Validacao do modelo P 3 6 30
Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30
Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da
distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-
mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores
igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva
e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para
acidentes do tipo 3
96 Capıtulo 3 Aplicacoes
359 Resultados obtidos com o modelo para acidentes do tipo 3
Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30
Efeitos fixosmedia dp 0025q 0975q
α2 00104 00520 -00923 01117
b3A 00258 00116 00031 00049
b3OSEPU -00001 00001 -00004 000006
Parametro de dispersao
ψminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 03598 00687 02422 05084
σ2ψ1
00246 00163 0007 00666
Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30
A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam
significativamente a variacao geografica dos riscos relativos sendo consideradas na es-
timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97
a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial
em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes
com maior area geografica ha uma contribuicao para o aumento das estimativas do risco
relativo mantendo fixos todos os restantes efeitos
O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de
trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-
trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico
mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No
entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos
Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30
E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo
modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que
consta na Tabela A11
Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-
mente a abordagem global e a abordagem local
98 Capıtulo 3 Aplicacoes
Tabela 337 Comparacao entre a abordagem local e a global
Abordagem Tipo Melhor Covariaveis Efeito Interacao
Modelo temporal espaco-temporal
Local 1 BN 1 9 42 C+OST fixo CAR
Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash
Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR
Gloal 2 BN 2 9 4 C fixo CAR
Local 3 P 3 6 30 A+OSEUP aleatorio mdash
Global 3 P 3 6 1 mdash aleatorio mdash
4Discussao e conclusoes
Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia
de dependencia espacial de tendencia temporal e de associacao regional em dados de
acidentes rodoviarios
Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-
delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por
areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar
diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao
espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel
recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados
com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de
trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de sobredispersao de associacao posi-
tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-
mentos e parques urbanos e uma associacao regional negativa com a populacao
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
100 Capıtulo 4 Discussao e conclusoes
bredispersao e de associacao regional positiva com o comprimento de estrada
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente
Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com o comprimento de estrada e com
a area de ocupacao do solo para turismo
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com a area de ocupacao de solo para
a industria com a area de ocupacao do solo com equipamentos e parques urbanos
e com a densidade populacional
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente de associacao regional
positiva com a area e de associacao regional negativa com a area de ocupacao de
solo com equipamentos e parques urbanos
Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-
se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas
Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com
interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao
do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido
o modelo Poisson com efeito temporal aleatorio
Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos
modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-
tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se
capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes
espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-
formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que
as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto
e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas
as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de
valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais
elevados diminuiram ou seja os valores extremos foram suavizados
101
Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos
dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-
gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi
possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia
temporal global Este e um tipo de resultado muito importante na fase de aplicacao
pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter
exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas
Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-
minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as
covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam
incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-
fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal
Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores
usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal
considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para
todos os anos em estudo
Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos
mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-
pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a
ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-
cativamente maior que um bem como as dos concelhos com valores consideravelmente
menores do que a unidade
Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-
timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises
por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-
pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de
estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-
nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o
TDMA de modo a introduzi-las no modelo
Os modelos multivariados constituiram um esforco computacional elevado nao tendo
havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises
comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi
possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes
tipos de acidentes
Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves
do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo
uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-
ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA
102 Capıtulo 4 Discussao e conclusoes
pela extrema concordancia de resultados pela facilidade de implementacao dos modelos
pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez
de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem
duvida muito mais acessıvel
Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-
dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de
um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-
patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de
recolha e definicao das variaveis de interesse A implementacao estes modelos tambem
pode ser efetuada atraves do R-INLA
Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir
como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-
dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite
efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-
gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade
dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas
geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios
constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel
mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-
sabilidade de todosrdquo
ACaracterizacao da regiao de estudo
A1 Portugal Continental
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes
administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados
em 18 distritos
O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a
partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na
pagina do Instituto Geografico Portugues - httpwwwigeopt
A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o
map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-
hancas no WinBUGS
104 Apendice A Caracterizacao da regiao de estudo
Figura A1 ID dos concelhos do Norte de Portugal Continental
A1 Portugal Continental 105
Figura A2 ID dos concelhos do Sul de Portugal Continental
106 Apendice A Caracterizacao da regiao de estudo
A1 Portugal Continental 107
108 Apendice A Caracterizacao da regiao de estudo
A2 Numero de acidentes
Tabela A1 Estatısticas resumo de acidentes tipo 1
Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200
Tabela A2 Estatısticas resumo de acidentes tipo 2
Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800
Tabela A3 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100
A2 Numero de acidentes 109
Numero de acidentes que ocorreram nas estradas secundarias
Tabela A4 Estatısticas resumo de acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900
Tabela A5 Estatısticas resumo de acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800
Tabela A6 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700
110 Apendice A Caracterizacao da regiao de estudo
A3 Covariaveis
bull Populacao - P
Tabela A7 Estatısticas resumo da covariavel populacao
Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700
Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)
A3 Covariaveis 111
bull Area - A
Figura A4 Area em centenas de km2 por concelho (Fonte INE)
bull Densidade Populacional - DP
Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)
112 Apendice A Caracterizacao da regiao de estudo
bull Comprimento de Estrada - C
Figura A6 Quilometros de estrada por concelho (Fonte EP)
bull Quantidade de combustıvel vendido - VC
Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)
A3 Covariaveis 113
bull Ocupacao urbana do solo - OSU
Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
bull Ocupacao industrial do solo - OSI
Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)
114 Apendice A Caracterizacao da regiao de estudo
bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU
Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)
bull Ocupacao do solo com equipamento turıstico - OST
Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
A4 15 concelhos 115A
415
con
celh
os
Tab
ela
A8
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o1
Mold
elo
P1
816
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alb
ergaria
-a-V
elh
a3
Castro
Marim
Alc
acer
do
Sal
Grandola
Castro
Marim
Castro
Marim
Castro
Marim
Alb
ergaria
-a-V
elh
aV
ouzela
4A
lcacer
do
Sal
Castro
Marim
Castro
Marim
Grandola
Grandola
Alb
ergaria
-a-V
elh
aC
astro
Marim
Alc
acer
do
Sal
5V
izela
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
Vila
Velh
ade
Rodao
Pedrogao
Grande
6C
ondeix
a-a
-Nova
Azam
buja
Azam
buja
Azam
buja
Obid
os
Penela
Penela
Vila
Velh
ade
Rodao
7A
zam
buja
Viz
ela
Alj
ezur
Obid
os
Penela
Obid
os
Alj
ezur
Penela
8Silves
Alj
ezur
Obid
os
Condeix
a-a
-Nova
Azam
buja
Grandola
Obid
os
Alj
ezur
9A
lbufe
ira
Silves
Pom
bal
Pom
bal
Pom
bal
Vila
Velh
ade
Rodao
Pedrogao
Grande
Obid
os
10
Alj
ezur
Obid
os
Palm
ela
Penela
Alb
ergaria
-a-V
elh
aP
om
bal
Vouzela
Castro
Marim
11
Palm
ela
Pom
bal
Benavente
Palm
ela
Condeix
a-a
-Nova
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oE
sposende
12
Benavente
Benavente
Silves
Benavente
Vila
Velh
ade
Rodao
Azam
buja
Pom
bal
Montem
or-o
-Velh
o13
Pom
bal
Palm
ela
Penela
Vagos
Benavente
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
Tabua
14
Obid
os
Alb
ufe
ira
Olh
ao
Silves
Palm
ela
Condeix
a-a
-Nova
Esposende
Oliveir
ado
Bair
ro
15
Marin
ha
Grande
Olh
ao
Vagos
Olh
ao
Montem
or-o
-Velh
oP
edrogao
Grande
Tabua
Cham
usca
Mold
elo
BN
16
172
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
3C
astro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
4G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
5O
bid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
6C
ondeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
7A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
8P
om
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
9B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
10
Penela
Penela
Penela
Penela
Penela
Penela
Penela
Penela
11
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
12
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
13
Palm
ela
Alb
ergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
a14
Alb
ergaria
-a-V
elh
aP
alm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
15
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
o
116 Apendice A Caracterizacao da regiao de estudo
Tab
ela
A9
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o2
Modelo
P2
916
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ouriq
ue
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Alj
ustrel
4A
lcacer
do
Sal
Alc
acer
do
Sal
Avis
Nis
aO
urem
Nis
aA
ljustrel
Avis
5A
vis
Avis
Alc
acer
do
Sal
Rio
Maio
rN
isa
Alj
ustrel
Nis
aM
ourao
6C
ham
usca
Nis
aN
isa
Alj
ezur
Alc
acer
do
Sal
Mourao
Mourao
Nis
a7
Santarem
Cham
usca
Alj
ezur
Alc
acer
do
Sal
Alj
ustrel
Pedrogao
Grande
Pedrogao
Grande
Pedrogao
Grande
8V
ila
Nova
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rA
lcacer
do
Sal
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
da
Barquin
ha
da
Barquin
ha
9N
isa
Santarem
Vila
Nova
Pedrogao
Grande
Mourao
Ourem
Alc
acer
do
Sal
Proenca-a
-Nova
da
Barquin
ha
10
Alm
eir
imV
endas
Novas
Pedrogao
Grande
Mourao
Pedrogao
Grande
Ferreir
ado
Ale
ntejo
Proenca-a
-Nova
Alc
acer
do
Sal
11
Gole
ga
Montem
or-o
-Novo
Alj
ustrel
Vila
Nova
Ferreir
ado
Ale
ntejo
Rio
Maio
rG
randola
Idanha-a
-Nova
da
Barquin
ha
12
Vendas
Novas
Alj
ezur
Santarem
Cham
usca
Montem
or-o
-Novo
Montem
or-o
-Novo
Rio
Maio
rG
randola
13
Gavia
oG
avia
oM
ontem
or-o
-Novo
Montem
or-o
-Novo
Vila
Nova
Grandola
Ourem
Alm
odovar
da
Barquin
ha
14
Palm
ela
Gole
ga
Mourao
Ferreir
ado
Ale
ntejo
Grandola
Proenca-a
-Nova
Montem
or-o
-Novo
Montem
or-o
-Novo
15
Montem
or-o
-Novo
Alm
eir
imV
endas
Novas
Grandola
Cham
usca
Vila
Nova
Vila
Velh
ade
Rodao
Celo
ric
oda
Beir
ada
Barquin
ha
Modelo
BN
29
4
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ourem
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Avis
Alj
ustrel
4A
vis
Avis
Rio
Maio
rA
ljezur
Ourem
Nis
aA
ljustrel
Avis
5A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Nis
aN
isa
Alj
ustrel
Nis
aN
isa
6C
ham
usca
Nis
aN
isa
Alc
acer
do
Sal
Alc
acer
do
Sal
Ourem
Mourao
Mourao
7V
ila
Nova
Cham
usca
Alj
ezur
Rio
Maio
rA
ljustrel
Alc
acer
do
Sal
Alc
acer
do
Sal
Pedrogao
Grande
da
Barquin
ha
8Santarem
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rM
ourao
Pedrogao
Grande
Alc
acer
do
Sal
9N
isa
Santarem
Vila
Nova
Mourao
Mourao
Pedrogao
Grande
Ferreir
aFerreir
ada
Barquin
ha
do
Ale
ntejo
do
Ale
ntejo
10
Montem
or-o
-Novo
Alj
ezur
Alj
ustrel
Vila
Nova
Pedrogao
Grande
Rio
Maio
rO
urem
Proenca-a
-Nova
da
Barquin
ha
11
Vendas
Novas
Montem
or-o
-Novo
Santarem
Cham
usca
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
Rio
Maio
rC
elo
ric
oda
Beir
a12
Gole
ga
Alj
ustrel
Montem
or-o
-Novo
Pedrogao
Grande
Montem
or-o
-Novo
Montem
or-o
-Novo
Proenca-a
-Nova
Ourem
13
Salv
aterra
de
Magos
Vendas
Novas
Mourao
Montem
or-o
-Novo
Vila
Nova
Grandola
Montem
or-o
-Novo
Grandola
da
Barquin
ha
14
Alm
eir
imM
ourao
Pedrogao
Grande
Ferreir
aC
ham
usca
Vila
Nova
Grandola
Idanha-a
-Nova
do
Ale
ntejo
da
Barquin
ha
15
Alj
ezur
Salv
aterra
de
Magos
Ferreir
ado
Ale
ntejo
Grandola
Grandola
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aM
ontem
or-o
-Novo
A4 15 concelhos 117
Tab
ela
A1
015
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o3
Modelo
P3
61
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
Ferreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9C
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a10
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
11
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
12
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
13
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Modelo
BN
36
6
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9A
zam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
10
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
11
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a12
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
13
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
118 Apendice A Caracterizacao da regiao de estudoT
abel
aA
11
15co
nce
lhos
com
esti
mati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
Acid
entes
tip
o1
-M
odelo
BN
19
42
2000
2001
2002
2003
2004
2005
2006
2007
1M
arin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Ilhavo
Ilhavo
Ilhavo
Ilhavo
2Il
havo
Ilhavo
Ilhavo
Ilhavo
Marin
ha
Grande
Marin
ha
Grande
Vagos
Vagos
3A
lbufe
ira
Alb
ufe
ira
Vagos
Vagos
Vagos
Vagos
Marin
ha
Grande
Ferreir
ado
Zezere
4P
ortim
ao
Portim
ao
Alb
ufe
ira
Portim
ao
Portim
ao
Ferreir
ado
Zezere
Ferreir
ado
Zezere
Marin
ha
Grande
5V
agos
Vagos
Portim
ao
Porto
Porto
Portim
ao
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
6P
orto
Porto
Porto
Alb
ufe
ira
Ferreir
ado
Zezere
Porto
Porto
Montem
or-o
-Velh
o7
Faro
Penic
he
Penic
he
Penic
he
Penic
he
Penic
he
Portim
ao
Alp
iarca
8L
oule
Faro
Faro
Faro
Alb
ufe
ira
Oliveir
ado
Bair
ro
Montem
or-o
-Velh
oP
orto
9P
enic
he
Loule
Viz
ela
Ferreir
ado
Zezere
Coim
bra
Montem
or-o
-Velh
oP
enic
he
Penic
he
10
Odiv
ela
sO
div
ela
sC
oim
bra
Coim
bra
Faro
Coim
bra
Coim
bra
Coim
bra
11
Viz
ela
Viz
ela
Odiv
ela
sV
izela
Montem
or-o
-Velh
oA
lbufe
ira
Alp
iarca
Portim
ao
12
Olh
ao
Coim
bra
Loule
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Faro
Pom
bal
Pom
bal
13
Nazare
Olh
ao
Ferreir
ado
Zezere
Odiv
ela
sV
izela
Aveir
oA
veir
oA
veir
o14
Coim
bra
Setubal
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Aveir
oP
om
bal
Faro
Vis
eu
15
Setubal
Cantanhede
Setubal
Aveir
oP
om
bal
Viz
ela
Murtosa
Lis
boa
Acid
entes
tip
o2
-M
odelo
BN
29
86
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ourem
Ourem
Ourem
Ourem
Ourem
S
J
Madeir
a2
Rio
Maio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rFerreir
aZ
O
dem
ira
Odem
ira
3A
lmeir
imFerreir
aZ
Ferreir
aZ
Ferreir
aZ
Ferreir
aZ
R
ioM
aio
rFerreir
aZ
Ferreir
aZ
4
Ferreir
ado
Zezere
Alm
eir
imB
raganca
Braganca
Braganca
Odem
ira
S
J
Madeir
aV
izela
5Santarem
Braganca
Avis
Odem
ira
Odem
ira
Mourao
Braganca
Braganca
6L
isboa
Lis
boa
Odem
ira
Mourao
Mourao
Braganca
Rio
Maio
rO
urem
7C
ham
usca
Santarem
Lis
boa
Avis
Avis
S
J
Madeir
aA
lmodovar
Alm
odovar
8B
raganca
Cham
usca
Mourao
Lis
boa
Vim
ioso
Avis
Viz
ela
Tondela
9P
alm
ela
Avis
Santarem
Cham
usca
Ala
ndroal
Vim
ioso
Tondela
Chaves
10
Salv
aterra
de
Magos
Palm
ela
Cham
usca
Palm
ela
S
J
Madeir
aA
lmodovar
Chaves
Rio
Maio
r11
Avis
Salv
aterra
de
Magos
Alm
eir
imSantarem
Alm
odovar
Chaves
Elv
as
Guim
araes
12
Ilhavo
Odem
ira
Palm
ela
Ala
ndroal
Elv
as
Ala
ndroal
Serta
13
Vila
Nova
da
Barquin
ha
Mourao
Salv
aterra
de
Magos
Elv
as
Palm
ela
Tondela
Palm
ela
14
Nazare
Vila
Nova
da
Barquin
ha
Ala
ndroal
Alm
eir
imC
ham
usca
Elv
as
Portim
ao
15
Abrantes
Ala
ndroal
Lagos
Salv
aterra
de
Magos
Lis
boa
Palm
ela
Loule
Acid
entes
tip
o3
-M
odelo
P3
630
2000
2001
2002
2003
2004
2005
2006
2007
1O
dem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
2M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
3V
imio
so
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Cantanhede
4F
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
o5
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
6M
iranda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
7A
lmodovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
8Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
9A
lcoutim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
10
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
11
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
12
Alc
ochete
Alc
ochete
Alc
ochete
Macedo
de
Cavale
iros
Alc
ochete
Alc
ochete
13
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Vagos
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
14
Vagos
Vagos
Vagos
Cantanhede
Vagos
Vagos
15
Cantanhede
Cantanhede
Cantanhede
Alc
ochete
Cantanhede
Cantanhede
Referencias Bibliograficas
Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes
in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625
ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt
Defaultaspxtabid=220amplanguage=pt-PT
ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx
fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT
Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population
density Statistics in Medicine 18(16) 2147ndash2162
Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety
performance indicators by using a multivariate generalized linear mixed model Journal
of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517
Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis
for Spatial Data Chapman amp Hall
Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease
maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431
Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini
M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med
14(21-22) 2433ndash2443
Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis
of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007
Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems
Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236
Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-
tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20
101007BF00116466
120 Referencias bibliograficas
Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis
with R Springer
Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed
Models Journal of the American Statistical Association 88(421) 9ndash25
Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane
roads Accident Analysis amp Prevention 39(4) 657 ndash 670
Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a
velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos
PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico
Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em
Seguranca Rodoviaria Technical report IST and LNEC
Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-
Temporally Correlated Survival Data In Bayesian Statistics 7
Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data
Analysis Chapman amp Hall
Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative
Risks for Use in Disease Mapping Biometrics 43 671ndash681
Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data
Biometrics 65 1254ndash1261
Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao
em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo
20economico20e20social20dos20acidentes_versao20para20internet
Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in
Europe Applied Spatial Analysis 1 133ndash150
Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level
Example of Belgium Journal of Safety Research 39(4) 417 ndash 427
El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate
Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828
Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety
Accident Analysis amp Prevention 40(6) 1964 ndash 1969
Referencias bibliograficas 121
Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis
and Prevention 43 253ndash264
Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall
Gelfand A E (1996) Model determination using sampling-based methods In W
Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice
chapter 9 (pp 145ndash161) Chapman amp
Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive
models for spatial data analysis Biostatistics 4(1) 11ndash15
Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis
Chapman amp Hall
Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for
the analysis of spatial data An application to disease mapping Journal of Statistical
Planning and Inference 75(2) 305 ndash 318
Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and
Estimation Journal of the American Statistical Association 102(477) 359ndash378
Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical
Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808
Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps
with Application to German Mortality Data httpepububuni-muenchende
Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive
Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical
Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD
Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR
Models for Areal Data Biometrics 61(4) 950ndash961
Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease
risk Statistics In Medicine 19(17-18) 2555ndash2567
Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space
Statistics in Medicine 17(18) 2045ndash2060
Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-
demiology CRC Press Taylor amp Francis
122 Referencias bibliograficas
Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-
mann P e Divino F (2000) Disease mapping models an empirical evaluation
Statistics in Medicine 19(17-18) 2217ndash2241
Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-
temporal patterns of intra-city motor vehicle craches Journal of Transport Geography
15 274ndash285
Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical
models in road safety countermeasure effectiveness studies in Iowa Accident Analysis
amp Prevention 40(4) 1531 ndash 1542
Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-
Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis
amp Prevention 40(3) 1123 ndash 1134
Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small
sample size on the estimation of the fixed dispersion parameter of Poisson-gamma
models for modeling motor vehicle crashes A Bayesian perspective Safety Science
46(5) 751 ndash 770
Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-
persion parameters of Poisson-gamma models on empirical Bayes estimates Accident
Analysis amp Prevention 40(4) 1441 ndash 1457
Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-
inflated regression models of motor vehicle crashes balancing statistical fit and theory
Accident Analysis amp Prevention 37(1) 35 ndash 46
Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal
regression model for prediction of crash counts by severity using Bayesian methods
Accident Analysis amp Prevention 40(3) 964 ndash 975
MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident
and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028
Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P
Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive
Statistical Methods (pp 99ndash114) Springer
Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-
tent Gaussian models using integrated nested Laplace approximations A manual for
Referencias bibliograficas 123
the inla program Technical report Norwegian University of Science and Technology
Trondheim
McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall
Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-
provements Decision parameter treatability concept statistical criterion and spatial
dependence Accident Analysis amp Prevention 37(4) 699 ndash 720
Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A
Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57
Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures
for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201
Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle
crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468
Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties
in england Accident Analysis amp Prevention 36(6) 973 ndash 984
OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications
world_health_statistics2008en
OMS (2009) Global status report on road safety httpwhqlibdocwhoint
publications20099789241563840_engpdf
Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao
Calouste Gubenkian
Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes
factors Biometrika 77(3) 455ndash466
Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-
tistics 9(3) 523ndash539
Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis
and output analysis for MCMC R News 6(1) 7ndash11
Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and
heterogeneity An analysis of London crash data Accident Analysis amp Prevention
40(4) 1486 ndash 1497
124 Referencias bibliograficas
R Development Core Team (2008) R A Language and Environment for Statistical
Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-
07-0
Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology
Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications
Chapman amp HallCRC
Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent
gaussian models by using integrated nested laplace approximations Journal of the
Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392
Schrodle B e Held L (2011) A primer on disease mapping and ecological regression
using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2
Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment
and Posterior Inference Journal of Statistical Software 21(11) 1ndash37
Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial
models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)
246 ndash 273
Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian
measures of model complexity and fit J R Statist Soc B 64 583ndash639
Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and
Marginal Densities Journal of the American Statistical Association 81 82ndash86
Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian
Journal of Statistics 31 221ndash229
Wakefield J (2007) Disease mapping and spatial regression with count data Biostat
8(2) 158ndash183
Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press
Taylor amp Francis
Resumo
Os acidentes rodoviarios sao um grave problema de saude publica mundial com con-
sequencias socio-economicas devastadoras Apesar dos enormes esforcos efetuados nos
ultimos anos os valores de sinistralidade rodoviaria ainda sao inadmissıveis As es-
tatısticas registadas suscitaram o interesse de investigadores e de polıticos como peca
fundamental para no sentido de compreender melhor a complexidade de fatores relacio-
nados com os acidentes rodoviarios e determinar que aspetos do problema de seguranca
rodoviaria sao locais (nacional ou regional) e quais sao os partilhados por varios paıses
Assim tem havido uma consideravel investigacao direcionada para o desenvolvimento de
modelacao estatıstica de dados de acidentes rodoviarios ocorridos em areas geograficas
correspondentes a orgaos de administracao publica ou gestao de infraestruturas de trans-
porte com o objectivo de encontrar modelos que possam servir como referencia na imple-
mentacao de acoes corretivas destinadas a diminuir o numero de acidentes rodoviarios
A estimacao do numero esperado de acidentes continua a ser um problema em aberto
nao existindo um metodo que possa ser considerado otimo No entanto e generalizada
a referencia a superioridade dos metodos bayesianos Esta tese foca-se na aplicacao de
modelos hierarquicos bayesianos a dados espaco-temporais em seguranca rodoviaria
No que diz respeito a metodologia de inferencia foi utilizada uma abordagem recente
proposta em Rue et al (2009) que consiste na inferencia bayesiana aproximada via INLA
(Integrated Nested Laplace Approximations) e que e uma alternativa determinıstica aos
metodos de simulacao MCMC habitualmente usados Assim explorou-se no R atraves
do R-INLA a implementacao desta metodologia que torna o uso dos modelos bayesianos
hierarquicos mais acessıvel sendo uma alternativa muito competitiva relativamente ao
WinBUGS para situacoes em que a distribuicao da variavel dependente pertence a famılia
exponencial
Com a implementacao desses modelos foi possıvel reduzir a variabilidade das estimati-
vas dos riscos de acidentes em areas pequenas e simultaneamente revelar padroes de
dependencia espacial tendencias temporais e interacoes espaco-temporais Conseguiu-se
assim uma suavizacao espacial dos dados ainda que as regioes sob estudo possuam areas
pequenas Para alem disso foi possıvel fazer a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao Espera-se que esta metodologia possa vir a
permitir efetuar uma comparacao no que respeita a seguranca rodoviaria nao so ao nıvel
nacional ou regional mas tambem ao nıvel internacional
Palavras chave seguranca rodoviaria modelos bayesianos hierarquicos risco relativo
INLA
Abstract
Road accidents are a serious public health problem worldwide with devastating socio-
economic consequences Despite the enormous efforts made in recent years the road
fatalities values are still unacceptable Statistics recorded caught the interest of resear-
chers and politicians as a key to better understand the complexity of factors related to
road accidents and to determine which aspects of the problem of road safety are local
(national or regional) and which are shared by several countries Thus there has been
considerable research directed towards the development of statistical modeling of road
accident data in geographic areas corresponding to organs of public administration or
management of transport infrasctruture with the aim of finding models that can serve
as reference to the implementation of corrective actions aimed to reduce the number of
road accidents
The estimation of the expected number of accidents remains an open problem and there
is no method that can be considered optimal However there is a general reference to
the superiority of Bayesian methods This thesis focuses on the application of Bayesian
hierarchical models with spatio-temporal data in road safety
Regarding to inference methodology a recent approach proposed in Rue et al (2009)
which is the approximate Bayesian inference via INLA (Integrated Nested Laplace Appro-
ximations) was used which is a deterministic alternative to the simulation methods
MCMC commonly used Thus we explored in R through R-INLA the implementation of
this methodology which makes the use of Bayesian hierarchical models more accessible
being a very competitive alternative for the WinBUGS for situations where the depedent
variable distribution belongs to the exponential family
With the implementation of these models it was possible to reduce the estimates va-
riability of the risks of accidents in small areas and simultaneously to reveal patterns
of spatial dependence trends and spatio-temporal interactions In this way a spatial
smoothing of the data was obtained despite of the regions under study having small
areas Furthermore it was possible to identify the counties of Portugal at higher risk
relatively to the country and to analyze association of the district council with potential
risk factors or exposure It is hoped that this methodology will allow comparisons with
regard to road safety not only at national or regional level but also at international level
Keywords road safety hierarchical Bayesian models relative risk INLA
Agradecimentos
Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-
pressar o meu profundo agradecimento
A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-
mente pela sua compreensao
A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao
devido acima de tudo pela grande admiracao que tenho por ela
Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima
de tudo pelo seu entusiasmo por esta tese
Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo
Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA
e pelo incentivo
Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a
minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha
de conhecimentos importantes para a realizacao do meu doutoramento
Ao Professor Rune Elvik pelo interesse demostrado
Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-
ciado pela bolsa de doutoramento SFRHPROTEC492262008
A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de
Portugal Continental
Ao Dr Rui Pereira pela prontidao e pelo interesse
A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do
Instituto Superior de Engenharia
Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram
em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao
Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas
A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-
balho
Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha
espera
Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho
a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa
os quais me ajudaram cada um a sua maneira
A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude
partilhar muitos momentos de alegria e descontracao
Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira
A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre
em mim a Mariana e a Rita por me seguirem como exemplo
A minha mae
Siglas e Acronimos
A Area geografica
AE Autoestrada
ANSR Autoridade Nacional de Seguranca Rodoviaria
BN Binomial Negativo
BT Brigada de Transito
BOA An R Package for MCMC Output Convergence
Assessment and Posterior Inference
BUGS Bayesian Using Gibbs Sampling
C Comprimento de estrada
CARE Community database on accidents on the roads in Europe
CE Codigo de Estrada
CODA Convergence Diagnosis and Output Analysis for MCMC
CPO Conditional Predictive Ordinates
DIC Deviance Information Criterion
DP Densidade populacional
EN Estrada Nacional
ENSR Estrategia Nacional de Seguranca Rodoviaria
GNR Guarda Nacional Republicana
HPD Highest Probability Density
IC Itinerario Complementar
INLA Integrated Nested Laplace Approximations
IP Itinerario Principal
MCMC Markov Chains Monte Carlo
mls Mean logarithmic score
OMS Organizacao Mundial de Saude
ONU Organizacao das Nacoes Unidas
OSEPU Ocupacao do solo com equipamentos e parques urbanos
OSI Ocupacao industrial do solo
OST Ocupacao do solo com equipamento turıstico
OSU Ocupacao urbana do solo
pD Numero efetivo de parametros
PIT Probability Integral Transformation
PMOT Plano Municipal de Ordenamento do Territorio
PMSR Planos Municipais de Seguranca Rodoviaria
PSP Polıcia de Seguranca Publica
R A Language and Environment for Statistical Computing
SafetyNET Projeto europeu European Traffic Information System -
Data Colletion and Analysis Tools for Policy Making
SMR Standard Morbility Ratio
UE Uniao Europeia
WinBUGS versao em ambiente Windows do programa BUGS
VC Quantidade de combustıvel vendido
Conteudo
Lista de Tabelas xiv
Lista de Figuras xv
Introducao 1
1 Nocoes sobre seguranca rodoviaria 9
11 Risco em seguranca rodoviaria 9
12 Caracterizacao dos dados de acidentes 10
13 Caracterizacao da medida de exposicao 14
2 Modelacao estatıstica de acidentes rodoviarios 19
21 Modelos bayesianos hierarquicos 21
22 Modelos nao espaciais 24
23 Modelos espaciais 27
24 Modelos espaco-temporais 28
25 Modelos multivariados 30
26 Metodos de inferencia 32
261 INLA 32
27 Ajustamento e medidas preditivas 36
3 Aplicacoes 39
31 Associacao espacial 40
32 Modelos 43
33 Modelos espaco-temporais 45
331 Associacao regional 46
332 Selecao dos modelos 47
333 Modelos para acidentes do tipo 1 48
334 Validacao dos modelos para acidentes do tipo 1 49
335 Resultados obtidos com modelos para acidentes do tipo 1 49
xii Conteudos
336 Modelos para acidentes do tipo 2 61
337 Validacao dos modelos para acidentes do tipo 2 62
338 Resultados obtidos com modelos para acidentes do tipo 2 62
339 Modelos para acidentes do tipo 3 73
3310 Validacao dos modelos para acidentes do tipo 3 73
3311 Resultados obtidos com modelos para acidentes do tipo 3 74
34 Modelos multivariados 83
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
351 Modelo para acidentes do tipo 1 89
352 Validacao do modelo para acidentes do tipo 1 89
353 Resultados obtidos com o modelo para acidentes do tipo 1 90
354 Modelo para acidentes do tipo 2 92
355 Validacao do modelo para acidentes do tipo 2 92
356 Resultados obtidos com o modelo para acidentes do tipo 2 93
357 Modelos para acidentes do tipo 3 95
358 Validacao do modelo para acidentes do tipo 3 95
359 Resultados obtidos com o modelo para acidentes do tipo 3 96
4 Discussao e conclusoes 99
A Caracterizacao da regiao de estudo 103
A1 Portugal Continental 103
A2 Numero de acidentes 108
A3 Covariaveis 110
A4 15 concelhos 115
Referencias Bibliograficas 119
Lista de Tabelas
11 Numero total de cada tipo de acidentes rodoviarios por ano 11
12 Estatısticas resumo do numero de veıculos com seguro em milhares 14
21 Modelos univariados 30
31 Valores do ındice EBI para cada tipo de acidente por ano 43
32 Valores DIC e mls dos modelos Poisson sem covariaveis 44
33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44
34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45
35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem
covariaveis 46
36 DIC pD e mls para cada tipo de acidente 47
37 DIC pD e mls para acidentes tipo 1 48
38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50
39 Estatısticas resumo dos parametros do modelo P 1 8 1 53
310 Estatısticas resumo dos parametros do modelo P 1 8 16 54
311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55
312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55
313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57
314 DIC pD e mls para acidentes tipo 2 61
315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63
316 Estatısticas resumo para os parametros do modelo P 2 9 1 66
317 Estatısticas resumo para os parametros do modelo P 2 9 16 67
318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67
319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68
320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69
321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71
322 DIC pD e mls para acidentes tipo 3 73
323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74
xiv Lista de Tabelas
324 Estatısticas resumo dos parametros do modelo P 3 6 1 78
325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78
326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78
327 Modelos univariados 82
328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-
tivariado e dos modelos univariados 83
329 Correlacoes dos modelos multivariados com interacao e sem interacao
espaco-temporal 84
330 Vıtimas a 24 horas e vıtimas a 30 dias 84
331 Numero total de cada tipo de acidentes rodoviarios por ano 87
332 DIC pD e mls para cada tipo de acidente 89
333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90
334 DIC pD e mls 92
335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93
336 Estatısticas resumo dos parametros do modelo P 3 6 30 96
337 Comparacao entre a abordagem local e a global 98
A1 Estatısticas resumo de acidentes tipo 1 108
A2 Estatısticas resumo de acidentes tipo 2 108
A3 Estatısticas resumo de acidentes tipo 3 108
A4 Estatısticas resumo de acidentes tipo 1 109
A5 Estatısticas resumo de acidentes tipo 2 109
A6 Estatısticas resumo de acidentes tipo 3 109
A7 Estatısticas resumo da covariavel populacao 110
A8 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 1 115
A9 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 2 116
A10 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 3 117
A11 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 118
Lista de Figuras
1 Dez principais causas de morte no mundo 2
2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4
11 Numero de acidentes tipo 1 por concelho 12
12 Numero de acidentes tipo 2 por concelho 12
13 Numero de acidentes tipo 3 por concelho 13
14 Numero de veıculos com seguro em milhares por concelho e por ano 14
15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15
16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16
17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16
31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de
acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano
2000 41
32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de
veıculos com seguro no ano 2000 41
33 Valores estimados dos SMR1 e respetivos intervalos de confianca para
cada concelho no ano 2000 42
34 Histograma dos valores de EBI simulados e valor de EBI observado para
acidentes tipo 1 e para ano 2000 43
35 Histograma das diferencas entre as medias dos logscores 48
36 Histograma dos valores PIT ajustados para acidentes tipo 1 49
37 Box plot dos valores estimados para acidentes tipo 1 50
38 Amplitude dos intervalos para acidentes tipo 1 51
39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 1 51
310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o
ano 2000 52
xvi Lista de Figuras
311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52
312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53
313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo P 1 8 16 56
314 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo
P 1 8 16 56
315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo P 1 8 16 57
316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 6 172 58
317 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58
318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-
dos com o modelo BN 1 6 172 59
319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com
o modelo BN 1 6 172 60
320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 6 172 60
321 Histograma das diferencas entre as medias dos logscores 61
322 Histograma dos valores PIT ajustados para acidentes tipo 2 62
323 Box plot dos valores estimados para acidentes tipo 2 63
324 Amplitude dos intervalos para acidentes tipo 2 64
325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori dos acidentes tipo 2 64
326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o
ano 2000 65
327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65
328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66
329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo P 2 9 16 68
330 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
P 2 9 16 69
Lista de Figuras xvii
331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2
de 2000 a 2007 obtidos com o modelo P 2 9 16 70
332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 4 71
333 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
BN 2 9 4 71
334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 4 72
335 Histograma dos valores PIT ajustados para acidentes tipo 3 74
336 Box plot dos valores estimados para acidentes tipo 3 75
337 Amplitude dos intervalos para acidentes tipo 3 75
338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76
339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o
ano 2000 76
340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77
341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77
342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 1 79
343 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79
344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3
de 2000 a 2007 obtidos com o modelo P 3 6 1 80
345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo BN 3 6 6 81
346 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81
347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo BN 3 6 6 82
348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos univariados e com os modelos multivariados 85
349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos multivariados 86
350 Numero de acidentes tipo 1 por concelho 87
351 Numero de acidentes tipo 2 por concelho 88
xviii Lista de Figuras
352 Numero de acidentes tipo 3 por concelho 88
353 Histograma dos valores PIT ajustados para acidentes tipo 1 89
354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 9 42 90
355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 9 42 91
356 Histograma dos valores PIT justados para acidentes tipo 2 92
357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 86 94
358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 86 94
359 Histograma dos valores PIT ajustados para acidentes tipo 3 95
360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 30 96
361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo P 3 6 30 97
A1 ID dos concelhos do Norte de Portugal Continental 104
A2 ID dos concelhos do Sul de Portugal Continental 105
A3 Numero de habitantes por concelho e por ano 110
A4 Area por concelho 111
A5 Densidade populacional por concelho 111
A6 Quilometros de estrada por concelho 112
A7 Quantidade de combustıvel vendido por concelho 112
A8 Superfıcie de ocupacao urbana do solo por concelho 113
A9 Superfıcie de ocupacao industrial do solo por concelho 113
A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por
concelho 114
A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114
ldquoThe road to wisdom - Well itacutes plain and simple to express
Err and err and err again but less and less and lessrdquo
Piet Hein (1996)
Introducao
A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora
de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo
automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se
tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao
ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o
Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009
OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes
rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso
entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as
tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa
na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas
etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do
PIB mundial
A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas
necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004
para a quinta causa de morte em 2030
2 Introducao
2004
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Infecoes respiratorias
4 Doencas pulmonares
5 Diarreias
6 HIVAIDS
7 Tuberculose
8Cancro do pulmao
dos bronquios e da traqueia
9 Acidentes rodoviarios
10Recem-nascidos prematuros
e de peso baixo
HH
2030
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Doencas pulmonares
4 Infecoes respiratorias
5 Acidentes rodoviarios
6Cancro do pulmao
dos bronquios e da traqueia
7 Diabetes mellitus
8 Doencas do coracao hipertensas
9 Cancro do estomago
10 HIVAIDS
Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)
No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a
decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-
ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem
disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao
forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes
rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida
No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de
Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-
dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos
socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a
sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario
e Santos 2012)
O sistema de trafego rodoviario um subsistema do sistema de transportes e formado
por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-
fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes
rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos
correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada
e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a
deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos
Introducao 3
(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de
pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se
por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma
qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena
de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do
sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-
guranca deste sistema complexo tem consequencias devastadoras em termos humanos
sociais e economicos (Cardoso 2007)
Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta
consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos
consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-
vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma
descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-
tadas a nıvel mundial
minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-
doviaria
minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios
como um problema de saude publica
minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da
seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial
minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria
minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das
Nacoes Unidas
minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca
Rodoviaria
minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de
Acao para a Seguranca Rodoviaria
Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria
Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-
dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade
responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para
uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos
veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica
sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste
flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area
da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e
tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha
uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes
4 Introducao
projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do
trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para
veıculos tambem designada por sistemas inteligentes de transportes
A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-
volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos
30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-
tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi
progressivamente modernizado tendo sido acompanhado por um aumento do numero
de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal
terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de
toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu
aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver
na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada
a implementacao de algumas medidas especıficas
Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)
As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para
compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios
e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou
regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma
consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica
de dados de acidentes rodoviarios
Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo
pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e
Introducao 5
do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda
lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util
domınio para desenvolvimento de atividades de investigacao O ambito desta tese e
portanto a modelacao estatıstica de dados de acidentes rodoviarios
Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-
retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar
progressivamente a execucao dessas acoes foram identificados varios fatores capazes de
melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em
particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas
com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados
As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma
melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de
intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-
vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada
em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-
dos na UE (CARE - Community database on accidents on the roads in Europe) No
projeto integrado SafetyNET (European Traffic Information System - Data Colletion
and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de
informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas
principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco
e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como
ponto de partida para a modelacao estatıstica usada nesta tese
A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-
nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-
ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos
desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-
cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes
o que facilita a identificacao dos fatores causais e de intervencoes corretivas
As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-
tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial
como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy
A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-
tatıstica Em geral foram detetados varios problemas na estimacao dos parametros
de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou
desconhecidas dependencia espacial e depedencia temporal que continuam a constituir
objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-
blemas como por exemplo
1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm
6 Introducao
minus modelos lineares generalizados baseados na distribuicao de Poisson
minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia
de sobredispersao
minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado
para analisar dados de acidentes com sobredispersao e excesso de zeros
minus modelos de nıveis multiplos estruturados
minus modelos bayesianos hierarquicos
minus incorporacao de correlacao espacial e dependencia temporal nos modelos
A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao
existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada
a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre
os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos
hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem
podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li
et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar
a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais
e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais
atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004)
O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da
estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a
problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior
barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua
formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains
Monte Carlo) na computacao bayesiana
A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se
nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que
envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas
O seu crescimento ao nıvel das aplicacoes tem sido extraordinario
O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using
Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o
GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao
Introducao 7
CODA Plummer et al (2006) e ao BOA Smith (2007)
Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de
pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)
o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em
particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-
tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas
Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana
aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa
determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas
limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes
de concordancia
Todas as analises envolvidas no metodo INLA estao implementadas num programa que
pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser
descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos
hierarquicos complexos tornou-se muito mais acessıvel
Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA
Objetivos
Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-
los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca
rodoviaria em areas geograficas diferentes
Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse
tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-
pacial e depedencia temporal
Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao
Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes
nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional
Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-
place Approximations atraves da exploracao do pacote R-INLA
8 Introducao
Estrutura da tese
No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a
caracterizacao dos dados usados nesta tese
No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos
No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais
de sinistralidade rodoviaria registados em Portugal Continental
No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido
de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros
No Anexo A faz-se a caracterizacao da regiao de estudo
No CD em anexo encontram-se todos os codigos usados nesta tese
1Nocoes sobre seguranca rodoviaria
11 Risco em seguranca rodoviaria
O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores
de seguranca informativos muito importantes No entanto quando se pretende fazer
comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de
acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca
rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de
acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja
risco=numero esperado de acidentesmedida de exposicao
A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-
responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel
ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-
teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a
melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-
cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos
proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens
e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego
10 Capıtulo 1 Nocoes sobre seguranca rodoviaria
atraves do comprimento de estrada do numero de veıculos ou preferencialmente da
distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode
estar associada a populacao de risco atraves do numero de habitantes do numero de
condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas
times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco
de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia
de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-
cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o
numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para
a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande
disponibilidade de informacao desagregada o que permite analisar as especificidades de
varios grupos populacionais As restantes medidas indicadas apresentam atualmente
muitas limitacoes1
Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se
deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido
e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a
relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata
de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes
e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-
se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de
veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se
a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho
12 Caracterizacao dos dados de acidentes
Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito
e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas
sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela
gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de
exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-
tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao
usada e sobre as covariaveis usadas
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-
ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez
1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2
205-v3_finalpdf
12 Caracterizacao dos dados de acidentes 11
agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho
A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos
se encontram no litoral norte sendo consequentemente mais proximos uns dos outros
Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz
respeito a caracterizacao dos concelhos2
Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311
Total 279644 28844 8890 317378
Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR
minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo
menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT
e PSP) e da qual resultem vıtimas ou danos materiais
minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais
minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do
acidente ou no seu percurso ate a unidade de saude No perıodo em analise para
obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)
aplica-se um coeficiente multiplicativo de 114 ao numero de mortos
minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo
de hospitalizacao superior a 24 horas
minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave
minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima
minus Acidente mortal Acidente do qual resulte pelo menos um morto
minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido
grave nao tendo ocorrido qualquer morte
minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido
leve e em que nao se tenham registado mortos nem feridos graves
2ver Anexo A
12 Capıtulo 1 Nocoes sobre seguranca rodoviaria
Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes
com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes
do tipo 3 os acidentes mortais
Figura 11 Numero de acidentes tipo 1 por concelho
Figura 12 Numero de acidentes tipo 2 por concelho
12 Caracterizacao dos dados de acidentes 13
Figura 13 Numero de acidentes tipo 3 por concelho
Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero
de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de
acidentes
Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor
risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao
entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria
muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos
mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278
concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado
o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de
cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes
decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para
permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no
espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes
Isto e especialmente importante porque apesar do numero de acidentes ser relacionado
com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria
que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de
3ver Anexo A
14 Capıtulo 1 Nocoes sobre seguranca rodoviaria
trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a
variabilidade da medida de exposicao em funcao do espaco ou do tempo
13 Caracterizacao da medida de exposicao - numero
de veıculos com seguro
Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares
Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730
Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)
13 Caracterizacao da medida de exposicao 15
O numero de veıculos com seguro varia bastante de concelho para concelho como se pode
verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo
por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que
cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media
inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo
Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho
i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o
numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =
100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de
acidente rodoviario para acidentes do tipo 1ndash3
Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por
concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes
e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos
sugerindo a existencia de correlacao espacial
Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na
faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas
mais baixas
Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007
Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-
se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se
mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas
muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a
16 Capıtulo 1 Nocoes sobre seguranca rodoviaria
nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos
com taxas mais baixas
Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007
Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007
No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas
usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer
mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-
petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao
13 Caracterizacao da medida de exposicao 17
ocorre com muita frequencia com dados de contagem com muitos valores escassos e
ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou
unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas
pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes
associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso
nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando
as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante
afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e
Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas
dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem
como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-
tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de
forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e
Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004) descritos no Capıtulo 2
2Modelacao estatıstica de acidentes rodoviarios
Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram
baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados
normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido
que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-
doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia
de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma
probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre
os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-
dos de contagens sao modelos mais apropriados para este tipo de estudos
Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo
constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo
et al 2007 Cardoso 1996)
Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo
caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala
espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais
desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais
como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel
explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-
20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como
uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade
espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias
ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao
apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo
muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao
verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos
com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao
de riscos relativos em areas pequenas
No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-
dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade
de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto
deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-
mas na alocacao de fundos governamentais e no planeamento regional Determinados
atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-
cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para
areas pequenas e esta tendencia ira provavelmente continuar
Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-
vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco
relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario
num determinado concelho relativamente ao risco no paıs (Portugal Continental)
As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e
consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem
acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999
Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os
metodos tradicionais para investigar questoes importantes relacionadas com estimacao de
riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia
temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis
nao observaveis tais como clima determinadas caracterısticas da populacao entre outras
Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser
pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a
construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios
ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al
2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-
tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes
21 Modelos bayesianos hierarquicos 21
espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e
temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a
suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos
pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos
dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-
doviarios
A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma
serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia
em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-
dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes
rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem
ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade
existente no dados Noland e Quddus (2004) Elvik (2011)
A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-
melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio
que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-
blema atribuıdo a comportamentos inadequados dos condutores associados a falencias
da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de
acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA
constitui a covariavel com maior poder explicativo da variacao observada No entanto
nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas
do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por
exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de
servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel
vendido e um indicador do volume de trafego e a densidade populacional um indicador de
urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais
o numero de habitantes a area geografica a densidade populacional o comprimento de
estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao
industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao
do solo com equipamento turıstico como sera abordado no Capıtulo 4
21 Modelos bayesianos hierarquicos
O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que
o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro
θ e o segundo traduz a distribuicao a priori para o parametro θ
22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica
na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-
delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-
nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo
que p(θ) =
intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =
1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa
estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-
formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros
Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade
associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-
tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia
a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori
nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-
tribuicao a priori padrao p(θ) (Paulino et al 2003)
Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte
estrutura
1o nıvel f(y|θ) funcao de verosimilhanca
2o nıvel p(θ|φ) distribuicao a priori dos parametros
3o nıvel p(φ) distribuicao a priori dos hiperparametros
Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e
evoluindo para modelos cada vez mais complexos
O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-
creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-
vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de
acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar
esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-
dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se
Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou
sejaYit|θit sim Poisson(Eitθit)
f(yit|θit) =(Eitθit)
yiteminusEitθit
yit
Eit = nitr = nit
sumij
Yitsumij
nit
21 Modelos bayesianos hierarquicos 23
onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit
representa o numero de veıculos com seguro e θit representa o risco relativo de acidente
rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja
se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia
de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de
acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)
A funcao de versimilhanca e dada por
L(θ|y) =prodit
f(yit|θit) =prodit
(Eitθit)yiteminusEitθit
yitpropprod
θyitit e
minussumit
Eitθit
e l(θ|y) = lnL(θ|y) propsumit
yit ln θitminussumit
Eitθit O estimador de maxima verosimilhanca
do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-
dardized Mortality Ratio1 - SMR) e dado por
θit = SMRit =YitEit
(211)
Note-se que V ar(SMRit) =V ar(Yit)
E2it
=θitEit
podendo-se fazer V ar(SMRit) =θitEit
=YitE2it
Um procedimento classico usual para identificar regioes de maior risco consiste na cons-
trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR
Apesar de util este procedimento tem algumas desvantagens Note-se que em areas
com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero
de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR
podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com
muita frequencia com dados desta natureza quando as unidades espaciais de analise sao
concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao
das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit
associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser
grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram
ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de
tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida
em que a respetiva variabilidade pode ser muito grande A variancia destes valores e
1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso
24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao
grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro
estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-
minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992
Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR
tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores
estimados com menos precisao As maiores variacoes do risco relativo nao estarao em
geral associadas com variacoes do risco subjacente a medida de exposicao mas serao
apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)
Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se
que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-
dade teorica subjacente ao modelo Poisson
A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados
(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do
modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado
que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al
2008 2005)
Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-
mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos
tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao
de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das
flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto
dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se
usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico
medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial
entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao
mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)
22 Modelos nao espaciais
Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh
e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis
atraves da funcao de ligacao usada para modelar a media
ln(θit) = α+
nβsump=1
βpxitp (221)
22 Modelos nao espaciais 25
onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel
e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um
nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual
considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a
priori p = 1 2 nβ i = 1 2 N e t = 1 2 T
No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-
adequadamente capturada pelas variaveis explicativas na funcao da media condicional
Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser
distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-
tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como
ln θit = α+
nβsump=1
βpxitp + vit (222)
onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p
Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que
foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-
los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares
generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)
Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-
dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao
a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo
Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples
de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma
fechada dado que esta mistura resulta de um modelo conjugado
Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao
Poisson e na distribuicao Binomial Negativa
O modelo Poisson Lognormal surge quando se admite que
vit sim Normal(0 σ2v) (223)
A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por
f(yit θNit σ
2v) =
1
σ2v
radic2π
EitθNit
y
int infin0
eminusEitθNit e
v
(ev)yminus1eminus v2
2σ2v dev
nao havendo forma explicıta com
26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
ln θNit = α+
nβsump=1
βpxitp (224)
E[Yit] = microNit eσ2v2 = Eitθ
Nit e
σ2v2 e V ar[Yit] = microNit e
σ2v2(
1 + (eσ2v minus 1)microNit e
minusσ2v2)
O modelo Poisson-Gama ou Binomial Negativo surge quando
exp(vit) sim Gama(φ φ) (225)
A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por
f(yit θBNit φ) =
Γ(yit + φ)
Γ(φ)yit
(φ
microBNit + φ
)φ(microBNit
microBNit + φ
)yitou seja
Yit|θBNit sim BN(EitθBNit φ)
com
ln θBNit = α+
nβsump=1
βpxitp (226)
E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit
(1 +
microBNitφ
) Note-se que quando φrarrinfin o
modelo Binomial Negativo reduz-se ao modelo Poisson
Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo
podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais
um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com
av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O
parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de
dispersao
O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-
plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre
unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-
quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito
afectadas (Miranda-Moreno et al 2007 Lord et al 2008)
Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)
A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-
pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os
23 Modelos espaciais 27
riscos relativos conjuntamente como um processo espacial atraves de uma especificacao
a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-
lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco
relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados
observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada
area e a soma de duas componentes que representam fatores espaciais e nao espaciais
No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica
de interesse em cada area tem distribuicao Poisson com media especıfica de cada area
As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre
a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento
das variaveis nao-observadas como em Bernardinelli et al (1995ab)
23 Modelos espaciais
Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia
espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos
mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao
associados uma distribuicao a priori conveniente
log(θit) = α+
nβsump=1
βpxitp + si (231)
Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de
notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario
quer para os modelos baseados na distribuicao de Poisson abreviadamente designados
de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa
abreviadamente designados de modelos BN com os devidos significados
Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que
representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos
atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori
associada
log(θit) = α+
nβsump=1
βpxitp + si + vi (232)
onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-
turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e
si sao mutuamente independentes viiidsim Normal(0 σ2
v) e si|sminusi sim Normal(si σ2smi)
28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
onde o sminusi indica o vetor s com o elemento si removido si =1
mi
sumi 6=j
wijsj e a media
dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e
wij = 0 caso contrario Deste modo mi =sumi 6=j
wij e o respetivo numero de vizinhos e
σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma
s tem distribuicao conjunta
f(s) prop (σ2s)minusn2 exp
minus 1
2σ2s
sumi6=j
(si minus sj)2wij
e (σ2v)minus1 sim Gama(av bv) (σ2
s)minus1 sim Gama(as bs) com av bv as e bs conhecidos
Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial
local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo
gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991
Banerjee et al 2004)
24 Modelos espaco-temporais
Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-
tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a
aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios
e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos
com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se
definiu na seccao anterior
Modelos espaco-temporais sem interacao
Nestes modelos tem-se log(θit) = α+
nβsump=1
βpxitp + si + vi + ψt
onde se considera
ψt sim Normal(0 σ2ψ) (241)
ou
ψt sim RW (1 σ2ψ) (242)
e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ
2s σ
2v σ
2ψ mutuamente
independentes
24 Modelos espaco-temporais 29
Alternativamente log(θit) = α+
nβsump=1
βpxitp + si + vi + γt
onde se considera
γ sim Normal(0 cγ) (243)
sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ
2v mutuamente
independentes (Knorr-Held 2000)
Modelos espaco-temporais com interacao
Neste caso log(θit) = α+
nβsump=1
βpxitp + si + vi + (γ + δi)t
onde se considera alternativamente
δi sim Normal(0 σ2δ ) (244)
ou
δi sim CAR(σ2δ ) (245)
e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com
aδ bδ conhecidos e α βp σ2s σ2
v σ2δ mutuamente independentes (Bernardinelli et al
1995b)
A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando
um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de
acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de
risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia
e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de
cada area e a media global α e δi representa a diferenca entre a tendencia temporal
local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0
a tendencia temporal local da area i e menos acentuada do que a tendencia temporal
global enquanto que quando δi gt 0 e mais acentuada
Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados
neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo
nao se encontra definida uma distribuicao a priori para um parametro considera-se a
distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior
30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Tabela 21 Modelos univariados
M log(θit) Distribuicao a priori Distribuicao a priori
dos parametros dos hiperparametros
1 α+
nβsump=1
βpxitp α sim Normal(0 cα)
βp sim Normal(0 cβ)
2 α+
nβsump=1
βpxitp + vi vi sim Normal(0 σ2v) σminus2
v sim Gama(av bv)
3 α+
nβsump=1
βpxitp + si si sim CAR(σ2s) σminus2
s sim Gama(as bs)
4 α+
nβsump=1
βpxitp + vi + si
5 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2
ψ sim Gama(aψ bψ)
6 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim RW (σ2ψ)
7 α+
nβsump=1
βpxitp + vi + si + γt γ sim Normal(0 cγ)
8 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2
δ sim Gama(aδ bδ)
9 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )
25 Modelos multivariados
Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-
mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes
modelos nao consideram a interdependencia que pode existir entre os riscos relativos
dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na
variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia
para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico
tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-
son capazes de considerar a relacao entre diferentes processos de contagem tais como
contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-
25 Modelos multivariados 31
son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta
abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de
diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o
numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo
k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit
condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou
seja
Ykit|θkit sim Poisson(Ekitθkit)
Modelos espaciais multivariados
1)log θkit = αk +
nβsump=1
βpxitp + ski
com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs
conhecidos
Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)
e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios
ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K
tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-
bilidade assume que a estrutura de associacao se separa numa componente nao espacial
e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta
de s e
s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)
Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)
D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de
vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK
definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre
os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao
espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se
o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo
improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou
modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin
et al (2005) Lawson (2009) Waller e Carlin (2010)
Para alem do modelo 1 foram implementados os modelos multivariados seguintes no
WinBUGS
32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)
3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)
4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e
dδ Rδ conhecidos
mas apenas se obteve convergencia para os modelos 1 e 4
Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =
bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =
001 0 0
0 001 0
0 0 001
26 Metodos de inferencia
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e
computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas
abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)
consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-
ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino
e Rue (2010a)
261 INLA
O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-
siana aproximada numa subclasse de modelos de regressao estruturados aditivamente
nomeadamente em modelos latentes gaussianos
Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z
que representa todas as componentes nao observaveis com distribuicao a priori Normal
Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-
mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-
buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia
exponencial A media microi de cada componente e relacionada com um preditor aditivo
estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor
incorpora aditivamente os efeitos de varias componentes
26 Metodos de inferencia 33
ηi = α+
nfsumj=1
f (j)(uij) +
nβsump=1
βpxip + εi (261)
onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-
cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u
podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis
contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-
torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos
podem ser representados atraves das funcoes f (j)()
Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-
mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por
suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a
priori dos hiperparametros nao tem de ser gaussianas
Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-
dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto
de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF
Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel
aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e
Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6
embora possa haver excecoes
Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro
nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos
parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-
sume que os dados observados sao condicionalmente independentes dado o campo latente
z tem-se que
f(y|xφ) =prodi
f(yi|ziφ)
Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca
do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos
φ
A distribuicao a posteriori e dada por
p(zφ|y) prop p(φ)p(z|φ)prodi
f(yi|ziφ) (262)
Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e
analiticamente tratavel
Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao
34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao
analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e
possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa
pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como
tempo computacional longo possibilidade de as amostras simuladas dos parametros se-
rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte
Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser
particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori
entre as componentes espacial ou espaco-temporal do campo latente
Em contraste o metodo de aproximacao INLA e apresentado como um metodo que
fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-
vamente pouco tempo
No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes
marginais a posteriori dos parametros de interesse
As distribuicoes marginais a posteriori pretendidas sao
p(zi|y) =
intφ
p(zi|φy)p(φ|y) dφ (263)
e
p(φj |y) =
intφj
p(φ|y) dφminusj (264)
A aproximacao de p(zi|y) e determinada usando a soma finita
p(zi|y) =sumk
p(zi|φky)p(φk|y)∆k (265)
onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-
vamente Esta soma e calculada por integracao numerica em pontos suporte φk com
pesos apropriados ∆k
A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e
obtida atraves da aproximacao de Laplace
p(φ|y) prop p(zφy)
pG(z|φy)
∣∣z=zlowast(φ) (266)
onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-
cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao
corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)
De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade
a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes
26 Metodos de inferencia 35
pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste
basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior
quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste
em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a
estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)
Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a
estrategia CCD a estrategia por omissao no R-INLA
Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a
aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace
simplificada
A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter
a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))
onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia
marginal Os autores referem que apesar de muito conveniente ao nıvel computacional
pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de
simetria das distribuicoes a posteriori marginais quer a ambos nıveis
Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais
demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-
place semelhante a 266 a p(zi|φy)
pLA(zi|φy) prop p(zφy)
pGG(zminusi|ziφy)
∣∣∣zminusi=zlowastminusi(ziφ) (267)
No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-
nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes
numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de
Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo
menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada
uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-
trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e
simetria Para mais detalhes ver Rue et al (2009)
Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre
os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao
de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos
O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-
parametros entre outras No entanto o seu potencial e reconhecidamente enorme e
encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-
tensoes com muita frequencia
36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
27 Ajustamento e medidas preditivas
Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o
criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio
combina uma medida de adequabilidade a media a posteriori da desvianca D com
uma medida de complexidade o numero efetivo de parametros pD sendo dado por
DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-
promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no
WinBUGS quer no R-INLA
No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos
aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-
vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive
Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-
tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle
e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-
delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para
detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)
As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)
p(yminusi)=
intf(yi|θyminusi)p(θ|yminusi) dθ
e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores
CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para
efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de
calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou
grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito
diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de
dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem
uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este
problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim
pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =
yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma
forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem
ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)
Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a
0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa
por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira
a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da
concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de
27 Ajustamento e medidas preditivas 37
referencia
Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls
(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))
ntimes T Esta medida e muito
utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os
valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo
3Aplicacoes
Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios
ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os
resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo
de aproximacao INLA atraves do R-INLA
Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-
sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel
usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos
no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao
apresentados os resultados obtidos no WinBUGS
Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a
analise individual de cada ano comparando-se os varios modelos e os resultados obtidos
no WinBUGS e no R-INLA tendo havido concordancia
Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial
40 Capıtulo 3 Aplicacoes
31 Associacao espacial
A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-
doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco
como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter
uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas
determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes
entre areas de maior risco e potenciais fatores
Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-
racterısticas que revelam alguns dos seus problemas Para alem da concentracao de
concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito
diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de
veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a
uma pequena mudanca no numero de acidentes
Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-
rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa
global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com
feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0
e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes
valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no
de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida
ao acaso pois os concelhos possuem condicoes identicas
Tendo em conta que o numero de veıculos com seguro varia muito por concelho este
comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-
ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem
medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito
instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis
ja que possuem variancias muito diferentes
A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura
31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero
de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro
para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas
versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em
2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho
da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com
tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que
assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se
31 Associacao espacial 41
ter uma percecao dessa variabilidade em cada concelho
Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000
Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000
42 Capıtulo 3 Aplicacoes
Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000
A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem
a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir
uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de
contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz
de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma
fronteira e wij = 0 caso contrario
As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e
o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em
areas pequenas em que o tamanho da medida de exposicao e diferente de area para
area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta
questao foram desenvolvidas diversas propostas alternativas para dados com populacoes
heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em
conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se
o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por
EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma
estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa
os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes
empırica da media marginal padronizado pela estimativa do desvio padrao da taxa
Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros
sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI
tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao
32 Modelos 43
do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao
aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de
EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado
no R atraves do pacote spdep e da funcao EBImoranmc()
Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano
Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859
Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000
Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente
por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos
testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo
p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na
Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para
acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao
espacial
32 Modelos
Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais
espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos
modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo
uma vez que forneceram melhores resultados como se pode verificar comparando os
valores das Tabelas 32mdash35
Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA
44 Capıtulo 3 Aplicacoes
No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo
da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo
A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos
de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente
pela analise dos resultados com o programa CODA do R (Plummer et al 2006)
No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-
tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada
computacionalmente menos intensa
Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266
P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205
P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204
P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204
Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 1 2063493 188 464 1351516 170 304 988082 169 222
BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201
BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201
BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201
As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos
espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos
com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo
Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial
Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3
1referente a Tabela 21
33 Modelos espaco-temporais 45
Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior
a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a
diferenca entre o numero de parametros e muito grande
No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos
os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero
correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se
pode ver mais adiante quando se usam os modelos espaco-temporais este problema e
ultrapassado
Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao
menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos
os tipos de acidentes
33 Modelos espaco-temporais
De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para
estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-
mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se
reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre
muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21
Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191
P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191
P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192
P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192
P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192
Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor
modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para
2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso
46 Capıtulo 3 Aplicacoes
o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela
35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo
1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash
e para o tipo 3 o modelo 6 mdash BN 3 6
Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191
BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191
BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192
BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193
BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193
Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e
do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores
sao os modelos Poisson
331 Associacao regional
Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao
geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar
informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-
plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos
nos riscos de acidentes
Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes
em milhares de habitantes P a area em centenas de km2 A a densidade populacional em
centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade
de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU
a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques
urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do
solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se
valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST
os valores sao por concelho e iguais em todos os anos
33 Modelos espaco-temporais 47
332 Selecao dos modelos
Foram implementados todos os modelos com todas as combinacoes entre as covariaveis
mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de
acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram
escolhidos os seguintes modelos
Tabela 36 DIC pD e mls para cada tipo de acidente
Tipo P DIC pD mls BN DIC pD mls
1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418
2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260
3 3 6 4 846237 20562 191 3 6 6 852362 19267 191
Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais
P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e
Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU
e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash
modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP
mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI
e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash
modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6
com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos
Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para
cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e
nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao
relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os
valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921
e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo
sao relativamente pequenas 961 594 e 076 respetivamente
Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao
contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis
covariaveis significativas e respetiva contribuicao para os resultados Assim fica para
trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais
significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em
48 Capıtulo 3 Aplicacoes
particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)
e uma covariavel considerada muito importante na modelacao estatıstica de acidentes
rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao
nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica
designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos
hoteleiros
333 Modelos para acidentes do tipo 1
Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172
log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t
e
log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t
No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente
para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos
de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem
o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o
zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor
HPD que contem o zero considera-se que a covariavel nao contribui significativamente
para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso
contrario considera-se que a covariavel contribui significativamente para a explicacao
da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado
que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124
obtendo-se o modelo Poisson 1 8 16 ou seja
log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t
Tabela 37 DIC pD e mls para acidentes tipo 1
Modelo DIC pD mls
P 1 8 1 1940548 47786 458
P 1 8 16 1939877 47789 458
BN 1 6 1 1861278 25154 419
BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
33 Modelos espaco-temporais 49
No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as
covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se
manter as covariaveis no modelo
334 Validacao dos modelos para acidentes do tipo 1
Validacao do modelo P 1 8 16 e do modelo BN 1 6 172
Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172
Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do
que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela
37 O valor da media do logscore tambem e significativamente menor de acordo com
o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores
PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O
valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo
BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes
sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do
tipo 1
335 Resultados obtidos com modelos para acidentes do tipo 1
Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172
A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um
efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma
50 Capıtulo 3 Aplicacoes
diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo
1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16
e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo
BN 1 6 172
Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172
Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max
SMR1 00000 07512 09656 10020 12360 32610
RR1 8 1 02290 07728 09663 09989 11870 28890
RR1 8 16 02274 07722 09628 09979 11860 28770
RR1 6 1 02886 07807 09599 10010 11890 24480
RR1 6 172 02852 07798 09589 09999 11870 24400
Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de
33 Modelos espaco-temporais 51
confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-
bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com
os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-
nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172
Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172
Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados
52 Capıtulo 3 Aplicacoes
os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo
P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000
Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para
o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312
se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de
33 Modelos espaco-temporais 53
suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos
erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais
Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000
Relativamente a introducao das covariaveis comprimento de estrada e quantidade de
combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia
dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis
explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao
explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados
espacialmente
Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1
Efeitos fixosmedia dp 0025q 0975q
α1 00580 00074 00435 00723
γ1 -00263 00030 -00321 -00204
Variancia dos efeitos aleatorios
σ2s1 05816 00591 04706 07001
σ2δ1
00019 00002 00015 00023
Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1
54 Capıtulo 3 Aplicacoes
mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-
plicacao da variacao associada aos efeitos temporais
Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel
vendido influenciam significativamente a variacao geografica dos riscos relativos sao
consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem
de forma positiva para a variacao os riscos o que significa que em regioes com maior
comprimento de estrada e em regioes com maior quantidade de combustıvel vendido
esta associado um aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16
Efeitos fixosmedia dp 0025q 0975q
α1 -00898 00354 -01595 -00207
b1C 00016 00004 00008 00024
b1V C 00003 00001 00002 00005
γ1 -00257 00030 -00315 -00198
Variancia dos efeitos aleatorios
σ2s1 05492 00560 04440 06615
σ2δ1
00019 00002 00015 00023
No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada
do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da
ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos
espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-
buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou
efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves
dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos
temporais σ2ψ1
se mantem o que implica que as covariaveis nao contribuem para a ex-
plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o
modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao
e significativa
Mais uma vez as covariaveis que influenciam significativamente a variacao geografica
dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-
variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que
33 Modelos espaco-temporais 55
regioes com maior comprimento de estrada regioes com maior ocupacao de solo com
equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento
turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos
os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-
mente para a estimacao dos riscos o que significa que em regioes com maior numero de
habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo
fixos todos os restantes efeitos
Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1
Efeitos fixosmedia dp 0025q 0975q
α1 -00429 00052 -00595 -00389
Parametro de dispersao φminus11 00298 00017 00267 00332
Variancia dos efeitos aleatorios
σ2s1 02603 00266 02108 03142
σ2ψ1
00090 00057 00029 00237
Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172
Efeitos fixosmedia dp 0025q 0975q
α1 -01348 00243 -01826 -00872
b1C 00013 00003 00007 00019
b1P -00135 00044 -00221 -00049
b1OSEUP 00001 000008 -000005 00003
b1OST 00001 000006 -0000003 00002
Parametro de dispersao φminus11 00300 00017 00269 00334
Variancia dos efeitos aleatorios
σ2s1 02438 00254 01966 02951
σ2ψ1
00090 00056 00029 00235
Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente
56 Capıtulo 3 Aplicacoes
espacial contribui fortemente para a variacao geografica do risco relativo O padrao e
muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes
com maior risco relativo estimado correspondem as regioes em que as estimativas dos
efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-
dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo
proximo de um correspondem as regioes em que as estimativas de si sao proximas de
zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade
HPD nao contem o zero e 633 para o modelo P 1 4 16
Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16
Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16
33 Modelos espaco-temporais 57
A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0
eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao
longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio
anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta
tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores
correspondente a diminuicao das estimativas dos riscos ao longo dos anos
Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16
Min 1oQ Mediana Media 3oQ Max
δ1 -00919 -00254 -00476 00768 00197 00133
eδ1 09125 09751 09954 10010 10200 11420
Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16
Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de
credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1
a tendencia temporal local e maior que a tendencia global sendo o decrescimento do
numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia
58 Capıtulo 3 Aplicacoes
temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia
temporal local e menor do que a global sendo o decrescimento mais acentuado No
mapa da Figura 315 pode ver-se a distribuicao destes concelhos
Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um
sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada
na Tabela A8 do Anexo A
Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172
Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172
Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos
mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial
33 Modelos espaco-temporais 59
contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado
e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com
menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si
sao proximas de zero Para este modelo a percentagem de estimativas dos valores de
s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente
a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos
seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais
acentuado nos cinco anos seguintes
Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172
Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo
BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um
aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os
restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-
gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos
estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel
contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i
no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54
Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a
percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento
turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como
os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de
60 Capıtulo 3 Aplicacoes
(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo
da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel
OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com
equipamentos turısticos vai de 0 a 038
Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172
Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172
Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior
33 Modelos espaco-temporais 61
que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos
com risco relativo significativamente maior que um
336 Modelos para acidentes do tipo 2
Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192
log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +
b2DPDP2it + s2i + (γ2 + δ2i)t
e
log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t
No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente
das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519
pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo
Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o
modelo P 2 9 16 ou seja
log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t
No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-
variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e
pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-
delo BN 2 9 4 ou seja
log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t
Tabela 314 DIC pD e mls para acidentes tipo 2
modelo DIC pD mls
P 2 9 1 1170386 35334 270
P 2 9 16 1169631 35476 270
BN 2 9 1 1156921 29101 261
BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
62 Capıtulo 3 Aplicacoes
337 Validacao dos modelos para acidentes do tipo 2
Validacao do modelo P 2 9 16 e do modelo BN 2 9 4
Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4
Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-
ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual
a 13956 O valor da media do logscore tambem e significativamente menor de acordo
com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos
valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura
322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para
o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes
sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do
tipo 2
338 Resultados obtidos com modelos para acidentes do tipo 2
Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4
A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as
estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre
um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das
estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados
a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores
esperados a posteriori obtidos com o modelo BN 2 9 4
33 Modelos espaco-temporais 63
Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4
Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os
modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max
SMR2 00000 05062 09180 11830 15740 87830
RR2 9 1 02237 06553 09651 11910 14980 77550
RR2 9 16 02218 06547 09624 11860 14970 77060
RR2 9 1 nb 02391 06636 09751 11870 14960 59240
RR2 9 4 nb 02363 06630 09720 11810 14850 59030
64 Capıtulo 3 Aplicacoes
Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo
P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes
33 Modelos espaco-temporais 65
do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000
Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000
66 Capıtulo 3 Aplicacoes
Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000
Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das
covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo
Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja
as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos
sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito
espacial
Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03511 00191 03135 03883
γ2 -00844 00037 -00918 -00771
Variancia dos efeitos aleatorios
σ2s2 09474 01054 07554 11648
σ2δ2
00099 00016 00070 00133
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-
plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao
33 Modelos espaco-temporais 67
para a variacao geografica das estimativas dos riscos e positiva em regioes com maior
comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao
para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos
Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16
Efeitos fixosmedia dp 0025q 0975q
α2 01790 00530 00741 02822
b2C 00020 00005 00009 00031
b2V C -00004 00003 -00010 00003
γ2 -00833 00038 -00906 -00759
Variancia dos efeitos aleatorios
σ2s2 09162 01019 07325 11282
σ2δ2
00099 00016 00015 00135
Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com
a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos
efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma
efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam
incluıdos no modelo P 2 9 1 atraves do efeito espacial
Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03529 00223 03090 03965
γ2 -00819 00044 -00906 -00733
Parametro de dispersao φminus11 00577 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07824 00925 06156 09748
σ2δ2
00051 00012 00031 00079
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
68 Capıtulo 3 Aplicacoes
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao
associada aos efeitos temporais Para alem disso como a contribuicao para a variacao
geografica das estimativas dos riscos e positiva em regioes com maior comprimento de
estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos
os restantes efeitos
Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4
Efeitos fixosmedia dp 0025q 0975q
α2 01961 00530 00741 02822
b2C 00017 00005 00008 00027
γ2 -00814 00044 -00900 -00727
Parametro de dispersao φminus11 00576 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07516 00894 05914 09385
σ2δ2
00052 00013 00031 00080
Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16
33 Modelos espaco-temporais 69
Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode
verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o
padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado
correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as
regioes com menor risco relativo estimado correspondem as regioes em que as estimativas
de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes
em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem
de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero
e 608
Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era
esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou
seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem
de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295
Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16
Min 1oQ Mediana Media 3oQ Max
δ2 -01805 -00411 00082 00003 00485 01532
eδ2 08358 09604 10090 10030 10500 11660
No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se
que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia
70 Capıtulo 3 Aplicacoes
temporal local maior do que a global e um decrescimento no numero de acidentes do tipo
2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local
menor que a global e um decrescimento mais acentuado
Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16
E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um
obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um que permite complementar esta informacao
Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-
temente para a variacao geografica do risco relativo como se pode observar no mapa da
Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-
mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes
com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao
proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i
cujo intervalo de credibilidade HPD nao contem o zero e 5665
33 Modelos espaco-temporais 71
Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4
Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4
Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4
Min 1oQ Mediana Media 3oQ Max
δ1 -01530 -00368 00052 00001 00402 01140
eδ1 08592 09646 10060 10020 10420 11210
72 Capıtulo 3 Aplicacoes
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca
no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de
78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de
valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa
da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a
global sendo o seu decrescimento menos acentuado que o decrescimento global havendo
uma minoria onde se passa o contrario
Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4
Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior
que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao
com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista
ordenada dos primeiros quinze concelhos
33 Modelos espaco-temporais 73
339 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6
log(θ3ij) = α3 + b3CCi + s3i + ψ3t
e
log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t
No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a
covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo
P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1
log(θ3ij) = α3 + s3i + ψ3t
No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade
populacional nao contem o zero por isso o modelo mantem-se
Tabela 322 DIC pD e mls para acidentes tipo 3
modelo DIC pD mls
P 3 6 1 846290 20551 191
P 3 6 4 846237 20562 191
BN 3 6 1 852438 19770 191
BN 3 6 6 852362 19267 191
3310 Validacao dos modelos para acidentes do tipo 3
Validacao do modelo P 3 6 1 e do modelo BN 3 6 6
Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e
menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072
Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos
valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia
preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo
74 Capıtulo 3 Aplicacoes
ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se
que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3
Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6
3311 Resultados obtidos com modelos para acidentes do tipo 3
Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6
Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max
SMR3 00000 04639 11050 15100 20490 156700
RR3 6 1 01363 08869 13050 14900 18430 95400
RR3 6 6 bn 01247 09020 13170 14850 18370 87310
Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo
obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-
vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores
esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos
valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e
Tabela 323
33 Modelos espaco-temporais 75
Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6
Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6
Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-
76 Capıtulo 3 Aplicacoes
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os
modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6
Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000
Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo
P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
33 Modelos espaco-temporais 77
Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000
Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem
comentarios acerca de associacao regional para este modelo
78 Capıtulo 3 Aplicacoes
No modelo BN observa-se que com a introducao da covariavel densidade populacional o
valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da
variancia dos efeitos temporais σ2ψ1t
se mantem Tabelas 325 e 326
Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02114 00152 01815 02410
Variancia dos efeitos aleatorios
σ2s3 06817 00802 05383 08499
σ2ψ3
00255 00157 00082 00660
Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02155 00158 01842 02464
Parametro de dispersao ψminus11 00455 00061 00348 00584
Variancia dos efeitos aleatorios
σ2s3 06497 00800 05070 08174
σ2ψ3
00255 00161 00081 00672
Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6
Efeitos fixosmedia dp 0025q 0975q
α3 02791 00217 02362 03215
bDP -00199 00048 -00294 -00105
Parametro de dispersao φminus11 00459 00061 00350 00588
Variancia dos efeitos aleatorios
σ2s3 05855 00749 04532 07440
σ2ψ3
00255 00161 00081 00672
Tal significa que a covariavel densidade populacional contribui para a explicacao da
33 Modelos espaco-temporais 79
variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao
da variacao temporal A contribuicao da covariavel densidade populacional e negativa
o que indica que em regioes com maior densidade populacional ocorre a contribuicao
para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos
No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a
sobredispersao nao e significativa
Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1
Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1
80 Capıtulo 3 Aplicacoes
O padrao espacial das estimativas do risco relativo e das estimativas da componente
espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras
342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao
positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos
efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem
o zero e 439 para o modelo P 3 6 1
No que respeita a componente temporal observa-se um decrescimento nos dois primeiros
anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento
nos ultimos cinco anos
Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1
Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco
relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a
lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-
tivamente maior que um na Tabela A9 do Anexo A
33 Modelos espaco-temporais 81
Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6
Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6
Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os
padroes revelados pelos mapas As regioes com maior contribuicao da componente es-
pacial para o aumento do risco relativo correspondem em geral a regioes com maiores
estimativas de risco relativo Tal significa que a componente espacial explica grande parte
da variacao das estimativas do risco relativo A percentagem de estimativas dos valores
de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1
82 Capıtulo 3 Aplicacoes
Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6
A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo
modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode
ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se
pode encontrar uma lista ordenada dos primeiros quinze concelhos
Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se
apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista
o tipo de interacao espaco-temporal
Tabela 327 Modelos univariados
Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal
1 BN 1 6 172 C+P+OSEPU+OST RW mdash
2 BN 2 9 4 C fixo CAR
3 P 3 6 1 mdash RW mdash
34 Modelos multivariados 83
34 Modelos multivariados
Os modelos multivariados usados foram
log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)
log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)
Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-
tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito
complexos nao parece haver um ganho substancial em usa-los
Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados
Modelos multivariados Modelos univariados
Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q
α1 00565 00181 00214 00914 00580 00074 00435 00723
α2 03423 00344 02735 04083 03511 00191 03135 03883
α3 05993 00331 05340 06644 06633 00247 06147 07115
γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204
γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771
γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907
Σu =
05551 03843 05519
03843 1042 05864
05519 05864 09113
Σδ =
00074 00035 00061
00035 00111 00059
00061 00059 00081
No entanto e interessante verificar que em termos de correlacao entre as estimativas
dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo
2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao
que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios
nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e
tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no
numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330
84 Capıtulo 3 Aplicacoes
Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal
Modelos com interacao Modelos sem interacao
media dp 0025q 0975q media dp 0025q 0975q
ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669
ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879
ρ23(θ) 06793 00242 06304 07252 06831 002647 07326
ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196
ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941
ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976
ρ12(δ) 03823 00894 01960 05465
ρ13(δ) 07979 00634 06487 08998
ρ23(δ) 06203 00938 04153 07829
Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias
AnoVıtimas mortais Feridos graves Feridos leves
24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif
2010 741 937 196 2637 2475 -162 43924 43890 -34
2011 689 891 202 2436 2265 -171 39726 39695 -31
34 Modelos multivariados 85
Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados
86 Capıtulo 3 Aplicacoes
Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
35 Aplicacao para acidentes rodoviarios nas estradas
secundarias
Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-
cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram
retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-
damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior
risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do
poder local
Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840
Total 175741 16909 3471 196121
Figura 350 Numero de acidentes tipo 1 por concelho
88 Capıtulo 3 Aplicacoes
Figura 351 Numero de acidentes tipo 2 por concelho
Figura 352 Numero de acidentes tipo 3 por concelho
No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados
Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89
de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos
Tabela 332 DIC pD e mls para cada tipo de acidente
Modelo DIC pD mls
BN 1 9 42 1614530 32359 363
BN 2 9 246 924765 27530 208
P 3 6 30 581058 11747 131
351 Modelo para acidentes do tipo 1
Modelo Binomial Negativo 1 9 42
log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t
Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a
variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do
modelo
352 Validacao do modelo para acidentes do tipo 1
Validacao do modelo BN 1 9 42
Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42
O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-
pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O
90 Capıtulo 3 Aplicacoes
valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem
um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-
ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42
e o melhor modelo para acidentes do tipo 1
353 Resultados obtidos com o modelo para acidentes do tipo 1
Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42
Efeitos fixosmedia dp 0025q 0975q
α1 -03518 00346 -04202 -02843
b1C 00012 00004 00005 00019
b1OST 00001 000007 -000005 00002
γ1 -00128 00026 -00179 -00077
Parametro de dispersao φminus11 00287 00021 00248 00328
Variancia dos efeitos aleatorios
σ2s1 03982 00445 03180 04909
σ2δ1
00026 00007 00015 00040
Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91
As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico
influenciam significativamente a variacao geografica dos riscos relativos e portanto sao
consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de
forma positiva para a variacao dos riscos o que significa que em regioes com maior
comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma
contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes
efeitos
Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-
derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura
temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao
envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial
se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de
risco relativo Figuras 354 e 316
Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42
Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco
relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um
92 Capıtulo 3 Aplicacoes
354 Modelo para acidentes do tipo 2
Modelo Binomial Negativo 2 9 246
log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +
s2i + (γ2 + δ2i)t2
Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de
todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938
pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e
manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja
log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2
Tabela 334 DIC pD e mls
Modelo DIC pD mls
BN 2 9 86 924868 24786 208
355 Validacao do modelo para acidentes do tipo 2
Validacao do modelo BN 2 9 86
Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86
O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo
Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93
do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto
proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e
95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor
modelo para acidentes do tipo 2
356 Resultados obtidos com o modelo para acidentes do tipo 2
Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86
Efeitos fixosmedia dp 0025q 0975q
α2 -01198 00480 -02147 -00266
b1OSI 00002 000008 000007 00004
b1OSEPU 00003 00002 000001 00006
b1DP 00084 00066 -00046 00215
γ1 -01198 00480 -02147 -00266
Parametro de dispersao
φminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 10557 01336 08161 13345
σ2δ1
00094 00023 00057 00147
A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-
nos e a densidade populacional influenciam significativamente a variacao geografica dos
riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-
variaveis contribuem de forma positiva para a variacao dos riscos o que significa que
em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo
com equipamentos e parques urbanos e a regioes com maior densidade populacional ha
contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes
do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a
mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao
Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que
os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos
94 Capıtulo 3 Aplicacoes
concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns
conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas
do risco relativo sao os mesmos
Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86
Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95
A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com
o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que
consta na Tabela A11
357 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 30
log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt
Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU
contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo
358 Validacao do modelo para acidentes do tipo 3
Validacao do modelo P 3 6 30
Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30
Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da
distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-
mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores
igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva
e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para
acidentes do tipo 3
96 Capıtulo 3 Aplicacoes
359 Resultados obtidos com o modelo para acidentes do tipo 3
Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30
Efeitos fixosmedia dp 0025q 0975q
α2 00104 00520 -00923 01117
b3A 00258 00116 00031 00049
b3OSEPU -00001 00001 -00004 000006
Parametro de dispersao
ψminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 03598 00687 02422 05084
σ2ψ1
00246 00163 0007 00666
Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30
A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam
significativamente a variacao geografica dos riscos relativos sendo consideradas na es-
timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97
a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial
em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes
com maior area geografica ha uma contribuicao para o aumento das estimativas do risco
relativo mantendo fixos todos os restantes efeitos
O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de
trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-
trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico
mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No
entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos
Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30
E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo
modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que
consta na Tabela A11
Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-
mente a abordagem global e a abordagem local
98 Capıtulo 3 Aplicacoes
Tabela 337 Comparacao entre a abordagem local e a global
Abordagem Tipo Melhor Covariaveis Efeito Interacao
Modelo temporal espaco-temporal
Local 1 BN 1 9 42 C+OST fixo CAR
Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash
Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR
Gloal 2 BN 2 9 4 C fixo CAR
Local 3 P 3 6 30 A+OSEUP aleatorio mdash
Global 3 P 3 6 1 mdash aleatorio mdash
4Discussao e conclusoes
Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia
de dependencia espacial de tendencia temporal e de associacao regional em dados de
acidentes rodoviarios
Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-
delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por
areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar
diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao
espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel
recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados
com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de
trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de sobredispersao de associacao posi-
tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-
mentos e parques urbanos e uma associacao regional negativa com a populacao
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
100 Capıtulo 4 Discussao e conclusoes
bredispersao e de associacao regional positiva com o comprimento de estrada
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente
Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com o comprimento de estrada e com
a area de ocupacao do solo para turismo
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com a area de ocupacao de solo para
a industria com a area de ocupacao do solo com equipamentos e parques urbanos
e com a densidade populacional
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente de associacao regional
positiva com a area e de associacao regional negativa com a area de ocupacao de
solo com equipamentos e parques urbanos
Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-
se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas
Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com
interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao
do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido
o modelo Poisson com efeito temporal aleatorio
Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos
modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-
tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se
capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes
espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-
formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que
as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto
e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas
as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de
valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais
elevados diminuiram ou seja os valores extremos foram suavizados
101
Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos
dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-
gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi
possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia
temporal global Este e um tipo de resultado muito importante na fase de aplicacao
pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter
exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas
Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-
minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as
covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam
incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-
fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal
Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores
usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal
considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para
todos os anos em estudo
Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos
mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-
pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a
ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-
cativamente maior que um bem como as dos concelhos com valores consideravelmente
menores do que a unidade
Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-
timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises
por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-
pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de
estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-
nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o
TDMA de modo a introduzi-las no modelo
Os modelos multivariados constituiram um esforco computacional elevado nao tendo
havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises
comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi
possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes
tipos de acidentes
Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves
do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo
uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-
ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA
102 Capıtulo 4 Discussao e conclusoes
pela extrema concordancia de resultados pela facilidade de implementacao dos modelos
pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez
de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem
duvida muito mais acessıvel
Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-
dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de
um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-
patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de
recolha e definicao das variaveis de interesse A implementacao estes modelos tambem
pode ser efetuada atraves do R-INLA
Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir
como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-
dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite
efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-
gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade
dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas
geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios
constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel
mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-
sabilidade de todosrdquo
ACaracterizacao da regiao de estudo
A1 Portugal Continental
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes
administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados
em 18 distritos
O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a
partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na
pagina do Instituto Geografico Portugues - httpwwwigeopt
A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o
map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-
hancas no WinBUGS
104 Apendice A Caracterizacao da regiao de estudo
Figura A1 ID dos concelhos do Norte de Portugal Continental
A1 Portugal Continental 105
Figura A2 ID dos concelhos do Sul de Portugal Continental
106 Apendice A Caracterizacao da regiao de estudo
A1 Portugal Continental 107
108 Apendice A Caracterizacao da regiao de estudo
A2 Numero de acidentes
Tabela A1 Estatısticas resumo de acidentes tipo 1
Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200
Tabela A2 Estatısticas resumo de acidentes tipo 2
Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800
Tabela A3 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100
A2 Numero de acidentes 109
Numero de acidentes que ocorreram nas estradas secundarias
Tabela A4 Estatısticas resumo de acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900
Tabela A5 Estatısticas resumo de acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800
Tabela A6 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700
110 Apendice A Caracterizacao da regiao de estudo
A3 Covariaveis
bull Populacao - P
Tabela A7 Estatısticas resumo da covariavel populacao
Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700
Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)
A3 Covariaveis 111
bull Area - A
Figura A4 Area em centenas de km2 por concelho (Fonte INE)
bull Densidade Populacional - DP
Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)
112 Apendice A Caracterizacao da regiao de estudo
bull Comprimento de Estrada - C
Figura A6 Quilometros de estrada por concelho (Fonte EP)
bull Quantidade de combustıvel vendido - VC
Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)
A3 Covariaveis 113
bull Ocupacao urbana do solo - OSU
Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
bull Ocupacao industrial do solo - OSI
Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)
114 Apendice A Caracterizacao da regiao de estudo
bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU
Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)
bull Ocupacao do solo com equipamento turıstico - OST
Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
A4 15 concelhos 115A
415
con
celh
os
Tab
ela
A8
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o1
Mold
elo
P1
816
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alb
ergaria
-a-V
elh
a3
Castro
Marim
Alc
acer
do
Sal
Grandola
Castro
Marim
Castro
Marim
Castro
Marim
Alb
ergaria
-a-V
elh
aV
ouzela
4A
lcacer
do
Sal
Castro
Marim
Castro
Marim
Grandola
Grandola
Alb
ergaria
-a-V
elh
aC
astro
Marim
Alc
acer
do
Sal
5V
izela
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
Vila
Velh
ade
Rodao
Pedrogao
Grande
6C
ondeix
a-a
-Nova
Azam
buja
Azam
buja
Azam
buja
Obid
os
Penela
Penela
Vila
Velh
ade
Rodao
7A
zam
buja
Viz
ela
Alj
ezur
Obid
os
Penela
Obid
os
Alj
ezur
Penela
8Silves
Alj
ezur
Obid
os
Condeix
a-a
-Nova
Azam
buja
Grandola
Obid
os
Alj
ezur
9A
lbufe
ira
Silves
Pom
bal
Pom
bal
Pom
bal
Vila
Velh
ade
Rodao
Pedrogao
Grande
Obid
os
10
Alj
ezur
Obid
os
Palm
ela
Penela
Alb
ergaria
-a-V
elh
aP
om
bal
Vouzela
Castro
Marim
11
Palm
ela
Pom
bal
Benavente
Palm
ela
Condeix
a-a
-Nova
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oE
sposende
12
Benavente
Benavente
Silves
Benavente
Vila
Velh
ade
Rodao
Azam
buja
Pom
bal
Montem
or-o
-Velh
o13
Pom
bal
Palm
ela
Penela
Vagos
Benavente
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
Tabua
14
Obid
os
Alb
ufe
ira
Olh
ao
Silves
Palm
ela
Condeix
a-a
-Nova
Esposende
Oliveir
ado
Bair
ro
15
Marin
ha
Grande
Olh
ao
Vagos
Olh
ao
Montem
or-o
-Velh
oP
edrogao
Grande
Tabua
Cham
usca
Mold
elo
BN
16
172
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
3C
astro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
4G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
5O
bid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
6C
ondeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
7A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
8P
om
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
9B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
10
Penela
Penela
Penela
Penela
Penela
Penela
Penela
Penela
11
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
12
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
13
Palm
ela
Alb
ergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
a14
Alb
ergaria
-a-V
elh
aP
alm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
15
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
o
116 Apendice A Caracterizacao da regiao de estudo
Tab
ela
A9
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o2
Modelo
P2
916
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ouriq
ue
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Alj
ustrel
4A
lcacer
do
Sal
Alc
acer
do
Sal
Avis
Nis
aO
urem
Nis
aA
ljustrel
Avis
5A
vis
Avis
Alc
acer
do
Sal
Rio
Maio
rN
isa
Alj
ustrel
Nis
aM
ourao
6C
ham
usca
Nis
aN
isa
Alj
ezur
Alc
acer
do
Sal
Mourao
Mourao
Nis
a7
Santarem
Cham
usca
Alj
ezur
Alc
acer
do
Sal
Alj
ustrel
Pedrogao
Grande
Pedrogao
Grande
Pedrogao
Grande
8V
ila
Nova
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rA
lcacer
do
Sal
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
da
Barquin
ha
da
Barquin
ha
9N
isa
Santarem
Vila
Nova
Pedrogao
Grande
Mourao
Ourem
Alc
acer
do
Sal
Proenca-a
-Nova
da
Barquin
ha
10
Alm
eir
imV
endas
Novas
Pedrogao
Grande
Mourao
Pedrogao
Grande
Ferreir
ado
Ale
ntejo
Proenca-a
-Nova
Alc
acer
do
Sal
11
Gole
ga
Montem
or-o
-Novo
Alj
ustrel
Vila
Nova
Ferreir
ado
Ale
ntejo
Rio
Maio
rG
randola
Idanha-a
-Nova
da
Barquin
ha
12
Vendas
Novas
Alj
ezur
Santarem
Cham
usca
Montem
or-o
-Novo
Montem
or-o
-Novo
Rio
Maio
rG
randola
13
Gavia
oG
avia
oM
ontem
or-o
-Novo
Montem
or-o
-Novo
Vila
Nova
Grandola
Ourem
Alm
odovar
da
Barquin
ha
14
Palm
ela
Gole
ga
Mourao
Ferreir
ado
Ale
ntejo
Grandola
Proenca-a
-Nova
Montem
or-o
-Novo
Montem
or-o
-Novo
15
Montem
or-o
-Novo
Alm
eir
imV
endas
Novas
Grandola
Cham
usca
Vila
Nova
Vila
Velh
ade
Rodao
Celo
ric
oda
Beir
ada
Barquin
ha
Modelo
BN
29
4
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ourem
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Avis
Alj
ustrel
4A
vis
Avis
Rio
Maio
rA
ljezur
Ourem
Nis
aA
ljustrel
Avis
5A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Nis
aN
isa
Alj
ustrel
Nis
aN
isa
6C
ham
usca
Nis
aN
isa
Alc
acer
do
Sal
Alc
acer
do
Sal
Ourem
Mourao
Mourao
7V
ila
Nova
Cham
usca
Alj
ezur
Rio
Maio
rA
ljustrel
Alc
acer
do
Sal
Alc
acer
do
Sal
Pedrogao
Grande
da
Barquin
ha
8Santarem
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rM
ourao
Pedrogao
Grande
Alc
acer
do
Sal
9N
isa
Santarem
Vila
Nova
Mourao
Mourao
Pedrogao
Grande
Ferreir
aFerreir
ada
Barquin
ha
do
Ale
ntejo
do
Ale
ntejo
10
Montem
or-o
-Novo
Alj
ezur
Alj
ustrel
Vila
Nova
Pedrogao
Grande
Rio
Maio
rO
urem
Proenca-a
-Nova
da
Barquin
ha
11
Vendas
Novas
Montem
or-o
-Novo
Santarem
Cham
usca
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
Rio
Maio
rC
elo
ric
oda
Beir
a12
Gole
ga
Alj
ustrel
Montem
or-o
-Novo
Pedrogao
Grande
Montem
or-o
-Novo
Montem
or-o
-Novo
Proenca-a
-Nova
Ourem
13
Salv
aterra
de
Magos
Vendas
Novas
Mourao
Montem
or-o
-Novo
Vila
Nova
Grandola
Montem
or-o
-Novo
Grandola
da
Barquin
ha
14
Alm
eir
imM
ourao
Pedrogao
Grande
Ferreir
aC
ham
usca
Vila
Nova
Grandola
Idanha-a
-Nova
do
Ale
ntejo
da
Barquin
ha
15
Alj
ezur
Salv
aterra
de
Magos
Ferreir
ado
Ale
ntejo
Grandola
Grandola
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aM
ontem
or-o
-Novo
A4 15 concelhos 117
Tab
ela
A1
015
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o3
Modelo
P3
61
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
Ferreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9C
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a10
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
11
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
12
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
13
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Modelo
BN
36
6
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9A
zam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
10
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
11
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a12
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
13
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
118 Apendice A Caracterizacao da regiao de estudoT
abel
aA
11
15co
nce
lhos
com
esti
mati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
Acid
entes
tip
o1
-M
odelo
BN
19
42
2000
2001
2002
2003
2004
2005
2006
2007
1M
arin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Ilhavo
Ilhavo
Ilhavo
Ilhavo
2Il
havo
Ilhavo
Ilhavo
Ilhavo
Marin
ha
Grande
Marin
ha
Grande
Vagos
Vagos
3A
lbufe
ira
Alb
ufe
ira
Vagos
Vagos
Vagos
Vagos
Marin
ha
Grande
Ferreir
ado
Zezere
4P
ortim
ao
Portim
ao
Alb
ufe
ira
Portim
ao
Portim
ao
Ferreir
ado
Zezere
Ferreir
ado
Zezere
Marin
ha
Grande
5V
agos
Vagos
Portim
ao
Porto
Porto
Portim
ao
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
6P
orto
Porto
Porto
Alb
ufe
ira
Ferreir
ado
Zezere
Porto
Porto
Montem
or-o
-Velh
o7
Faro
Penic
he
Penic
he
Penic
he
Penic
he
Penic
he
Portim
ao
Alp
iarca
8L
oule
Faro
Faro
Faro
Alb
ufe
ira
Oliveir
ado
Bair
ro
Montem
or-o
-Velh
oP
orto
9P
enic
he
Loule
Viz
ela
Ferreir
ado
Zezere
Coim
bra
Montem
or-o
-Velh
oP
enic
he
Penic
he
10
Odiv
ela
sO
div
ela
sC
oim
bra
Coim
bra
Faro
Coim
bra
Coim
bra
Coim
bra
11
Viz
ela
Viz
ela
Odiv
ela
sV
izela
Montem
or-o
-Velh
oA
lbufe
ira
Alp
iarca
Portim
ao
12
Olh
ao
Coim
bra
Loule
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Faro
Pom
bal
Pom
bal
13
Nazare
Olh
ao
Ferreir
ado
Zezere
Odiv
ela
sV
izela
Aveir
oA
veir
oA
veir
o14
Coim
bra
Setubal
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Aveir
oP
om
bal
Faro
Vis
eu
15
Setubal
Cantanhede
Setubal
Aveir
oP
om
bal
Viz
ela
Murtosa
Lis
boa
Acid
entes
tip
o2
-M
odelo
BN
29
86
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ourem
Ourem
Ourem
Ourem
Ourem
S
J
Madeir
a2
Rio
Maio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rFerreir
aZ
O
dem
ira
Odem
ira
3A
lmeir
imFerreir
aZ
Ferreir
aZ
Ferreir
aZ
Ferreir
aZ
R
ioM
aio
rFerreir
aZ
Ferreir
aZ
4
Ferreir
ado
Zezere
Alm
eir
imB
raganca
Braganca
Braganca
Odem
ira
S
J
Madeir
aV
izela
5Santarem
Braganca
Avis
Odem
ira
Odem
ira
Mourao
Braganca
Braganca
6L
isboa
Lis
boa
Odem
ira
Mourao
Mourao
Braganca
Rio
Maio
rO
urem
7C
ham
usca
Santarem
Lis
boa
Avis
Avis
S
J
Madeir
aA
lmodovar
Alm
odovar
8B
raganca
Cham
usca
Mourao
Lis
boa
Vim
ioso
Avis
Viz
ela
Tondela
9P
alm
ela
Avis
Santarem
Cham
usca
Ala
ndroal
Vim
ioso
Tondela
Chaves
10
Salv
aterra
de
Magos
Palm
ela
Cham
usca
Palm
ela
S
J
Madeir
aA
lmodovar
Chaves
Rio
Maio
r11
Avis
Salv
aterra
de
Magos
Alm
eir
imSantarem
Alm
odovar
Chaves
Elv
as
Guim
araes
12
Ilhavo
Odem
ira
Palm
ela
Ala
ndroal
Elv
as
Ala
ndroal
Serta
13
Vila
Nova
da
Barquin
ha
Mourao
Salv
aterra
de
Magos
Elv
as
Palm
ela
Tondela
Palm
ela
14
Nazare
Vila
Nova
da
Barquin
ha
Ala
ndroal
Alm
eir
imC
ham
usca
Elv
as
Portim
ao
15
Abrantes
Ala
ndroal
Lagos
Salv
aterra
de
Magos
Lis
boa
Palm
ela
Loule
Acid
entes
tip
o3
-M
odelo
P3
630
2000
2001
2002
2003
2004
2005
2006
2007
1O
dem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
2M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
3V
imio
so
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Cantanhede
4F
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
o5
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
6M
iranda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
7A
lmodovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
8Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
9A
lcoutim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
10
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
11
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
12
Alc
ochete
Alc
ochete
Alc
ochete
Macedo
de
Cavale
iros
Alc
ochete
Alc
ochete
13
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Vagos
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
14
Vagos
Vagos
Vagos
Cantanhede
Vagos
Vagos
15
Cantanhede
Cantanhede
Cantanhede
Alc
ochete
Cantanhede
Cantanhede
Referencias Bibliograficas
Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes
in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625
ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt
Defaultaspxtabid=220amplanguage=pt-PT
ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx
fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT
Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population
density Statistics in Medicine 18(16) 2147ndash2162
Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety
performance indicators by using a multivariate generalized linear mixed model Journal
of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517
Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis
for Spatial Data Chapman amp Hall
Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease
maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431
Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini
M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med
14(21-22) 2433ndash2443
Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis
of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007
Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems
Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236
Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-
tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20
101007BF00116466
120 Referencias bibliograficas
Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis
with R Springer
Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed
Models Journal of the American Statistical Association 88(421) 9ndash25
Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane
roads Accident Analysis amp Prevention 39(4) 657 ndash 670
Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a
velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos
PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico
Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em
Seguranca Rodoviaria Technical report IST and LNEC
Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-
Temporally Correlated Survival Data In Bayesian Statistics 7
Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data
Analysis Chapman amp Hall
Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative
Risks for Use in Disease Mapping Biometrics 43 671ndash681
Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data
Biometrics 65 1254ndash1261
Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao
em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo
20economico20e20social20dos20acidentes_versao20para20internet
Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in
Europe Applied Spatial Analysis 1 133ndash150
Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level
Example of Belgium Journal of Safety Research 39(4) 417 ndash 427
El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate
Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828
Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety
Accident Analysis amp Prevention 40(6) 1964 ndash 1969
Referencias bibliograficas 121
Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis
and Prevention 43 253ndash264
Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall
Gelfand A E (1996) Model determination using sampling-based methods In W
Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice
chapter 9 (pp 145ndash161) Chapman amp
Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive
models for spatial data analysis Biostatistics 4(1) 11ndash15
Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis
Chapman amp Hall
Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for
the analysis of spatial data An application to disease mapping Journal of Statistical
Planning and Inference 75(2) 305 ndash 318
Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and
Estimation Journal of the American Statistical Association 102(477) 359ndash378
Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical
Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808
Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps
with Application to German Mortality Data httpepububuni-muenchende
Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive
Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical
Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD
Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR
Models for Areal Data Biometrics 61(4) 950ndash961
Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease
risk Statistics In Medicine 19(17-18) 2555ndash2567
Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space
Statistics in Medicine 17(18) 2045ndash2060
Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-
demiology CRC Press Taylor amp Francis
122 Referencias bibliograficas
Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-
mann P e Divino F (2000) Disease mapping models an empirical evaluation
Statistics in Medicine 19(17-18) 2217ndash2241
Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-
temporal patterns of intra-city motor vehicle craches Journal of Transport Geography
15 274ndash285
Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical
models in road safety countermeasure effectiveness studies in Iowa Accident Analysis
amp Prevention 40(4) 1531 ndash 1542
Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-
Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis
amp Prevention 40(3) 1123 ndash 1134
Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small
sample size on the estimation of the fixed dispersion parameter of Poisson-gamma
models for modeling motor vehicle crashes A Bayesian perspective Safety Science
46(5) 751 ndash 770
Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-
persion parameters of Poisson-gamma models on empirical Bayes estimates Accident
Analysis amp Prevention 40(4) 1441 ndash 1457
Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-
inflated regression models of motor vehicle crashes balancing statistical fit and theory
Accident Analysis amp Prevention 37(1) 35 ndash 46
Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal
regression model for prediction of crash counts by severity using Bayesian methods
Accident Analysis amp Prevention 40(3) 964 ndash 975
MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident
and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028
Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P
Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive
Statistical Methods (pp 99ndash114) Springer
Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-
tent Gaussian models using integrated nested Laplace approximations A manual for
Referencias bibliograficas 123
the inla program Technical report Norwegian University of Science and Technology
Trondheim
McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall
Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-
provements Decision parameter treatability concept statistical criterion and spatial
dependence Accident Analysis amp Prevention 37(4) 699 ndash 720
Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A
Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57
Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures
for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201
Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle
crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468
Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties
in england Accident Analysis amp Prevention 36(6) 973 ndash 984
OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications
world_health_statistics2008en
OMS (2009) Global status report on road safety httpwhqlibdocwhoint
publications20099789241563840_engpdf
Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao
Calouste Gubenkian
Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes
factors Biometrika 77(3) 455ndash466
Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-
tistics 9(3) 523ndash539
Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis
and output analysis for MCMC R News 6(1) 7ndash11
Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and
heterogeneity An analysis of London crash data Accident Analysis amp Prevention
40(4) 1486 ndash 1497
124 Referencias bibliograficas
R Development Core Team (2008) R A Language and Environment for Statistical
Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-
07-0
Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology
Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications
Chapman amp HallCRC
Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent
gaussian models by using integrated nested laplace approximations Journal of the
Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392
Schrodle B e Held L (2011) A primer on disease mapping and ecological regression
using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2
Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment
and Posterior Inference Journal of Statistical Software 21(11) 1ndash37
Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial
models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)
246 ndash 273
Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian
measures of model complexity and fit J R Statist Soc B 64 583ndash639
Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and
Marginal Densities Journal of the American Statistical Association 81 82ndash86
Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian
Journal of Statistics 31 221ndash229
Wakefield J (2007) Disease mapping and spatial regression with count data Biostat
8(2) 158ndash183
Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press
Taylor amp Francis
Abstract
Road accidents are a serious public health problem worldwide with devastating socio-
economic consequences Despite the enormous efforts made in recent years the road
fatalities values are still unacceptable Statistics recorded caught the interest of resear-
chers and politicians as a key to better understand the complexity of factors related to
road accidents and to determine which aspects of the problem of road safety are local
(national or regional) and which are shared by several countries Thus there has been
considerable research directed towards the development of statistical modeling of road
accident data in geographic areas corresponding to organs of public administration or
management of transport infrasctruture with the aim of finding models that can serve
as reference to the implementation of corrective actions aimed to reduce the number of
road accidents
The estimation of the expected number of accidents remains an open problem and there
is no method that can be considered optimal However there is a general reference to
the superiority of Bayesian methods This thesis focuses on the application of Bayesian
hierarchical models with spatio-temporal data in road safety
Regarding to inference methodology a recent approach proposed in Rue et al (2009)
which is the approximate Bayesian inference via INLA (Integrated Nested Laplace Appro-
ximations) was used which is a deterministic alternative to the simulation methods
MCMC commonly used Thus we explored in R through R-INLA the implementation of
this methodology which makes the use of Bayesian hierarchical models more accessible
being a very competitive alternative for the WinBUGS for situations where the depedent
variable distribution belongs to the exponential family
With the implementation of these models it was possible to reduce the estimates va-
riability of the risks of accidents in small areas and simultaneously to reveal patterns
of spatial dependence trends and spatio-temporal interactions In this way a spatial
smoothing of the data was obtained despite of the regions under study having small
areas Furthermore it was possible to identify the counties of Portugal at higher risk
relatively to the country and to analyze association of the district council with potential
risk factors or exposure It is hoped that this methodology will allow comparisons with
regard to road safety not only at national or regional level but also at international level
Keywords road safety hierarchical Bayesian models relative risk INLA
Agradecimentos
Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-
pressar o meu profundo agradecimento
A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-
mente pela sua compreensao
A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao
devido acima de tudo pela grande admiracao que tenho por ela
Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima
de tudo pelo seu entusiasmo por esta tese
Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo
Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA
e pelo incentivo
Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a
minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha
de conhecimentos importantes para a realizacao do meu doutoramento
Ao Professor Rune Elvik pelo interesse demostrado
Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-
ciado pela bolsa de doutoramento SFRHPROTEC492262008
A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de
Portugal Continental
Ao Dr Rui Pereira pela prontidao e pelo interesse
A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do
Instituto Superior de Engenharia
Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram
em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao
Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas
A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-
balho
Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha
espera
Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho
a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa
os quais me ajudaram cada um a sua maneira
A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude
partilhar muitos momentos de alegria e descontracao
Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira
A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre
em mim a Mariana e a Rita por me seguirem como exemplo
A minha mae
Siglas e Acronimos
A Area geografica
AE Autoestrada
ANSR Autoridade Nacional de Seguranca Rodoviaria
BN Binomial Negativo
BT Brigada de Transito
BOA An R Package for MCMC Output Convergence
Assessment and Posterior Inference
BUGS Bayesian Using Gibbs Sampling
C Comprimento de estrada
CARE Community database on accidents on the roads in Europe
CE Codigo de Estrada
CODA Convergence Diagnosis and Output Analysis for MCMC
CPO Conditional Predictive Ordinates
DIC Deviance Information Criterion
DP Densidade populacional
EN Estrada Nacional
ENSR Estrategia Nacional de Seguranca Rodoviaria
GNR Guarda Nacional Republicana
HPD Highest Probability Density
IC Itinerario Complementar
INLA Integrated Nested Laplace Approximations
IP Itinerario Principal
MCMC Markov Chains Monte Carlo
mls Mean logarithmic score
OMS Organizacao Mundial de Saude
ONU Organizacao das Nacoes Unidas
OSEPU Ocupacao do solo com equipamentos e parques urbanos
OSI Ocupacao industrial do solo
OST Ocupacao do solo com equipamento turıstico
OSU Ocupacao urbana do solo
pD Numero efetivo de parametros
PIT Probability Integral Transformation
PMOT Plano Municipal de Ordenamento do Territorio
PMSR Planos Municipais de Seguranca Rodoviaria
PSP Polıcia de Seguranca Publica
R A Language and Environment for Statistical Computing
SafetyNET Projeto europeu European Traffic Information System -
Data Colletion and Analysis Tools for Policy Making
SMR Standard Morbility Ratio
UE Uniao Europeia
WinBUGS versao em ambiente Windows do programa BUGS
VC Quantidade de combustıvel vendido
Conteudo
Lista de Tabelas xiv
Lista de Figuras xv
Introducao 1
1 Nocoes sobre seguranca rodoviaria 9
11 Risco em seguranca rodoviaria 9
12 Caracterizacao dos dados de acidentes 10
13 Caracterizacao da medida de exposicao 14
2 Modelacao estatıstica de acidentes rodoviarios 19
21 Modelos bayesianos hierarquicos 21
22 Modelos nao espaciais 24
23 Modelos espaciais 27
24 Modelos espaco-temporais 28
25 Modelos multivariados 30
26 Metodos de inferencia 32
261 INLA 32
27 Ajustamento e medidas preditivas 36
3 Aplicacoes 39
31 Associacao espacial 40
32 Modelos 43
33 Modelos espaco-temporais 45
331 Associacao regional 46
332 Selecao dos modelos 47
333 Modelos para acidentes do tipo 1 48
334 Validacao dos modelos para acidentes do tipo 1 49
335 Resultados obtidos com modelos para acidentes do tipo 1 49
xii Conteudos
336 Modelos para acidentes do tipo 2 61
337 Validacao dos modelos para acidentes do tipo 2 62
338 Resultados obtidos com modelos para acidentes do tipo 2 62
339 Modelos para acidentes do tipo 3 73
3310 Validacao dos modelos para acidentes do tipo 3 73
3311 Resultados obtidos com modelos para acidentes do tipo 3 74
34 Modelos multivariados 83
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
351 Modelo para acidentes do tipo 1 89
352 Validacao do modelo para acidentes do tipo 1 89
353 Resultados obtidos com o modelo para acidentes do tipo 1 90
354 Modelo para acidentes do tipo 2 92
355 Validacao do modelo para acidentes do tipo 2 92
356 Resultados obtidos com o modelo para acidentes do tipo 2 93
357 Modelos para acidentes do tipo 3 95
358 Validacao do modelo para acidentes do tipo 3 95
359 Resultados obtidos com o modelo para acidentes do tipo 3 96
4 Discussao e conclusoes 99
A Caracterizacao da regiao de estudo 103
A1 Portugal Continental 103
A2 Numero de acidentes 108
A3 Covariaveis 110
A4 15 concelhos 115
Referencias Bibliograficas 119
Lista de Tabelas
11 Numero total de cada tipo de acidentes rodoviarios por ano 11
12 Estatısticas resumo do numero de veıculos com seguro em milhares 14
21 Modelos univariados 30
31 Valores do ındice EBI para cada tipo de acidente por ano 43
32 Valores DIC e mls dos modelos Poisson sem covariaveis 44
33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44
34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45
35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem
covariaveis 46
36 DIC pD e mls para cada tipo de acidente 47
37 DIC pD e mls para acidentes tipo 1 48
38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50
39 Estatısticas resumo dos parametros do modelo P 1 8 1 53
310 Estatısticas resumo dos parametros do modelo P 1 8 16 54
311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55
312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55
313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57
314 DIC pD e mls para acidentes tipo 2 61
315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63
316 Estatısticas resumo para os parametros do modelo P 2 9 1 66
317 Estatısticas resumo para os parametros do modelo P 2 9 16 67
318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67
319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68
320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69
321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71
322 DIC pD e mls para acidentes tipo 3 73
323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74
xiv Lista de Tabelas
324 Estatısticas resumo dos parametros do modelo P 3 6 1 78
325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78
326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78
327 Modelos univariados 82
328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-
tivariado e dos modelos univariados 83
329 Correlacoes dos modelos multivariados com interacao e sem interacao
espaco-temporal 84
330 Vıtimas a 24 horas e vıtimas a 30 dias 84
331 Numero total de cada tipo de acidentes rodoviarios por ano 87
332 DIC pD e mls para cada tipo de acidente 89
333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90
334 DIC pD e mls 92
335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93
336 Estatısticas resumo dos parametros do modelo P 3 6 30 96
337 Comparacao entre a abordagem local e a global 98
A1 Estatısticas resumo de acidentes tipo 1 108
A2 Estatısticas resumo de acidentes tipo 2 108
A3 Estatısticas resumo de acidentes tipo 3 108
A4 Estatısticas resumo de acidentes tipo 1 109
A5 Estatısticas resumo de acidentes tipo 2 109
A6 Estatısticas resumo de acidentes tipo 3 109
A7 Estatısticas resumo da covariavel populacao 110
A8 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 1 115
A9 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 2 116
A10 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 3 117
A11 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 118
Lista de Figuras
1 Dez principais causas de morte no mundo 2
2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4
11 Numero de acidentes tipo 1 por concelho 12
12 Numero de acidentes tipo 2 por concelho 12
13 Numero de acidentes tipo 3 por concelho 13
14 Numero de veıculos com seguro em milhares por concelho e por ano 14
15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15
16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16
17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16
31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de
acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano
2000 41
32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de
veıculos com seguro no ano 2000 41
33 Valores estimados dos SMR1 e respetivos intervalos de confianca para
cada concelho no ano 2000 42
34 Histograma dos valores de EBI simulados e valor de EBI observado para
acidentes tipo 1 e para ano 2000 43
35 Histograma das diferencas entre as medias dos logscores 48
36 Histograma dos valores PIT ajustados para acidentes tipo 1 49
37 Box plot dos valores estimados para acidentes tipo 1 50
38 Amplitude dos intervalos para acidentes tipo 1 51
39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 1 51
310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o
ano 2000 52
xvi Lista de Figuras
311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52
312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53
313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo P 1 8 16 56
314 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo
P 1 8 16 56
315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo P 1 8 16 57
316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 6 172 58
317 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58
318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-
dos com o modelo BN 1 6 172 59
319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com
o modelo BN 1 6 172 60
320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 6 172 60
321 Histograma das diferencas entre as medias dos logscores 61
322 Histograma dos valores PIT ajustados para acidentes tipo 2 62
323 Box plot dos valores estimados para acidentes tipo 2 63
324 Amplitude dos intervalos para acidentes tipo 2 64
325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori dos acidentes tipo 2 64
326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o
ano 2000 65
327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65
328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66
329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo P 2 9 16 68
330 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
P 2 9 16 69
Lista de Figuras xvii
331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2
de 2000 a 2007 obtidos com o modelo P 2 9 16 70
332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 4 71
333 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
BN 2 9 4 71
334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 4 72
335 Histograma dos valores PIT ajustados para acidentes tipo 3 74
336 Box plot dos valores estimados para acidentes tipo 3 75
337 Amplitude dos intervalos para acidentes tipo 3 75
338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76
339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o
ano 2000 76
340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77
341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77
342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 1 79
343 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79
344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3
de 2000 a 2007 obtidos com o modelo P 3 6 1 80
345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo BN 3 6 6 81
346 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81
347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo BN 3 6 6 82
348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos univariados e com os modelos multivariados 85
349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos multivariados 86
350 Numero de acidentes tipo 1 por concelho 87
351 Numero de acidentes tipo 2 por concelho 88
xviii Lista de Figuras
352 Numero de acidentes tipo 3 por concelho 88
353 Histograma dos valores PIT ajustados para acidentes tipo 1 89
354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 9 42 90
355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 9 42 91
356 Histograma dos valores PIT justados para acidentes tipo 2 92
357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 86 94
358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 86 94
359 Histograma dos valores PIT ajustados para acidentes tipo 3 95
360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 30 96
361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo P 3 6 30 97
A1 ID dos concelhos do Norte de Portugal Continental 104
A2 ID dos concelhos do Sul de Portugal Continental 105
A3 Numero de habitantes por concelho e por ano 110
A4 Area por concelho 111
A5 Densidade populacional por concelho 111
A6 Quilometros de estrada por concelho 112
A7 Quantidade de combustıvel vendido por concelho 112
A8 Superfıcie de ocupacao urbana do solo por concelho 113
A9 Superfıcie de ocupacao industrial do solo por concelho 113
A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por
concelho 114
A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114
ldquoThe road to wisdom - Well itacutes plain and simple to express
Err and err and err again but less and less and lessrdquo
Piet Hein (1996)
Introducao
A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora
de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo
automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se
tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao
ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o
Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009
OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes
rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso
entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as
tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa
na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas
etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do
PIB mundial
A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas
necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004
para a quinta causa de morte em 2030
2 Introducao
2004
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Infecoes respiratorias
4 Doencas pulmonares
5 Diarreias
6 HIVAIDS
7 Tuberculose
8Cancro do pulmao
dos bronquios e da traqueia
9 Acidentes rodoviarios
10Recem-nascidos prematuros
e de peso baixo
HH
2030
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Doencas pulmonares
4 Infecoes respiratorias
5 Acidentes rodoviarios
6Cancro do pulmao
dos bronquios e da traqueia
7 Diabetes mellitus
8 Doencas do coracao hipertensas
9 Cancro do estomago
10 HIVAIDS
Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)
No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a
decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-
ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem
disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao
forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes
rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida
No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de
Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-
dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos
socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a
sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario
e Santos 2012)
O sistema de trafego rodoviario um subsistema do sistema de transportes e formado
por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-
fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes
rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos
correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada
e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a
deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos
Introducao 3
(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de
pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se
por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma
qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena
de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do
sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-
guranca deste sistema complexo tem consequencias devastadoras em termos humanos
sociais e economicos (Cardoso 2007)
Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta
consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos
consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-
vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma
descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-
tadas a nıvel mundial
minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-
doviaria
minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios
como um problema de saude publica
minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da
seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial
minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria
minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das
Nacoes Unidas
minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca
Rodoviaria
minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de
Acao para a Seguranca Rodoviaria
Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria
Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-
dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade
responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para
uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos
veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica
sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste
flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area
da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e
tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha
uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes
4 Introducao
projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do
trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para
veıculos tambem designada por sistemas inteligentes de transportes
A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-
volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos
30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-
tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi
progressivamente modernizado tendo sido acompanhado por um aumento do numero
de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal
terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de
toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu
aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver
na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada
a implementacao de algumas medidas especıficas
Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)
As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para
compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios
e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou
regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma
consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica
de dados de acidentes rodoviarios
Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo
pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e
Introducao 5
do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda
lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util
domınio para desenvolvimento de atividades de investigacao O ambito desta tese e
portanto a modelacao estatıstica de dados de acidentes rodoviarios
Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-
retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar
progressivamente a execucao dessas acoes foram identificados varios fatores capazes de
melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em
particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas
com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados
As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma
melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de
intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-
vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada
em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-
dos na UE (CARE - Community database on accidents on the roads in Europe) No
projeto integrado SafetyNET (European Traffic Information System - Data Colletion
and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de
informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas
principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco
e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como
ponto de partida para a modelacao estatıstica usada nesta tese
A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-
nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-
ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos
desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-
cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes
o que facilita a identificacao dos fatores causais e de intervencoes corretivas
As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-
tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial
como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy
A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-
tatıstica Em geral foram detetados varios problemas na estimacao dos parametros
de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou
desconhecidas dependencia espacial e depedencia temporal que continuam a constituir
objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-
blemas como por exemplo
1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm
6 Introducao
minus modelos lineares generalizados baseados na distribuicao de Poisson
minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia
de sobredispersao
minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado
para analisar dados de acidentes com sobredispersao e excesso de zeros
minus modelos de nıveis multiplos estruturados
minus modelos bayesianos hierarquicos
minus incorporacao de correlacao espacial e dependencia temporal nos modelos
A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao
existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada
a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre
os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos
hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem
podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li
et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar
a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais
e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais
atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004)
O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da
estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a
problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior
barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua
formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains
Monte Carlo) na computacao bayesiana
A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se
nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que
envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas
O seu crescimento ao nıvel das aplicacoes tem sido extraordinario
O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using
Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o
GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao
Introducao 7
CODA Plummer et al (2006) e ao BOA Smith (2007)
Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de
pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)
o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em
particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-
tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas
Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana
aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa
determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas
limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes
de concordancia
Todas as analises envolvidas no metodo INLA estao implementadas num programa que
pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser
descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos
hierarquicos complexos tornou-se muito mais acessıvel
Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA
Objetivos
Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-
los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca
rodoviaria em areas geograficas diferentes
Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse
tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-
pacial e depedencia temporal
Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao
Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes
nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional
Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-
place Approximations atraves da exploracao do pacote R-INLA
8 Introducao
Estrutura da tese
No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a
caracterizacao dos dados usados nesta tese
No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos
No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais
de sinistralidade rodoviaria registados em Portugal Continental
No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido
de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros
No Anexo A faz-se a caracterizacao da regiao de estudo
No CD em anexo encontram-se todos os codigos usados nesta tese
1Nocoes sobre seguranca rodoviaria
11 Risco em seguranca rodoviaria
O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores
de seguranca informativos muito importantes No entanto quando se pretende fazer
comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de
acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca
rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de
acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja
risco=numero esperado de acidentesmedida de exposicao
A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-
responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel
ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-
teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a
melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-
cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos
proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens
e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego
10 Capıtulo 1 Nocoes sobre seguranca rodoviaria
atraves do comprimento de estrada do numero de veıculos ou preferencialmente da
distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode
estar associada a populacao de risco atraves do numero de habitantes do numero de
condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas
times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco
de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia
de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-
cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o
numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para
a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande
disponibilidade de informacao desagregada o que permite analisar as especificidades de
varios grupos populacionais As restantes medidas indicadas apresentam atualmente
muitas limitacoes1
Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se
deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido
e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a
relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata
de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes
e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-
se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de
veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se
a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho
12 Caracterizacao dos dados de acidentes
Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito
e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas
sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela
gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de
exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-
tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao
usada e sobre as covariaveis usadas
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-
ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez
1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2
205-v3_finalpdf
12 Caracterizacao dos dados de acidentes 11
agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho
A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos
se encontram no litoral norte sendo consequentemente mais proximos uns dos outros
Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz
respeito a caracterizacao dos concelhos2
Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311
Total 279644 28844 8890 317378
Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR
minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo
menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT
e PSP) e da qual resultem vıtimas ou danos materiais
minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais
minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do
acidente ou no seu percurso ate a unidade de saude No perıodo em analise para
obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)
aplica-se um coeficiente multiplicativo de 114 ao numero de mortos
minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo
de hospitalizacao superior a 24 horas
minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave
minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima
minus Acidente mortal Acidente do qual resulte pelo menos um morto
minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido
grave nao tendo ocorrido qualquer morte
minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido
leve e em que nao se tenham registado mortos nem feridos graves
2ver Anexo A
12 Capıtulo 1 Nocoes sobre seguranca rodoviaria
Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes
com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes
do tipo 3 os acidentes mortais
Figura 11 Numero de acidentes tipo 1 por concelho
Figura 12 Numero de acidentes tipo 2 por concelho
12 Caracterizacao dos dados de acidentes 13
Figura 13 Numero de acidentes tipo 3 por concelho
Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero
de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de
acidentes
Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor
risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao
entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria
muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos
mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278
concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado
o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de
cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes
decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para
permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no
espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes
Isto e especialmente importante porque apesar do numero de acidentes ser relacionado
com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria
que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de
3ver Anexo A
14 Capıtulo 1 Nocoes sobre seguranca rodoviaria
trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a
variabilidade da medida de exposicao em funcao do espaco ou do tempo
13 Caracterizacao da medida de exposicao - numero
de veıculos com seguro
Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares
Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730
Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)
13 Caracterizacao da medida de exposicao 15
O numero de veıculos com seguro varia bastante de concelho para concelho como se pode
verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo
por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que
cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media
inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo
Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho
i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o
numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =
100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de
acidente rodoviario para acidentes do tipo 1ndash3
Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por
concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes
e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos
sugerindo a existencia de correlacao espacial
Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na
faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas
mais baixas
Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007
Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-
se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se
mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas
muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a
16 Capıtulo 1 Nocoes sobre seguranca rodoviaria
nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos
com taxas mais baixas
Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007
Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007
No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas
usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer
mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-
petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao
13 Caracterizacao da medida de exposicao 17
ocorre com muita frequencia com dados de contagem com muitos valores escassos e
ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou
unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas
pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes
associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso
nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando
as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante
afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e
Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas
dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem
como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-
tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de
forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e
Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004) descritos no Capıtulo 2
2Modelacao estatıstica de acidentes rodoviarios
Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram
baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados
normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido
que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-
doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia
de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma
probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre
os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-
dos de contagens sao modelos mais apropriados para este tipo de estudos
Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo
constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo
et al 2007 Cardoso 1996)
Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo
caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala
espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais
desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais
como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel
explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-
20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como
uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade
espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias
ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao
apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo
muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao
verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos
com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao
de riscos relativos em areas pequenas
No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-
dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade
de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto
deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-
mas na alocacao de fundos governamentais e no planeamento regional Determinados
atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-
cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para
areas pequenas e esta tendencia ira provavelmente continuar
Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-
vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco
relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario
num determinado concelho relativamente ao risco no paıs (Portugal Continental)
As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e
consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem
acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999
Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os
metodos tradicionais para investigar questoes importantes relacionadas com estimacao de
riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia
temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis
nao observaveis tais como clima determinadas caracterısticas da populacao entre outras
Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser
pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a
construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios
ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al
2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-
tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes
21 Modelos bayesianos hierarquicos 21
espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e
temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a
suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos
pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos
dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-
doviarios
A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma
serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia
em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-
dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes
rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem
ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade
existente no dados Noland e Quddus (2004) Elvik (2011)
A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-
melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio
que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-
blema atribuıdo a comportamentos inadequados dos condutores associados a falencias
da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de
acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA
constitui a covariavel com maior poder explicativo da variacao observada No entanto
nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas
do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por
exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de
servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel
vendido e um indicador do volume de trafego e a densidade populacional um indicador de
urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais
o numero de habitantes a area geografica a densidade populacional o comprimento de
estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao
industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao
do solo com equipamento turıstico como sera abordado no Capıtulo 4
21 Modelos bayesianos hierarquicos
O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que
o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro
θ e o segundo traduz a distribuicao a priori para o parametro θ
22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica
na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-
delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-
nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo
que p(θ) =
intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =
1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa
estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-
formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros
Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade
associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-
tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia
a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori
nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-
tribuicao a priori padrao p(θ) (Paulino et al 2003)
Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte
estrutura
1o nıvel f(y|θ) funcao de verosimilhanca
2o nıvel p(θ|φ) distribuicao a priori dos parametros
3o nıvel p(φ) distribuicao a priori dos hiperparametros
Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e
evoluindo para modelos cada vez mais complexos
O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-
creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-
vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de
acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar
esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-
dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se
Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou
sejaYit|θit sim Poisson(Eitθit)
f(yit|θit) =(Eitθit)
yiteminusEitθit
yit
Eit = nitr = nit
sumij
Yitsumij
nit
21 Modelos bayesianos hierarquicos 23
onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit
representa o numero de veıculos com seguro e θit representa o risco relativo de acidente
rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja
se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia
de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de
acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)
A funcao de versimilhanca e dada por
L(θ|y) =prodit
f(yit|θit) =prodit
(Eitθit)yiteminusEitθit
yitpropprod
θyitit e
minussumit
Eitθit
e l(θ|y) = lnL(θ|y) propsumit
yit ln θitminussumit
Eitθit O estimador de maxima verosimilhanca
do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-
dardized Mortality Ratio1 - SMR) e dado por
θit = SMRit =YitEit
(211)
Note-se que V ar(SMRit) =V ar(Yit)
E2it
=θitEit
podendo-se fazer V ar(SMRit) =θitEit
=YitE2it
Um procedimento classico usual para identificar regioes de maior risco consiste na cons-
trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR
Apesar de util este procedimento tem algumas desvantagens Note-se que em areas
com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero
de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR
podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com
muita frequencia com dados desta natureza quando as unidades espaciais de analise sao
concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao
das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit
associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser
grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram
ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de
tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida
em que a respetiva variabilidade pode ser muito grande A variancia destes valores e
1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso
24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao
grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro
estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-
minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992
Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR
tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores
estimados com menos precisao As maiores variacoes do risco relativo nao estarao em
geral associadas com variacoes do risco subjacente a medida de exposicao mas serao
apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)
Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se
que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-
dade teorica subjacente ao modelo Poisson
A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados
(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do
modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado
que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al
2008 2005)
Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-
mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos
tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao
de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das
flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto
dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se
usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico
medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial
entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao
mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)
22 Modelos nao espaciais
Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh
e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis
atraves da funcao de ligacao usada para modelar a media
ln(θit) = α+
nβsump=1
βpxitp (221)
22 Modelos nao espaciais 25
onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel
e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um
nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual
considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a
priori p = 1 2 nβ i = 1 2 N e t = 1 2 T
No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-
adequadamente capturada pelas variaveis explicativas na funcao da media condicional
Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser
distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-
tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como
ln θit = α+
nβsump=1
βpxitp + vit (222)
onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p
Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que
foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-
los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares
generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)
Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-
dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao
a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo
Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples
de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma
fechada dado que esta mistura resulta de um modelo conjugado
Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao
Poisson e na distribuicao Binomial Negativa
O modelo Poisson Lognormal surge quando se admite que
vit sim Normal(0 σ2v) (223)
A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por
f(yit θNit σ
2v) =
1
σ2v
radic2π
EitθNit
y
int infin0
eminusEitθNit e
v
(ev)yminus1eminus v2
2σ2v dev
nao havendo forma explicıta com
26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
ln θNit = α+
nβsump=1
βpxitp (224)
E[Yit] = microNit eσ2v2 = Eitθ
Nit e
σ2v2 e V ar[Yit] = microNit e
σ2v2(
1 + (eσ2v minus 1)microNit e
minusσ2v2)
O modelo Poisson-Gama ou Binomial Negativo surge quando
exp(vit) sim Gama(φ φ) (225)
A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por
f(yit θBNit φ) =
Γ(yit + φ)
Γ(φ)yit
(φ
microBNit + φ
)φ(microBNit
microBNit + φ
)yitou seja
Yit|θBNit sim BN(EitθBNit φ)
com
ln θBNit = α+
nβsump=1
βpxitp (226)
E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit
(1 +
microBNitφ
) Note-se que quando φrarrinfin o
modelo Binomial Negativo reduz-se ao modelo Poisson
Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo
podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais
um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com
av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O
parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de
dispersao
O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-
plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre
unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-
quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito
afectadas (Miranda-Moreno et al 2007 Lord et al 2008)
Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)
A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-
pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os
23 Modelos espaciais 27
riscos relativos conjuntamente como um processo espacial atraves de uma especificacao
a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-
lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco
relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados
observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada
area e a soma de duas componentes que representam fatores espaciais e nao espaciais
No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica
de interesse em cada area tem distribuicao Poisson com media especıfica de cada area
As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre
a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento
das variaveis nao-observadas como em Bernardinelli et al (1995ab)
23 Modelos espaciais
Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia
espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos
mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao
associados uma distribuicao a priori conveniente
log(θit) = α+
nβsump=1
βpxitp + si (231)
Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de
notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario
quer para os modelos baseados na distribuicao de Poisson abreviadamente designados
de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa
abreviadamente designados de modelos BN com os devidos significados
Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que
representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos
atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori
associada
log(θit) = α+
nβsump=1
βpxitp + si + vi (232)
onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-
turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e
si sao mutuamente independentes viiidsim Normal(0 σ2
v) e si|sminusi sim Normal(si σ2smi)
28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
onde o sminusi indica o vetor s com o elemento si removido si =1
mi
sumi 6=j
wijsj e a media
dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e
wij = 0 caso contrario Deste modo mi =sumi 6=j
wij e o respetivo numero de vizinhos e
σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma
s tem distribuicao conjunta
f(s) prop (σ2s)minusn2 exp
minus 1
2σ2s
sumi6=j
(si minus sj)2wij
e (σ2v)minus1 sim Gama(av bv) (σ2
s)minus1 sim Gama(as bs) com av bv as e bs conhecidos
Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial
local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo
gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991
Banerjee et al 2004)
24 Modelos espaco-temporais
Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-
tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a
aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios
e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos
com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se
definiu na seccao anterior
Modelos espaco-temporais sem interacao
Nestes modelos tem-se log(θit) = α+
nβsump=1
βpxitp + si + vi + ψt
onde se considera
ψt sim Normal(0 σ2ψ) (241)
ou
ψt sim RW (1 σ2ψ) (242)
e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ
2s σ
2v σ
2ψ mutuamente
independentes
24 Modelos espaco-temporais 29
Alternativamente log(θit) = α+
nβsump=1
βpxitp + si + vi + γt
onde se considera
γ sim Normal(0 cγ) (243)
sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ
2v mutuamente
independentes (Knorr-Held 2000)
Modelos espaco-temporais com interacao
Neste caso log(θit) = α+
nβsump=1
βpxitp + si + vi + (γ + δi)t
onde se considera alternativamente
δi sim Normal(0 σ2δ ) (244)
ou
δi sim CAR(σ2δ ) (245)
e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com
aδ bδ conhecidos e α βp σ2s σ2
v σ2δ mutuamente independentes (Bernardinelli et al
1995b)
A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando
um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de
acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de
risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia
e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de
cada area e a media global α e δi representa a diferenca entre a tendencia temporal
local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0
a tendencia temporal local da area i e menos acentuada do que a tendencia temporal
global enquanto que quando δi gt 0 e mais acentuada
Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados
neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo
nao se encontra definida uma distribuicao a priori para um parametro considera-se a
distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior
30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Tabela 21 Modelos univariados
M log(θit) Distribuicao a priori Distribuicao a priori
dos parametros dos hiperparametros
1 α+
nβsump=1
βpxitp α sim Normal(0 cα)
βp sim Normal(0 cβ)
2 α+
nβsump=1
βpxitp + vi vi sim Normal(0 σ2v) σminus2
v sim Gama(av bv)
3 α+
nβsump=1
βpxitp + si si sim CAR(σ2s) σminus2
s sim Gama(as bs)
4 α+
nβsump=1
βpxitp + vi + si
5 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2
ψ sim Gama(aψ bψ)
6 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim RW (σ2ψ)
7 α+
nβsump=1
βpxitp + vi + si + γt γ sim Normal(0 cγ)
8 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2
δ sim Gama(aδ bδ)
9 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )
25 Modelos multivariados
Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-
mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes
modelos nao consideram a interdependencia que pode existir entre os riscos relativos
dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na
variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia
para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico
tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-
son capazes de considerar a relacao entre diferentes processos de contagem tais como
contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-
25 Modelos multivariados 31
son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta
abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de
diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o
numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo
k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit
condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou
seja
Ykit|θkit sim Poisson(Ekitθkit)
Modelos espaciais multivariados
1)log θkit = αk +
nβsump=1
βpxitp + ski
com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs
conhecidos
Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)
e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios
ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K
tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-
bilidade assume que a estrutura de associacao se separa numa componente nao espacial
e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta
de s e
s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)
Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)
D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de
vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK
definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre
os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao
espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se
o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo
improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou
modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin
et al (2005) Lawson (2009) Waller e Carlin (2010)
Para alem do modelo 1 foram implementados os modelos multivariados seguintes no
WinBUGS
32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)
3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)
4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e
dδ Rδ conhecidos
mas apenas se obteve convergencia para os modelos 1 e 4
Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =
bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =
001 0 0
0 001 0
0 0 001
26 Metodos de inferencia
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e
computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas
abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)
consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-
ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino
e Rue (2010a)
261 INLA
O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-
siana aproximada numa subclasse de modelos de regressao estruturados aditivamente
nomeadamente em modelos latentes gaussianos
Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z
que representa todas as componentes nao observaveis com distribuicao a priori Normal
Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-
mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-
buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia
exponencial A media microi de cada componente e relacionada com um preditor aditivo
estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor
incorpora aditivamente os efeitos de varias componentes
26 Metodos de inferencia 33
ηi = α+
nfsumj=1
f (j)(uij) +
nβsump=1
βpxip + εi (261)
onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-
cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u
podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis
contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-
torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos
podem ser representados atraves das funcoes f (j)()
Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-
mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por
suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a
priori dos hiperparametros nao tem de ser gaussianas
Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-
dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto
de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF
Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel
aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e
Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6
embora possa haver excecoes
Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro
nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos
parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-
sume que os dados observados sao condicionalmente independentes dado o campo latente
z tem-se que
f(y|xφ) =prodi
f(yi|ziφ)
Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca
do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos
φ
A distribuicao a posteriori e dada por
p(zφ|y) prop p(φ)p(z|φ)prodi
f(yi|ziφ) (262)
Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e
analiticamente tratavel
Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao
34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao
analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e
possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa
pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como
tempo computacional longo possibilidade de as amostras simuladas dos parametros se-
rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte
Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser
particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori
entre as componentes espacial ou espaco-temporal do campo latente
Em contraste o metodo de aproximacao INLA e apresentado como um metodo que
fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-
vamente pouco tempo
No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes
marginais a posteriori dos parametros de interesse
As distribuicoes marginais a posteriori pretendidas sao
p(zi|y) =
intφ
p(zi|φy)p(φ|y) dφ (263)
e
p(φj |y) =
intφj
p(φ|y) dφminusj (264)
A aproximacao de p(zi|y) e determinada usando a soma finita
p(zi|y) =sumk
p(zi|φky)p(φk|y)∆k (265)
onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-
vamente Esta soma e calculada por integracao numerica em pontos suporte φk com
pesos apropriados ∆k
A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e
obtida atraves da aproximacao de Laplace
p(φ|y) prop p(zφy)
pG(z|φy)
∣∣z=zlowast(φ) (266)
onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-
cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao
corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)
De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade
a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes
26 Metodos de inferencia 35
pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste
basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior
quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste
em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a
estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)
Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a
estrategia CCD a estrategia por omissao no R-INLA
Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a
aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace
simplificada
A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter
a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))
onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia
marginal Os autores referem que apesar de muito conveniente ao nıvel computacional
pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de
simetria das distribuicoes a posteriori marginais quer a ambos nıveis
Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais
demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-
place semelhante a 266 a p(zi|φy)
pLA(zi|φy) prop p(zφy)
pGG(zminusi|ziφy)
∣∣∣zminusi=zlowastminusi(ziφ) (267)
No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-
nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes
numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de
Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo
menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada
uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-
trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e
simetria Para mais detalhes ver Rue et al (2009)
Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre
os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao
de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos
O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-
parametros entre outras No entanto o seu potencial e reconhecidamente enorme e
encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-
tensoes com muita frequencia
36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
27 Ajustamento e medidas preditivas
Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o
criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio
combina uma medida de adequabilidade a media a posteriori da desvianca D com
uma medida de complexidade o numero efetivo de parametros pD sendo dado por
DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-
promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no
WinBUGS quer no R-INLA
No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos
aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-
vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive
Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-
tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle
e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-
delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para
detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)
As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)
p(yminusi)=
intf(yi|θyminusi)p(θ|yminusi) dθ
e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores
CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para
efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de
calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou
grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito
diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de
dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem
uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este
problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim
pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =
yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma
forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem
ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)
Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a
0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa
por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira
a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da
concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de
27 Ajustamento e medidas preditivas 37
referencia
Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls
(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))
ntimes T Esta medida e muito
utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os
valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo
3Aplicacoes
Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios
ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os
resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo
de aproximacao INLA atraves do R-INLA
Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-
sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel
usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos
no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao
apresentados os resultados obtidos no WinBUGS
Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a
analise individual de cada ano comparando-se os varios modelos e os resultados obtidos
no WinBUGS e no R-INLA tendo havido concordancia
Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial
40 Capıtulo 3 Aplicacoes
31 Associacao espacial
A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-
doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco
como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter
uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas
determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes
entre areas de maior risco e potenciais fatores
Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-
racterısticas que revelam alguns dos seus problemas Para alem da concentracao de
concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito
diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de
veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a
uma pequena mudanca no numero de acidentes
Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-
rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa
global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com
feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0
e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes
valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no
de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida
ao acaso pois os concelhos possuem condicoes identicas
Tendo em conta que o numero de veıculos com seguro varia muito por concelho este
comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-
ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem
medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito
instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis
ja que possuem variancias muito diferentes
A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura
31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero
de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro
para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas
versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em
2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho
da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com
tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que
assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se
31 Associacao espacial 41
ter uma percecao dessa variabilidade em cada concelho
Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000
Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000
42 Capıtulo 3 Aplicacoes
Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000
A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem
a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir
uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de
contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz
de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma
fronteira e wij = 0 caso contrario
As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e
o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em
areas pequenas em que o tamanho da medida de exposicao e diferente de area para
area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta
questao foram desenvolvidas diversas propostas alternativas para dados com populacoes
heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em
conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se
o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por
EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma
estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa
os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes
empırica da media marginal padronizado pela estimativa do desvio padrao da taxa
Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros
sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI
tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao
32 Modelos 43
do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao
aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de
EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado
no R atraves do pacote spdep e da funcao EBImoranmc()
Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano
Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859
Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000
Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente
por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos
testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo
p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na
Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para
acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao
espacial
32 Modelos
Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais
espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos
modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo
uma vez que forneceram melhores resultados como se pode verificar comparando os
valores das Tabelas 32mdash35
Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA
44 Capıtulo 3 Aplicacoes
No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo
da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo
A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos
de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente
pela analise dos resultados com o programa CODA do R (Plummer et al 2006)
No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-
tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada
computacionalmente menos intensa
Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266
P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205
P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204
P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204
Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 1 2063493 188 464 1351516 170 304 988082 169 222
BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201
BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201
BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201
As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos
espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos
com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo
Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial
Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3
1referente a Tabela 21
33 Modelos espaco-temporais 45
Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior
a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a
diferenca entre o numero de parametros e muito grande
No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos
os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero
correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se
pode ver mais adiante quando se usam os modelos espaco-temporais este problema e
ultrapassado
Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao
menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos
os tipos de acidentes
33 Modelos espaco-temporais
De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para
estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-
mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se
reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre
muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21
Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191
P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191
P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192
P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192
P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192
Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor
modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para
2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso
46 Capıtulo 3 Aplicacoes
o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela
35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo
1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash
e para o tipo 3 o modelo 6 mdash BN 3 6
Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191
BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191
BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192
BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193
BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193
Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e
do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores
sao os modelos Poisson
331 Associacao regional
Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao
geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar
informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-
plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos
nos riscos de acidentes
Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes
em milhares de habitantes P a area em centenas de km2 A a densidade populacional em
centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade
de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU
a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques
urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do
solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se
valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST
os valores sao por concelho e iguais em todos os anos
33 Modelos espaco-temporais 47
332 Selecao dos modelos
Foram implementados todos os modelos com todas as combinacoes entre as covariaveis
mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de
acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram
escolhidos os seguintes modelos
Tabela 36 DIC pD e mls para cada tipo de acidente
Tipo P DIC pD mls BN DIC pD mls
1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418
2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260
3 3 6 4 846237 20562 191 3 6 6 852362 19267 191
Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais
P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e
Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU
e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash
modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP
mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI
e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash
modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6
com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos
Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para
cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e
nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao
relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os
valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921
e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo
sao relativamente pequenas 961 594 e 076 respetivamente
Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao
contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis
covariaveis significativas e respetiva contribuicao para os resultados Assim fica para
trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais
significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em
48 Capıtulo 3 Aplicacoes
particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)
e uma covariavel considerada muito importante na modelacao estatıstica de acidentes
rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao
nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica
designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos
hoteleiros
333 Modelos para acidentes do tipo 1
Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172
log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t
e
log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t
No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente
para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos
de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem
o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o
zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor
HPD que contem o zero considera-se que a covariavel nao contribui significativamente
para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso
contrario considera-se que a covariavel contribui significativamente para a explicacao
da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado
que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124
obtendo-se o modelo Poisson 1 8 16 ou seja
log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t
Tabela 37 DIC pD e mls para acidentes tipo 1
Modelo DIC pD mls
P 1 8 1 1940548 47786 458
P 1 8 16 1939877 47789 458
BN 1 6 1 1861278 25154 419
BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
33 Modelos espaco-temporais 49
No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as
covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se
manter as covariaveis no modelo
334 Validacao dos modelos para acidentes do tipo 1
Validacao do modelo P 1 8 16 e do modelo BN 1 6 172
Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172
Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do
que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela
37 O valor da media do logscore tambem e significativamente menor de acordo com
o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores
PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O
valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo
BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes
sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do
tipo 1
335 Resultados obtidos com modelos para acidentes do tipo 1
Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172
A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um
efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma
50 Capıtulo 3 Aplicacoes
diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo
1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16
e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo
BN 1 6 172
Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172
Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max
SMR1 00000 07512 09656 10020 12360 32610
RR1 8 1 02290 07728 09663 09989 11870 28890
RR1 8 16 02274 07722 09628 09979 11860 28770
RR1 6 1 02886 07807 09599 10010 11890 24480
RR1 6 172 02852 07798 09589 09999 11870 24400
Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de
33 Modelos espaco-temporais 51
confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-
bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com
os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-
nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172
Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172
Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados
52 Capıtulo 3 Aplicacoes
os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo
P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000
Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para
o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312
se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de
33 Modelos espaco-temporais 53
suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos
erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais
Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000
Relativamente a introducao das covariaveis comprimento de estrada e quantidade de
combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia
dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis
explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao
explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados
espacialmente
Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1
Efeitos fixosmedia dp 0025q 0975q
α1 00580 00074 00435 00723
γ1 -00263 00030 -00321 -00204
Variancia dos efeitos aleatorios
σ2s1 05816 00591 04706 07001
σ2δ1
00019 00002 00015 00023
Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1
54 Capıtulo 3 Aplicacoes
mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-
plicacao da variacao associada aos efeitos temporais
Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel
vendido influenciam significativamente a variacao geografica dos riscos relativos sao
consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem
de forma positiva para a variacao os riscos o que significa que em regioes com maior
comprimento de estrada e em regioes com maior quantidade de combustıvel vendido
esta associado um aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16
Efeitos fixosmedia dp 0025q 0975q
α1 -00898 00354 -01595 -00207
b1C 00016 00004 00008 00024
b1V C 00003 00001 00002 00005
γ1 -00257 00030 -00315 -00198
Variancia dos efeitos aleatorios
σ2s1 05492 00560 04440 06615
σ2δ1
00019 00002 00015 00023
No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada
do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da
ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos
espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-
buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou
efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves
dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos
temporais σ2ψ1
se mantem o que implica que as covariaveis nao contribuem para a ex-
plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o
modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao
e significativa
Mais uma vez as covariaveis que influenciam significativamente a variacao geografica
dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-
variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que
33 Modelos espaco-temporais 55
regioes com maior comprimento de estrada regioes com maior ocupacao de solo com
equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento
turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos
os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-
mente para a estimacao dos riscos o que significa que em regioes com maior numero de
habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo
fixos todos os restantes efeitos
Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1
Efeitos fixosmedia dp 0025q 0975q
α1 -00429 00052 -00595 -00389
Parametro de dispersao φminus11 00298 00017 00267 00332
Variancia dos efeitos aleatorios
σ2s1 02603 00266 02108 03142
σ2ψ1
00090 00057 00029 00237
Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172
Efeitos fixosmedia dp 0025q 0975q
α1 -01348 00243 -01826 -00872
b1C 00013 00003 00007 00019
b1P -00135 00044 -00221 -00049
b1OSEUP 00001 000008 -000005 00003
b1OST 00001 000006 -0000003 00002
Parametro de dispersao φminus11 00300 00017 00269 00334
Variancia dos efeitos aleatorios
σ2s1 02438 00254 01966 02951
σ2ψ1
00090 00056 00029 00235
Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente
56 Capıtulo 3 Aplicacoes
espacial contribui fortemente para a variacao geografica do risco relativo O padrao e
muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes
com maior risco relativo estimado correspondem as regioes em que as estimativas dos
efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-
dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo
proximo de um correspondem as regioes em que as estimativas de si sao proximas de
zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade
HPD nao contem o zero e 633 para o modelo P 1 4 16
Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16
Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16
33 Modelos espaco-temporais 57
A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0
eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao
longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio
anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta
tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores
correspondente a diminuicao das estimativas dos riscos ao longo dos anos
Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16
Min 1oQ Mediana Media 3oQ Max
δ1 -00919 -00254 -00476 00768 00197 00133
eδ1 09125 09751 09954 10010 10200 11420
Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16
Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de
credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1
a tendencia temporal local e maior que a tendencia global sendo o decrescimento do
numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia
58 Capıtulo 3 Aplicacoes
temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia
temporal local e menor do que a global sendo o decrescimento mais acentuado No
mapa da Figura 315 pode ver-se a distribuicao destes concelhos
Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um
sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada
na Tabela A8 do Anexo A
Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172
Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172
Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos
mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial
33 Modelos espaco-temporais 59
contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado
e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com
menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si
sao proximas de zero Para este modelo a percentagem de estimativas dos valores de
s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente
a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos
seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais
acentuado nos cinco anos seguintes
Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172
Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo
BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um
aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os
restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-
gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos
estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel
contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i
no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54
Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a
percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento
turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como
os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de
60 Capıtulo 3 Aplicacoes
(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo
da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel
OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com
equipamentos turısticos vai de 0 a 038
Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172
Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172
Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior
33 Modelos espaco-temporais 61
que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos
com risco relativo significativamente maior que um
336 Modelos para acidentes do tipo 2
Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192
log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +
b2DPDP2it + s2i + (γ2 + δ2i)t
e
log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t
No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente
das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519
pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo
Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o
modelo P 2 9 16 ou seja
log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t
No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-
variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e
pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-
delo BN 2 9 4 ou seja
log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t
Tabela 314 DIC pD e mls para acidentes tipo 2
modelo DIC pD mls
P 2 9 1 1170386 35334 270
P 2 9 16 1169631 35476 270
BN 2 9 1 1156921 29101 261
BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
62 Capıtulo 3 Aplicacoes
337 Validacao dos modelos para acidentes do tipo 2
Validacao do modelo P 2 9 16 e do modelo BN 2 9 4
Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4
Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-
ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual
a 13956 O valor da media do logscore tambem e significativamente menor de acordo
com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos
valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura
322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para
o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes
sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do
tipo 2
338 Resultados obtidos com modelos para acidentes do tipo 2
Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4
A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as
estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre
um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das
estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados
a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores
esperados a posteriori obtidos com o modelo BN 2 9 4
33 Modelos espaco-temporais 63
Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4
Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os
modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max
SMR2 00000 05062 09180 11830 15740 87830
RR2 9 1 02237 06553 09651 11910 14980 77550
RR2 9 16 02218 06547 09624 11860 14970 77060
RR2 9 1 nb 02391 06636 09751 11870 14960 59240
RR2 9 4 nb 02363 06630 09720 11810 14850 59030
64 Capıtulo 3 Aplicacoes
Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo
P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes
33 Modelos espaco-temporais 65
do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000
Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000
66 Capıtulo 3 Aplicacoes
Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000
Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das
covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo
Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja
as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos
sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito
espacial
Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03511 00191 03135 03883
γ2 -00844 00037 -00918 -00771
Variancia dos efeitos aleatorios
σ2s2 09474 01054 07554 11648
σ2δ2
00099 00016 00070 00133
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-
plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao
33 Modelos espaco-temporais 67
para a variacao geografica das estimativas dos riscos e positiva em regioes com maior
comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao
para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos
Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16
Efeitos fixosmedia dp 0025q 0975q
α2 01790 00530 00741 02822
b2C 00020 00005 00009 00031
b2V C -00004 00003 -00010 00003
γ2 -00833 00038 -00906 -00759
Variancia dos efeitos aleatorios
σ2s2 09162 01019 07325 11282
σ2δ2
00099 00016 00015 00135
Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com
a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos
efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma
efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam
incluıdos no modelo P 2 9 1 atraves do efeito espacial
Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03529 00223 03090 03965
γ2 -00819 00044 -00906 -00733
Parametro de dispersao φminus11 00577 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07824 00925 06156 09748
σ2δ2
00051 00012 00031 00079
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
68 Capıtulo 3 Aplicacoes
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao
associada aos efeitos temporais Para alem disso como a contribuicao para a variacao
geografica das estimativas dos riscos e positiva em regioes com maior comprimento de
estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos
os restantes efeitos
Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4
Efeitos fixosmedia dp 0025q 0975q
α2 01961 00530 00741 02822
b2C 00017 00005 00008 00027
γ2 -00814 00044 -00900 -00727
Parametro de dispersao φminus11 00576 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07516 00894 05914 09385
σ2δ2
00052 00013 00031 00080
Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16
33 Modelos espaco-temporais 69
Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode
verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o
padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado
correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as
regioes com menor risco relativo estimado correspondem as regioes em que as estimativas
de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes
em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem
de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero
e 608
Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era
esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou
seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem
de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295
Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16
Min 1oQ Mediana Media 3oQ Max
δ2 -01805 -00411 00082 00003 00485 01532
eδ2 08358 09604 10090 10030 10500 11660
No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se
que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia
70 Capıtulo 3 Aplicacoes
temporal local maior do que a global e um decrescimento no numero de acidentes do tipo
2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local
menor que a global e um decrescimento mais acentuado
Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16
E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um
obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um que permite complementar esta informacao
Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-
temente para a variacao geografica do risco relativo como se pode observar no mapa da
Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-
mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes
com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao
proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i
cujo intervalo de credibilidade HPD nao contem o zero e 5665
33 Modelos espaco-temporais 71
Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4
Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4
Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4
Min 1oQ Mediana Media 3oQ Max
δ1 -01530 -00368 00052 00001 00402 01140
eδ1 08592 09646 10060 10020 10420 11210
72 Capıtulo 3 Aplicacoes
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca
no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de
78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de
valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa
da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a
global sendo o seu decrescimento menos acentuado que o decrescimento global havendo
uma minoria onde se passa o contrario
Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4
Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior
que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao
com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista
ordenada dos primeiros quinze concelhos
33 Modelos espaco-temporais 73
339 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6
log(θ3ij) = α3 + b3CCi + s3i + ψ3t
e
log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t
No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a
covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo
P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1
log(θ3ij) = α3 + s3i + ψ3t
No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade
populacional nao contem o zero por isso o modelo mantem-se
Tabela 322 DIC pD e mls para acidentes tipo 3
modelo DIC pD mls
P 3 6 1 846290 20551 191
P 3 6 4 846237 20562 191
BN 3 6 1 852438 19770 191
BN 3 6 6 852362 19267 191
3310 Validacao dos modelos para acidentes do tipo 3
Validacao do modelo P 3 6 1 e do modelo BN 3 6 6
Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e
menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072
Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos
valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia
preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo
74 Capıtulo 3 Aplicacoes
ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se
que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3
Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6
3311 Resultados obtidos com modelos para acidentes do tipo 3
Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6
Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max
SMR3 00000 04639 11050 15100 20490 156700
RR3 6 1 01363 08869 13050 14900 18430 95400
RR3 6 6 bn 01247 09020 13170 14850 18370 87310
Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo
obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-
vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores
esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos
valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e
Tabela 323
33 Modelos espaco-temporais 75
Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6
Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6
Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-
76 Capıtulo 3 Aplicacoes
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os
modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6
Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000
Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo
P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
33 Modelos espaco-temporais 77
Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000
Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem
comentarios acerca de associacao regional para este modelo
78 Capıtulo 3 Aplicacoes
No modelo BN observa-se que com a introducao da covariavel densidade populacional o
valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da
variancia dos efeitos temporais σ2ψ1t
se mantem Tabelas 325 e 326
Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02114 00152 01815 02410
Variancia dos efeitos aleatorios
σ2s3 06817 00802 05383 08499
σ2ψ3
00255 00157 00082 00660
Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02155 00158 01842 02464
Parametro de dispersao ψminus11 00455 00061 00348 00584
Variancia dos efeitos aleatorios
σ2s3 06497 00800 05070 08174
σ2ψ3
00255 00161 00081 00672
Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6
Efeitos fixosmedia dp 0025q 0975q
α3 02791 00217 02362 03215
bDP -00199 00048 -00294 -00105
Parametro de dispersao φminus11 00459 00061 00350 00588
Variancia dos efeitos aleatorios
σ2s3 05855 00749 04532 07440
σ2ψ3
00255 00161 00081 00672
Tal significa que a covariavel densidade populacional contribui para a explicacao da
33 Modelos espaco-temporais 79
variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao
da variacao temporal A contribuicao da covariavel densidade populacional e negativa
o que indica que em regioes com maior densidade populacional ocorre a contribuicao
para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos
No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a
sobredispersao nao e significativa
Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1
Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1
80 Capıtulo 3 Aplicacoes
O padrao espacial das estimativas do risco relativo e das estimativas da componente
espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras
342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao
positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos
efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem
o zero e 439 para o modelo P 3 6 1
No que respeita a componente temporal observa-se um decrescimento nos dois primeiros
anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento
nos ultimos cinco anos
Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1
Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco
relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a
lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-
tivamente maior que um na Tabela A9 do Anexo A
33 Modelos espaco-temporais 81
Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6
Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6
Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os
padroes revelados pelos mapas As regioes com maior contribuicao da componente es-
pacial para o aumento do risco relativo correspondem em geral a regioes com maiores
estimativas de risco relativo Tal significa que a componente espacial explica grande parte
da variacao das estimativas do risco relativo A percentagem de estimativas dos valores
de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1
82 Capıtulo 3 Aplicacoes
Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6
A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo
modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode
ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se
pode encontrar uma lista ordenada dos primeiros quinze concelhos
Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se
apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista
o tipo de interacao espaco-temporal
Tabela 327 Modelos univariados
Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal
1 BN 1 6 172 C+P+OSEPU+OST RW mdash
2 BN 2 9 4 C fixo CAR
3 P 3 6 1 mdash RW mdash
34 Modelos multivariados 83
34 Modelos multivariados
Os modelos multivariados usados foram
log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)
log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)
Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-
tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito
complexos nao parece haver um ganho substancial em usa-los
Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados
Modelos multivariados Modelos univariados
Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q
α1 00565 00181 00214 00914 00580 00074 00435 00723
α2 03423 00344 02735 04083 03511 00191 03135 03883
α3 05993 00331 05340 06644 06633 00247 06147 07115
γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204
γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771
γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907
Σu =
05551 03843 05519
03843 1042 05864
05519 05864 09113
Σδ =
00074 00035 00061
00035 00111 00059
00061 00059 00081
No entanto e interessante verificar que em termos de correlacao entre as estimativas
dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo
2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao
que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios
nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e
tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no
numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330
84 Capıtulo 3 Aplicacoes
Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal
Modelos com interacao Modelos sem interacao
media dp 0025q 0975q media dp 0025q 0975q
ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669
ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879
ρ23(θ) 06793 00242 06304 07252 06831 002647 07326
ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196
ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941
ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976
ρ12(δ) 03823 00894 01960 05465
ρ13(δ) 07979 00634 06487 08998
ρ23(δ) 06203 00938 04153 07829
Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias
AnoVıtimas mortais Feridos graves Feridos leves
24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif
2010 741 937 196 2637 2475 -162 43924 43890 -34
2011 689 891 202 2436 2265 -171 39726 39695 -31
34 Modelos multivariados 85
Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados
86 Capıtulo 3 Aplicacoes
Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
35 Aplicacao para acidentes rodoviarios nas estradas
secundarias
Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-
cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram
retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-
damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior
risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do
poder local
Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840
Total 175741 16909 3471 196121
Figura 350 Numero de acidentes tipo 1 por concelho
88 Capıtulo 3 Aplicacoes
Figura 351 Numero de acidentes tipo 2 por concelho
Figura 352 Numero de acidentes tipo 3 por concelho
No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados
Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89
de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos
Tabela 332 DIC pD e mls para cada tipo de acidente
Modelo DIC pD mls
BN 1 9 42 1614530 32359 363
BN 2 9 246 924765 27530 208
P 3 6 30 581058 11747 131
351 Modelo para acidentes do tipo 1
Modelo Binomial Negativo 1 9 42
log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t
Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a
variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do
modelo
352 Validacao do modelo para acidentes do tipo 1
Validacao do modelo BN 1 9 42
Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42
O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-
pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O
90 Capıtulo 3 Aplicacoes
valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem
um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-
ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42
e o melhor modelo para acidentes do tipo 1
353 Resultados obtidos com o modelo para acidentes do tipo 1
Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42
Efeitos fixosmedia dp 0025q 0975q
α1 -03518 00346 -04202 -02843
b1C 00012 00004 00005 00019
b1OST 00001 000007 -000005 00002
γ1 -00128 00026 -00179 -00077
Parametro de dispersao φminus11 00287 00021 00248 00328
Variancia dos efeitos aleatorios
σ2s1 03982 00445 03180 04909
σ2δ1
00026 00007 00015 00040
Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91
As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico
influenciam significativamente a variacao geografica dos riscos relativos e portanto sao
consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de
forma positiva para a variacao dos riscos o que significa que em regioes com maior
comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma
contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes
efeitos
Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-
derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura
temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao
envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial
se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de
risco relativo Figuras 354 e 316
Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42
Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco
relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um
92 Capıtulo 3 Aplicacoes
354 Modelo para acidentes do tipo 2
Modelo Binomial Negativo 2 9 246
log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +
s2i + (γ2 + δ2i)t2
Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de
todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938
pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e
manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja
log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2
Tabela 334 DIC pD e mls
Modelo DIC pD mls
BN 2 9 86 924868 24786 208
355 Validacao do modelo para acidentes do tipo 2
Validacao do modelo BN 2 9 86
Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86
O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo
Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93
do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto
proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e
95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor
modelo para acidentes do tipo 2
356 Resultados obtidos com o modelo para acidentes do tipo 2
Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86
Efeitos fixosmedia dp 0025q 0975q
α2 -01198 00480 -02147 -00266
b1OSI 00002 000008 000007 00004
b1OSEPU 00003 00002 000001 00006
b1DP 00084 00066 -00046 00215
γ1 -01198 00480 -02147 -00266
Parametro de dispersao
φminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 10557 01336 08161 13345
σ2δ1
00094 00023 00057 00147
A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-
nos e a densidade populacional influenciam significativamente a variacao geografica dos
riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-
variaveis contribuem de forma positiva para a variacao dos riscos o que significa que
em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo
com equipamentos e parques urbanos e a regioes com maior densidade populacional ha
contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes
do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a
mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao
Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que
os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos
94 Capıtulo 3 Aplicacoes
concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns
conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas
do risco relativo sao os mesmos
Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86
Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95
A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com
o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que
consta na Tabela A11
357 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 30
log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt
Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU
contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo
358 Validacao do modelo para acidentes do tipo 3
Validacao do modelo P 3 6 30
Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30
Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da
distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-
mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores
igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva
e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para
acidentes do tipo 3
96 Capıtulo 3 Aplicacoes
359 Resultados obtidos com o modelo para acidentes do tipo 3
Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30
Efeitos fixosmedia dp 0025q 0975q
α2 00104 00520 -00923 01117
b3A 00258 00116 00031 00049
b3OSEPU -00001 00001 -00004 000006
Parametro de dispersao
ψminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 03598 00687 02422 05084
σ2ψ1
00246 00163 0007 00666
Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30
A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam
significativamente a variacao geografica dos riscos relativos sendo consideradas na es-
timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97
a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial
em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes
com maior area geografica ha uma contribuicao para o aumento das estimativas do risco
relativo mantendo fixos todos os restantes efeitos
O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de
trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-
trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico
mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No
entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos
Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30
E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo
modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que
consta na Tabela A11
Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-
mente a abordagem global e a abordagem local
98 Capıtulo 3 Aplicacoes
Tabela 337 Comparacao entre a abordagem local e a global
Abordagem Tipo Melhor Covariaveis Efeito Interacao
Modelo temporal espaco-temporal
Local 1 BN 1 9 42 C+OST fixo CAR
Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash
Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR
Gloal 2 BN 2 9 4 C fixo CAR
Local 3 P 3 6 30 A+OSEUP aleatorio mdash
Global 3 P 3 6 1 mdash aleatorio mdash
4Discussao e conclusoes
Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia
de dependencia espacial de tendencia temporal e de associacao regional em dados de
acidentes rodoviarios
Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-
delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por
areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar
diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao
espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel
recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados
com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de
trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de sobredispersao de associacao posi-
tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-
mentos e parques urbanos e uma associacao regional negativa com a populacao
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
100 Capıtulo 4 Discussao e conclusoes
bredispersao e de associacao regional positiva com o comprimento de estrada
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente
Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com o comprimento de estrada e com
a area de ocupacao do solo para turismo
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com a area de ocupacao de solo para
a industria com a area de ocupacao do solo com equipamentos e parques urbanos
e com a densidade populacional
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente de associacao regional
positiva com a area e de associacao regional negativa com a area de ocupacao de
solo com equipamentos e parques urbanos
Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-
se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas
Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com
interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao
do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido
o modelo Poisson com efeito temporal aleatorio
Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos
modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-
tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se
capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes
espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-
formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que
as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto
e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas
as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de
valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais
elevados diminuiram ou seja os valores extremos foram suavizados
101
Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos
dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-
gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi
possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia
temporal global Este e um tipo de resultado muito importante na fase de aplicacao
pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter
exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas
Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-
minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as
covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam
incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-
fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal
Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores
usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal
considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para
todos os anos em estudo
Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos
mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-
pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a
ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-
cativamente maior que um bem como as dos concelhos com valores consideravelmente
menores do que a unidade
Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-
timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises
por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-
pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de
estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-
nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o
TDMA de modo a introduzi-las no modelo
Os modelos multivariados constituiram um esforco computacional elevado nao tendo
havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises
comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi
possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes
tipos de acidentes
Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves
do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo
uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-
ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA
102 Capıtulo 4 Discussao e conclusoes
pela extrema concordancia de resultados pela facilidade de implementacao dos modelos
pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez
de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem
duvida muito mais acessıvel
Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-
dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de
um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-
patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de
recolha e definicao das variaveis de interesse A implementacao estes modelos tambem
pode ser efetuada atraves do R-INLA
Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir
como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-
dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite
efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-
gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade
dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas
geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios
constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel
mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-
sabilidade de todosrdquo
ACaracterizacao da regiao de estudo
A1 Portugal Continental
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes
administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados
em 18 distritos
O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a
partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na
pagina do Instituto Geografico Portugues - httpwwwigeopt
A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o
map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-
hancas no WinBUGS
104 Apendice A Caracterizacao da regiao de estudo
Figura A1 ID dos concelhos do Norte de Portugal Continental
A1 Portugal Continental 105
Figura A2 ID dos concelhos do Sul de Portugal Continental
106 Apendice A Caracterizacao da regiao de estudo
A1 Portugal Continental 107
108 Apendice A Caracterizacao da regiao de estudo
A2 Numero de acidentes
Tabela A1 Estatısticas resumo de acidentes tipo 1
Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200
Tabela A2 Estatısticas resumo de acidentes tipo 2
Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800
Tabela A3 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100
A2 Numero de acidentes 109
Numero de acidentes que ocorreram nas estradas secundarias
Tabela A4 Estatısticas resumo de acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900
Tabela A5 Estatısticas resumo de acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800
Tabela A6 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700
110 Apendice A Caracterizacao da regiao de estudo
A3 Covariaveis
bull Populacao - P
Tabela A7 Estatısticas resumo da covariavel populacao
Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700
Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)
A3 Covariaveis 111
bull Area - A
Figura A4 Area em centenas de km2 por concelho (Fonte INE)
bull Densidade Populacional - DP
Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)
112 Apendice A Caracterizacao da regiao de estudo
bull Comprimento de Estrada - C
Figura A6 Quilometros de estrada por concelho (Fonte EP)
bull Quantidade de combustıvel vendido - VC
Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)
A3 Covariaveis 113
bull Ocupacao urbana do solo - OSU
Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
bull Ocupacao industrial do solo - OSI
Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)
114 Apendice A Caracterizacao da regiao de estudo
bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU
Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)
bull Ocupacao do solo com equipamento turıstico - OST
Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
A4 15 concelhos 115A
415
con
celh
os
Tab
ela
A8
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o1
Mold
elo
P1
816
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alb
ergaria
-a-V
elh
a3
Castro
Marim
Alc
acer
do
Sal
Grandola
Castro
Marim
Castro
Marim
Castro
Marim
Alb
ergaria
-a-V
elh
aV
ouzela
4A
lcacer
do
Sal
Castro
Marim
Castro
Marim
Grandola
Grandola
Alb
ergaria
-a-V
elh
aC
astro
Marim
Alc
acer
do
Sal
5V
izela
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
Vila
Velh
ade
Rodao
Pedrogao
Grande
6C
ondeix
a-a
-Nova
Azam
buja
Azam
buja
Azam
buja
Obid
os
Penela
Penela
Vila
Velh
ade
Rodao
7A
zam
buja
Viz
ela
Alj
ezur
Obid
os
Penela
Obid
os
Alj
ezur
Penela
8Silves
Alj
ezur
Obid
os
Condeix
a-a
-Nova
Azam
buja
Grandola
Obid
os
Alj
ezur
9A
lbufe
ira
Silves
Pom
bal
Pom
bal
Pom
bal
Vila
Velh
ade
Rodao
Pedrogao
Grande
Obid
os
10
Alj
ezur
Obid
os
Palm
ela
Penela
Alb
ergaria
-a-V
elh
aP
om
bal
Vouzela
Castro
Marim
11
Palm
ela
Pom
bal
Benavente
Palm
ela
Condeix
a-a
-Nova
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oE
sposende
12
Benavente
Benavente
Silves
Benavente
Vila
Velh
ade
Rodao
Azam
buja
Pom
bal
Montem
or-o
-Velh
o13
Pom
bal
Palm
ela
Penela
Vagos
Benavente
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
Tabua
14
Obid
os
Alb
ufe
ira
Olh
ao
Silves
Palm
ela
Condeix
a-a
-Nova
Esposende
Oliveir
ado
Bair
ro
15
Marin
ha
Grande
Olh
ao
Vagos
Olh
ao
Montem
or-o
-Velh
oP
edrogao
Grande
Tabua
Cham
usca
Mold
elo
BN
16
172
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
3C
astro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
4G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
5O
bid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
6C
ondeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
7A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
8P
om
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
9B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
10
Penela
Penela
Penela
Penela
Penela
Penela
Penela
Penela
11
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
12
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
13
Palm
ela
Alb
ergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
a14
Alb
ergaria
-a-V
elh
aP
alm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
15
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
o
116 Apendice A Caracterizacao da regiao de estudo
Tab
ela
A9
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o2
Modelo
P2
916
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ouriq
ue
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Alj
ustrel
4A
lcacer
do
Sal
Alc
acer
do
Sal
Avis
Nis
aO
urem
Nis
aA
ljustrel
Avis
5A
vis
Avis
Alc
acer
do
Sal
Rio
Maio
rN
isa
Alj
ustrel
Nis
aM
ourao
6C
ham
usca
Nis
aN
isa
Alj
ezur
Alc
acer
do
Sal
Mourao
Mourao
Nis
a7
Santarem
Cham
usca
Alj
ezur
Alc
acer
do
Sal
Alj
ustrel
Pedrogao
Grande
Pedrogao
Grande
Pedrogao
Grande
8V
ila
Nova
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rA
lcacer
do
Sal
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
da
Barquin
ha
da
Barquin
ha
9N
isa
Santarem
Vila
Nova
Pedrogao
Grande
Mourao
Ourem
Alc
acer
do
Sal
Proenca-a
-Nova
da
Barquin
ha
10
Alm
eir
imV
endas
Novas
Pedrogao
Grande
Mourao
Pedrogao
Grande
Ferreir
ado
Ale
ntejo
Proenca-a
-Nova
Alc
acer
do
Sal
11
Gole
ga
Montem
or-o
-Novo
Alj
ustrel
Vila
Nova
Ferreir
ado
Ale
ntejo
Rio
Maio
rG
randola
Idanha-a
-Nova
da
Barquin
ha
12
Vendas
Novas
Alj
ezur
Santarem
Cham
usca
Montem
or-o
-Novo
Montem
or-o
-Novo
Rio
Maio
rG
randola
13
Gavia
oG
avia
oM
ontem
or-o
-Novo
Montem
or-o
-Novo
Vila
Nova
Grandola
Ourem
Alm
odovar
da
Barquin
ha
14
Palm
ela
Gole
ga
Mourao
Ferreir
ado
Ale
ntejo
Grandola
Proenca-a
-Nova
Montem
or-o
-Novo
Montem
or-o
-Novo
15
Montem
or-o
-Novo
Alm
eir
imV
endas
Novas
Grandola
Cham
usca
Vila
Nova
Vila
Velh
ade
Rodao
Celo
ric
oda
Beir
ada
Barquin
ha
Modelo
BN
29
4
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ourem
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Avis
Alj
ustrel
4A
vis
Avis
Rio
Maio
rA
ljezur
Ourem
Nis
aA
ljustrel
Avis
5A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Nis
aN
isa
Alj
ustrel
Nis
aN
isa
6C
ham
usca
Nis
aN
isa
Alc
acer
do
Sal
Alc
acer
do
Sal
Ourem
Mourao
Mourao
7V
ila
Nova
Cham
usca
Alj
ezur
Rio
Maio
rA
ljustrel
Alc
acer
do
Sal
Alc
acer
do
Sal
Pedrogao
Grande
da
Barquin
ha
8Santarem
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rM
ourao
Pedrogao
Grande
Alc
acer
do
Sal
9N
isa
Santarem
Vila
Nova
Mourao
Mourao
Pedrogao
Grande
Ferreir
aFerreir
ada
Barquin
ha
do
Ale
ntejo
do
Ale
ntejo
10
Montem
or-o
-Novo
Alj
ezur
Alj
ustrel
Vila
Nova
Pedrogao
Grande
Rio
Maio
rO
urem
Proenca-a
-Nova
da
Barquin
ha
11
Vendas
Novas
Montem
or-o
-Novo
Santarem
Cham
usca
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
Rio
Maio
rC
elo
ric
oda
Beir
a12
Gole
ga
Alj
ustrel
Montem
or-o
-Novo
Pedrogao
Grande
Montem
or-o
-Novo
Montem
or-o
-Novo
Proenca-a
-Nova
Ourem
13
Salv
aterra
de
Magos
Vendas
Novas
Mourao
Montem
or-o
-Novo
Vila
Nova
Grandola
Montem
or-o
-Novo
Grandola
da
Barquin
ha
14
Alm
eir
imM
ourao
Pedrogao
Grande
Ferreir
aC
ham
usca
Vila
Nova
Grandola
Idanha-a
-Nova
do
Ale
ntejo
da
Barquin
ha
15
Alj
ezur
Salv
aterra
de
Magos
Ferreir
ado
Ale
ntejo
Grandola
Grandola
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aM
ontem
or-o
-Novo
A4 15 concelhos 117
Tab
ela
A1
015
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o3
Modelo
P3
61
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
Ferreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9C
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a10
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
11
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
12
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
13
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Modelo
BN
36
6
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9A
zam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
10
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
11
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a12
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
13
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
118 Apendice A Caracterizacao da regiao de estudoT
abel
aA
11
15co
nce
lhos
com
esti
mati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
Acid
entes
tip
o1
-M
odelo
BN
19
42
2000
2001
2002
2003
2004
2005
2006
2007
1M
arin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Ilhavo
Ilhavo
Ilhavo
Ilhavo
2Il
havo
Ilhavo
Ilhavo
Ilhavo
Marin
ha
Grande
Marin
ha
Grande
Vagos
Vagos
3A
lbufe
ira
Alb
ufe
ira
Vagos
Vagos
Vagos
Vagos
Marin
ha
Grande
Ferreir
ado
Zezere
4P
ortim
ao
Portim
ao
Alb
ufe
ira
Portim
ao
Portim
ao
Ferreir
ado
Zezere
Ferreir
ado
Zezere
Marin
ha
Grande
5V
agos
Vagos
Portim
ao
Porto
Porto
Portim
ao
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
6P
orto
Porto
Porto
Alb
ufe
ira
Ferreir
ado
Zezere
Porto
Porto
Montem
or-o
-Velh
o7
Faro
Penic
he
Penic
he
Penic
he
Penic
he
Penic
he
Portim
ao
Alp
iarca
8L
oule
Faro
Faro
Faro
Alb
ufe
ira
Oliveir
ado
Bair
ro
Montem
or-o
-Velh
oP
orto
9P
enic
he
Loule
Viz
ela
Ferreir
ado
Zezere
Coim
bra
Montem
or-o
-Velh
oP
enic
he
Penic
he
10
Odiv
ela
sO
div
ela
sC
oim
bra
Coim
bra
Faro
Coim
bra
Coim
bra
Coim
bra
11
Viz
ela
Viz
ela
Odiv
ela
sV
izela
Montem
or-o
-Velh
oA
lbufe
ira
Alp
iarca
Portim
ao
12
Olh
ao
Coim
bra
Loule
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Faro
Pom
bal
Pom
bal
13
Nazare
Olh
ao
Ferreir
ado
Zezere
Odiv
ela
sV
izela
Aveir
oA
veir
oA
veir
o14
Coim
bra
Setubal
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Aveir
oP
om
bal
Faro
Vis
eu
15
Setubal
Cantanhede
Setubal
Aveir
oP
om
bal
Viz
ela
Murtosa
Lis
boa
Acid
entes
tip
o2
-M
odelo
BN
29
86
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ourem
Ourem
Ourem
Ourem
Ourem
S
J
Madeir
a2
Rio
Maio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rFerreir
aZ
O
dem
ira
Odem
ira
3A
lmeir
imFerreir
aZ
Ferreir
aZ
Ferreir
aZ
Ferreir
aZ
R
ioM
aio
rFerreir
aZ
Ferreir
aZ
4
Ferreir
ado
Zezere
Alm
eir
imB
raganca
Braganca
Braganca
Odem
ira
S
J
Madeir
aV
izela
5Santarem
Braganca
Avis
Odem
ira
Odem
ira
Mourao
Braganca
Braganca
6L
isboa
Lis
boa
Odem
ira
Mourao
Mourao
Braganca
Rio
Maio
rO
urem
7C
ham
usca
Santarem
Lis
boa
Avis
Avis
S
J
Madeir
aA
lmodovar
Alm
odovar
8B
raganca
Cham
usca
Mourao
Lis
boa
Vim
ioso
Avis
Viz
ela
Tondela
9P
alm
ela
Avis
Santarem
Cham
usca
Ala
ndroal
Vim
ioso
Tondela
Chaves
10
Salv
aterra
de
Magos
Palm
ela
Cham
usca
Palm
ela
S
J
Madeir
aA
lmodovar
Chaves
Rio
Maio
r11
Avis
Salv
aterra
de
Magos
Alm
eir
imSantarem
Alm
odovar
Chaves
Elv
as
Guim
araes
12
Ilhavo
Odem
ira
Palm
ela
Ala
ndroal
Elv
as
Ala
ndroal
Serta
13
Vila
Nova
da
Barquin
ha
Mourao
Salv
aterra
de
Magos
Elv
as
Palm
ela
Tondela
Palm
ela
14
Nazare
Vila
Nova
da
Barquin
ha
Ala
ndroal
Alm
eir
imC
ham
usca
Elv
as
Portim
ao
15
Abrantes
Ala
ndroal
Lagos
Salv
aterra
de
Magos
Lis
boa
Palm
ela
Loule
Acid
entes
tip
o3
-M
odelo
P3
630
2000
2001
2002
2003
2004
2005
2006
2007
1O
dem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
2M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
3V
imio
so
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Cantanhede
4F
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
o5
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
6M
iranda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
7A
lmodovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
8Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
9A
lcoutim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
10
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
11
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
12
Alc
ochete
Alc
ochete
Alc
ochete
Macedo
de
Cavale
iros
Alc
ochete
Alc
ochete
13
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Vagos
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
14
Vagos
Vagos
Vagos
Cantanhede
Vagos
Vagos
15
Cantanhede
Cantanhede
Cantanhede
Alc
ochete
Cantanhede
Cantanhede
Referencias Bibliograficas
Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes
in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625
ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt
Defaultaspxtabid=220amplanguage=pt-PT
ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx
fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT
Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population
density Statistics in Medicine 18(16) 2147ndash2162
Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety
performance indicators by using a multivariate generalized linear mixed model Journal
of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517
Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis
for Spatial Data Chapman amp Hall
Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease
maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431
Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini
M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med
14(21-22) 2433ndash2443
Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis
of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007
Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems
Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236
Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-
tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20
101007BF00116466
120 Referencias bibliograficas
Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis
with R Springer
Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed
Models Journal of the American Statistical Association 88(421) 9ndash25
Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane
roads Accident Analysis amp Prevention 39(4) 657 ndash 670
Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a
velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos
PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico
Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em
Seguranca Rodoviaria Technical report IST and LNEC
Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-
Temporally Correlated Survival Data In Bayesian Statistics 7
Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data
Analysis Chapman amp Hall
Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative
Risks for Use in Disease Mapping Biometrics 43 671ndash681
Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data
Biometrics 65 1254ndash1261
Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao
em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo
20economico20e20social20dos20acidentes_versao20para20internet
Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in
Europe Applied Spatial Analysis 1 133ndash150
Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level
Example of Belgium Journal of Safety Research 39(4) 417 ndash 427
El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate
Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828
Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety
Accident Analysis amp Prevention 40(6) 1964 ndash 1969
Referencias bibliograficas 121
Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis
and Prevention 43 253ndash264
Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall
Gelfand A E (1996) Model determination using sampling-based methods In W
Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice
chapter 9 (pp 145ndash161) Chapman amp
Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive
models for spatial data analysis Biostatistics 4(1) 11ndash15
Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis
Chapman amp Hall
Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for
the analysis of spatial data An application to disease mapping Journal of Statistical
Planning and Inference 75(2) 305 ndash 318
Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and
Estimation Journal of the American Statistical Association 102(477) 359ndash378
Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical
Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808
Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps
with Application to German Mortality Data httpepububuni-muenchende
Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive
Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical
Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD
Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR
Models for Areal Data Biometrics 61(4) 950ndash961
Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease
risk Statistics In Medicine 19(17-18) 2555ndash2567
Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space
Statistics in Medicine 17(18) 2045ndash2060
Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-
demiology CRC Press Taylor amp Francis
122 Referencias bibliograficas
Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-
mann P e Divino F (2000) Disease mapping models an empirical evaluation
Statistics in Medicine 19(17-18) 2217ndash2241
Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-
temporal patterns of intra-city motor vehicle craches Journal of Transport Geography
15 274ndash285
Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical
models in road safety countermeasure effectiveness studies in Iowa Accident Analysis
amp Prevention 40(4) 1531 ndash 1542
Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-
Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis
amp Prevention 40(3) 1123 ndash 1134
Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small
sample size on the estimation of the fixed dispersion parameter of Poisson-gamma
models for modeling motor vehicle crashes A Bayesian perspective Safety Science
46(5) 751 ndash 770
Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-
persion parameters of Poisson-gamma models on empirical Bayes estimates Accident
Analysis amp Prevention 40(4) 1441 ndash 1457
Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-
inflated regression models of motor vehicle crashes balancing statistical fit and theory
Accident Analysis amp Prevention 37(1) 35 ndash 46
Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal
regression model for prediction of crash counts by severity using Bayesian methods
Accident Analysis amp Prevention 40(3) 964 ndash 975
MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident
and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028
Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P
Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive
Statistical Methods (pp 99ndash114) Springer
Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-
tent Gaussian models using integrated nested Laplace approximations A manual for
Referencias bibliograficas 123
the inla program Technical report Norwegian University of Science and Technology
Trondheim
McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall
Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-
provements Decision parameter treatability concept statistical criterion and spatial
dependence Accident Analysis amp Prevention 37(4) 699 ndash 720
Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A
Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57
Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures
for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201
Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle
crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468
Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties
in england Accident Analysis amp Prevention 36(6) 973 ndash 984
OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications
world_health_statistics2008en
OMS (2009) Global status report on road safety httpwhqlibdocwhoint
publications20099789241563840_engpdf
Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao
Calouste Gubenkian
Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes
factors Biometrika 77(3) 455ndash466
Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-
tistics 9(3) 523ndash539
Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis
and output analysis for MCMC R News 6(1) 7ndash11
Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and
heterogeneity An analysis of London crash data Accident Analysis amp Prevention
40(4) 1486 ndash 1497
124 Referencias bibliograficas
R Development Core Team (2008) R A Language and Environment for Statistical
Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-
07-0
Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology
Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications
Chapman amp HallCRC
Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent
gaussian models by using integrated nested laplace approximations Journal of the
Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392
Schrodle B e Held L (2011) A primer on disease mapping and ecological regression
using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2
Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment
and Posterior Inference Journal of Statistical Software 21(11) 1ndash37
Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial
models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)
246 ndash 273
Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian
measures of model complexity and fit J R Statist Soc B 64 583ndash639
Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and
Marginal Densities Journal of the American Statistical Association 81 82ndash86
Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian
Journal of Statistics 31 221ndash229
Wakefield J (2007) Disease mapping and spatial regression with count data Biostat
8(2) 158ndash183
Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press
Taylor amp Francis
Agradecimentos
Esta tese nao poderia ser realizada sem o apoio de algumas pessoas as quais quero ex-
pressar o meu profundo agradecimento
A Professora Doutora Maria Antonia Amaral Turkman pela sua orientacao e principal-
mente pela sua compreensao
A Professora Antonia tem sido para mim ao longo destes anos uma fonte de motivacao
devido acima de tudo pela grande admiracao que tenho por ela
Ao Professor Doutor Joao Paulo Lourenco Cardoso pelo apoio pela compreensao e acima
de tudo pelo seu entusiasmo por esta tese
Ao Professor Alan Gelfand por se interessar pela ldquominha historiardquo
Ao Professor Havard Rue pela disponibilidade em ajudar na minha exploracao do R-INLA
e pelo incentivo
Ao Centro de Estatıstica e Aplicacoes da Universidade de Lisboa pelo incentivo e apoio a
minha presenca em eventos cientıficos que muito contribuiram para a aquisicao e partilha
de conhecimentos importantes para a realizacao do meu doutoramento
Ao Professor Rune Elvik pelo interesse demostrado
Este trabalho foi financiado por FCT-Est-OEMATUI00062011 e parcialmente finan-
ciado pela bolsa de doutoramento SFRHPROTEC492262008
A Estradas de Portugal SA pela disponibilizacao de informacao sobre as estradas de
Portugal Continental
Ao Dr Rui Pereira pela prontidao e pelo interesse
A Universidade do Algarve e em particular ao Departamento de Engenharia Civil do
Instituto Superior de Engenharia
Aos meus amigos e ldquocolegas de doutoramentordquo que sempre me apoiaram e incentivaram
em especial a Claudia Santos a Sılvia Pedro a Paula Pereira a Vanda Inacio e ao
Miguel Carvalho por tornarem as viagens e os encontros cientıficos em descobertas
A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-
balho
Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha
espera
Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho
a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa
os quais me ajudaram cada um a sua maneira
A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude
partilhar muitos momentos de alegria e descontracao
Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira
A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre
em mim a Mariana e a Rita por me seguirem como exemplo
A minha mae
Siglas e Acronimos
A Area geografica
AE Autoestrada
ANSR Autoridade Nacional de Seguranca Rodoviaria
BN Binomial Negativo
BT Brigada de Transito
BOA An R Package for MCMC Output Convergence
Assessment and Posterior Inference
BUGS Bayesian Using Gibbs Sampling
C Comprimento de estrada
CARE Community database on accidents on the roads in Europe
CE Codigo de Estrada
CODA Convergence Diagnosis and Output Analysis for MCMC
CPO Conditional Predictive Ordinates
DIC Deviance Information Criterion
DP Densidade populacional
EN Estrada Nacional
ENSR Estrategia Nacional de Seguranca Rodoviaria
GNR Guarda Nacional Republicana
HPD Highest Probability Density
IC Itinerario Complementar
INLA Integrated Nested Laplace Approximations
IP Itinerario Principal
MCMC Markov Chains Monte Carlo
mls Mean logarithmic score
OMS Organizacao Mundial de Saude
ONU Organizacao das Nacoes Unidas
OSEPU Ocupacao do solo com equipamentos e parques urbanos
OSI Ocupacao industrial do solo
OST Ocupacao do solo com equipamento turıstico
OSU Ocupacao urbana do solo
pD Numero efetivo de parametros
PIT Probability Integral Transformation
PMOT Plano Municipal de Ordenamento do Territorio
PMSR Planos Municipais de Seguranca Rodoviaria
PSP Polıcia de Seguranca Publica
R A Language and Environment for Statistical Computing
SafetyNET Projeto europeu European Traffic Information System -
Data Colletion and Analysis Tools for Policy Making
SMR Standard Morbility Ratio
UE Uniao Europeia
WinBUGS versao em ambiente Windows do programa BUGS
VC Quantidade de combustıvel vendido
Conteudo
Lista de Tabelas xiv
Lista de Figuras xv
Introducao 1
1 Nocoes sobre seguranca rodoviaria 9
11 Risco em seguranca rodoviaria 9
12 Caracterizacao dos dados de acidentes 10
13 Caracterizacao da medida de exposicao 14
2 Modelacao estatıstica de acidentes rodoviarios 19
21 Modelos bayesianos hierarquicos 21
22 Modelos nao espaciais 24
23 Modelos espaciais 27
24 Modelos espaco-temporais 28
25 Modelos multivariados 30
26 Metodos de inferencia 32
261 INLA 32
27 Ajustamento e medidas preditivas 36
3 Aplicacoes 39
31 Associacao espacial 40
32 Modelos 43
33 Modelos espaco-temporais 45
331 Associacao regional 46
332 Selecao dos modelos 47
333 Modelos para acidentes do tipo 1 48
334 Validacao dos modelos para acidentes do tipo 1 49
335 Resultados obtidos com modelos para acidentes do tipo 1 49
xii Conteudos
336 Modelos para acidentes do tipo 2 61
337 Validacao dos modelos para acidentes do tipo 2 62
338 Resultados obtidos com modelos para acidentes do tipo 2 62
339 Modelos para acidentes do tipo 3 73
3310 Validacao dos modelos para acidentes do tipo 3 73
3311 Resultados obtidos com modelos para acidentes do tipo 3 74
34 Modelos multivariados 83
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
351 Modelo para acidentes do tipo 1 89
352 Validacao do modelo para acidentes do tipo 1 89
353 Resultados obtidos com o modelo para acidentes do tipo 1 90
354 Modelo para acidentes do tipo 2 92
355 Validacao do modelo para acidentes do tipo 2 92
356 Resultados obtidos com o modelo para acidentes do tipo 2 93
357 Modelos para acidentes do tipo 3 95
358 Validacao do modelo para acidentes do tipo 3 95
359 Resultados obtidos com o modelo para acidentes do tipo 3 96
4 Discussao e conclusoes 99
A Caracterizacao da regiao de estudo 103
A1 Portugal Continental 103
A2 Numero de acidentes 108
A3 Covariaveis 110
A4 15 concelhos 115
Referencias Bibliograficas 119
Lista de Tabelas
11 Numero total de cada tipo de acidentes rodoviarios por ano 11
12 Estatısticas resumo do numero de veıculos com seguro em milhares 14
21 Modelos univariados 30
31 Valores do ındice EBI para cada tipo de acidente por ano 43
32 Valores DIC e mls dos modelos Poisson sem covariaveis 44
33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44
34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45
35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem
covariaveis 46
36 DIC pD e mls para cada tipo de acidente 47
37 DIC pD e mls para acidentes tipo 1 48
38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50
39 Estatısticas resumo dos parametros do modelo P 1 8 1 53
310 Estatısticas resumo dos parametros do modelo P 1 8 16 54
311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55
312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55
313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57
314 DIC pD e mls para acidentes tipo 2 61
315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63
316 Estatısticas resumo para os parametros do modelo P 2 9 1 66
317 Estatısticas resumo para os parametros do modelo P 2 9 16 67
318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67
319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68
320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69
321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71
322 DIC pD e mls para acidentes tipo 3 73
323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74
xiv Lista de Tabelas
324 Estatısticas resumo dos parametros do modelo P 3 6 1 78
325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78
326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78
327 Modelos univariados 82
328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-
tivariado e dos modelos univariados 83
329 Correlacoes dos modelos multivariados com interacao e sem interacao
espaco-temporal 84
330 Vıtimas a 24 horas e vıtimas a 30 dias 84
331 Numero total de cada tipo de acidentes rodoviarios por ano 87
332 DIC pD e mls para cada tipo de acidente 89
333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90
334 DIC pD e mls 92
335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93
336 Estatısticas resumo dos parametros do modelo P 3 6 30 96
337 Comparacao entre a abordagem local e a global 98
A1 Estatısticas resumo de acidentes tipo 1 108
A2 Estatısticas resumo de acidentes tipo 2 108
A3 Estatısticas resumo de acidentes tipo 3 108
A4 Estatısticas resumo de acidentes tipo 1 109
A5 Estatısticas resumo de acidentes tipo 2 109
A6 Estatısticas resumo de acidentes tipo 3 109
A7 Estatısticas resumo da covariavel populacao 110
A8 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 1 115
A9 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 2 116
A10 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 3 117
A11 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 118
Lista de Figuras
1 Dez principais causas de morte no mundo 2
2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4
11 Numero de acidentes tipo 1 por concelho 12
12 Numero de acidentes tipo 2 por concelho 12
13 Numero de acidentes tipo 3 por concelho 13
14 Numero de veıculos com seguro em milhares por concelho e por ano 14
15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15
16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16
17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16
31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de
acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano
2000 41
32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de
veıculos com seguro no ano 2000 41
33 Valores estimados dos SMR1 e respetivos intervalos de confianca para
cada concelho no ano 2000 42
34 Histograma dos valores de EBI simulados e valor de EBI observado para
acidentes tipo 1 e para ano 2000 43
35 Histograma das diferencas entre as medias dos logscores 48
36 Histograma dos valores PIT ajustados para acidentes tipo 1 49
37 Box plot dos valores estimados para acidentes tipo 1 50
38 Amplitude dos intervalos para acidentes tipo 1 51
39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 1 51
310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o
ano 2000 52
xvi Lista de Figuras
311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52
312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53
313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo P 1 8 16 56
314 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo
P 1 8 16 56
315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo P 1 8 16 57
316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 6 172 58
317 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58
318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-
dos com o modelo BN 1 6 172 59
319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com
o modelo BN 1 6 172 60
320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 6 172 60
321 Histograma das diferencas entre as medias dos logscores 61
322 Histograma dos valores PIT ajustados para acidentes tipo 2 62
323 Box plot dos valores estimados para acidentes tipo 2 63
324 Amplitude dos intervalos para acidentes tipo 2 64
325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori dos acidentes tipo 2 64
326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o
ano 2000 65
327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65
328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66
329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo P 2 9 16 68
330 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
P 2 9 16 69
Lista de Figuras xvii
331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2
de 2000 a 2007 obtidos com o modelo P 2 9 16 70
332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 4 71
333 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
BN 2 9 4 71
334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 4 72
335 Histograma dos valores PIT ajustados para acidentes tipo 3 74
336 Box plot dos valores estimados para acidentes tipo 3 75
337 Amplitude dos intervalos para acidentes tipo 3 75
338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76
339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o
ano 2000 76
340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77
341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77
342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 1 79
343 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79
344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3
de 2000 a 2007 obtidos com o modelo P 3 6 1 80
345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo BN 3 6 6 81
346 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81
347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo BN 3 6 6 82
348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos univariados e com os modelos multivariados 85
349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos multivariados 86
350 Numero de acidentes tipo 1 por concelho 87
351 Numero de acidentes tipo 2 por concelho 88
xviii Lista de Figuras
352 Numero de acidentes tipo 3 por concelho 88
353 Histograma dos valores PIT ajustados para acidentes tipo 1 89
354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 9 42 90
355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 9 42 91
356 Histograma dos valores PIT justados para acidentes tipo 2 92
357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 86 94
358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 86 94
359 Histograma dos valores PIT ajustados para acidentes tipo 3 95
360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 30 96
361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo P 3 6 30 97
A1 ID dos concelhos do Norte de Portugal Continental 104
A2 ID dos concelhos do Sul de Portugal Continental 105
A3 Numero de habitantes por concelho e por ano 110
A4 Area por concelho 111
A5 Densidade populacional por concelho 111
A6 Quilometros de estrada por concelho 112
A7 Quantidade de combustıvel vendido por concelho 112
A8 Superfıcie de ocupacao urbana do solo por concelho 113
A9 Superfıcie de ocupacao industrial do solo por concelho 113
A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por
concelho 114
A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114
ldquoThe road to wisdom - Well itacutes plain and simple to express
Err and err and err again but less and less and lessrdquo
Piet Hein (1996)
Introducao
A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora
de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo
automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se
tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao
ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o
Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009
OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes
rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso
entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as
tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa
na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas
etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do
PIB mundial
A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas
necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004
para a quinta causa de morte em 2030
2 Introducao
2004
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Infecoes respiratorias
4 Doencas pulmonares
5 Diarreias
6 HIVAIDS
7 Tuberculose
8Cancro do pulmao
dos bronquios e da traqueia
9 Acidentes rodoviarios
10Recem-nascidos prematuros
e de peso baixo
HH
2030
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Doencas pulmonares
4 Infecoes respiratorias
5 Acidentes rodoviarios
6Cancro do pulmao
dos bronquios e da traqueia
7 Diabetes mellitus
8 Doencas do coracao hipertensas
9 Cancro do estomago
10 HIVAIDS
Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)
No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a
decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-
ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem
disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao
forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes
rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida
No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de
Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-
dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos
socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a
sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario
e Santos 2012)
O sistema de trafego rodoviario um subsistema do sistema de transportes e formado
por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-
fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes
rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos
correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada
e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a
deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos
Introducao 3
(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de
pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se
por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma
qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena
de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do
sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-
guranca deste sistema complexo tem consequencias devastadoras em termos humanos
sociais e economicos (Cardoso 2007)
Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta
consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos
consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-
vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma
descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-
tadas a nıvel mundial
minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-
doviaria
minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios
como um problema de saude publica
minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da
seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial
minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria
minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das
Nacoes Unidas
minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca
Rodoviaria
minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de
Acao para a Seguranca Rodoviaria
Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria
Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-
dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade
responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para
uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos
veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica
sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste
flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area
da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e
tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha
uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes
4 Introducao
projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do
trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para
veıculos tambem designada por sistemas inteligentes de transportes
A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-
volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos
30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-
tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi
progressivamente modernizado tendo sido acompanhado por um aumento do numero
de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal
terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de
toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu
aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver
na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada
a implementacao de algumas medidas especıficas
Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)
As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para
compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios
e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou
regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma
consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica
de dados de acidentes rodoviarios
Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo
pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e
Introducao 5
do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda
lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util
domınio para desenvolvimento de atividades de investigacao O ambito desta tese e
portanto a modelacao estatıstica de dados de acidentes rodoviarios
Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-
retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar
progressivamente a execucao dessas acoes foram identificados varios fatores capazes de
melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em
particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas
com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados
As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma
melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de
intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-
vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada
em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-
dos na UE (CARE - Community database on accidents on the roads in Europe) No
projeto integrado SafetyNET (European Traffic Information System - Data Colletion
and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de
informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas
principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco
e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como
ponto de partida para a modelacao estatıstica usada nesta tese
A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-
nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-
ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos
desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-
cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes
o que facilita a identificacao dos fatores causais e de intervencoes corretivas
As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-
tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial
como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy
A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-
tatıstica Em geral foram detetados varios problemas na estimacao dos parametros
de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou
desconhecidas dependencia espacial e depedencia temporal que continuam a constituir
objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-
blemas como por exemplo
1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm
6 Introducao
minus modelos lineares generalizados baseados na distribuicao de Poisson
minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia
de sobredispersao
minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado
para analisar dados de acidentes com sobredispersao e excesso de zeros
minus modelos de nıveis multiplos estruturados
minus modelos bayesianos hierarquicos
minus incorporacao de correlacao espacial e dependencia temporal nos modelos
A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao
existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada
a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre
os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos
hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem
podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li
et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar
a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais
e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais
atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004)
O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da
estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a
problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior
barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua
formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains
Monte Carlo) na computacao bayesiana
A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se
nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que
envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas
O seu crescimento ao nıvel das aplicacoes tem sido extraordinario
O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using
Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o
GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao
Introducao 7
CODA Plummer et al (2006) e ao BOA Smith (2007)
Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de
pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)
o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em
particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-
tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas
Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana
aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa
determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas
limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes
de concordancia
Todas as analises envolvidas no metodo INLA estao implementadas num programa que
pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser
descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos
hierarquicos complexos tornou-se muito mais acessıvel
Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA
Objetivos
Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-
los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca
rodoviaria em areas geograficas diferentes
Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse
tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-
pacial e depedencia temporal
Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao
Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes
nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional
Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-
place Approximations atraves da exploracao do pacote R-INLA
8 Introducao
Estrutura da tese
No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a
caracterizacao dos dados usados nesta tese
No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos
No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais
de sinistralidade rodoviaria registados em Portugal Continental
No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido
de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros
No Anexo A faz-se a caracterizacao da regiao de estudo
No CD em anexo encontram-se todos os codigos usados nesta tese
1Nocoes sobre seguranca rodoviaria
11 Risco em seguranca rodoviaria
O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores
de seguranca informativos muito importantes No entanto quando se pretende fazer
comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de
acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca
rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de
acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja
risco=numero esperado de acidentesmedida de exposicao
A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-
responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel
ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-
teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a
melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-
cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos
proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens
e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego
10 Capıtulo 1 Nocoes sobre seguranca rodoviaria
atraves do comprimento de estrada do numero de veıculos ou preferencialmente da
distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode
estar associada a populacao de risco atraves do numero de habitantes do numero de
condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas
times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco
de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia
de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-
cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o
numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para
a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande
disponibilidade de informacao desagregada o que permite analisar as especificidades de
varios grupos populacionais As restantes medidas indicadas apresentam atualmente
muitas limitacoes1
Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se
deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido
e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a
relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata
de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes
e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-
se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de
veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se
a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho
12 Caracterizacao dos dados de acidentes
Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito
e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas
sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela
gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de
exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-
tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao
usada e sobre as covariaveis usadas
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-
ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez
1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2
205-v3_finalpdf
12 Caracterizacao dos dados de acidentes 11
agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho
A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos
se encontram no litoral norte sendo consequentemente mais proximos uns dos outros
Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz
respeito a caracterizacao dos concelhos2
Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311
Total 279644 28844 8890 317378
Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR
minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo
menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT
e PSP) e da qual resultem vıtimas ou danos materiais
minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais
minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do
acidente ou no seu percurso ate a unidade de saude No perıodo em analise para
obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)
aplica-se um coeficiente multiplicativo de 114 ao numero de mortos
minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo
de hospitalizacao superior a 24 horas
minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave
minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima
minus Acidente mortal Acidente do qual resulte pelo menos um morto
minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido
grave nao tendo ocorrido qualquer morte
minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido
leve e em que nao se tenham registado mortos nem feridos graves
2ver Anexo A
12 Capıtulo 1 Nocoes sobre seguranca rodoviaria
Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes
com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes
do tipo 3 os acidentes mortais
Figura 11 Numero de acidentes tipo 1 por concelho
Figura 12 Numero de acidentes tipo 2 por concelho
12 Caracterizacao dos dados de acidentes 13
Figura 13 Numero de acidentes tipo 3 por concelho
Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero
de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de
acidentes
Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor
risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao
entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria
muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos
mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278
concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado
o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de
cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes
decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para
permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no
espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes
Isto e especialmente importante porque apesar do numero de acidentes ser relacionado
com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria
que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de
3ver Anexo A
14 Capıtulo 1 Nocoes sobre seguranca rodoviaria
trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a
variabilidade da medida de exposicao em funcao do espaco ou do tempo
13 Caracterizacao da medida de exposicao - numero
de veıculos com seguro
Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares
Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730
Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)
13 Caracterizacao da medida de exposicao 15
O numero de veıculos com seguro varia bastante de concelho para concelho como se pode
verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo
por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que
cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media
inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo
Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho
i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o
numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =
100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de
acidente rodoviario para acidentes do tipo 1ndash3
Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por
concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes
e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos
sugerindo a existencia de correlacao espacial
Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na
faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas
mais baixas
Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007
Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-
se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se
mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas
muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a
16 Capıtulo 1 Nocoes sobre seguranca rodoviaria
nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos
com taxas mais baixas
Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007
Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007
No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas
usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer
mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-
petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao
13 Caracterizacao da medida de exposicao 17
ocorre com muita frequencia com dados de contagem com muitos valores escassos e
ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou
unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas
pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes
associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso
nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando
as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante
afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e
Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas
dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem
como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-
tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de
forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e
Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004) descritos no Capıtulo 2
2Modelacao estatıstica de acidentes rodoviarios
Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram
baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados
normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido
que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-
doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia
de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma
probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre
os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-
dos de contagens sao modelos mais apropriados para este tipo de estudos
Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo
constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo
et al 2007 Cardoso 1996)
Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo
caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala
espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais
desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais
como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel
explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-
20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como
uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade
espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias
ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao
apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo
muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao
verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos
com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao
de riscos relativos em areas pequenas
No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-
dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade
de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto
deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-
mas na alocacao de fundos governamentais e no planeamento regional Determinados
atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-
cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para
areas pequenas e esta tendencia ira provavelmente continuar
Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-
vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco
relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario
num determinado concelho relativamente ao risco no paıs (Portugal Continental)
As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e
consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem
acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999
Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os
metodos tradicionais para investigar questoes importantes relacionadas com estimacao de
riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia
temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis
nao observaveis tais como clima determinadas caracterısticas da populacao entre outras
Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser
pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a
construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios
ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al
2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-
tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes
21 Modelos bayesianos hierarquicos 21
espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e
temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a
suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos
pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos
dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-
doviarios
A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma
serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia
em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-
dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes
rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem
ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade
existente no dados Noland e Quddus (2004) Elvik (2011)
A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-
melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio
que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-
blema atribuıdo a comportamentos inadequados dos condutores associados a falencias
da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de
acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA
constitui a covariavel com maior poder explicativo da variacao observada No entanto
nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas
do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por
exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de
servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel
vendido e um indicador do volume de trafego e a densidade populacional um indicador de
urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais
o numero de habitantes a area geografica a densidade populacional o comprimento de
estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao
industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao
do solo com equipamento turıstico como sera abordado no Capıtulo 4
21 Modelos bayesianos hierarquicos
O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que
o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro
θ e o segundo traduz a distribuicao a priori para o parametro θ
22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica
na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-
delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-
nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo
que p(θ) =
intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =
1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa
estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-
formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros
Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade
associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-
tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia
a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori
nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-
tribuicao a priori padrao p(θ) (Paulino et al 2003)
Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte
estrutura
1o nıvel f(y|θ) funcao de verosimilhanca
2o nıvel p(θ|φ) distribuicao a priori dos parametros
3o nıvel p(φ) distribuicao a priori dos hiperparametros
Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e
evoluindo para modelos cada vez mais complexos
O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-
creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-
vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de
acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar
esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-
dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se
Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou
sejaYit|θit sim Poisson(Eitθit)
f(yit|θit) =(Eitθit)
yiteminusEitθit
yit
Eit = nitr = nit
sumij
Yitsumij
nit
21 Modelos bayesianos hierarquicos 23
onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit
representa o numero de veıculos com seguro e θit representa o risco relativo de acidente
rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja
se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia
de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de
acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)
A funcao de versimilhanca e dada por
L(θ|y) =prodit
f(yit|θit) =prodit
(Eitθit)yiteminusEitθit
yitpropprod
θyitit e
minussumit
Eitθit
e l(θ|y) = lnL(θ|y) propsumit
yit ln θitminussumit
Eitθit O estimador de maxima verosimilhanca
do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-
dardized Mortality Ratio1 - SMR) e dado por
θit = SMRit =YitEit
(211)
Note-se que V ar(SMRit) =V ar(Yit)
E2it
=θitEit
podendo-se fazer V ar(SMRit) =θitEit
=YitE2it
Um procedimento classico usual para identificar regioes de maior risco consiste na cons-
trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR
Apesar de util este procedimento tem algumas desvantagens Note-se que em areas
com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero
de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR
podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com
muita frequencia com dados desta natureza quando as unidades espaciais de analise sao
concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao
das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit
associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser
grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram
ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de
tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida
em que a respetiva variabilidade pode ser muito grande A variancia destes valores e
1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso
24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao
grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro
estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-
minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992
Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR
tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores
estimados com menos precisao As maiores variacoes do risco relativo nao estarao em
geral associadas com variacoes do risco subjacente a medida de exposicao mas serao
apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)
Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se
que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-
dade teorica subjacente ao modelo Poisson
A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados
(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do
modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado
que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al
2008 2005)
Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-
mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos
tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao
de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das
flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto
dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se
usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico
medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial
entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao
mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)
22 Modelos nao espaciais
Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh
e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis
atraves da funcao de ligacao usada para modelar a media
ln(θit) = α+
nβsump=1
βpxitp (221)
22 Modelos nao espaciais 25
onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel
e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um
nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual
considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a
priori p = 1 2 nβ i = 1 2 N e t = 1 2 T
No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-
adequadamente capturada pelas variaveis explicativas na funcao da media condicional
Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser
distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-
tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como
ln θit = α+
nβsump=1
βpxitp + vit (222)
onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p
Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que
foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-
los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares
generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)
Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-
dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao
a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo
Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples
de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma
fechada dado que esta mistura resulta de um modelo conjugado
Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao
Poisson e na distribuicao Binomial Negativa
O modelo Poisson Lognormal surge quando se admite que
vit sim Normal(0 σ2v) (223)
A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por
f(yit θNit σ
2v) =
1
σ2v
radic2π
EitθNit
y
int infin0
eminusEitθNit e
v
(ev)yminus1eminus v2
2σ2v dev
nao havendo forma explicıta com
26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
ln θNit = α+
nβsump=1
βpxitp (224)
E[Yit] = microNit eσ2v2 = Eitθ
Nit e
σ2v2 e V ar[Yit] = microNit e
σ2v2(
1 + (eσ2v minus 1)microNit e
minusσ2v2)
O modelo Poisson-Gama ou Binomial Negativo surge quando
exp(vit) sim Gama(φ φ) (225)
A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por
f(yit θBNit φ) =
Γ(yit + φ)
Γ(φ)yit
(φ
microBNit + φ
)φ(microBNit
microBNit + φ
)yitou seja
Yit|θBNit sim BN(EitθBNit φ)
com
ln θBNit = α+
nβsump=1
βpxitp (226)
E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit
(1 +
microBNitφ
) Note-se que quando φrarrinfin o
modelo Binomial Negativo reduz-se ao modelo Poisson
Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo
podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais
um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com
av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O
parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de
dispersao
O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-
plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre
unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-
quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito
afectadas (Miranda-Moreno et al 2007 Lord et al 2008)
Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)
A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-
pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os
23 Modelos espaciais 27
riscos relativos conjuntamente como um processo espacial atraves de uma especificacao
a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-
lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco
relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados
observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada
area e a soma de duas componentes que representam fatores espaciais e nao espaciais
No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica
de interesse em cada area tem distribuicao Poisson com media especıfica de cada area
As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre
a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento
das variaveis nao-observadas como em Bernardinelli et al (1995ab)
23 Modelos espaciais
Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia
espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos
mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao
associados uma distribuicao a priori conveniente
log(θit) = α+
nβsump=1
βpxitp + si (231)
Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de
notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario
quer para os modelos baseados na distribuicao de Poisson abreviadamente designados
de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa
abreviadamente designados de modelos BN com os devidos significados
Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que
representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos
atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori
associada
log(θit) = α+
nβsump=1
βpxitp + si + vi (232)
onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-
turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e
si sao mutuamente independentes viiidsim Normal(0 σ2
v) e si|sminusi sim Normal(si σ2smi)
28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
onde o sminusi indica o vetor s com o elemento si removido si =1
mi
sumi 6=j
wijsj e a media
dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e
wij = 0 caso contrario Deste modo mi =sumi 6=j
wij e o respetivo numero de vizinhos e
σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma
s tem distribuicao conjunta
f(s) prop (σ2s)minusn2 exp
minus 1
2σ2s
sumi6=j
(si minus sj)2wij
e (σ2v)minus1 sim Gama(av bv) (σ2
s)minus1 sim Gama(as bs) com av bv as e bs conhecidos
Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial
local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo
gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991
Banerjee et al 2004)
24 Modelos espaco-temporais
Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-
tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a
aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios
e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos
com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se
definiu na seccao anterior
Modelos espaco-temporais sem interacao
Nestes modelos tem-se log(θit) = α+
nβsump=1
βpxitp + si + vi + ψt
onde se considera
ψt sim Normal(0 σ2ψ) (241)
ou
ψt sim RW (1 σ2ψ) (242)
e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ
2s σ
2v σ
2ψ mutuamente
independentes
24 Modelos espaco-temporais 29
Alternativamente log(θit) = α+
nβsump=1
βpxitp + si + vi + γt
onde se considera
γ sim Normal(0 cγ) (243)
sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ
2v mutuamente
independentes (Knorr-Held 2000)
Modelos espaco-temporais com interacao
Neste caso log(θit) = α+
nβsump=1
βpxitp + si + vi + (γ + δi)t
onde se considera alternativamente
δi sim Normal(0 σ2δ ) (244)
ou
δi sim CAR(σ2δ ) (245)
e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com
aδ bδ conhecidos e α βp σ2s σ2
v σ2δ mutuamente independentes (Bernardinelli et al
1995b)
A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando
um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de
acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de
risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia
e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de
cada area e a media global α e δi representa a diferenca entre a tendencia temporal
local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0
a tendencia temporal local da area i e menos acentuada do que a tendencia temporal
global enquanto que quando δi gt 0 e mais acentuada
Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados
neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo
nao se encontra definida uma distribuicao a priori para um parametro considera-se a
distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior
30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Tabela 21 Modelos univariados
M log(θit) Distribuicao a priori Distribuicao a priori
dos parametros dos hiperparametros
1 α+
nβsump=1
βpxitp α sim Normal(0 cα)
βp sim Normal(0 cβ)
2 α+
nβsump=1
βpxitp + vi vi sim Normal(0 σ2v) σminus2
v sim Gama(av bv)
3 α+
nβsump=1
βpxitp + si si sim CAR(σ2s) σminus2
s sim Gama(as bs)
4 α+
nβsump=1
βpxitp + vi + si
5 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2
ψ sim Gama(aψ bψ)
6 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim RW (σ2ψ)
7 α+
nβsump=1
βpxitp + vi + si + γt γ sim Normal(0 cγ)
8 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2
δ sim Gama(aδ bδ)
9 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )
25 Modelos multivariados
Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-
mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes
modelos nao consideram a interdependencia que pode existir entre os riscos relativos
dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na
variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia
para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico
tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-
son capazes de considerar a relacao entre diferentes processos de contagem tais como
contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-
25 Modelos multivariados 31
son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta
abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de
diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o
numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo
k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit
condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou
seja
Ykit|θkit sim Poisson(Ekitθkit)
Modelos espaciais multivariados
1)log θkit = αk +
nβsump=1
βpxitp + ski
com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs
conhecidos
Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)
e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios
ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K
tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-
bilidade assume que a estrutura de associacao se separa numa componente nao espacial
e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta
de s e
s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)
Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)
D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de
vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK
definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre
os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao
espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se
o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo
improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou
modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin
et al (2005) Lawson (2009) Waller e Carlin (2010)
Para alem do modelo 1 foram implementados os modelos multivariados seguintes no
WinBUGS
32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)
3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)
4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e
dδ Rδ conhecidos
mas apenas se obteve convergencia para os modelos 1 e 4
Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =
bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =
001 0 0
0 001 0
0 0 001
26 Metodos de inferencia
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e
computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas
abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)
consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-
ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino
e Rue (2010a)
261 INLA
O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-
siana aproximada numa subclasse de modelos de regressao estruturados aditivamente
nomeadamente em modelos latentes gaussianos
Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z
que representa todas as componentes nao observaveis com distribuicao a priori Normal
Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-
mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-
buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia
exponencial A media microi de cada componente e relacionada com um preditor aditivo
estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor
incorpora aditivamente os efeitos de varias componentes
26 Metodos de inferencia 33
ηi = α+
nfsumj=1
f (j)(uij) +
nβsump=1
βpxip + εi (261)
onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-
cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u
podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis
contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-
torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos
podem ser representados atraves das funcoes f (j)()
Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-
mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por
suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a
priori dos hiperparametros nao tem de ser gaussianas
Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-
dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto
de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF
Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel
aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e
Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6
embora possa haver excecoes
Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro
nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos
parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-
sume que os dados observados sao condicionalmente independentes dado o campo latente
z tem-se que
f(y|xφ) =prodi
f(yi|ziφ)
Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca
do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos
φ
A distribuicao a posteriori e dada por
p(zφ|y) prop p(φ)p(z|φ)prodi
f(yi|ziφ) (262)
Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e
analiticamente tratavel
Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao
34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao
analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e
possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa
pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como
tempo computacional longo possibilidade de as amostras simuladas dos parametros se-
rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte
Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser
particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori
entre as componentes espacial ou espaco-temporal do campo latente
Em contraste o metodo de aproximacao INLA e apresentado como um metodo que
fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-
vamente pouco tempo
No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes
marginais a posteriori dos parametros de interesse
As distribuicoes marginais a posteriori pretendidas sao
p(zi|y) =
intφ
p(zi|φy)p(φ|y) dφ (263)
e
p(φj |y) =
intφj
p(φ|y) dφminusj (264)
A aproximacao de p(zi|y) e determinada usando a soma finita
p(zi|y) =sumk
p(zi|φky)p(φk|y)∆k (265)
onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-
vamente Esta soma e calculada por integracao numerica em pontos suporte φk com
pesos apropriados ∆k
A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e
obtida atraves da aproximacao de Laplace
p(φ|y) prop p(zφy)
pG(z|φy)
∣∣z=zlowast(φ) (266)
onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-
cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao
corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)
De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade
a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes
26 Metodos de inferencia 35
pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste
basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior
quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste
em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a
estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)
Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a
estrategia CCD a estrategia por omissao no R-INLA
Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a
aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace
simplificada
A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter
a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))
onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia
marginal Os autores referem que apesar de muito conveniente ao nıvel computacional
pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de
simetria das distribuicoes a posteriori marginais quer a ambos nıveis
Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais
demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-
place semelhante a 266 a p(zi|φy)
pLA(zi|φy) prop p(zφy)
pGG(zminusi|ziφy)
∣∣∣zminusi=zlowastminusi(ziφ) (267)
No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-
nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes
numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de
Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo
menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada
uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-
trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e
simetria Para mais detalhes ver Rue et al (2009)
Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre
os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao
de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos
O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-
parametros entre outras No entanto o seu potencial e reconhecidamente enorme e
encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-
tensoes com muita frequencia
36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
27 Ajustamento e medidas preditivas
Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o
criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio
combina uma medida de adequabilidade a media a posteriori da desvianca D com
uma medida de complexidade o numero efetivo de parametros pD sendo dado por
DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-
promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no
WinBUGS quer no R-INLA
No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos
aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-
vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive
Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-
tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle
e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-
delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para
detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)
As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)
p(yminusi)=
intf(yi|θyminusi)p(θ|yminusi) dθ
e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores
CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para
efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de
calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou
grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito
diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de
dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem
uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este
problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim
pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =
yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma
forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem
ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)
Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a
0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa
por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira
a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da
concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de
27 Ajustamento e medidas preditivas 37
referencia
Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls
(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))
ntimes T Esta medida e muito
utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os
valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo
3Aplicacoes
Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios
ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os
resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo
de aproximacao INLA atraves do R-INLA
Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-
sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel
usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos
no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao
apresentados os resultados obtidos no WinBUGS
Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a
analise individual de cada ano comparando-se os varios modelos e os resultados obtidos
no WinBUGS e no R-INLA tendo havido concordancia
Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial
40 Capıtulo 3 Aplicacoes
31 Associacao espacial
A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-
doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco
como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter
uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas
determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes
entre areas de maior risco e potenciais fatores
Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-
racterısticas que revelam alguns dos seus problemas Para alem da concentracao de
concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito
diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de
veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a
uma pequena mudanca no numero de acidentes
Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-
rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa
global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com
feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0
e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes
valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no
de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida
ao acaso pois os concelhos possuem condicoes identicas
Tendo em conta que o numero de veıculos com seguro varia muito por concelho este
comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-
ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem
medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito
instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis
ja que possuem variancias muito diferentes
A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura
31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero
de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro
para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas
versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em
2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho
da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com
tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que
assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se
31 Associacao espacial 41
ter uma percecao dessa variabilidade em cada concelho
Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000
Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000
42 Capıtulo 3 Aplicacoes
Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000
A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem
a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir
uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de
contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz
de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma
fronteira e wij = 0 caso contrario
As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e
o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em
areas pequenas em que o tamanho da medida de exposicao e diferente de area para
area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta
questao foram desenvolvidas diversas propostas alternativas para dados com populacoes
heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em
conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se
o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por
EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma
estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa
os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes
empırica da media marginal padronizado pela estimativa do desvio padrao da taxa
Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros
sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI
tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao
32 Modelos 43
do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao
aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de
EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado
no R atraves do pacote spdep e da funcao EBImoranmc()
Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano
Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859
Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000
Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente
por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos
testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo
p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na
Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para
acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao
espacial
32 Modelos
Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais
espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos
modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo
uma vez que forneceram melhores resultados como se pode verificar comparando os
valores das Tabelas 32mdash35
Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA
44 Capıtulo 3 Aplicacoes
No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo
da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo
A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos
de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente
pela analise dos resultados com o programa CODA do R (Plummer et al 2006)
No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-
tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada
computacionalmente menos intensa
Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266
P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205
P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204
P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204
Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 1 2063493 188 464 1351516 170 304 988082 169 222
BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201
BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201
BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201
As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos
espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos
com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo
Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial
Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3
1referente a Tabela 21
33 Modelos espaco-temporais 45
Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior
a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a
diferenca entre o numero de parametros e muito grande
No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos
os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero
correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se
pode ver mais adiante quando se usam os modelos espaco-temporais este problema e
ultrapassado
Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao
menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos
os tipos de acidentes
33 Modelos espaco-temporais
De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para
estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-
mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se
reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre
muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21
Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191
P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191
P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192
P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192
P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192
Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor
modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para
2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso
46 Capıtulo 3 Aplicacoes
o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela
35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo
1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash
e para o tipo 3 o modelo 6 mdash BN 3 6
Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191
BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191
BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192
BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193
BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193
Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e
do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores
sao os modelos Poisson
331 Associacao regional
Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao
geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar
informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-
plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos
nos riscos de acidentes
Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes
em milhares de habitantes P a area em centenas de km2 A a densidade populacional em
centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade
de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU
a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques
urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do
solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se
valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST
os valores sao por concelho e iguais em todos os anos
33 Modelos espaco-temporais 47
332 Selecao dos modelos
Foram implementados todos os modelos com todas as combinacoes entre as covariaveis
mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de
acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram
escolhidos os seguintes modelos
Tabela 36 DIC pD e mls para cada tipo de acidente
Tipo P DIC pD mls BN DIC pD mls
1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418
2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260
3 3 6 4 846237 20562 191 3 6 6 852362 19267 191
Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais
P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e
Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU
e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash
modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP
mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI
e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash
modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6
com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos
Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para
cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e
nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao
relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os
valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921
e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo
sao relativamente pequenas 961 594 e 076 respetivamente
Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao
contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis
covariaveis significativas e respetiva contribuicao para os resultados Assim fica para
trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais
significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em
48 Capıtulo 3 Aplicacoes
particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)
e uma covariavel considerada muito importante na modelacao estatıstica de acidentes
rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao
nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica
designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos
hoteleiros
333 Modelos para acidentes do tipo 1
Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172
log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t
e
log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t
No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente
para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos
de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem
o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o
zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor
HPD que contem o zero considera-se que a covariavel nao contribui significativamente
para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso
contrario considera-se que a covariavel contribui significativamente para a explicacao
da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado
que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124
obtendo-se o modelo Poisson 1 8 16 ou seja
log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t
Tabela 37 DIC pD e mls para acidentes tipo 1
Modelo DIC pD mls
P 1 8 1 1940548 47786 458
P 1 8 16 1939877 47789 458
BN 1 6 1 1861278 25154 419
BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
33 Modelos espaco-temporais 49
No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as
covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se
manter as covariaveis no modelo
334 Validacao dos modelos para acidentes do tipo 1
Validacao do modelo P 1 8 16 e do modelo BN 1 6 172
Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172
Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do
que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela
37 O valor da media do logscore tambem e significativamente menor de acordo com
o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores
PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O
valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo
BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes
sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do
tipo 1
335 Resultados obtidos com modelos para acidentes do tipo 1
Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172
A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um
efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma
50 Capıtulo 3 Aplicacoes
diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo
1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16
e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo
BN 1 6 172
Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172
Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max
SMR1 00000 07512 09656 10020 12360 32610
RR1 8 1 02290 07728 09663 09989 11870 28890
RR1 8 16 02274 07722 09628 09979 11860 28770
RR1 6 1 02886 07807 09599 10010 11890 24480
RR1 6 172 02852 07798 09589 09999 11870 24400
Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de
33 Modelos espaco-temporais 51
confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-
bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com
os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-
nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172
Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172
Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados
52 Capıtulo 3 Aplicacoes
os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo
P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000
Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para
o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312
se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de
33 Modelos espaco-temporais 53
suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos
erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais
Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000
Relativamente a introducao das covariaveis comprimento de estrada e quantidade de
combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia
dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis
explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao
explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados
espacialmente
Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1
Efeitos fixosmedia dp 0025q 0975q
α1 00580 00074 00435 00723
γ1 -00263 00030 -00321 -00204
Variancia dos efeitos aleatorios
σ2s1 05816 00591 04706 07001
σ2δ1
00019 00002 00015 00023
Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1
54 Capıtulo 3 Aplicacoes
mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-
plicacao da variacao associada aos efeitos temporais
Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel
vendido influenciam significativamente a variacao geografica dos riscos relativos sao
consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem
de forma positiva para a variacao os riscos o que significa que em regioes com maior
comprimento de estrada e em regioes com maior quantidade de combustıvel vendido
esta associado um aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16
Efeitos fixosmedia dp 0025q 0975q
α1 -00898 00354 -01595 -00207
b1C 00016 00004 00008 00024
b1V C 00003 00001 00002 00005
γ1 -00257 00030 -00315 -00198
Variancia dos efeitos aleatorios
σ2s1 05492 00560 04440 06615
σ2δ1
00019 00002 00015 00023
No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada
do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da
ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos
espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-
buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou
efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves
dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos
temporais σ2ψ1
se mantem o que implica que as covariaveis nao contribuem para a ex-
plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o
modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao
e significativa
Mais uma vez as covariaveis que influenciam significativamente a variacao geografica
dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-
variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que
33 Modelos espaco-temporais 55
regioes com maior comprimento de estrada regioes com maior ocupacao de solo com
equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento
turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos
os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-
mente para a estimacao dos riscos o que significa que em regioes com maior numero de
habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo
fixos todos os restantes efeitos
Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1
Efeitos fixosmedia dp 0025q 0975q
α1 -00429 00052 -00595 -00389
Parametro de dispersao φminus11 00298 00017 00267 00332
Variancia dos efeitos aleatorios
σ2s1 02603 00266 02108 03142
σ2ψ1
00090 00057 00029 00237
Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172
Efeitos fixosmedia dp 0025q 0975q
α1 -01348 00243 -01826 -00872
b1C 00013 00003 00007 00019
b1P -00135 00044 -00221 -00049
b1OSEUP 00001 000008 -000005 00003
b1OST 00001 000006 -0000003 00002
Parametro de dispersao φminus11 00300 00017 00269 00334
Variancia dos efeitos aleatorios
σ2s1 02438 00254 01966 02951
σ2ψ1
00090 00056 00029 00235
Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente
56 Capıtulo 3 Aplicacoes
espacial contribui fortemente para a variacao geografica do risco relativo O padrao e
muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes
com maior risco relativo estimado correspondem as regioes em que as estimativas dos
efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-
dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo
proximo de um correspondem as regioes em que as estimativas de si sao proximas de
zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade
HPD nao contem o zero e 633 para o modelo P 1 4 16
Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16
Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16
33 Modelos espaco-temporais 57
A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0
eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao
longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio
anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta
tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores
correspondente a diminuicao das estimativas dos riscos ao longo dos anos
Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16
Min 1oQ Mediana Media 3oQ Max
δ1 -00919 -00254 -00476 00768 00197 00133
eδ1 09125 09751 09954 10010 10200 11420
Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16
Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de
credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1
a tendencia temporal local e maior que a tendencia global sendo o decrescimento do
numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia
58 Capıtulo 3 Aplicacoes
temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia
temporal local e menor do que a global sendo o decrescimento mais acentuado No
mapa da Figura 315 pode ver-se a distribuicao destes concelhos
Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um
sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada
na Tabela A8 do Anexo A
Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172
Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172
Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos
mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial
33 Modelos espaco-temporais 59
contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado
e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com
menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si
sao proximas de zero Para este modelo a percentagem de estimativas dos valores de
s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente
a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos
seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais
acentuado nos cinco anos seguintes
Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172
Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo
BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um
aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os
restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-
gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos
estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel
contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i
no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54
Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a
percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento
turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como
os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de
60 Capıtulo 3 Aplicacoes
(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo
da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel
OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com
equipamentos turısticos vai de 0 a 038
Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172
Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172
Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior
33 Modelos espaco-temporais 61
que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos
com risco relativo significativamente maior que um
336 Modelos para acidentes do tipo 2
Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192
log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +
b2DPDP2it + s2i + (γ2 + δ2i)t
e
log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t
No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente
das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519
pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo
Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o
modelo P 2 9 16 ou seja
log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t
No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-
variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e
pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-
delo BN 2 9 4 ou seja
log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t
Tabela 314 DIC pD e mls para acidentes tipo 2
modelo DIC pD mls
P 2 9 1 1170386 35334 270
P 2 9 16 1169631 35476 270
BN 2 9 1 1156921 29101 261
BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
62 Capıtulo 3 Aplicacoes
337 Validacao dos modelos para acidentes do tipo 2
Validacao do modelo P 2 9 16 e do modelo BN 2 9 4
Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4
Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-
ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual
a 13956 O valor da media do logscore tambem e significativamente menor de acordo
com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos
valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura
322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para
o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes
sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do
tipo 2
338 Resultados obtidos com modelos para acidentes do tipo 2
Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4
A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as
estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre
um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das
estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados
a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores
esperados a posteriori obtidos com o modelo BN 2 9 4
33 Modelos espaco-temporais 63
Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4
Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os
modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max
SMR2 00000 05062 09180 11830 15740 87830
RR2 9 1 02237 06553 09651 11910 14980 77550
RR2 9 16 02218 06547 09624 11860 14970 77060
RR2 9 1 nb 02391 06636 09751 11870 14960 59240
RR2 9 4 nb 02363 06630 09720 11810 14850 59030
64 Capıtulo 3 Aplicacoes
Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo
P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes
33 Modelos espaco-temporais 65
do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000
Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000
66 Capıtulo 3 Aplicacoes
Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000
Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das
covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo
Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja
as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos
sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito
espacial
Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03511 00191 03135 03883
γ2 -00844 00037 -00918 -00771
Variancia dos efeitos aleatorios
σ2s2 09474 01054 07554 11648
σ2δ2
00099 00016 00070 00133
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-
plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao
33 Modelos espaco-temporais 67
para a variacao geografica das estimativas dos riscos e positiva em regioes com maior
comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao
para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos
Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16
Efeitos fixosmedia dp 0025q 0975q
α2 01790 00530 00741 02822
b2C 00020 00005 00009 00031
b2V C -00004 00003 -00010 00003
γ2 -00833 00038 -00906 -00759
Variancia dos efeitos aleatorios
σ2s2 09162 01019 07325 11282
σ2δ2
00099 00016 00015 00135
Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com
a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos
efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma
efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam
incluıdos no modelo P 2 9 1 atraves do efeito espacial
Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03529 00223 03090 03965
γ2 -00819 00044 -00906 -00733
Parametro de dispersao φminus11 00577 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07824 00925 06156 09748
σ2δ2
00051 00012 00031 00079
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
68 Capıtulo 3 Aplicacoes
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao
associada aos efeitos temporais Para alem disso como a contribuicao para a variacao
geografica das estimativas dos riscos e positiva em regioes com maior comprimento de
estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos
os restantes efeitos
Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4
Efeitos fixosmedia dp 0025q 0975q
α2 01961 00530 00741 02822
b2C 00017 00005 00008 00027
γ2 -00814 00044 -00900 -00727
Parametro de dispersao φminus11 00576 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07516 00894 05914 09385
σ2δ2
00052 00013 00031 00080
Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16
33 Modelos espaco-temporais 69
Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode
verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o
padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado
correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as
regioes com menor risco relativo estimado correspondem as regioes em que as estimativas
de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes
em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem
de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero
e 608
Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era
esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou
seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem
de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295
Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16
Min 1oQ Mediana Media 3oQ Max
δ2 -01805 -00411 00082 00003 00485 01532
eδ2 08358 09604 10090 10030 10500 11660
No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se
que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia
70 Capıtulo 3 Aplicacoes
temporal local maior do que a global e um decrescimento no numero de acidentes do tipo
2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local
menor que a global e um decrescimento mais acentuado
Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16
E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um
obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um que permite complementar esta informacao
Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-
temente para a variacao geografica do risco relativo como se pode observar no mapa da
Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-
mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes
com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao
proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i
cujo intervalo de credibilidade HPD nao contem o zero e 5665
33 Modelos espaco-temporais 71
Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4
Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4
Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4
Min 1oQ Mediana Media 3oQ Max
δ1 -01530 -00368 00052 00001 00402 01140
eδ1 08592 09646 10060 10020 10420 11210
72 Capıtulo 3 Aplicacoes
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca
no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de
78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de
valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa
da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a
global sendo o seu decrescimento menos acentuado que o decrescimento global havendo
uma minoria onde se passa o contrario
Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4
Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior
que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao
com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista
ordenada dos primeiros quinze concelhos
33 Modelos espaco-temporais 73
339 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6
log(θ3ij) = α3 + b3CCi + s3i + ψ3t
e
log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t
No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a
covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo
P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1
log(θ3ij) = α3 + s3i + ψ3t
No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade
populacional nao contem o zero por isso o modelo mantem-se
Tabela 322 DIC pD e mls para acidentes tipo 3
modelo DIC pD mls
P 3 6 1 846290 20551 191
P 3 6 4 846237 20562 191
BN 3 6 1 852438 19770 191
BN 3 6 6 852362 19267 191
3310 Validacao dos modelos para acidentes do tipo 3
Validacao do modelo P 3 6 1 e do modelo BN 3 6 6
Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e
menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072
Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos
valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia
preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo
74 Capıtulo 3 Aplicacoes
ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se
que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3
Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6
3311 Resultados obtidos com modelos para acidentes do tipo 3
Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6
Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max
SMR3 00000 04639 11050 15100 20490 156700
RR3 6 1 01363 08869 13050 14900 18430 95400
RR3 6 6 bn 01247 09020 13170 14850 18370 87310
Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo
obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-
vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores
esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos
valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e
Tabela 323
33 Modelos espaco-temporais 75
Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6
Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6
Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-
76 Capıtulo 3 Aplicacoes
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os
modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6
Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000
Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo
P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
33 Modelos espaco-temporais 77
Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000
Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem
comentarios acerca de associacao regional para este modelo
78 Capıtulo 3 Aplicacoes
No modelo BN observa-se que com a introducao da covariavel densidade populacional o
valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da
variancia dos efeitos temporais σ2ψ1t
se mantem Tabelas 325 e 326
Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02114 00152 01815 02410
Variancia dos efeitos aleatorios
σ2s3 06817 00802 05383 08499
σ2ψ3
00255 00157 00082 00660
Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02155 00158 01842 02464
Parametro de dispersao ψminus11 00455 00061 00348 00584
Variancia dos efeitos aleatorios
σ2s3 06497 00800 05070 08174
σ2ψ3
00255 00161 00081 00672
Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6
Efeitos fixosmedia dp 0025q 0975q
α3 02791 00217 02362 03215
bDP -00199 00048 -00294 -00105
Parametro de dispersao φminus11 00459 00061 00350 00588
Variancia dos efeitos aleatorios
σ2s3 05855 00749 04532 07440
σ2ψ3
00255 00161 00081 00672
Tal significa que a covariavel densidade populacional contribui para a explicacao da
33 Modelos espaco-temporais 79
variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao
da variacao temporal A contribuicao da covariavel densidade populacional e negativa
o que indica que em regioes com maior densidade populacional ocorre a contribuicao
para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos
No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a
sobredispersao nao e significativa
Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1
Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1
80 Capıtulo 3 Aplicacoes
O padrao espacial das estimativas do risco relativo e das estimativas da componente
espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras
342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao
positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos
efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem
o zero e 439 para o modelo P 3 6 1
No que respeita a componente temporal observa-se um decrescimento nos dois primeiros
anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento
nos ultimos cinco anos
Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1
Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco
relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a
lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-
tivamente maior que um na Tabela A9 do Anexo A
33 Modelos espaco-temporais 81
Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6
Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6
Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os
padroes revelados pelos mapas As regioes com maior contribuicao da componente es-
pacial para o aumento do risco relativo correspondem em geral a regioes com maiores
estimativas de risco relativo Tal significa que a componente espacial explica grande parte
da variacao das estimativas do risco relativo A percentagem de estimativas dos valores
de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1
82 Capıtulo 3 Aplicacoes
Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6
A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo
modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode
ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se
pode encontrar uma lista ordenada dos primeiros quinze concelhos
Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se
apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista
o tipo de interacao espaco-temporal
Tabela 327 Modelos univariados
Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal
1 BN 1 6 172 C+P+OSEPU+OST RW mdash
2 BN 2 9 4 C fixo CAR
3 P 3 6 1 mdash RW mdash
34 Modelos multivariados 83
34 Modelos multivariados
Os modelos multivariados usados foram
log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)
log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)
Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-
tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito
complexos nao parece haver um ganho substancial em usa-los
Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados
Modelos multivariados Modelos univariados
Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q
α1 00565 00181 00214 00914 00580 00074 00435 00723
α2 03423 00344 02735 04083 03511 00191 03135 03883
α3 05993 00331 05340 06644 06633 00247 06147 07115
γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204
γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771
γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907
Σu =
05551 03843 05519
03843 1042 05864
05519 05864 09113
Σδ =
00074 00035 00061
00035 00111 00059
00061 00059 00081
No entanto e interessante verificar que em termos de correlacao entre as estimativas
dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo
2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao
que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios
nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e
tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no
numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330
84 Capıtulo 3 Aplicacoes
Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal
Modelos com interacao Modelos sem interacao
media dp 0025q 0975q media dp 0025q 0975q
ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669
ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879
ρ23(θ) 06793 00242 06304 07252 06831 002647 07326
ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196
ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941
ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976
ρ12(δ) 03823 00894 01960 05465
ρ13(δ) 07979 00634 06487 08998
ρ23(δ) 06203 00938 04153 07829
Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias
AnoVıtimas mortais Feridos graves Feridos leves
24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif
2010 741 937 196 2637 2475 -162 43924 43890 -34
2011 689 891 202 2436 2265 -171 39726 39695 -31
34 Modelos multivariados 85
Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados
86 Capıtulo 3 Aplicacoes
Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
35 Aplicacao para acidentes rodoviarios nas estradas
secundarias
Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-
cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram
retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-
damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior
risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do
poder local
Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840
Total 175741 16909 3471 196121
Figura 350 Numero de acidentes tipo 1 por concelho
88 Capıtulo 3 Aplicacoes
Figura 351 Numero de acidentes tipo 2 por concelho
Figura 352 Numero de acidentes tipo 3 por concelho
No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados
Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89
de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos
Tabela 332 DIC pD e mls para cada tipo de acidente
Modelo DIC pD mls
BN 1 9 42 1614530 32359 363
BN 2 9 246 924765 27530 208
P 3 6 30 581058 11747 131
351 Modelo para acidentes do tipo 1
Modelo Binomial Negativo 1 9 42
log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t
Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a
variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do
modelo
352 Validacao do modelo para acidentes do tipo 1
Validacao do modelo BN 1 9 42
Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42
O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-
pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O
90 Capıtulo 3 Aplicacoes
valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem
um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-
ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42
e o melhor modelo para acidentes do tipo 1
353 Resultados obtidos com o modelo para acidentes do tipo 1
Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42
Efeitos fixosmedia dp 0025q 0975q
α1 -03518 00346 -04202 -02843
b1C 00012 00004 00005 00019
b1OST 00001 000007 -000005 00002
γ1 -00128 00026 -00179 -00077
Parametro de dispersao φminus11 00287 00021 00248 00328
Variancia dos efeitos aleatorios
σ2s1 03982 00445 03180 04909
σ2δ1
00026 00007 00015 00040
Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91
As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico
influenciam significativamente a variacao geografica dos riscos relativos e portanto sao
consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de
forma positiva para a variacao dos riscos o que significa que em regioes com maior
comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma
contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes
efeitos
Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-
derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura
temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao
envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial
se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de
risco relativo Figuras 354 e 316
Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42
Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco
relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um
92 Capıtulo 3 Aplicacoes
354 Modelo para acidentes do tipo 2
Modelo Binomial Negativo 2 9 246
log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +
s2i + (γ2 + δ2i)t2
Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de
todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938
pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e
manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja
log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2
Tabela 334 DIC pD e mls
Modelo DIC pD mls
BN 2 9 86 924868 24786 208
355 Validacao do modelo para acidentes do tipo 2
Validacao do modelo BN 2 9 86
Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86
O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo
Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93
do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto
proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e
95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor
modelo para acidentes do tipo 2
356 Resultados obtidos com o modelo para acidentes do tipo 2
Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86
Efeitos fixosmedia dp 0025q 0975q
α2 -01198 00480 -02147 -00266
b1OSI 00002 000008 000007 00004
b1OSEPU 00003 00002 000001 00006
b1DP 00084 00066 -00046 00215
γ1 -01198 00480 -02147 -00266
Parametro de dispersao
φminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 10557 01336 08161 13345
σ2δ1
00094 00023 00057 00147
A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-
nos e a densidade populacional influenciam significativamente a variacao geografica dos
riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-
variaveis contribuem de forma positiva para a variacao dos riscos o que significa que
em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo
com equipamentos e parques urbanos e a regioes com maior densidade populacional ha
contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes
do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a
mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao
Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que
os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos
94 Capıtulo 3 Aplicacoes
concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns
conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas
do risco relativo sao os mesmos
Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86
Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95
A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com
o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que
consta na Tabela A11
357 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 30
log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt
Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU
contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo
358 Validacao do modelo para acidentes do tipo 3
Validacao do modelo P 3 6 30
Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30
Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da
distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-
mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores
igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva
e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para
acidentes do tipo 3
96 Capıtulo 3 Aplicacoes
359 Resultados obtidos com o modelo para acidentes do tipo 3
Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30
Efeitos fixosmedia dp 0025q 0975q
α2 00104 00520 -00923 01117
b3A 00258 00116 00031 00049
b3OSEPU -00001 00001 -00004 000006
Parametro de dispersao
ψminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 03598 00687 02422 05084
σ2ψ1
00246 00163 0007 00666
Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30
A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam
significativamente a variacao geografica dos riscos relativos sendo consideradas na es-
timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97
a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial
em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes
com maior area geografica ha uma contribuicao para o aumento das estimativas do risco
relativo mantendo fixos todos os restantes efeitos
O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de
trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-
trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico
mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No
entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos
Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30
E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo
modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que
consta na Tabela A11
Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-
mente a abordagem global e a abordagem local
98 Capıtulo 3 Aplicacoes
Tabela 337 Comparacao entre a abordagem local e a global
Abordagem Tipo Melhor Covariaveis Efeito Interacao
Modelo temporal espaco-temporal
Local 1 BN 1 9 42 C+OST fixo CAR
Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash
Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR
Gloal 2 BN 2 9 4 C fixo CAR
Local 3 P 3 6 30 A+OSEUP aleatorio mdash
Global 3 P 3 6 1 mdash aleatorio mdash
4Discussao e conclusoes
Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia
de dependencia espacial de tendencia temporal e de associacao regional em dados de
acidentes rodoviarios
Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-
delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por
areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar
diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao
espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel
recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados
com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de
trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de sobredispersao de associacao posi-
tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-
mentos e parques urbanos e uma associacao regional negativa com a populacao
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
100 Capıtulo 4 Discussao e conclusoes
bredispersao e de associacao regional positiva com o comprimento de estrada
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente
Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com o comprimento de estrada e com
a area de ocupacao do solo para turismo
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com a area de ocupacao de solo para
a industria com a area de ocupacao do solo com equipamentos e parques urbanos
e com a densidade populacional
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente de associacao regional
positiva com a area e de associacao regional negativa com a area de ocupacao de
solo com equipamentos e parques urbanos
Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-
se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas
Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com
interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao
do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido
o modelo Poisson com efeito temporal aleatorio
Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos
modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-
tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se
capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes
espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-
formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que
as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto
e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas
as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de
valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais
elevados diminuiram ou seja os valores extremos foram suavizados
101
Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos
dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-
gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi
possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia
temporal global Este e um tipo de resultado muito importante na fase de aplicacao
pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter
exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas
Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-
minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as
covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam
incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-
fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal
Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores
usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal
considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para
todos os anos em estudo
Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos
mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-
pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a
ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-
cativamente maior que um bem como as dos concelhos com valores consideravelmente
menores do que a unidade
Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-
timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises
por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-
pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de
estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-
nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o
TDMA de modo a introduzi-las no modelo
Os modelos multivariados constituiram um esforco computacional elevado nao tendo
havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises
comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi
possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes
tipos de acidentes
Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves
do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo
uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-
ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA
102 Capıtulo 4 Discussao e conclusoes
pela extrema concordancia de resultados pela facilidade de implementacao dos modelos
pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez
de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem
duvida muito mais acessıvel
Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-
dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de
um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-
patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de
recolha e definicao das variaveis de interesse A implementacao estes modelos tambem
pode ser efetuada atraves do R-INLA
Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir
como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-
dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite
efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-
gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade
dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas
geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios
constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel
mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-
sabilidade de todosrdquo
ACaracterizacao da regiao de estudo
A1 Portugal Continental
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes
administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados
em 18 distritos
O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a
partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na
pagina do Instituto Geografico Portugues - httpwwwigeopt
A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o
map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-
hancas no WinBUGS
104 Apendice A Caracterizacao da regiao de estudo
Figura A1 ID dos concelhos do Norte de Portugal Continental
A1 Portugal Continental 105
Figura A2 ID dos concelhos do Sul de Portugal Continental
106 Apendice A Caracterizacao da regiao de estudo
A1 Portugal Continental 107
108 Apendice A Caracterizacao da regiao de estudo
A2 Numero de acidentes
Tabela A1 Estatısticas resumo de acidentes tipo 1
Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200
Tabela A2 Estatısticas resumo de acidentes tipo 2
Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800
Tabela A3 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100
A2 Numero de acidentes 109
Numero de acidentes que ocorreram nas estradas secundarias
Tabela A4 Estatısticas resumo de acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900
Tabela A5 Estatısticas resumo de acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800
Tabela A6 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700
110 Apendice A Caracterizacao da regiao de estudo
A3 Covariaveis
bull Populacao - P
Tabela A7 Estatısticas resumo da covariavel populacao
Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700
Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)
A3 Covariaveis 111
bull Area - A
Figura A4 Area em centenas de km2 por concelho (Fonte INE)
bull Densidade Populacional - DP
Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)
112 Apendice A Caracterizacao da regiao de estudo
bull Comprimento de Estrada - C
Figura A6 Quilometros de estrada por concelho (Fonte EP)
bull Quantidade de combustıvel vendido - VC
Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)
A3 Covariaveis 113
bull Ocupacao urbana do solo - OSU
Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
bull Ocupacao industrial do solo - OSI
Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)
114 Apendice A Caracterizacao da regiao de estudo
bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU
Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)
bull Ocupacao do solo com equipamento turıstico - OST
Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
A4 15 concelhos 115A
415
con
celh
os
Tab
ela
A8
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o1
Mold
elo
P1
816
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alb
ergaria
-a-V
elh
a3
Castro
Marim
Alc
acer
do
Sal
Grandola
Castro
Marim
Castro
Marim
Castro
Marim
Alb
ergaria
-a-V
elh
aV
ouzela
4A
lcacer
do
Sal
Castro
Marim
Castro
Marim
Grandola
Grandola
Alb
ergaria
-a-V
elh
aC
astro
Marim
Alc
acer
do
Sal
5V
izela
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
Vila
Velh
ade
Rodao
Pedrogao
Grande
6C
ondeix
a-a
-Nova
Azam
buja
Azam
buja
Azam
buja
Obid
os
Penela
Penela
Vila
Velh
ade
Rodao
7A
zam
buja
Viz
ela
Alj
ezur
Obid
os
Penela
Obid
os
Alj
ezur
Penela
8Silves
Alj
ezur
Obid
os
Condeix
a-a
-Nova
Azam
buja
Grandola
Obid
os
Alj
ezur
9A
lbufe
ira
Silves
Pom
bal
Pom
bal
Pom
bal
Vila
Velh
ade
Rodao
Pedrogao
Grande
Obid
os
10
Alj
ezur
Obid
os
Palm
ela
Penela
Alb
ergaria
-a-V
elh
aP
om
bal
Vouzela
Castro
Marim
11
Palm
ela
Pom
bal
Benavente
Palm
ela
Condeix
a-a
-Nova
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oE
sposende
12
Benavente
Benavente
Silves
Benavente
Vila
Velh
ade
Rodao
Azam
buja
Pom
bal
Montem
or-o
-Velh
o13
Pom
bal
Palm
ela
Penela
Vagos
Benavente
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
Tabua
14
Obid
os
Alb
ufe
ira
Olh
ao
Silves
Palm
ela
Condeix
a-a
-Nova
Esposende
Oliveir
ado
Bair
ro
15
Marin
ha
Grande
Olh
ao
Vagos
Olh
ao
Montem
or-o
-Velh
oP
edrogao
Grande
Tabua
Cham
usca
Mold
elo
BN
16
172
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
3C
astro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
4G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
5O
bid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
6C
ondeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
7A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
8P
om
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
9B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
10
Penela
Penela
Penela
Penela
Penela
Penela
Penela
Penela
11
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
12
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
13
Palm
ela
Alb
ergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
a14
Alb
ergaria
-a-V
elh
aP
alm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
15
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
o
116 Apendice A Caracterizacao da regiao de estudo
Tab
ela
A9
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o2
Modelo
P2
916
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ouriq
ue
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Alj
ustrel
4A
lcacer
do
Sal
Alc
acer
do
Sal
Avis
Nis
aO
urem
Nis
aA
ljustrel
Avis
5A
vis
Avis
Alc
acer
do
Sal
Rio
Maio
rN
isa
Alj
ustrel
Nis
aM
ourao
6C
ham
usca
Nis
aN
isa
Alj
ezur
Alc
acer
do
Sal
Mourao
Mourao
Nis
a7
Santarem
Cham
usca
Alj
ezur
Alc
acer
do
Sal
Alj
ustrel
Pedrogao
Grande
Pedrogao
Grande
Pedrogao
Grande
8V
ila
Nova
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rA
lcacer
do
Sal
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
da
Barquin
ha
da
Barquin
ha
9N
isa
Santarem
Vila
Nova
Pedrogao
Grande
Mourao
Ourem
Alc
acer
do
Sal
Proenca-a
-Nova
da
Barquin
ha
10
Alm
eir
imV
endas
Novas
Pedrogao
Grande
Mourao
Pedrogao
Grande
Ferreir
ado
Ale
ntejo
Proenca-a
-Nova
Alc
acer
do
Sal
11
Gole
ga
Montem
or-o
-Novo
Alj
ustrel
Vila
Nova
Ferreir
ado
Ale
ntejo
Rio
Maio
rG
randola
Idanha-a
-Nova
da
Barquin
ha
12
Vendas
Novas
Alj
ezur
Santarem
Cham
usca
Montem
or-o
-Novo
Montem
or-o
-Novo
Rio
Maio
rG
randola
13
Gavia
oG
avia
oM
ontem
or-o
-Novo
Montem
or-o
-Novo
Vila
Nova
Grandola
Ourem
Alm
odovar
da
Barquin
ha
14
Palm
ela
Gole
ga
Mourao
Ferreir
ado
Ale
ntejo
Grandola
Proenca-a
-Nova
Montem
or-o
-Novo
Montem
or-o
-Novo
15
Montem
or-o
-Novo
Alm
eir
imV
endas
Novas
Grandola
Cham
usca
Vila
Nova
Vila
Velh
ade
Rodao
Celo
ric
oda
Beir
ada
Barquin
ha
Modelo
BN
29
4
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ourem
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Avis
Alj
ustrel
4A
vis
Avis
Rio
Maio
rA
ljezur
Ourem
Nis
aA
ljustrel
Avis
5A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Nis
aN
isa
Alj
ustrel
Nis
aN
isa
6C
ham
usca
Nis
aN
isa
Alc
acer
do
Sal
Alc
acer
do
Sal
Ourem
Mourao
Mourao
7V
ila
Nova
Cham
usca
Alj
ezur
Rio
Maio
rA
ljustrel
Alc
acer
do
Sal
Alc
acer
do
Sal
Pedrogao
Grande
da
Barquin
ha
8Santarem
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rM
ourao
Pedrogao
Grande
Alc
acer
do
Sal
9N
isa
Santarem
Vila
Nova
Mourao
Mourao
Pedrogao
Grande
Ferreir
aFerreir
ada
Barquin
ha
do
Ale
ntejo
do
Ale
ntejo
10
Montem
or-o
-Novo
Alj
ezur
Alj
ustrel
Vila
Nova
Pedrogao
Grande
Rio
Maio
rO
urem
Proenca-a
-Nova
da
Barquin
ha
11
Vendas
Novas
Montem
or-o
-Novo
Santarem
Cham
usca
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
Rio
Maio
rC
elo
ric
oda
Beir
a12
Gole
ga
Alj
ustrel
Montem
or-o
-Novo
Pedrogao
Grande
Montem
or-o
-Novo
Montem
or-o
-Novo
Proenca-a
-Nova
Ourem
13
Salv
aterra
de
Magos
Vendas
Novas
Mourao
Montem
or-o
-Novo
Vila
Nova
Grandola
Montem
or-o
-Novo
Grandola
da
Barquin
ha
14
Alm
eir
imM
ourao
Pedrogao
Grande
Ferreir
aC
ham
usca
Vila
Nova
Grandola
Idanha-a
-Nova
do
Ale
ntejo
da
Barquin
ha
15
Alj
ezur
Salv
aterra
de
Magos
Ferreir
ado
Ale
ntejo
Grandola
Grandola
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aM
ontem
or-o
-Novo
A4 15 concelhos 117
Tab
ela
A1
015
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o3
Modelo
P3
61
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
Ferreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9C
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a10
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
11
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
12
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
13
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Modelo
BN
36
6
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9A
zam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
10
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
11
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a12
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
13
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
118 Apendice A Caracterizacao da regiao de estudoT
abel
aA
11
15co
nce
lhos
com
esti
mati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
Acid
entes
tip
o1
-M
odelo
BN
19
42
2000
2001
2002
2003
2004
2005
2006
2007
1M
arin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Ilhavo
Ilhavo
Ilhavo
Ilhavo
2Il
havo
Ilhavo
Ilhavo
Ilhavo
Marin
ha
Grande
Marin
ha
Grande
Vagos
Vagos
3A
lbufe
ira
Alb
ufe
ira
Vagos
Vagos
Vagos
Vagos
Marin
ha
Grande
Ferreir
ado
Zezere
4P
ortim
ao
Portim
ao
Alb
ufe
ira
Portim
ao
Portim
ao
Ferreir
ado
Zezere
Ferreir
ado
Zezere
Marin
ha
Grande
5V
agos
Vagos
Portim
ao
Porto
Porto
Portim
ao
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
6P
orto
Porto
Porto
Alb
ufe
ira
Ferreir
ado
Zezere
Porto
Porto
Montem
or-o
-Velh
o7
Faro
Penic
he
Penic
he
Penic
he
Penic
he
Penic
he
Portim
ao
Alp
iarca
8L
oule
Faro
Faro
Faro
Alb
ufe
ira
Oliveir
ado
Bair
ro
Montem
or-o
-Velh
oP
orto
9P
enic
he
Loule
Viz
ela
Ferreir
ado
Zezere
Coim
bra
Montem
or-o
-Velh
oP
enic
he
Penic
he
10
Odiv
ela
sO
div
ela
sC
oim
bra
Coim
bra
Faro
Coim
bra
Coim
bra
Coim
bra
11
Viz
ela
Viz
ela
Odiv
ela
sV
izela
Montem
or-o
-Velh
oA
lbufe
ira
Alp
iarca
Portim
ao
12
Olh
ao
Coim
bra
Loule
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Faro
Pom
bal
Pom
bal
13
Nazare
Olh
ao
Ferreir
ado
Zezere
Odiv
ela
sV
izela
Aveir
oA
veir
oA
veir
o14
Coim
bra
Setubal
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Aveir
oP
om
bal
Faro
Vis
eu
15
Setubal
Cantanhede
Setubal
Aveir
oP
om
bal
Viz
ela
Murtosa
Lis
boa
Acid
entes
tip
o2
-M
odelo
BN
29
86
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ourem
Ourem
Ourem
Ourem
Ourem
S
J
Madeir
a2
Rio
Maio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rFerreir
aZ
O
dem
ira
Odem
ira
3A
lmeir
imFerreir
aZ
Ferreir
aZ
Ferreir
aZ
Ferreir
aZ
R
ioM
aio
rFerreir
aZ
Ferreir
aZ
4
Ferreir
ado
Zezere
Alm
eir
imB
raganca
Braganca
Braganca
Odem
ira
S
J
Madeir
aV
izela
5Santarem
Braganca
Avis
Odem
ira
Odem
ira
Mourao
Braganca
Braganca
6L
isboa
Lis
boa
Odem
ira
Mourao
Mourao
Braganca
Rio
Maio
rO
urem
7C
ham
usca
Santarem
Lis
boa
Avis
Avis
S
J
Madeir
aA
lmodovar
Alm
odovar
8B
raganca
Cham
usca
Mourao
Lis
boa
Vim
ioso
Avis
Viz
ela
Tondela
9P
alm
ela
Avis
Santarem
Cham
usca
Ala
ndroal
Vim
ioso
Tondela
Chaves
10
Salv
aterra
de
Magos
Palm
ela
Cham
usca
Palm
ela
S
J
Madeir
aA
lmodovar
Chaves
Rio
Maio
r11
Avis
Salv
aterra
de
Magos
Alm
eir
imSantarem
Alm
odovar
Chaves
Elv
as
Guim
araes
12
Ilhavo
Odem
ira
Palm
ela
Ala
ndroal
Elv
as
Ala
ndroal
Serta
13
Vila
Nova
da
Barquin
ha
Mourao
Salv
aterra
de
Magos
Elv
as
Palm
ela
Tondela
Palm
ela
14
Nazare
Vila
Nova
da
Barquin
ha
Ala
ndroal
Alm
eir
imC
ham
usca
Elv
as
Portim
ao
15
Abrantes
Ala
ndroal
Lagos
Salv
aterra
de
Magos
Lis
boa
Palm
ela
Loule
Acid
entes
tip
o3
-M
odelo
P3
630
2000
2001
2002
2003
2004
2005
2006
2007
1O
dem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
2M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
3V
imio
so
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Cantanhede
4F
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
o5
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
6M
iranda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
7A
lmodovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
8Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
9A
lcoutim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
10
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
11
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
12
Alc
ochete
Alc
ochete
Alc
ochete
Macedo
de
Cavale
iros
Alc
ochete
Alc
ochete
13
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Vagos
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
14
Vagos
Vagos
Vagos
Cantanhede
Vagos
Vagos
15
Cantanhede
Cantanhede
Cantanhede
Alc
ochete
Cantanhede
Cantanhede
Referencias Bibliograficas
Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes
in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625
ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt
Defaultaspxtabid=220amplanguage=pt-PT
ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx
fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT
Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population
density Statistics in Medicine 18(16) 2147ndash2162
Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety
performance indicators by using a multivariate generalized linear mixed model Journal
of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517
Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis
for Spatial Data Chapman amp Hall
Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease
maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431
Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini
M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med
14(21-22) 2433ndash2443
Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis
of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007
Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems
Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236
Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-
tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20
101007BF00116466
120 Referencias bibliograficas
Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis
with R Springer
Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed
Models Journal of the American Statistical Association 88(421) 9ndash25
Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane
roads Accident Analysis amp Prevention 39(4) 657 ndash 670
Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a
velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos
PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico
Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em
Seguranca Rodoviaria Technical report IST and LNEC
Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-
Temporally Correlated Survival Data In Bayesian Statistics 7
Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data
Analysis Chapman amp Hall
Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative
Risks for Use in Disease Mapping Biometrics 43 671ndash681
Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data
Biometrics 65 1254ndash1261
Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao
em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo
20economico20e20social20dos20acidentes_versao20para20internet
Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in
Europe Applied Spatial Analysis 1 133ndash150
Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level
Example of Belgium Journal of Safety Research 39(4) 417 ndash 427
El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate
Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828
Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety
Accident Analysis amp Prevention 40(6) 1964 ndash 1969
Referencias bibliograficas 121
Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis
and Prevention 43 253ndash264
Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall
Gelfand A E (1996) Model determination using sampling-based methods In W
Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice
chapter 9 (pp 145ndash161) Chapman amp
Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive
models for spatial data analysis Biostatistics 4(1) 11ndash15
Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis
Chapman amp Hall
Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for
the analysis of spatial data An application to disease mapping Journal of Statistical
Planning and Inference 75(2) 305 ndash 318
Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and
Estimation Journal of the American Statistical Association 102(477) 359ndash378
Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical
Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808
Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps
with Application to German Mortality Data httpepububuni-muenchende
Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive
Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical
Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD
Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR
Models for Areal Data Biometrics 61(4) 950ndash961
Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease
risk Statistics In Medicine 19(17-18) 2555ndash2567
Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space
Statistics in Medicine 17(18) 2045ndash2060
Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-
demiology CRC Press Taylor amp Francis
122 Referencias bibliograficas
Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-
mann P e Divino F (2000) Disease mapping models an empirical evaluation
Statistics in Medicine 19(17-18) 2217ndash2241
Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-
temporal patterns of intra-city motor vehicle craches Journal of Transport Geography
15 274ndash285
Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical
models in road safety countermeasure effectiveness studies in Iowa Accident Analysis
amp Prevention 40(4) 1531 ndash 1542
Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-
Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis
amp Prevention 40(3) 1123 ndash 1134
Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small
sample size on the estimation of the fixed dispersion parameter of Poisson-gamma
models for modeling motor vehicle crashes A Bayesian perspective Safety Science
46(5) 751 ndash 770
Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-
persion parameters of Poisson-gamma models on empirical Bayes estimates Accident
Analysis amp Prevention 40(4) 1441 ndash 1457
Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-
inflated regression models of motor vehicle crashes balancing statistical fit and theory
Accident Analysis amp Prevention 37(1) 35 ndash 46
Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal
regression model for prediction of crash counts by severity using Bayesian methods
Accident Analysis amp Prevention 40(3) 964 ndash 975
MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident
and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028
Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P
Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive
Statistical Methods (pp 99ndash114) Springer
Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-
tent Gaussian models using integrated nested Laplace approximations A manual for
Referencias bibliograficas 123
the inla program Technical report Norwegian University of Science and Technology
Trondheim
McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall
Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-
provements Decision parameter treatability concept statistical criterion and spatial
dependence Accident Analysis amp Prevention 37(4) 699 ndash 720
Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A
Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57
Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures
for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201
Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle
crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468
Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties
in england Accident Analysis amp Prevention 36(6) 973 ndash 984
OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications
world_health_statistics2008en
OMS (2009) Global status report on road safety httpwhqlibdocwhoint
publications20099789241563840_engpdf
Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao
Calouste Gubenkian
Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes
factors Biometrika 77(3) 455ndash466
Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-
tistics 9(3) 523ndash539
Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis
and output analysis for MCMC R News 6(1) 7ndash11
Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and
heterogeneity An analysis of London crash data Accident Analysis amp Prevention
40(4) 1486 ndash 1497
124 Referencias bibliograficas
R Development Core Team (2008) R A Language and Environment for Statistical
Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-
07-0
Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology
Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications
Chapman amp HallCRC
Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent
gaussian models by using integrated nested laplace approximations Journal of the
Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392
Schrodle B e Held L (2011) A primer on disease mapping and ecological regression
using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2
Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment
and Posterior Inference Journal of Statistical Software 21(11) 1ndash37
Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial
models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)
246 ndash 273
Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian
measures of model complexity and fit J R Statist Soc B 64 583ndash639
Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and
Marginal Densities Journal of the American Statistical Association 81 82ndash86
Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian
Journal of Statistics 31 221ndash229
Wakefield J (2007) Disease mapping and spatial regression with count data Biostat
8(2) 158ndash183
Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press
Taylor amp Francis
A Sofia Azeredo pelo interesse pela apreciacao e pela hospitalidade do seu local de tra-
balho
Um agradecimento muito especial a Margarida Silva que tem sempre um carinho a minha
espera
Aos meus amigos e colegas de trabalho em particular a Celeste Gameiro a Ana Pinho
a Carla Rebelo a Sara Madeira a Paula Ribeiro ao Jose Rodrigues e ao Carlos Sousa
os quais me ajudaram cada um a sua maneira
A um grupo de amigos muito especiais que estiveram sempre presentes e com quem pude
partilhar muitos momentos de alegria e descontracao
Um agradecimento muito especial a Lidia Pereira a Helena Serodio e ao Arnaldo Pereira
A minha famılia que soube aceitar e esperar Em especial ao Jorge por acreditar sempre
em mim a Mariana e a Rita por me seguirem como exemplo
A minha mae
Siglas e Acronimos
A Area geografica
AE Autoestrada
ANSR Autoridade Nacional de Seguranca Rodoviaria
BN Binomial Negativo
BT Brigada de Transito
BOA An R Package for MCMC Output Convergence
Assessment and Posterior Inference
BUGS Bayesian Using Gibbs Sampling
C Comprimento de estrada
CARE Community database on accidents on the roads in Europe
CE Codigo de Estrada
CODA Convergence Diagnosis and Output Analysis for MCMC
CPO Conditional Predictive Ordinates
DIC Deviance Information Criterion
DP Densidade populacional
EN Estrada Nacional
ENSR Estrategia Nacional de Seguranca Rodoviaria
GNR Guarda Nacional Republicana
HPD Highest Probability Density
IC Itinerario Complementar
INLA Integrated Nested Laplace Approximations
IP Itinerario Principal
MCMC Markov Chains Monte Carlo
mls Mean logarithmic score
OMS Organizacao Mundial de Saude
ONU Organizacao das Nacoes Unidas
OSEPU Ocupacao do solo com equipamentos e parques urbanos
OSI Ocupacao industrial do solo
OST Ocupacao do solo com equipamento turıstico
OSU Ocupacao urbana do solo
pD Numero efetivo de parametros
PIT Probability Integral Transformation
PMOT Plano Municipal de Ordenamento do Territorio
PMSR Planos Municipais de Seguranca Rodoviaria
PSP Polıcia de Seguranca Publica
R A Language and Environment for Statistical Computing
SafetyNET Projeto europeu European Traffic Information System -
Data Colletion and Analysis Tools for Policy Making
SMR Standard Morbility Ratio
UE Uniao Europeia
WinBUGS versao em ambiente Windows do programa BUGS
VC Quantidade de combustıvel vendido
Conteudo
Lista de Tabelas xiv
Lista de Figuras xv
Introducao 1
1 Nocoes sobre seguranca rodoviaria 9
11 Risco em seguranca rodoviaria 9
12 Caracterizacao dos dados de acidentes 10
13 Caracterizacao da medida de exposicao 14
2 Modelacao estatıstica de acidentes rodoviarios 19
21 Modelos bayesianos hierarquicos 21
22 Modelos nao espaciais 24
23 Modelos espaciais 27
24 Modelos espaco-temporais 28
25 Modelos multivariados 30
26 Metodos de inferencia 32
261 INLA 32
27 Ajustamento e medidas preditivas 36
3 Aplicacoes 39
31 Associacao espacial 40
32 Modelos 43
33 Modelos espaco-temporais 45
331 Associacao regional 46
332 Selecao dos modelos 47
333 Modelos para acidentes do tipo 1 48
334 Validacao dos modelos para acidentes do tipo 1 49
335 Resultados obtidos com modelos para acidentes do tipo 1 49
xii Conteudos
336 Modelos para acidentes do tipo 2 61
337 Validacao dos modelos para acidentes do tipo 2 62
338 Resultados obtidos com modelos para acidentes do tipo 2 62
339 Modelos para acidentes do tipo 3 73
3310 Validacao dos modelos para acidentes do tipo 3 73
3311 Resultados obtidos com modelos para acidentes do tipo 3 74
34 Modelos multivariados 83
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
351 Modelo para acidentes do tipo 1 89
352 Validacao do modelo para acidentes do tipo 1 89
353 Resultados obtidos com o modelo para acidentes do tipo 1 90
354 Modelo para acidentes do tipo 2 92
355 Validacao do modelo para acidentes do tipo 2 92
356 Resultados obtidos com o modelo para acidentes do tipo 2 93
357 Modelos para acidentes do tipo 3 95
358 Validacao do modelo para acidentes do tipo 3 95
359 Resultados obtidos com o modelo para acidentes do tipo 3 96
4 Discussao e conclusoes 99
A Caracterizacao da regiao de estudo 103
A1 Portugal Continental 103
A2 Numero de acidentes 108
A3 Covariaveis 110
A4 15 concelhos 115
Referencias Bibliograficas 119
Lista de Tabelas
11 Numero total de cada tipo de acidentes rodoviarios por ano 11
12 Estatısticas resumo do numero de veıculos com seguro em milhares 14
21 Modelos univariados 30
31 Valores do ındice EBI para cada tipo de acidente por ano 43
32 Valores DIC e mls dos modelos Poisson sem covariaveis 44
33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44
34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45
35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem
covariaveis 46
36 DIC pD e mls para cada tipo de acidente 47
37 DIC pD e mls para acidentes tipo 1 48
38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50
39 Estatısticas resumo dos parametros do modelo P 1 8 1 53
310 Estatısticas resumo dos parametros do modelo P 1 8 16 54
311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55
312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55
313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57
314 DIC pD e mls para acidentes tipo 2 61
315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63
316 Estatısticas resumo para os parametros do modelo P 2 9 1 66
317 Estatısticas resumo para os parametros do modelo P 2 9 16 67
318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67
319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68
320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69
321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71
322 DIC pD e mls para acidentes tipo 3 73
323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74
xiv Lista de Tabelas
324 Estatısticas resumo dos parametros do modelo P 3 6 1 78
325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78
326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78
327 Modelos univariados 82
328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-
tivariado e dos modelos univariados 83
329 Correlacoes dos modelos multivariados com interacao e sem interacao
espaco-temporal 84
330 Vıtimas a 24 horas e vıtimas a 30 dias 84
331 Numero total de cada tipo de acidentes rodoviarios por ano 87
332 DIC pD e mls para cada tipo de acidente 89
333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90
334 DIC pD e mls 92
335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93
336 Estatısticas resumo dos parametros do modelo P 3 6 30 96
337 Comparacao entre a abordagem local e a global 98
A1 Estatısticas resumo de acidentes tipo 1 108
A2 Estatısticas resumo de acidentes tipo 2 108
A3 Estatısticas resumo de acidentes tipo 3 108
A4 Estatısticas resumo de acidentes tipo 1 109
A5 Estatısticas resumo de acidentes tipo 2 109
A6 Estatısticas resumo de acidentes tipo 3 109
A7 Estatısticas resumo da covariavel populacao 110
A8 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 1 115
A9 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 2 116
A10 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 3 117
A11 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 118
Lista de Figuras
1 Dez principais causas de morte no mundo 2
2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4
11 Numero de acidentes tipo 1 por concelho 12
12 Numero de acidentes tipo 2 por concelho 12
13 Numero de acidentes tipo 3 por concelho 13
14 Numero de veıculos com seguro em milhares por concelho e por ano 14
15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15
16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16
17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16
31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de
acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano
2000 41
32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de
veıculos com seguro no ano 2000 41
33 Valores estimados dos SMR1 e respetivos intervalos de confianca para
cada concelho no ano 2000 42
34 Histograma dos valores de EBI simulados e valor de EBI observado para
acidentes tipo 1 e para ano 2000 43
35 Histograma das diferencas entre as medias dos logscores 48
36 Histograma dos valores PIT ajustados para acidentes tipo 1 49
37 Box plot dos valores estimados para acidentes tipo 1 50
38 Amplitude dos intervalos para acidentes tipo 1 51
39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 1 51
310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o
ano 2000 52
xvi Lista de Figuras
311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52
312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53
313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo P 1 8 16 56
314 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo
P 1 8 16 56
315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo P 1 8 16 57
316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 6 172 58
317 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58
318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-
dos com o modelo BN 1 6 172 59
319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com
o modelo BN 1 6 172 60
320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 6 172 60
321 Histograma das diferencas entre as medias dos logscores 61
322 Histograma dos valores PIT ajustados para acidentes tipo 2 62
323 Box plot dos valores estimados para acidentes tipo 2 63
324 Amplitude dos intervalos para acidentes tipo 2 64
325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori dos acidentes tipo 2 64
326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o
ano 2000 65
327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65
328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66
329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo P 2 9 16 68
330 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
P 2 9 16 69
Lista de Figuras xvii
331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2
de 2000 a 2007 obtidos com o modelo P 2 9 16 70
332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 4 71
333 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
BN 2 9 4 71
334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 4 72
335 Histograma dos valores PIT ajustados para acidentes tipo 3 74
336 Box plot dos valores estimados para acidentes tipo 3 75
337 Amplitude dos intervalos para acidentes tipo 3 75
338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76
339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o
ano 2000 76
340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77
341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77
342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 1 79
343 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79
344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3
de 2000 a 2007 obtidos com o modelo P 3 6 1 80
345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo BN 3 6 6 81
346 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81
347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo BN 3 6 6 82
348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos univariados e com os modelos multivariados 85
349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos multivariados 86
350 Numero de acidentes tipo 1 por concelho 87
351 Numero de acidentes tipo 2 por concelho 88
xviii Lista de Figuras
352 Numero de acidentes tipo 3 por concelho 88
353 Histograma dos valores PIT ajustados para acidentes tipo 1 89
354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 9 42 90
355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 9 42 91
356 Histograma dos valores PIT justados para acidentes tipo 2 92
357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 86 94
358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 86 94
359 Histograma dos valores PIT ajustados para acidentes tipo 3 95
360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 30 96
361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo P 3 6 30 97
A1 ID dos concelhos do Norte de Portugal Continental 104
A2 ID dos concelhos do Sul de Portugal Continental 105
A3 Numero de habitantes por concelho e por ano 110
A4 Area por concelho 111
A5 Densidade populacional por concelho 111
A6 Quilometros de estrada por concelho 112
A7 Quantidade de combustıvel vendido por concelho 112
A8 Superfıcie de ocupacao urbana do solo por concelho 113
A9 Superfıcie de ocupacao industrial do solo por concelho 113
A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por
concelho 114
A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114
ldquoThe road to wisdom - Well itacutes plain and simple to express
Err and err and err again but less and less and lessrdquo
Piet Hein (1996)
Introducao
A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora
de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo
automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se
tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao
ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o
Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009
OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes
rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso
entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as
tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa
na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas
etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do
PIB mundial
A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas
necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004
para a quinta causa de morte em 2030
2 Introducao
2004
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Infecoes respiratorias
4 Doencas pulmonares
5 Diarreias
6 HIVAIDS
7 Tuberculose
8Cancro do pulmao
dos bronquios e da traqueia
9 Acidentes rodoviarios
10Recem-nascidos prematuros
e de peso baixo
HH
2030
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Doencas pulmonares
4 Infecoes respiratorias
5 Acidentes rodoviarios
6Cancro do pulmao
dos bronquios e da traqueia
7 Diabetes mellitus
8 Doencas do coracao hipertensas
9 Cancro do estomago
10 HIVAIDS
Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)
No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a
decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-
ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem
disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao
forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes
rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida
No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de
Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-
dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos
socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a
sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario
e Santos 2012)
O sistema de trafego rodoviario um subsistema do sistema de transportes e formado
por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-
fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes
rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos
correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada
e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a
deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos
Introducao 3
(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de
pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se
por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma
qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena
de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do
sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-
guranca deste sistema complexo tem consequencias devastadoras em termos humanos
sociais e economicos (Cardoso 2007)
Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta
consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos
consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-
vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma
descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-
tadas a nıvel mundial
minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-
doviaria
minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios
como um problema de saude publica
minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da
seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial
minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria
minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das
Nacoes Unidas
minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca
Rodoviaria
minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de
Acao para a Seguranca Rodoviaria
Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria
Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-
dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade
responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para
uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos
veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica
sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste
flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area
da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e
tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha
uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes
4 Introducao
projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do
trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para
veıculos tambem designada por sistemas inteligentes de transportes
A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-
volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos
30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-
tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi
progressivamente modernizado tendo sido acompanhado por um aumento do numero
de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal
terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de
toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu
aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver
na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada
a implementacao de algumas medidas especıficas
Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)
As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para
compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios
e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou
regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma
consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica
de dados de acidentes rodoviarios
Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo
pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e
Introducao 5
do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda
lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util
domınio para desenvolvimento de atividades de investigacao O ambito desta tese e
portanto a modelacao estatıstica de dados de acidentes rodoviarios
Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-
retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar
progressivamente a execucao dessas acoes foram identificados varios fatores capazes de
melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em
particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas
com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados
As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma
melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de
intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-
vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada
em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-
dos na UE (CARE - Community database on accidents on the roads in Europe) No
projeto integrado SafetyNET (European Traffic Information System - Data Colletion
and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de
informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas
principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco
e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como
ponto de partida para a modelacao estatıstica usada nesta tese
A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-
nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-
ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos
desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-
cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes
o que facilita a identificacao dos fatores causais e de intervencoes corretivas
As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-
tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial
como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy
A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-
tatıstica Em geral foram detetados varios problemas na estimacao dos parametros
de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou
desconhecidas dependencia espacial e depedencia temporal que continuam a constituir
objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-
blemas como por exemplo
1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm
6 Introducao
minus modelos lineares generalizados baseados na distribuicao de Poisson
minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia
de sobredispersao
minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado
para analisar dados de acidentes com sobredispersao e excesso de zeros
minus modelos de nıveis multiplos estruturados
minus modelos bayesianos hierarquicos
minus incorporacao de correlacao espacial e dependencia temporal nos modelos
A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao
existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada
a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre
os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos
hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem
podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li
et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar
a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais
e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais
atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004)
O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da
estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a
problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior
barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua
formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains
Monte Carlo) na computacao bayesiana
A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se
nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que
envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas
O seu crescimento ao nıvel das aplicacoes tem sido extraordinario
O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using
Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o
GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao
Introducao 7
CODA Plummer et al (2006) e ao BOA Smith (2007)
Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de
pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)
o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em
particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-
tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas
Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana
aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa
determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas
limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes
de concordancia
Todas as analises envolvidas no metodo INLA estao implementadas num programa que
pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser
descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos
hierarquicos complexos tornou-se muito mais acessıvel
Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA
Objetivos
Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-
los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca
rodoviaria em areas geograficas diferentes
Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse
tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-
pacial e depedencia temporal
Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao
Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes
nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional
Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-
place Approximations atraves da exploracao do pacote R-INLA
8 Introducao
Estrutura da tese
No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a
caracterizacao dos dados usados nesta tese
No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos
No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais
de sinistralidade rodoviaria registados em Portugal Continental
No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido
de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros
No Anexo A faz-se a caracterizacao da regiao de estudo
No CD em anexo encontram-se todos os codigos usados nesta tese
1Nocoes sobre seguranca rodoviaria
11 Risco em seguranca rodoviaria
O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores
de seguranca informativos muito importantes No entanto quando se pretende fazer
comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de
acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca
rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de
acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja
risco=numero esperado de acidentesmedida de exposicao
A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-
responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel
ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-
teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a
melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-
cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos
proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens
e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego
10 Capıtulo 1 Nocoes sobre seguranca rodoviaria
atraves do comprimento de estrada do numero de veıculos ou preferencialmente da
distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode
estar associada a populacao de risco atraves do numero de habitantes do numero de
condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas
times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco
de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia
de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-
cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o
numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para
a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande
disponibilidade de informacao desagregada o que permite analisar as especificidades de
varios grupos populacionais As restantes medidas indicadas apresentam atualmente
muitas limitacoes1
Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se
deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido
e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a
relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata
de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes
e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-
se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de
veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se
a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho
12 Caracterizacao dos dados de acidentes
Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito
e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas
sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela
gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de
exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-
tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao
usada e sobre as covariaveis usadas
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-
ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez
1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2
205-v3_finalpdf
12 Caracterizacao dos dados de acidentes 11
agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho
A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos
se encontram no litoral norte sendo consequentemente mais proximos uns dos outros
Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz
respeito a caracterizacao dos concelhos2
Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311
Total 279644 28844 8890 317378
Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR
minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo
menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT
e PSP) e da qual resultem vıtimas ou danos materiais
minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais
minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do
acidente ou no seu percurso ate a unidade de saude No perıodo em analise para
obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)
aplica-se um coeficiente multiplicativo de 114 ao numero de mortos
minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo
de hospitalizacao superior a 24 horas
minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave
minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima
minus Acidente mortal Acidente do qual resulte pelo menos um morto
minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido
grave nao tendo ocorrido qualquer morte
minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido
leve e em que nao se tenham registado mortos nem feridos graves
2ver Anexo A
12 Capıtulo 1 Nocoes sobre seguranca rodoviaria
Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes
com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes
do tipo 3 os acidentes mortais
Figura 11 Numero de acidentes tipo 1 por concelho
Figura 12 Numero de acidentes tipo 2 por concelho
12 Caracterizacao dos dados de acidentes 13
Figura 13 Numero de acidentes tipo 3 por concelho
Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero
de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de
acidentes
Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor
risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao
entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria
muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos
mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278
concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado
o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de
cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes
decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para
permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no
espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes
Isto e especialmente importante porque apesar do numero de acidentes ser relacionado
com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria
que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de
3ver Anexo A
14 Capıtulo 1 Nocoes sobre seguranca rodoviaria
trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a
variabilidade da medida de exposicao em funcao do espaco ou do tempo
13 Caracterizacao da medida de exposicao - numero
de veıculos com seguro
Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares
Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730
Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)
13 Caracterizacao da medida de exposicao 15
O numero de veıculos com seguro varia bastante de concelho para concelho como se pode
verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo
por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que
cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media
inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo
Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho
i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o
numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =
100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de
acidente rodoviario para acidentes do tipo 1ndash3
Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por
concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes
e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos
sugerindo a existencia de correlacao espacial
Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na
faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas
mais baixas
Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007
Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-
se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se
mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas
muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a
16 Capıtulo 1 Nocoes sobre seguranca rodoviaria
nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos
com taxas mais baixas
Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007
Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007
No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas
usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer
mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-
petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao
13 Caracterizacao da medida de exposicao 17
ocorre com muita frequencia com dados de contagem com muitos valores escassos e
ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou
unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas
pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes
associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso
nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando
as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante
afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e
Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas
dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem
como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-
tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de
forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e
Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004) descritos no Capıtulo 2
2Modelacao estatıstica de acidentes rodoviarios
Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram
baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados
normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido
que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-
doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia
de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma
probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre
os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-
dos de contagens sao modelos mais apropriados para este tipo de estudos
Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo
constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo
et al 2007 Cardoso 1996)
Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo
caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala
espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais
desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais
como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel
explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-
20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como
uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade
espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias
ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao
apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo
muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao
verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos
com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao
de riscos relativos em areas pequenas
No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-
dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade
de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto
deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-
mas na alocacao de fundos governamentais e no planeamento regional Determinados
atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-
cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para
areas pequenas e esta tendencia ira provavelmente continuar
Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-
vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco
relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario
num determinado concelho relativamente ao risco no paıs (Portugal Continental)
As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e
consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem
acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999
Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os
metodos tradicionais para investigar questoes importantes relacionadas com estimacao de
riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia
temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis
nao observaveis tais como clima determinadas caracterısticas da populacao entre outras
Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser
pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a
construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios
ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al
2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-
tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes
21 Modelos bayesianos hierarquicos 21
espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e
temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a
suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos
pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos
dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-
doviarios
A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma
serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia
em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-
dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes
rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem
ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade
existente no dados Noland e Quddus (2004) Elvik (2011)
A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-
melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio
que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-
blema atribuıdo a comportamentos inadequados dos condutores associados a falencias
da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de
acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA
constitui a covariavel com maior poder explicativo da variacao observada No entanto
nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas
do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por
exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de
servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel
vendido e um indicador do volume de trafego e a densidade populacional um indicador de
urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais
o numero de habitantes a area geografica a densidade populacional o comprimento de
estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao
industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao
do solo com equipamento turıstico como sera abordado no Capıtulo 4
21 Modelos bayesianos hierarquicos
O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que
o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro
θ e o segundo traduz a distribuicao a priori para o parametro θ
22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica
na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-
delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-
nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo
que p(θ) =
intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =
1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa
estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-
formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros
Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade
associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-
tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia
a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori
nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-
tribuicao a priori padrao p(θ) (Paulino et al 2003)
Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte
estrutura
1o nıvel f(y|θ) funcao de verosimilhanca
2o nıvel p(θ|φ) distribuicao a priori dos parametros
3o nıvel p(φ) distribuicao a priori dos hiperparametros
Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e
evoluindo para modelos cada vez mais complexos
O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-
creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-
vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de
acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar
esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-
dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se
Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou
sejaYit|θit sim Poisson(Eitθit)
f(yit|θit) =(Eitθit)
yiteminusEitθit
yit
Eit = nitr = nit
sumij
Yitsumij
nit
21 Modelos bayesianos hierarquicos 23
onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit
representa o numero de veıculos com seguro e θit representa o risco relativo de acidente
rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja
se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia
de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de
acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)
A funcao de versimilhanca e dada por
L(θ|y) =prodit
f(yit|θit) =prodit
(Eitθit)yiteminusEitθit
yitpropprod
θyitit e
minussumit
Eitθit
e l(θ|y) = lnL(θ|y) propsumit
yit ln θitminussumit
Eitθit O estimador de maxima verosimilhanca
do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-
dardized Mortality Ratio1 - SMR) e dado por
θit = SMRit =YitEit
(211)
Note-se que V ar(SMRit) =V ar(Yit)
E2it
=θitEit
podendo-se fazer V ar(SMRit) =θitEit
=YitE2it
Um procedimento classico usual para identificar regioes de maior risco consiste na cons-
trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR
Apesar de util este procedimento tem algumas desvantagens Note-se que em areas
com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero
de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR
podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com
muita frequencia com dados desta natureza quando as unidades espaciais de analise sao
concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao
das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit
associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser
grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram
ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de
tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida
em que a respetiva variabilidade pode ser muito grande A variancia destes valores e
1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso
24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao
grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro
estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-
minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992
Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR
tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores
estimados com menos precisao As maiores variacoes do risco relativo nao estarao em
geral associadas com variacoes do risco subjacente a medida de exposicao mas serao
apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)
Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se
que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-
dade teorica subjacente ao modelo Poisson
A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados
(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do
modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado
que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al
2008 2005)
Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-
mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos
tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao
de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das
flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto
dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se
usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico
medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial
entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao
mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)
22 Modelos nao espaciais
Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh
e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis
atraves da funcao de ligacao usada para modelar a media
ln(θit) = α+
nβsump=1
βpxitp (221)
22 Modelos nao espaciais 25
onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel
e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um
nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual
considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a
priori p = 1 2 nβ i = 1 2 N e t = 1 2 T
No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-
adequadamente capturada pelas variaveis explicativas na funcao da media condicional
Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser
distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-
tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como
ln θit = α+
nβsump=1
βpxitp + vit (222)
onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p
Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que
foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-
los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares
generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)
Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-
dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao
a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo
Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples
de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma
fechada dado que esta mistura resulta de um modelo conjugado
Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao
Poisson e na distribuicao Binomial Negativa
O modelo Poisson Lognormal surge quando se admite que
vit sim Normal(0 σ2v) (223)
A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por
f(yit θNit σ
2v) =
1
σ2v
radic2π
EitθNit
y
int infin0
eminusEitθNit e
v
(ev)yminus1eminus v2
2σ2v dev
nao havendo forma explicıta com
26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
ln θNit = α+
nβsump=1
βpxitp (224)
E[Yit] = microNit eσ2v2 = Eitθ
Nit e
σ2v2 e V ar[Yit] = microNit e
σ2v2(
1 + (eσ2v minus 1)microNit e
minusσ2v2)
O modelo Poisson-Gama ou Binomial Negativo surge quando
exp(vit) sim Gama(φ φ) (225)
A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por
f(yit θBNit φ) =
Γ(yit + φ)
Γ(φ)yit
(φ
microBNit + φ
)φ(microBNit
microBNit + φ
)yitou seja
Yit|θBNit sim BN(EitθBNit φ)
com
ln θBNit = α+
nβsump=1
βpxitp (226)
E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit
(1 +
microBNitφ
) Note-se que quando φrarrinfin o
modelo Binomial Negativo reduz-se ao modelo Poisson
Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo
podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais
um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com
av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O
parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de
dispersao
O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-
plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre
unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-
quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito
afectadas (Miranda-Moreno et al 2007 Lord et al 2008)
Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)
A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-
pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os
23 Modelos espaciais 27
riscos relativos conjuntamente como um processo espacial atraves de uma especificacao
a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-
lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco
relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados
observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada
area e a soma de duas componentes que representam fatores espaciais e nao espaciais
No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica
de interesse em cada area tem distribuicao Poisson com media especıfica de cada area
As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre
a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento
das variaveis nao-observadas como em Bernardinelli et al (1995ab)
23 Modelos espaciais
Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia
espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos
mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao
associados uma distribuicao a priori conveniente
log(θit) = α+
nβsump=1
βpxitp + si (231)
Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de
notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario
quer para os modelos baseados na distribuicao de Poisson abreviadamente designados
de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa
abreviadamente designados de modelos BN com os devidos significados
Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que
representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos
atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori
associada
log(θit) = α+
nβsump=1
βpxitp + si + vi (232)
onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-
turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e
si sao mutuamente independentes viiidsim Normal(0 σ2
v) e si|sminusi sim Normal(si σ2smi)
28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
onde o sminusi indica o vetor s com o elemento si removido si =1
mi
sumi 6=j
wijsj e a media
dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e
wij = 0 caso contrario Deste modo mi =sumi 6=j
wij e o respetivo numero de vizinhos e
σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma
s tem distribuicao conjunta
f(s) prop (σ2s)minusn2 exp
minus 1
2σ2s
sumi6=j
(si minus sj)2wij
e (σ2v)minus1 sim Gama(av bv) (σ2
s)minus1 sim Gama(as bs) com av bv as e bs conhecidos
Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial
local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo
gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991
Banerjee et al 2004)
24 Modelos espaco-temporais
Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-
tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a
aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios
e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos
com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se
definiu na seccao anterior
Modelos espaco-temporais sem interacao
Nestes modelos tem-se log(θit) = α+
nβsump=1
βpxitp + si + vi + ψt
onde se considera
ψt sim Normal(0 σ2ψ) (241)
ou
ψt sim RW (1 σ2ψ) (242)
e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ
2s σ
2v σ
2ψ mutuamente
independentes
24 Modelos espaco-temporais 29
Alternativamente log(θit) = α+
nβsump=1
βpxitp + si + vi + γt
onde se considera
γ sim Normal(0 cγ) (243)
sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ
2v mutuamente
independentes (Knorr-Held 2000)
Modelos espaco-temporais com interacao
Neste caso log(θit) = α+
nβsump=1
βpxitp + si + vi + (γ + δi)t
onde se considera alternativamente
δi sim Normal(0 σ2δ ) (244)
ou
δi sim CAR(σ2δ ) (245)
e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com
aδ bδ conhecidos e α βp σ2s σ2
v σ2δ mutuamente independentes (Bernardinelli et al
1995b)
A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando
um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de
acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de
risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia
e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de
cada area e a media global α e δi representa a diferenca entre a tendencia temporal
local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0
a tendencia temporal local da area i e menos acentuada do que a tendencia temporal
global enquanto que quando δi gt 0 e mais acentuada
Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados
neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo
nao se encontra definida uma distribuicao a priori para um parametro considera-se a
distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior
30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Tabela 21 Modelos univariados
M log(θit) Distribuicao a priori Distribuicao a priori
dos parametros dos hiperparametros
1 α+
nβsump=1
βpxitp α sim Normal(0 cα)
βp sim Normal(0 cβ)
2 α+
nβsump=1
βpxitp + vi vi sim Normal(0 σ2v) σminus2
v sim Gama(av bv)
3 α+
nβsump=1
βpxitp + si si sim CAR(σ2s) σminus2
s sim Gama(as bs)
4 α+
nβsump=1
βpxitp + vi + si
5 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2
ψ sim Gama(aψ bψ)
6 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim RW (σ2ψ)
7 α+
nβsump=1
βpxitp + vi + si + γt γ sim Normal(0 cγ)
8 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2
δ sim Gama(aδ bδ)
9 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )
25 Modelos multivariados
Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-
mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes
modelos nao consideram a interdependencia que pode existir entre os riscos relativos
dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na
variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia
para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico
tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-
son capazes de considerar a relacao entre diferentes processos de contagem tais como
contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-
25 Modelos multivariados 31
son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta
abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de
diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o
numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo
k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit
condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou
seja
Ykit|θkit sim Poisson(Ekitθkit)
Modelos espaciais multivariados
1)log θkit = αk +
nβsump=1
βpxitp + ski
com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs
conhecidos
Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)
e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios
ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K
tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-
bilidade assume que a estrutura de associacao se separa numa componente nao espacial
e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta
de s e
s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)
Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)
D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de
vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK
definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre
os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao
espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se
o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo
improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou
modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin
et al (2005) Lawson (2009) Waller e Carlin (2010)
Para alem do modelo 1 foram implementados os modelos multivariados seguintes no
WinBUGS
32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)
3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)
4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e
dδ Rδ conhecidos
mas apenas se obteve convergencia para os modelos 1 e 4
Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =
bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =
001 0 0
0 001 0
0 0 001
26 Metodos de inferencia
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e
computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas
abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)
consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-
ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino
e Rue (2010a)
261 INLA
O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-
siana aproximada numa subclasse de modelos de regressao estruturados aditivamente
nomeadamente em modelos latentes gaussianos
Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z
que representa todas as componentes nao observaveis com distribuicao a priori Normal
Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-
mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-
buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia
exponencial A media microi de cada componente e relacionada com um preditor aditivo
estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor
incorpora aditivamente os efeitos de varias componentes
26 Metodos de inferencia 33
ηi = α+
nfsumj=1
f (j)(uij) +
nβsump=1
βpxip + εi (261)
onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-
cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u
podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis
contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-
torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos
podem ser representados atraves das funcoes f (j)()
Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-
mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por
suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a
priori dos hiperparametros nao tem de ser gaussianas
Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-
dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto
de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF
Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel
aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e
Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6
embora possa haver excecoes
Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro
nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos
parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-
sume que os dados observados sao condicionalmente independentes dado o campo latente
z tem-se que
f(y|xφ) =prodi
f(yi|ziφ)
Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca
do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos
φ
A distribuicao a posteriori e dada por
p(zφ|y) prop p(φ)p(z|φ)prodi
f(yi|ziφ) (262)
Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e
analiticamente tratavel
Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao
34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao
analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e
possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa
pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como
tempo computacional longo possibilidade de as amostras simuladas dos parametros se-
rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte
Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser
particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori
entre as componentes espacial ou espaco-temporal do campo latente
Em contraste o metodo de aproximacao INLA e apresentado como um metodo que
fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-
vamente pouco tempo
No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes
marginais a posteriori dos parametros de interesse
As distribuicoes marginais a posteriori pretendidas sao
p(zi|y) =
intφ
p(zi|φy)p(φ|y) dφ (263)
e
p(φj |y) =
intφj
p(φ|y) dφminusj (264)
A aproximacao de p(zi|y) e determinada usando a soma finita
p(zi|y) =sumk
p(zi|φky)p(φk|y)∆k (265)
onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-
vamente Esta soma e calculada por integracao numerica em pontos suporte φk com
pesos apropriados ∆k
A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e
obtida atraves da aproximacao de Laplace
p(φ|y) prop p(zφy)
pG(z|φy)
∣∣z=zlowast(φ) (266)
onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-
cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao
corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)
De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade
a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes
26 Metodos de inferencia 35
pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste
basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior
quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste
em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a
estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)
Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a
estrategia CCD a estrategia por omissao no R-INLA
Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a
aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace
simplificada
A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter
a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))
onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia
marginal Os autores referem que apesar de muito conveniente ao nıvel computacional
pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de
simetria das distribuicoes a posteriori marginais quer a ambos nıveis
Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais
demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-
place semelhante a 266 a p(zi|φy)
pLA(zi|φy) prop p(zφy)
pGG(zminusi|ziφy)
∣∣∣zminusi=zlowastminusi(ziφ) (267)
No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-
nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes
numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de
Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo
menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada
uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-
trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e
simetria Para mais detalhes ver Rue et al (2009)
Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre
os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao
de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos
O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-
parametros entre outras No entanto o seu potencial e reconhecidamente enorme e
encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-
tensoes com muita frequencia
36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
27 Ajustamento e medidas preditivas
Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o
criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio
combina uma medida de adequabilidade a media a posteriori da desvianca D com
uma medida de complexidade o numero efetivo de parametros pD sendo dado por
DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-
promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no
WinBUGS quer no R-INLA
No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos
aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-
vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive
Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-
tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle
e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-
delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para
detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)
As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)
p(yminusi)=
intf(yi|θyminusi)p(θ|yminusi) dθ
e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores
CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para
efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de
calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou
grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito
diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de
dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem
uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este
problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim
pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =
yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma
forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem
ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)
Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a
0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa
por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira
a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da
concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de
27 Ajustamento e medidas preditivas 37
referencia
Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls
(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))
ntimes T Esta medida e muito
utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os
valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo
3Aplicacoes
Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios
ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os
resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo
de aproximacao INLA atraves do R-INLA
Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-
sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel
usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos
no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao
apresentados os resultados obtidos no WinBUGS
Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a
analise individual de cada ano comparando-se os varios modelos e os resultados obtidos
no WinBUGS e no R-INLA tendo havido concordancia
Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial
40 Capıtulo 3 Aplicacoes
31 Associacao espacial
A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-
doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco
como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter
uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas
determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes
entre areas de maior risco e potenciais fatores
Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-
racterısticas que revelam alguns dos seus problemas Para alem da concentracao de
concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito
diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de
veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a
uma pequena mudanca no numero de acidentes
Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-
rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa
global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com
feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0
e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes
valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no
de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida
ao acaso pois os concelhos possuem condicoes identicas
Tendo em conta que o numero de veıculos com seguro varia muito por concelho este
comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-
ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem
medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito
instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis
ja que possuem variancias muito diferentes
A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura
31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero
de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro
para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas
versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em
2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho
da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com
tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que
assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se
31 Associacao espacial 41
ter uma percecao dessa variabilidade em cada concelho
Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000
Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000
42 Capıtulo 3 Aplicacoes
Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000
A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem
a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir
uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de
contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz
de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma
fronteira e wij = 0 caso contrario
As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e
o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em
areas pequenas em que o tamanho da medida de exposicao e diferente de area para
area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta
questao foram desenvolvidas diversas propostas alternativas para dados com populacoes
heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em
conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se
o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por
EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma
estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa
os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes
empırica da media marginal padronizado pela estimativa do desvio padrao da taxa
Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros
sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI
tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao
32 Modelos 43
do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao
aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de
EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado
no R atraves do pacote spdep e da funcao EBImoranmc()
Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano
Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859
Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000
Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente
por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos
testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo
p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na
Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para
acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao
espacial
32 Modelos
Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais
espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos
modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo
uma vez que forneceram melhores resultados como se pode verificar comparando os
valores das Tabelas 32mdash35
Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA
44 Capıtulo 3 Aplicacoes
No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo
da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo
A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos
de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente
pela analise dos resultados com o programa CODA do R (Plummer et al 2006)
No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-
tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada
computacionalmente menos intensa
Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266
P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205
P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204
P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204
Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 1 2063493 188 464 1351516 170 304 988082 169 222
BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201
BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201
BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201
As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos
espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos
com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo
Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial
Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3
1referente a Tabela 21
33 Modelos espaco-temporais 45
Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior
a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a
diferenca entre o numero de parametros e muito grande
No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos
os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero
correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se
pode ver mais adiante quando se usam os modelos espaco-temporais este problema e
ultrapassado
Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao
menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos
os tipos de acidentes
33 Modelos espaco-temporais
De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para
estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-
mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se
reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre
muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21
Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191
P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191
P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192
P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192
P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192
Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor
modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para
2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso
46 Capıtulo 3 Aplicacoes
o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela
35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo
1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash
e para o tipo 3 o modelo 6 mdash BN 3 6
Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191
BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191
BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192
BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193
BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193
Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e
do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores
sao os modelos Poisson
331 Associacao regional
Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao
geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar
informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-
plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos
nos riscos de acidentes
Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes
em milhares de habitantes P a area em centenas de km2 A a densidade populacional em
centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade
de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU
a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques
urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do
solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se
valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST
os valores sao por concelho e iguais em todos os anos
33 Modelos espaco-temporais 47
332 Selecao dos modelos
Foram implementados todos os modelos com todas as combinacoes entre as covariaveis
mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de
acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram
escolhidos os seguintes modelos
Tabela 36 DIC pD e mls para cada tipo de acidente
Tipo P DIC pD mls BN DIC pD mls
1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418
2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260
3 3 6 4 846237 20562 191 3 6 6 852362 19267 191
Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais
P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e
Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU
e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash
modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP
mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI
e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash
modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6
com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos
Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para
cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e
nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao
relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os
valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921
e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo
sao relativamente pequenas 961 594 e 076 respetivamente
Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao
contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis
covariaveis significativas e respetiva contribuicao para os resultados Assim fica para
trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais
significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em
48 Capıtulo 3 Aplicacoes
particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)
e uma covariavel considerada muito importante na modelacao estatıstica de acidentes
rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao
nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica
designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos
hoteleiros
333 Modelos para acidentes do tipo 1
Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172
log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t
e
log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t
No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente
para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos
de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem
o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o
zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor
HPD que contem o zero considera-se que a covariavel nao contribui significativamente
para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso
contrario considera-se que a covariavel contribui significativamente para a explicacao
da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado
que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124
obtendo-se o modelo Poisson 1 8 16 ou seja
log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t
Tabela 37 DIC pD e mls para acidentes tipo 1
Modelo DIC pD mls
P 1 8 1 1940548 47786 458
P 1 8 16 1939877 47789 458
BN 1 6 1 1861278 25154 419
BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
33 Modelos espaco-temporais 49
No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as
covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se
manter as covariaveis no modelo
334 Validacao dos modelos para acidentes do tipo 1
Validacao do modelo P 1 8 16 e do modelo BN 1 6 172
Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172
Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do
que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela
37 O valor da media do logscore tambem e significativamente menor de acordo com
o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores
PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O
valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo
BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes
sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do
tipo 1
335 Resultados obtidos com modelos para acidentes do tipo 1
Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172
A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um
efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma
50 Capıtulo 3 Aplicacoes
diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo
1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16
e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo
BN 1 6 172
Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172
Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max
SMR1 00000 07512 09656 10020 12360 32610
RR1 8 1 02290 07728 09663 09989 11870 28890
RR1 8 16 02274 07722 09628 09979 11860 28770
RR1 6 1 02886 07807 09599 10010 11890 24480
RR1 6 172 02852 07798 09589 09999 11870 24400
Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de
33 Modelos espaco-temporais 51
confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-
bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com
os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-
nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172
Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172
Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados
52 Capıtulo 3 Aplicacoes
os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo
P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000
Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para
o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312
se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de
33 Modelos espaco-temporais 53
suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos
erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais
Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000
Relativamente a introducao das covariaveis comprimento de estrada e quantidade de
combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia
dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis
explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao
explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados
espacialmente
Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1
Efeitos fixosmedia dp 0025q 0975q
α1 00580 00074 00435 00723
γ1 -00263 00030 -00321 -00204
Variancia dos efeitos aleatorios
σ2s1 05816 00591 04706 07001
σ2δ1
00019 00002 00015 00023
Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1
54 Capıtulo 3 Aplicacoes
mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-
plicacao da variacao associada aos efeitos temporais
Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel
vendido influenciam significativamente a variacao geografica dos riscos relativos sao
consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem
de forma positiva para a variacao os riscos o que significa que em regioes com maior
comprimento de estrada e em regioes com maior quantidade de combustıvel vendido
esta associado um aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16
Efeitos fixosmedia dp 0025q 0975q
α1 -00898 00354 -01595 -00207
b1C 00016 00004 00008 00024
b1V C 00003 00001 00002 00005
γ1 -00257 00030 -00315 -00198
Variancia dos efeitos aleatorios
σ2s1 05492 00560 04440 06615
σ2δ1
00019 00002 00015 00023
No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada
do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da
ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos
espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-
buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou
efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves
dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos
temporais σ2ψ1
se mantem o que implica que as covariaveis nao contribuem para a ex-
plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o
modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao
e significativa
Mais uma vez as covariaveis que influenciam significativamente a variacao geografica
dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-
variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que
33 Modelos espaco-temporais 55
regioes com maior comprimento de estrada regioes com maior ocupacao de solo com
equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento
turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos
os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-
mente para a estimacao dos riscos o que significa que em regioes com maior numero de
habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo
fixos todos os restantes efeitos
Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1
Efeitos fixosmedia dp 0025q 0975q
α1 -00429 00052 -00595 -00389
Parametro de dispersao φminus11 00298 00017 00267 00332
Variancia dos efeitos aleatorios
σ2s1 02603 00266 02108 03142
σ2ψ1
00090 00057 00029 00237
Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172
Efeitos fixosmedia dp 0025q 0975q
α1 -01348 00243 -01826 -00872
b1C 00013 00003 00007 00019
b1P -00135 00044 -00221 -00049
b1OSEUP 00001 000008 -000005 00003
b1OST 00001 000006 -0000003 00002
Parametro de dispersao φminus11 00300 00017 00269 00334
Variancia dos efeitos aleatorios
σ2s1 02438 00254 01966 02951
σ2ψ1
00090 00056 00029 00235
Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente
56 Capıtulo 3 Aplicacoes
espacial contribui fortemente para a variacao geografica do risco relativo O padrao e
muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes
com maior risco relativo estimado correspondem as regioes em que as estimativas dos
efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-
dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo
proximo de um correspondem as regioes em que as estimativas de si sao proximas de
zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade
HPD nao contem o zero e 633 para o modelo P 1 4 16
Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16
Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16
33 Modelos espaco-temporais 57
A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0
eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao
longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio
anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta
tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores
correspondente a diminuicao das estimativas dos riscos ao longo dos anos
Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16
Min 1oQ Mediana Media 3oQ Max
δ1 -00919 -00254 -00476 00768 00197 00133
eδ1 09125 09751 09954 10010 10200 11420
Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16
Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de
credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1
a tendencia temporal local e maior que a tendencia global sendo o decrescimento do
numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia
58 Capıtulo 3 Aplicacoes
temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia
temporal local e menor do que a global sendo o decrescimento mais acentuado No
mapa da Figura 315 pode ver-se a distribuicao destes concelhos
Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um
sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada
na Tabela A8 do Anexo A
Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172
Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172
Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos
mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial
33 Modelos espaco-temporais 59
contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado
e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com
menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si
sao proximas de zero Para este modelo a percentagem de estimativas dos valores de
s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente
a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos
seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais
acentuado nos cinco anos seguintes
Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172
Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo
BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um
aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os
restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-
gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos
estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel
contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i
no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54
Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a
percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento
turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como
os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de
60 Capıtulo 3 Aplicacoes
(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo
da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel
OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com
equipamentos turısticos vai de 0 a 038
Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172
Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172
Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior
33 Modelos espaco-temporais 61
que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos
com risco relativo significativamente maior que um
336 Modelos para acidentes do tipo 2
Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192
log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +
b2DPDP2it + s2i + (γ2 + δ2i)t
e
log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t
No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente
das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519
pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo
Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o
modelo P 2 9 16 ou seja
log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t
No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-
variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e
pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-
delo BN 2 9 4 ou seja
log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t
Tabela 314 DIC pD e mls para acidentes tipo 2
modelo DIC pD mls
P 2 9 1 1170386 35334 270
P 2 9 16 1169631 35476 270
BN 2 9 1 1156921 29101 261
BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
62 Capıtulo 3 Aplicacoes
337 Validacao dos modelos para acidentes do tipo 2
Validacao do modelo P 2 9 16 e do modelo BN 2 9 4
Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4
Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-
ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual
a 13956 O valor da media do logscore tambem e significativamente menor de acordo
com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos
valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura
322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para
o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes
sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do
tipo 2
338 Resultados obtidos com modelos para acidentes do tipo 2
Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4
A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as
estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre
um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das
estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados
a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores
esperados a posteriori obtidos com o modelo BN 2 9 4
33 Modelos espaco-temporais 63
Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4
Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os
modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max
SMR2 00000 05062 09180 11830 15740 87830
RR2 9 1 02237 06553 09651 11910 14980 77550
RR2 9 16 02218 06547 09624 11860 14970 77060
RR2 9 1 nb 02391 06636 09751 11870 14960 59240
RR2 9 4 nb 02363 06630 09720 11810 14850 59030
64 Capıtulo 3 Aplicacoes
Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo
P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes
33 Modelos espaco-temporais 65
do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000
Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000
66 Capıtulo 3 Aplicacoes
Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000
Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das
covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo
Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja
as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos
sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito
espacial
Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03511 00191 03135 03883
γ2 -00844 00037 -00918 -00771
Variancia dos efeitos aleatorios
σ2s2 09474 01054 07554 11648
σ2δ2
00099 00016 00070 00133
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-
plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao
33 Modelos espaco-temporais 67
para a variacao geografica das estimativas dos riscos e positiva em regioes com maior
comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao
para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos
Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16
Efeitos fixosmedia dp 0025q 0975q
α2 01790 00530 00741 02822
b2C 00020 00005 00009 00031
b2V C -00004 00003 -00010 00003
γ2 -00833 00038 -00906 -00759
Variancia dos efeitos aleatorios
σ2s2 09162 01019 07325 11282
σ2δ2
00099 00016 00015 00135
Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com
a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos
efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma
efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam
incluıdos no modelo P 2 9 1 atraves do efeito espacial
Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03529 00223 03090 03965
γ2 -00819 00044 -00906 -00733
Parametro de dispersao φminus11 00577 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07824 00925 06156 09748
σ2δ2
00051 00012 00031 00079
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
68 Capıtulo 3 Aplicacoes
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao
associada aos efeitos temporais Para alem disso como a contribuicao para a variacao
geografica das estimativas dos riscos e positiva em regioes com maior comprimento de
estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos
os restantes efeitos
Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4
Efeitos fixosmedia dp 0025q 0975q
α2 01961 00530 00741 02822
b2C 00017 00005 00008 00027
γ2 -00814 00044 -00900 -00727
Parametro de dispersao φminus11 00576 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07516 00894 05914 09385
σ2δ2
00052 00013 00031 00080
Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16
33 Modelos espaco-temporais 69
Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode
verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o
padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado
correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as
regioes com menor risco relativo estimado correspondem as regioes em que as estimativas
de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes
em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem
de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero
e 608
Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era
esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou
seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem
de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295
Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16
Min 1oQ Mediana Media 3oQ Max
δ2 -01805 -00411 00082 00003 00485 01532
eδ2 08358 09604 10090 10030 10500 11660
No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se
que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia
70 Capıtulo 3 Aplicacoes
temporal local maior do que a global e um decrescimento no numero de acidentes do tipo
2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local
menor que a global e um decrescimento mais acentuado
Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16
E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um
obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um que permite complementar esta informacao
Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-
temente para a variacao geografica do risco relativo como se pode observar no mapa da
Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-
mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes
com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao
proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i
cujo intervalo de credibilidade HPD nao contem o zero e 5665
33 Modelos espaco-temporais 71
Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4
Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4
Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4
Min 1oQ Mediana Media 3oQ Max
δ1 -01530 -00368 00052 00001 00402 01140
eδ1 08592 09646 10060 10020 10420 11210
72 Capıtulo 3 Aplicacoes
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca
no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de
78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de
valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa
da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a
global sendo o seu decrescimento menos acentuado que o decrescimento global havendo
uma minoria onde se passa o contrario
Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4
Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior
que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao
com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista
ordenada dos primeiros quinze concelhos
33 Modelos espaco-temporais 73
339 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6
log(θ3ij) = α3 + b3CCi + s3i + ψ3t
e
log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t
No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a
covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo
P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1
log(θ3ij) = α3 + s3i + ψ3t
No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade
populacional nao contem o zero por isso o modelo mantem-se
Tabela 322 DIC pD e mls para acidentes tipo 3
modelo DIC pD mls
P 3 6 1 846290 20551 191
P 3 6 4 846237 20562 191
BN 3 6 1 852438 19770 191
BN 3 6 6 852362 19267 191
3310 Validacao dos modelos para acidentes do tipo 3
Validacao do modelo P 3 6 1 e do modelo BN 3 6 6
Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e
menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072
Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos
valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia
preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo
74 Capıtulo 3 Aplicacoes
ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se
que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3
Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6
3311 Resultados obtidos com modelos para acidentes do tipo 3
Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6
Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max
SMR3 00000 04639 11050 15100 20490 156700
RR3 6 1 01363 08869 13050 14900 18430 95400
RR3 6 6 bn 01247 09020 13170 14850 18370 87310
Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo
obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-
vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores
esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos
valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e
Tabela 323
33 Modelos espaco-temporais 75
Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6
Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6
Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-
76 Capıtulo 3 Aplicacoes
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os
modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6
Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000
Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo
P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
33 Modelos espaco-temporais 77
Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000
Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem
comentarios acerca de associacao regional para este modelo
78 Capıtulo 3 Aplicacoes
No modelo BN observa-se que com a introducao da covariavel densidade populacional o
valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da
variancia dos efeitos temporais σ2ψ1t
se mantem Tabelas 325 e 326
Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02114 00152 01815 02410
Variancia dos efeitos aleatorios
σ2s3 06817 00802 05383 08499
σ2ψ3
00255 00157 00082 00660
Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02155 00158 01842 02464
Parametro de dispersao ψminus11 00455 00061 00348 00584
Variancia dos efeitos aleatorios
σ2s3 06497 00800 05070 08174
σ2ψ3
00255 00161 00081 00672
Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6
Efeitos fixosmedia dp 0025q 0975q
α3 02791 00217 02362 03215
bDP -00199 00048 -00294 -00105
Parametro de dispersao φminus11 00459 00061 00350 00588
Variancia dos efeitos aleatorios
σ2s3 05855 00749 04532 07440
σ2ψ3
00255 00161 00081 00672
Tal significa que a covariavel densidade populacional contribui para a explicacao da
33 Modelos espaco-temporais 79
variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao
da variacao temporal A contribuicao da covariavel densidade populacional e negativa
o que indica que em regioes com maior densidade populacional ocorre a contribuicao
para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos
No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a
sobredispersao nao e significativa
Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1
Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1
80 Capıtulo 3 Aplicacoes
O padrao espacial das estimativas do risco relativo e das estimativas da componente
espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras
342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao
positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos
efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem
o zero e 439 para o modelo P 3 6 1
No que respeita a componente temporal observa-se um decrescimento nos dois primeiros
anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento
nos ultimos cinco anos
Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1
Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco
relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a
lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-
tivamente maior que um na Tabela A9 do Anexo A
33 Modelos espaco-temporais 81
Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6
Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6
Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os
padroes revelados pelos mapas As regioes com maior contribuicao da componente es-
pacial para o aumento do risco relativo correspondem em geral a regioes com maiores
estimativas de risco relativo Tal significa que a componente espacial explica grande parte
da variacao das estimativas do risco relativo A percentagem de estimativas dos valores
de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1
82 Capıtulo 3 Aplicacoes
Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6
A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo
modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode
ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se
pode encontrar uma lista ordenada dos primeiros quinze concelhos
Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se
apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista
o tipo de interacao espaco-temporal
Tabela 327 Modelos univariados
Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal
1 BN 1 6 172 C+P+OSEPU+OST RW mdash
2 BN 2 9 4 C fixo CAR
3 P 3 6 1 mdash RW mdash
34 Modelos multivariados 83
34 Modelos multivariados
Os modelos multivariados usados foram
log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)
log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)
Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-
tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito
complexos nao parece haver um ganho substancial em usa-los
Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados
Modelos multivariados Modelos univariados
Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q
α1 00565 00181 00214 00914 00580 00074 00435 00723
α2 03423 00344 02735 04083 03511 00191 03135 03883
α3 05993 00331 05340 06644 06633 00247 06147 07115
γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204
γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771
γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907
Σu =
05551 03843 05519
03843 1042 05864
05519 05864 09113
Σδ =
00074 00035 00061
00035 00111 00059
00061 00059 00081
No entanto e interessante verificar que em termos de correlacao entre as estimativas
dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo
2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao
que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios
nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e
tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no
numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330
84 Capıtulo 3 Aplicacoes
Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal
Modelos com interacao Modelos sem interacao
media dp 0025q 0975q media dp 0025q 0975q
ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669
ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879
ρ23(θ) 06793 00242 06304 07252 06831 002647 07326
ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196
ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941
ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976
ρ12(δ) 03823 00894 01960 05465
ρ13(δ) 07979 00634 06487 08998
ρ23(δ) 06203 00938 04153 07829
Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias
AnoVıtimas mortais Feridos graves Feridos leves
24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif
2010 741 937 196 2637 2475 -162 43924 43890 -34
2011 689 891 202 2436 2265 -171 39726 39695 -31
34 Modelos multivariados 85
Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados
86 Capıtulo 3 Aplicacoes
Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
35 Aplicacao para acidentes rodoviarios nas estradas
secundarias
Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-
cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram
retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-
damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior
risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do
poder local
Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840
Total 175741 16909 3471 196121
Figura 350 Numero de acidentes tipo 1 por concelho
88 Capıtulo 3 Aplicacoes
Figura 351 Numero de acidentes tipo 2 por concelho
Figura 352 Numero de acidentes tipo 3 por concelho
No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados
Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89
de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos
Tabela 332 DIC pD e mls para cada tipo de acidente
Modelo DIC pD mls
BN 1 9 42 1614530 32359 363
BN 2 9 246 924765 27530 208
P 3 6 30 581058 11747 131
351 Modelo para acidentes do tipo 1
Modelo Binomial Negativo 1 9 42
log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t
Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a
variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do
modelo
352 Validacao do modelo para acidentes do tipo 1
Validacao do modelo BN 1 9 42
Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42
O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-
pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O
90 Capıtulo 3 Aplicacoes
valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem
um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-
ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42
e o melhor modelo para acidentes do tipo 1
353 Resultados obtidos com o modelo para acidentes do tipo 1
Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42
Efeitos fixosmedia dp 0025q 0975q
α1 -03518 00346 -04202 -02843
b1C 00012 00004 00005 00019
b1OST 00001 000007 -000005 00002
γ1 -00128 00026 -00179 -00077
Parametro de dispersao φminus11 00287 00021 00248 00328
Variancia dos efeitos aleatorios
σ2s1 03982 00445 03180 04909
σ2δ1
00026 00007 00015 00040
Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91
As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico
influenciam significativamente a variacao geografica dos riscos relativos e portanto sao
consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de
forma positiva para a variacao dos riscos o que significa que em regioes com maior
comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma
contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes
efeitos
Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-
derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura
temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao
envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial
se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de
risco relativo Figuras 354 e 316
Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42
Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco
relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um
92 Capıtulo 3 Aplicacoes
354 Modelo para acidentes do tipo 2
Modelo Binomial Negativo 2 9 246
log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +
s2i + (γ2 + δ2i)t2
Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de
todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938
pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e
manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja
log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2
Tabela 334 DIC pD e mls
Modelo DIC pD mls
BN 2 9 86 924868 24786 208
355 Validacao do modelo para acidentes do tipo 2
Validacao do modelo BN 2 9 86
Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86
O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo
Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93
do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto
proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e
95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor
modelo para acidentes do tipo 2
356 Resultados obtidos com o modelo para acidentes do tipo 2
Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86
Efeitos fixosmedia dp 0025q 0975q
α2 -01198 00480 -02147 -00266
b1OSI 00002 000008 000007 00004
b1OSEPU 00003 00002 000001 00006
b1DP 00084 00066 -00046 00215
γ1 -01198 00480 -02147 -00266
Parametro de dispersao
φminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 10557 01336 08161 13345
σ2δ1
00094 00023 00057 00147
A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-
nos e a densidade populacional influenciam significativamente a variacao geografica dos
riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-
variaveis contribuem de forma positiva para a variacao dos riscos o que significa que
em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo
com equipamentos e parques urbanos e a regioes com maior densidade populacional ha
contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes
do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a
mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao
Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que
os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos
94 Capıtulo 3 Aplicacoes
concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns
conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas
do risco relativo sao os mesmos
Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86
Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95
A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com
o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que
consta na Tabela A11
357 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 30
log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt
Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU
contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo
358 Validacao do modelo para acidentes do tipo 3
Validacao do modelo P 3 6 30
Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30
Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da
distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-
mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores
igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva
e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para
acidentes do tipo 3
96 Capıtulo 3 Aplicacoes
359 Resultados obtidos com o modelo para acidentes do tipo 3
Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30
Efeitos fixosmedia dp 0025q 0975q
α2 00104 00520 -00923 01117
b3A 00258 00116 00031 00049
b3OSEPU -00001 00001 -00004 000006
Parametro de dispersao
ψminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 03598 00687 02422 05084
σ2ψ1
00246 00163 0007 00666
Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30
A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam
significativamente a variacao geografica dos riscos relativos sendo consideradas na es-
timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97
a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial
em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes
com maior area geografica ha uma contribuicao para o aumento das estimativas do risco
relativo mantendo fixos todos os restantes efeitos
O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de
trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-
trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico
mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No
entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos
Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30
E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo
modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que
consta na Tabela A11
Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-
mente a abordagem global e a abordagem local
98 Capıtulo 3 Aplicacoes
Tabela 337 Comparacao entre a abordagem local e a global
Abordagem Tipo Melhor Covariaveis Efeito Interacao
Modelo temporal espaco-temporal
Local 1 BN 1 9 42 C+OST fixo CAR
Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash
Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR
Gloal 2 BN 2 9 4 C fixo CAR
Local 3 P 3 6 30 A+OSEUP aleatorio mdash
Global 3 P 3 6 1 mdash aleatorio mdash
4Discussao e conclusoes
Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia
de dependencia espacial de tendencia temporal e de associacao regional em dados de
acidentes rodoviarios
Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-
delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por
areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar
diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao
espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel
recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados
com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de
trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de sobredispersao de associacao posi-
tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-
mentos e parques urbanos e uma associacao regional negativa com a populacao
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
100 Capıtulo 4 Discussao e conclusoes
bredispersao e de associacao regional positiva com o comprimento de estrada
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente
Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com o comprimento de estrada e com
a area de ocupacao do solo para turismo
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com a area de ocupacao de solo para
a industria com a area de ocupacao do solo com equipamentos e parques urbanos
e com a densidade populacional
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente de associacao regional
positiva com a area e de associacao regional negativa com a area de ocupacao de
solo com equipamentos e parques urbanos
Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-
se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas
Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com
interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao
do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido
o modelo Poisson com efeito temporal aleatorio
Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos
modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-
tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se
capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes
espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-
formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que
as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto
e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas
as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de
valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais
elevados diminuiram ou seja os valores extremos foram suavizados
101
Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos
dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-
gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi
possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia
temporal global Este e um tipo de resultado muito importante na fase de aplicacao
pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter
exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas
Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-
minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as
covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam
incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-
fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal
Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores
usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal
considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para
todos os anos em estudo
Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos
mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-
pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a
ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-
cativamente maior que um bem como as dos concelhos com valores consideravelmente
menores do que a unidade
Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-
timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises
por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-
pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de
estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-
nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o
TDMA de modo a introduzi-las no modelo
Os modelos multivariados constituiram um esforco computacional elevado nao tendo
havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises
comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi
possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes
tipos de acidentes
Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves
do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo
uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-
ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA
102 Capıtulo 4 Discussao e conclusoes
pela extrema concordancia de resultados pela facilidade de implementacao dos modelos
pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez
de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem
duvida muito mais acessıvel
Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-
dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de
um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-
patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de
recolha e definicao das variaveis de interesse A implementacao estes modelos tambem
pode ser efetuada atraves do R-INLA
Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir
como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-
dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite
efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-
gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade
dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas
geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios
constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel
mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-
sabilidade de todosrdquo
ACaracterizacao da regiao de estudo
A1 Portugal Continental
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes
administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados
em 18 distritos
O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a
partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na
pagina do Instituto Geografico Portugues - httpwwwigeopt
A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o
map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-
hancas no WinBUGS
104 Apendice A Caracterizacao da regiao de estudo
Figura A1 ID dos concelhos do Norte de Portugal Continental
A1 Portugal Continental 105
Figura A2 ID dos concelhos do Sul de Portugal Continental
106 Apendice A Caracterizacao da regiao de estudo
A1 Portugal Continental 107
108 Apendice A Caracterizacao da regiao de estudo
A2 Numero de acidentes
Tabela A1 Estatısticas resumo de acidentes tipo 1
Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200
Tabela A2 Estatısticas resumo de acidentes tipo 2
Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800
Tabela A3 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100
A2 Numero de acidentes 109
Numero de acidentes que ocorreram nas estradas secundarias
Tabela A4 Estatısticas resumo de acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900
Tabela A5 Estatısticas resumo de acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800
Tabela A6 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700
110 Apendice A Caracterizacao da regiao de estudo
A3 Covariaveis
bull Populacao - P
Tabela A7 Estatısticas resumo da covariavel populacao
Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700
Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)
A3 Covariaveis 111
bull Area - A
Figura A4 Area em centenas de km2 por concelho (Fonte INE)
bull Densidade Populacional - DP
Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)
112 Apendice A Caracterizacao da regiao de estudo
bull Comprimento de Estrada - C
Figura A6 Quilometros de estrada por concelho (Fonte EP)
bull Quantidade de combustıvel vendido - VC
Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)
A3 Covariaveis 113
bull Ocupacao urbana do solo - OSU
Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
bull Ocupacao industrial do solo - OSI
Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)
114 Apendice A Caracterizacao da regiao de estudo
bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU
Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)
bull Ocupacao do solo com equipamento turıstico - OST
Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
A4 15 concelhos 115A
415
con
celh
os
Tab
ela
A8
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o1
Mold
elo
P1
816
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alb
ergaria
-a-V
elh
a3
Castro
Marim
Alc
acer
do
Sal
Grandola
Castro
Marim
Castro
Marim
Castro
Marim
Alb
ergaria
-a-V
elh
aV
ouzela
4A
lcacer
do
Sal
Castro
Marim
Castro
Marim
Grandola
Grandola
Alb
ergaria
-a-V
elh
aC
astro
Marim
Alc
acer
do
Sal
5V
izela
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
Vila
Velh
ade
Rodao
Pedrogao
Grande
6C
ondeix
a-a
-Nova
Azam
buja
Azam
buja
Azam
buja
Obid
os
Penela
Penela
Vila
Velh
ade
Rodao
7A
zam
buja
Viz
ela
Alj
ezur
Obid
os
Penela
Obid
os
Alj
ezur
Penela
8Silves
Alj
ezur
Obid
os
Condeix
a-a
-Nova
Azam
buja
Grandola
Obid
os
Alj
ezur
9A
lbufe
ira
Silves
Pom
bal
Pom
bal
Pom
bal
Vila
Velh
ade
Rodao
Pedrogao
Grande
Obid
os
10
Alj
ezur
Obid
os
Palm
ela
Penela
Alb
ergaria
-a-V
elh
aP
om
bal
Vouzela
Castro
Marim
11
Palm
ela
Pom
bal
Benavente
Palm
ela
Condeix
a-a
-Nova
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oE
sposende
12
Benavente
Benavente
Silves
Benavente
Vila
Velh
ade
Rodao
Azam
buja
Pom
bal
Montem
or-o
-Velh
o13
Pom
bal
Palm
ela
Penela
Vagos
Benavente
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
Tabua
14
Obid
os
Alb
ufe
ira
Olh
ao
Silves
Palm
ela
Condeix
a-a
-Nova
Esposende
Oliveir
ado
Bair
ro
15
Marin
ha
Grande
Olh
ao
Vagos
Olh
ao
Montem
or-o
-Velh
oP
edrogao
Grande
Tabua
Cham
usca
Mold
elo
BN
16
172
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
3C
astro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
4G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
5O
bid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
6C
ondeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
7A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
8P
om
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
9B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
10
Penela
Penela
Penela
Penela
Penela
Penela
Penela
Penela
11
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
12
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
13
Palm
ela
Alb
ergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
a14
Alb
ergaria
-a-V
elh
aP
alm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
15
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
o
116 Apendice A Caracterizacao da regiao de estudo
Tab
ela
A9
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o2
Modelo
P2
916
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ouriq
ue
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Alj
ustrel
4A
lcacer
do
Sal
Alc
acer
do
Sal
Avis
Nis
aO
urem
Nis
aA
ljustrel
Avis
5A
vis
Avis
Alc
acer
do
Sal
Rio
Maio
rN
isa
Alj
ustrel
Nis
aM
ourao
6C
ham
usca
Nis
aN
isa
Alj
ezur
Alc
acer
do
Sal
Mourao
Mourao
Nis
a7
Santarem
Cham
usca
Alj
ezur
Alc
acer
do
Sal
Alj
ustrel
Pedrogao
Grande
Pedrogao
Grande
Pedrogao
Grande
8V
ila
Nova
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rA
lcacer
do
Sal
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
da
Barquin
ha
da
Barquin
ha
9N
isa
Santarem
Vila
Nova
Pedrogao
Grande
Mourao
Ourem
Alc
acer
do
Sal
Proenca-a
-Nova
da
Barquin
ha
10
Alm
eir
imV
endas
Novas
Pedrogao
Grande
Mourao
Pedrogao
Grande
Ferreir
ado
Ale
ntejo
Proenca-a
-Nova
Alc
acer
do
Sal
11
Gole
ga
Montem
or-o
-Novo
Alj
ustrel
Vila
Nova
Ferreir
ado
Ale
ntejo
Rio
Maio
rG
randola
Idanha-a
-Nova
da
Barquin
ha
12
Vendas
Novas
Alj
ezur
Santarem
Cham
usca
Montem
or-o
-Novo
Montem
or-o
-Novo
Rio
Maio
rG
randola
13
Gavia
oG
avia
oM
ontem
or-o
-Novo
Montem
or-o
-Novo
Vila
Nova
Grandola
Ourem
Alm
odovar
da
Barquin
ha
14
Palm
ela
Gole
ga
Mourao
Ferreir
ado
Ale
ntejo
Grandola
Proenca-a
-Nova
Montem
or-o
-Novo
Montem
or-o
-Novo
15
Montem
or-o
-Novo
Alm
eir
imV
endas
Novas
Grandola
Cham
usca
Vila
Nova
Vila
Velh
ade
Rodao
Celo
ric
oda
Beir
ada
Barquin
ha
Modelo
BN
29
4
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ourem
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Avis
Alj
ustrel
4A
vis
Avis
Rio
Maio
rA
ljezur
Ourem
Nis
aA
ljustrel
Avis
5A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Nis
aN
isa
Alj
ustrel
Nis
aN
isa
6C
ham
usca
Nis
aN
isa
Alc
acer
do
Sal
Alc
acer
do
Sal
Ourem
Mourao
Mourao
7V
ila
Nova
Cham
usca
Alj
ezur
Rio
Maio
rA
ljustrel
Alc
acer
do
Sal
Alc
acer
do
Sal
Pedrogao
Grande
da
Barquin
ha
8Santarem
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rM
ourao
Pedrogao
Grande
Alc
acer
do
Sal
9N
isa
Santarem
Vila
Nova
Mourao
Mourao
Pedrogao
Grande
Ferreir
aFerreir
ada
Barquin
ha
do
Ale
ntejo
do
Ale
ntejo
10
Montem
or-o
-Novo
Alj
ezur
Alj
ustrel
Vila
Nova
Pedrogao
Grande
Rio
Maio
rO
urem
Proenca-a
-Nova
da
Barquin
ha
11
Vendas
Novas
Montem
or-o
-Novo
Santarem
Cham
usca
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
Rio
Maio
rC
elo
ric
oda
Beir
a12
Gole
ga
Alj
ustrel
Montem
or-o
-Novo
Pedrogao
Grande
Montem
or-o
-Novo
Montem
or-o
-Novo
Proenca-a
-Nova
Ourem
13
Salv
aterra
de
Magos
Vendas
Novas
Mourao
Montem
or-o
-Novo
Vila
Nova
Grandola
Montem
or-o
-Novo
Grandola
da
Barquin
ha
14
Alm
eir
imM
ourao
Pedrogao
Grande
Ferreir
aC
ham
usca
Vila
Nova
Grandola
Idanha-a
-Nova
do
Ale
ntejo
da
Barquin
ha
15
Alj
ezur
Salv
aterra
de
Magos
Ferreir
ado
Ale
ntejo
Grandola
Grandola
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aM
ontem
or-o
-Novo
A4 15 concelhos 117
Tab
ela
A1
015
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o3
Modelo
P3
61
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
Ferreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9C
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a10
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
11
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
12
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
13
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Modelo
BN
36
6
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9A
zam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
10
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
11
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a12
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
13
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
118 Apendice A Caracterizacao da regiao de estudoT
abel
aA
11
15co
nce
lhos
com
esti
mati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
Acid
entes
tip
o1
-M
odelo
BN
19
42
2000
2001
2002
2003
2004
2005
2006
2007
1M
arin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Ilhavo
Ilhavo
Ilhavo
Ilhavo
2Il
havo
Ilhavo
Ilhavo
Ilhavo
Marin
ha
Grande
Marin
ha
Grande
Vagos
Vagos
3A
lbufe
ira
Alb
ufe
ira
Vagos
Vagos
Vagos
Vagos
Marin
ha
Grande
Ferreir
ado
Zezere
4P
ortim
ao
Portim
ao
Alb
ufe
ira
Portim
ao
Portim
ao
Ferreir
ado
Zezere
Ferreir
ado
Zezere
Marin
ha
Grande
5V
agos
Vagos
Portim
ao
Porto
Porto
Portim
ao
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
6P
orto
Porto
Porto
Alb
ufe
ira
Ferreir
ado
Zezere
Porto
Porto
Montem
or-o
-Velh
o7
Faro
Penic
he
Penic
he
Penic
he
Penic
he
Penic
he
Portim
ao
Alp
iarca
8L
oule
Faro
Faro
Faro
Alb
ufe
ira
Oliveir
ado
Bair
ro
Montem
or-o
-Velh
oP
orto
9P
enic
he
Loule
Viz
ela
Ferreir
ado
Zezere
Coim
bra
Montem
or-o
-Velh
oP
enic
he
Penic
he
10
Odiv
ela
sO
div
ela
sC
oim
bra
Coim
bra
Faro
Coim
bra
Coim
bra
Coim
bra
11
Viz
ela
Viz
ela
Odiv
ela
sV
izela
Montem
or-o
-Velh
oA
lbufe
ira
Alp
iarca
Portim
ao
12
Olh
ao
Coim
bra
Loule
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Faro
Pom
bal
Pom
bal
13
Nazare
Olh
ao
Ferreir
ado
Zezere
Odiv
ela
sV
izela
Aveir
oA
veir
oA
veir
o14
Coim
bra
Setubal
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Aveir
oP
om
bal
Faro
Vis
eu
15
Setubal
Cantanhede
Setubal
Aveir
oP
om
bal
Viz
ela
Murtosa
Lis
boa
Acid
entes
tip
o2
-M
odelo
BN
29
86
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ourem
Ourem
Ourem
Ourem
Ourem
S
J
Madeir
a2
Rio
Maio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rFerreir
aZ
O
dem
ira
Odem
ira
3A
lmeir
imFerreir
aZ
Ferreir
aZ
Ferreir
aZ
Ferreir
aZ
R
ioM
aio
rFerreir
aZ
Ferreir
aZ
4
Ferreir
ado
Zezere
Alm
eir
imB
raganca
Braganca
Braganca
Odem
ira
S
J
Madeir
aV
izela
5Santarem
Braganca
Avis
Odem
ira
Odem
ira
Mourao
Braganca
Braganca
6L
isboa
Lis
boa
Odem
ira
Mourao
Mourao
Braganca
Rio
Maio
rO
urem
7C
ham
usca
Santarem
Lis
boa
Avis
Avis
S
J
Madeir
aA
lmodovar
Alm
odovar
8B
raganca
Cham
usca
Mourao
Lis
boa
Vim
ioso
Avis
Viz
ela
Tondela
9P
alm
ela
Avis
Santarem
Cham
usca
Ala
ndroal
Vim
ioso
Tondela
Chaves
10
Salv
aterra
de
Magos
Palm
ela
Cham
usca
Palm
ela
S
J
Madeir
aA
lmodovar
Chaves
Rio
Maio
r11
Avis
Salv
aterra
de
Magos
Alm
eir
imSantarem
Alm
odovar
Chaves
Elv
as
Guim
araes
12
Ilhavo
Odem
ira
Palm
ela
Ala
ndroal
Elv
as
Ala
ndroal
Serta
13
Vila
Nova
da
Barquin
ha
Mourao
Salv
aterra
de
Magos
Elv
as
Palm
ela
Tondela
Palm
ela
14
Nazare
Vila
Nova
da
Barquin
ha
Ala
ndroal
Alm
eir
imC
ham
usca
Elv
as
Portim
ao
15
Abrantes
Ala
ndroal
Lagos
Salv
aterra
de
Magos
Lis
boa
Palm
ela
Loule
Acid
entes
tip
o3
-M
odelo
P3
630
2000
2001
2002
2003
2004
2005
2006
2007
1O
dem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
2M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
3V
imio
so
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Cantanhede
4F
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
o5
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
6M
iranda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
7A
lmodovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
8Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
9A
lcoutim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
10
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
11
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
12
Alc
ochete
Alc
ochete
Alc
ochete
Macedo
de
Cavale
iros
Alc
ochete
Alc
ochete
13
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Vagos
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
14
Vagos
Vagos
Vagos
Cantanhede
Vagos
Vagos
15
Cantanhede
Cantanhede
Cantanhede
Alc
ochete
Cantanhede
Cantanhede
Referencias Bibliograficas
Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes
in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625
ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt
Defaultaspxtabid=220amplanguage=pt-PT
ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx
fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT
Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population
density Statistics in Medicine 18(16) 2147ndash2162
Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety
performance indicators by using a multivariate generalized linear mixed model Journal
of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517
Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis
for Spatial Data Chapman amp Hall
Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease
maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431
Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini
M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med
14(21-22) 2433ndash2443
Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis
of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007
Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems
Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236
Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-
tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20
101007BF00116466
120 Referencias bibliograficas
Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis
with R Springer
Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed
Models Journal of the American Statistical Association 88(421) 9ndash25
Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane
roads Accident Analysis amp Prevention 39(4) 657 ndash 670
Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a
velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos
PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico
Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em
Seguranca Rodoviaria Technical report IST and LNEC
Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-
Temporally Correlated Survival Data In Bayesian Statistics 7
Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data
Analysis Chapman amp Hall
Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative
Risks for Use in Disease Mapping Biometrics 43 671ndash681
Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data
Biometrics 65 1254ndash1261
Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao
em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo
20economico20e20social20dos20acidentes_versao20para20internet
Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in
Europe Applied Spatial Analysis 1 133ndash150
Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level
Example of Belgium Journal of Safety Research 39(4) 417 ndash 427
El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate
Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828
Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety
Accident Analysis amp Prevention 40(6) 1964 ndash 1969
Referencias bibliograficas 121
Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis
and Prevention 43 253ndash264
Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall
Gelfand A E (1996) Model determination using sampling-based methods In W
Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice
chapter 9 (pp 145ndash161) Chapman amp
Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive
models for spatial data analysis Biostatistics 4(1) 11ndash15
Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis
Chapman amp Hall
Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for
the analysis of spatial data An application to disease mapping Journal of Statistical
Planning and Inference 75(2) 305 ndash 318
Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and
Estimation Journal of the American Statistical Association 102(477) 359ndash378
Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical
Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808
Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps
with Application to German Mortality Data httpepububuni-muenchende
Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive
Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical
Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD
Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR
Models for Areal Data Biometrics 61(4) 950ndash961
Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease
risk Statistics In Medicine 19(17-18) 2555ndash2567
Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space
Statistics in Medicine 17(18) 2045ndash2060
Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-
demiology CRC Press Taylor amp Francis
122 Referencias bibliograficas
Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-
mann P e Divino F (2000) Disease mapping models an empirical evaluation
Statistics in Medicine 19(17-18) 2217ndash2241
Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-
temporal patterns of intra-city motor vehicle craches Journal of Transport Geography
15 274ndash285
Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical
models in road safety countermeasure effectiveness studies in Iowa Accident Analysis
amp Prevention 40(4) 1531 ndash 1542
Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-
Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis
amp Prevention 40(3) 1123 ndash 1134
Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small
sample size on the estimation of the fixed dispersion parameter of Poisson-gamma
models for modeling motor vehicle crashes A Bayesian perspective Safety Science
46(5) 751 ndash 770
Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-
persion parameters of Poisson-gamma models on empirical Bayes estimates Accident
Analysis amp Prevention 40(4) 1441 ndash 1457
Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-
inflated regression models of motor vehicle crashes balancing statistical fit and theory
Accident Analysis amp Prevention 37(1) 35 ndash 46
Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal
regression model for prediction of crash counts by severity using Bayesian methods
Accident Analysis amp Prevention 40(3) 964 ndash 975
MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident
and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028
Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P
Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive
Statistical Methods (pp 99ndash114) Springer
Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-
tent Gaussian models using integrated nested Laplace approximations A manual for
Referencias bibliograficas 123
the inla program Technical report Norwegian University of Science and Technology
Trondheim
McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall
Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-
provements Decision parameter treatability concept statistical criterion and spatial
dependence Accident Analysis amp Prevention 37(4) 699 ndash 720
Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A
Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57
Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures
for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201
Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle
crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468
Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties
in england Accident Analysis amp Prevention 36(6) 973 ndash 984
OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications
world_health_statistics2008en
OMS (2009) Global status report on road safety httpwhqlibdocwhoint
publications20099789241563840_engpdf
Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao
Calouste Gubenkian
Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes
factors Biometrika 77(3) 455ndash466
Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-
tistics 9(3) 523ndash539
Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis
and output analysis for MCMC R News 6(1) 7ndash11
Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and
heterogeneity An analysis of London crash data Accident Analysis amp Prevention
40(4) 1486 ndash 1497
124 Referencias bibliograficas
R Development Core Team (2008) R A Language and Environment for Statistical
Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-
07-0
Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology
Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications
Chapman amp HallCRC
Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent
gaussian models by using integrated nested laplace approximations Journal of the
Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392
Schrodle B e Held L (2011) A primer on disease mapping and ecological regression
using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2
Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment
and Posterior Inference Journal of Statistical Software 21(11) 1ndash37
Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial
models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)
246 ndash 273
Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian
measures of model complexity and fit J R Statist Soc B 64 583ndash639
Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and
Marginal Densities Journal of the American Statistical Association 81 82ndash86
Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian
Journal of Statistics 31 221ndash229
Wakefield J (2007) Disease mapping and spatial regression with count data Biostat
8(2) 158ndash183
Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press
Taylor amp Francis
A minha mae
Siglas e Acronimos
A Area geografica
AE Autoestrada
ANSR Autoridade Nacional de Seguranca Rodoviaria
BN Binomial Negativo
BT Brigada de Transito
BOA An R Package for MCMC Output Convergence
Assessment and Posterior Inference
BUGS Bayesian Using Gibbs Sampling
C Comprimento de estrada
CARE Community database on accidents on the roads in Europe
CE Codigo de Estrada
CODA Convergence Diagnosis and Output Analysis for MCMC
CPO Conditional Predictive Ordinates
DIC Deviance Information Criterion
DP Densidade populacional
EN Estrada Nacional
ENSR Estrategia Nacional de Seguranca Rodoviaria
GNR Guarda Nacional Republicana
HPD Highest Probability Density
IC Itinerario Complementar
INLA Integrated Nested Laplace Approximations
IP Itinerario Principal
MCMC Markov Chains Monte Carlo
mls Mean logarithmic score
OMS Organizacao Mundial de Saude
ONU Organizacao das Nacoes Unidas
OSEPU Ocupacao do solo com equipamentos e parques urbanos
OSI Ocupacao industrial do solo
OST Ocupacao do solo com equipamento turıstico
OSU Ocupacao urbana do solo
pD Numero efetivo de parametros
PIT Probability Integral Transformation
PMOT Plano Municipal de Ordenamento do Territorio
PMSR Planos Municipais de Seguranca Rodoviaria
PSP Polıcia de Seguranca Publica
R A Language and Environment for Statistical Computing
SafetyNET Projeto europeu European Traffic Information System -
Data Colletion and Analysis Tools for Policy Making
SMR Standard Morbility Ratio
UE Uniao Europeia
WinBUGS versao em ambiente Windows do programa BUGS
VC Quantidade de combustıvel vendido
Conteudo
Lista de Tabelas xiv
Lista de Figuras xv
Introducao 1
1 Nocoes sobre seguranca rodoviaria 9
11 Risco em seguranca rodoviaria 9
12 Caracterizacao dos dados de acidentes 10
13 Caracterizacao da medida de exposicao 14
2 Modelacao estatıstica de acidentes rodoviarios 19
21 Modelos bayesianos hierarquicos 21
22 Modelos nao espaciais 24
23 Modelos espaciais 27
24 Modelos espaco-temporais 28
25 Modelos multivariados 30
26 Metodos de inferencia 32
261 INLA 32
27 Ajustamento e medidas preditivas 36
3 Aplicacoes 39
31 Associacao espacial 40
32 Modelos 43
33 Modelos espaco-temporais 45
331 Associacao regional 46
332 Selecao dos modelos 47
333 Modelos para acidentes do tipo 1 48
334 Validacao dos modelos para acidentes do tipo 1 49
335 Resultados obtidos com modelos para acidentes do tipo 1 49
xii Conteudos
336 Modelos para acidentes do tipo 2 61
337 Validacao dos modelos para acidentes do tipo 2 62
338 Resultados obtidos com modelos para acidentes do tipo 2 62
339 Modelos para acidentes do tipo 3 73
3310 Validacao dos modelos para acidentes do tipo 3 73
3311 Resultados obtidos com modelos para acidentes do tipo 3 74
34 Modelos multivariados 83
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
351 Modelo para acidentes do tipo 1 89
352 Validacao do modelo para acidentes do tipo 1 89
353 Resultados obtidos com o modelo para acidentes do tipo 1 90
354 Modelo para acidentes do tipo 2 92
355 Validacao do modelo para acidentes do tipo 2 92
356 Resultados obtidos com o modelo para acidentes do tipo 2 93
357 Modelos para acidentes do tipo 3 95
358 Validacao do modelo para acidentes do tipo 3 95
359 Resultados obtidos com o modelo para acidentes do tipo 3 96
4 Discussao e conclusoes 99
A Caracterizacao da regiao de estudo 103
A1 Portugal Continental 103
A2 Numero de acidentes 108
A3 Covariaveis 110
A4 15 concelhos 115
Referencias Bibliograficas 119
Lista de Tabelas
11 Numero total de cada tipo de acidentes rodoviarios por ano 11
12 Estatısticas resumo do numero de veıculos com seguro em milhares 14
21 Modelos univariados 30
31 Valores do ındice EBI para cada tipo de acidente por ano 43
32 Valores DIC e mls dos modelos Poisson sem covariaveis 44
33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44
34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45
35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem
covariaveis 46
36 DIC pD e mls para cada tipo de acidente 47
37 DIC pD e mls para acidentes tipo 1 48
38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50
39 Estatısticas resumo dos parametros do modelo P 1 8 1 53
310 Estatısticas resumo dos parametros do modelo P 1 8 16 54
311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55
312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55
313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57
314 DIC pD e mls para acidentes tipo 2 61
315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63
316 Estatısticas resumo para os parametros do modelo P 2 9 1 66
317 Estatısticas resumo para os parametros do modelo P 2 9 16 67
318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67
319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68
320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69
321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71
322 DIC pD e mls para acidentes tipo 3 73
323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74
xiv Lista de Tabelas
324 Estatısticas resumo dos parametros do modelo P 3 6 1 78
325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78
326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78
327 Modelos univariados 82
328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-
tivariado e dos modelos univariados 83
329 Correlacoes dos modelos multivariados com interacao e sem interacao
espaco-temporal 84
330 Vıtimas a 24 horas e vıtimas a 30 dias 84
331 Numero total de cada tipo de acidentes rodoviarios por ano 87
332 DIC pD e mls para cada tipo de acidente 89
333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90
334 DIC pD e mls 92
335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93
336 Estatısticas resumo dos parametros do modelo P 3 6 30 96
337 Comparacao entre a abordagem local e a global 98
A1 Estatısticas resumo de acidentes tipo 1 108
A2 Estatısticas resumo de acidentes tipo 2 108
A3 Estatısticas resumo de acidentes tipo 3 108
A4 Estatısticas resumo de acidentes tipo 1 109
A5 Estatısticas resumo de acidentes tipo 2 109
A6 Estatısticas resumo de acidentes tipo 3 109
A7 Estatısticas resumo da covariavel populacao 110
A8 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 1 115
A9 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 2 116
A10 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 3 117
A11 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 118
Lista de Figuras
1 Dez principais causas de morte no mundo 2
2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4
11 Numero de acidentes tipo 1 por concelho 12
12 Numero de acidentes tipo 2 por concelho 12
13 Numero de acidentes tipo 3 por concelho 13
14 Numero de veıculos com seguro em milhares por concelho e por ano 14
15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15
16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16
17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16
31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de
acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano
2000 41
32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de
veıculos com seguro no ano 2000 41
33 Valores estimados dos SMR1 e respetivos intervalos de confianca para
cada concelho no ano 2000 42
34 Histograma dos valores de EBI simulados e valor de EBI observado para
acidentes tipo 1 e para ano 2000 43
35 Histograma das diferencas entre as medias dos logscores 48
36 Histograma dos valores PIT ajustados para acidentes tipo 1 49
37 Box plot dos valores estimados para acidentes tipo 1 50
38 Amplitude dos intervalos para acidentes tipo 1 51
39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 1 51
310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o
ano 2000 52
xvi Lista de Figuras
311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52
312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53
313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo P 1 8 16 56
314 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo
P 1 8 16 56
315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo P 1 8 16 57
316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 6 172 58
317 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58
318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-
dos com o modelo BN 1 6 172 59
319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com
o modelo BN 1 6 172 60
320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 6 172 60
321 Histograma das diferencas entre as medias dos logscores 61
322 Histograma dos valores PIT ajustados para acidentes tipo 2 62
323 Box plot dos valores estimados para acidentes tipo 2 63
324 Amplitude dos intervalos para acidentes tipo 2 64
325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori dos acidentes tipo 2 64
326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o
ano 2000 65
327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65
328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66
329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo P 2 9 16 68
330 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
P 2 9 16 69
Lista de Figuras xvii
331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2
de 2000 a 2007 obtidos com o modelo P 2 9 16 70
332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 4 71
333 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
BN 2 9 4 71
334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 4 72
335 Histograma dos valores PIT ajustados para acidentes tipo 3 74
336 Box plot dos valores estimados para acidentes tipo 3 75
337 Amplitude dos intervalos para acidentes tipo 3 75
338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76
339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o
ano 2000 76
340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77
341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77
342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 1 79
343 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79
344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3
de 2000 a 2007 obtidos com o modelo P 3 6 1 80
345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo BN 3 6 6 81
346 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81
347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo BN 3 6 6 82
348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos univariados e com os modelos multivariados 85
349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos multivariados 86
350 Numero de acidentes tipo 1 por concelho 87
351 Numero de acidentes tipo 2 por concelho 88
xviii Lista de Figuras
352 Numero de acidentes tipo 3 por concelho 88
353 Histograma dos valores PIT ajustados para acidentes tipo 1 89
354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 9 42 90
355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 9 42 91
356 Histograma dos valores PIT justados para acidentes tipo 2 92
357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 86 94
358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 86 94
359 Histograma dos valores PIT ajustados para acidentes tipo 3 95
360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 30 96
361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo P 3 6 30 97
A1 ID dos concelhos do Norte de Portugal Continental 104
A2 ID dos concelhos do Sul de Portugal Continental 105
A3 Numero de habitantes por concelho e por ano 110
A4 Area por concelho 111
A5 Densidade populacional por concelho 111
A6 Quilometros de estrada por concelho 112
A7 Quantidade de combustıvel vendido por concelho 112
A8 Superfıcie de ocupacao urbana do solo por concelho 113
A9 Superfıcie de ocupacao industrial do solo por concelho 113
A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por
concelho 114
A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114
ldquoThe road to wisdom - Well itacutes plain and simple to express
Err and err and err again but less and less and lessrdquo
Piet Hein (1996)
Introducao
A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora
de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo
automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se
tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao
ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o
Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009
OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes
rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso
entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as
tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa
na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas
etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do
PIB mundial
A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas
necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004
para a quinta causa de morte em 2030
2 Introducao
2004
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Infecoes respiratorias
4 Doencas pulmonares
5 Diarreias
6 HIVAIDS
7 Tuberculose
8Cancro do pulmao
dos bronquios e da traqueia
9 Acidentes rodoviarios
10Recem-nascidos prematuros
e de peso baixo
HH
2030
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Doencas pulmonares
4 Infecoes respiratorias
5 Acidentes rodoviarios
6Cancro do pulmao
dos bronquios e da traqueia
7 Diabetes mellitus
8 Doencas do coracao hipertensas
9 Cancro do estomago
10 HIVAIDS
Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)
No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a
decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-
ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem
disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao
forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes
rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida
No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de
Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-
dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos
socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a
sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario
e Santos 2012)
O sistema de trafego rodoviario um subsistema do sistema de transportes e formado
por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-
fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes
rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos
correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada
e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a
deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos
Introducao 3
(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de
pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se
por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma
qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena
de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do
sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-
guranca deste sistema complexo tem consequencias devastadoras em termos humanos
sociais e economicos (Cardoso 2007)
Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta
consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos
consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-
vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma
descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-
tadas a nıvel mundial
minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-
doviaria
minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios
como um problema de saude publica
minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da
seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial
minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria
minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das
Nacoes Unidas
minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca
Rodoviaria
minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de
Acao para a Seguranca Rodoviaria
Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria
Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-
dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade
responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para
uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos
veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica
sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste
flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area
da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e
tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha
uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes
4 Introducao
projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do
trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para
veıculos tambem designada por sistemas inteligentes de transportes
A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-
volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos
30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-
tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi
progressivamente modernizado tendo sido acompanhado por um aumento do numero
de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal
terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de
toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu
aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver
na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada
a implementacao de algumas medidas especıficas
Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)
As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para
compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios
e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou
regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma
consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica
de dados de acidentes rodoviarios
Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo
pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e
Introducao 5
do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda
lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util
domınio para desenvolvimento de atividades de investigacao O ambito desta tese e
portanto a modelacao estatıstica de dados de acidentes rodoviarios
Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-
retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar
progressivamente a execucao dessas acoes foram identificados varios fatores capazes de
melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em
particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas
com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados
As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma
melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de
intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-
vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada
em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-
dos na UE (CARE - Community database on accidents on the roads in Europe) No
projeto integrado SafetyNET (European Traffic Information System - Data Colletion
and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de
informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas
principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco
e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como
ponto de partida para a modelacao estatıstica usada nesta tese
A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-
nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-
ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos
desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-
cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes
o que facilita a identificacao dos fatores causais e de intervencoes corretivas
As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-
tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial
como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy
A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-
tatıstica Em geral foram detetados varios problemas na estimacao dos parametros
de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou
desconhecidas dependencia espacial e depedencia temporal que continuam a constituir
objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-
blemas como por exemplo
1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm
6 Introducao
minus modelos lineares generalizados baseados na distribuicao de Poisson
minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia
de sobredispersao
minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado
para analisar dados de acidentes com sobredispersao e excesso de zeros
minus modelos de nıveis multiplos estruturados
minus modelos bayesianos hierarquicos
minus incorporacao de correlacao espacial e dependencia temporal nos modelos
A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao
existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada
a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre
os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos
hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem
podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li
et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar
a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais
e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais
atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004)
O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da
estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a
problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior
barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua
formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains
Monte Carlo) na computacao bayesiana
A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se
nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que
envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas
O seu crescimento ao nıvel das aplicacoes tem sido extraordinario
O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using
Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o
GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao
Introducao 7
CODA Plummer et al (2006) e ao BOA Smith (2007)
Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de
pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)
o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em
particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-
tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas
Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana
aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa
determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas
limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes
de concordancia
Todas as analises envolvidas no metodo INLA estao implementadas num programa que
pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser
descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos
hierarquicos complexos tornou-se muito mais acessıvel
Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA
Objetivos
Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-
los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca
rodoviaria em areas geograficas diferentes
Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse
tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-
pacial e depedencia temporal
Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao
Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes
nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional
Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-
place Approximations atraves da exploracao do pacote R-INLA
8 Introducao
Estrutura da tese
No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a
caracterizacao dos dados usados nesta tese
No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos
No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais
de sinistralidade rodoviaria registados em Portugal Continental
No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido
de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros
No Anexo A faz-se a caracterizacao da regiao de estudo
No CD em anexo encontram-se todos os codigos usados nesta tese
1Nocoes sobre seguranca rodoviaria
11 Risco em seguranca rodoviaria
O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores
de seguranca informativos muito importantes No entanto quando se pretende fazer
comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de
acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca
rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de
acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja
risco=numero esperado de acidentesmedida de exposicao
A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-
responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel
ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-
teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a
melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-
cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos
proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens
e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego
10 Capıtulo 1 Nocoes sobre seguranca rodoviaria
atraves do comprimento de estrada do numero de veıculos ou preferencialmente da
distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode
estar associada a populacao de risco atraves do numero de habitantes do numero de
condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas
times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco
de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia
de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-
cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o
numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para
a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande
disponibilidade de informacao desagregada o que permite analisar as especificidades de
varios grupos populacionais As restantes medidas indicadas apresentam atualmente
muitas limitacoes1
Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se
deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido
e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a
relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata
de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes
e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-
se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de
veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se
a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho
12 Caracterizacao dos dados de acidentes
Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito
e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas
sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela
gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de
exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-
tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao
usada e sobre as covariaveis usadas
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-
ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez
1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2
205-v3_finalpdf
12 Caracterizacao dos dados de acidentes 11
agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho
A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos
se encontram no litoral norte sendo consequentemente mais proximos uns dos outros
Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz
respeito a caracterizacao dos concelhos2
Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311
Total 279644 28844 8890 317378
Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR
minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo
menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT
e PSP) e da qual resultem vıtimas ou danos materiais
minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais
minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do
acidente ou no seu percurso ate a unidade de saude No perıodo em analise para
obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)
aplica-se um coeficiente multiplicativo de 114 ao numero de mortos
minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo
de hospitalizacao superior a 24 horas
minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave
minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima
minus Acidente mortal Acidente do qual resulte pelo menos um morto
minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido
grave nao tendo ocorrido qualquer morte
minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido
leve e em que nao se tenham registado mortos nem feridos graves
2ver Anexo A
12 Capıtulo 1 Nocoes sobre seguranca rodoviaria
Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes
com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes
do tipo 3 os acidentes mortais
Figura 11 Numero de acidentes tipo 1 por concelho
Figura 12 Numero de acidentes tipo 2 por concelho
12 Caracterizacao dos dados de acidentes 13
Figura 13 Numero de acidentes tipo 3 por concelho
Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero
de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de
acidentes
Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor
risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao
entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria
muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos
mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278
concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado
o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de
cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes
decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para
permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no
espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes
Isto e especialmente importante porque apesar do numero de acidentes ser relacionado
com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria
que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de
3ver Anexo A
14 Capıtulo 1 Nocoes sobre seguranca rodoviaria
trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a
variabilidade da medida de exposicao em funcao do espaco ou do tempo
13 Caracterizacao da medida de exposicao - numero
de veıculos com seguro
Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares
Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730
Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)
13 Caracterizacao da medida de exposicao 15
O numero de veıculos com seguro varia bastante de concelho para concelho como se pode
verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo
por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que
cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media
inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo
Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho
i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o
numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =
100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de
acidente rodoviario para acidentes do tipo 1ndash3
Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por
concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes
e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos
sugerindo a existencia de correlacao espacial
Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na
faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas
mais baixas
Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007
Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-
se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se
mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas
muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a
16 Capıtulo 1 Nocoes sobre seguranca rodoviaria
nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos
com taxas mais baixas
Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007
Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007
No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas
usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer
mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-
petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao
13 Caracterizacao da medida de exposicao 17
ocorre com muita frequencia com dados de contagem com muitos valores escassos e
ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou
unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas
pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes
associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso
nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando
as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante
afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e
Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas
dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem
como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-
tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de
forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e
Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004) descritos no Capıtulo 2
2Modelacao estatıstica de acidentes rodoviarios
Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram
baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados
normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido
que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-
doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia
de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma
probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre
os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-
dos de contagens sao modelos mais apropriados para este tipo de estudos
Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo
constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo
et al 2007 Cardoso 1996)
Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo
caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala
espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais
desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais
como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel
explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-
20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como
uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade
espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias
ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao
apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo
muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao
verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos
com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao
de riscos relativos em areas pequenas
No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-
dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade
de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto
deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-
mas na alocacao de fundos governamentais e no planeamento regional Determinados
atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-
cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para
areas pequenas e esta tendencia ira provavelmente continuar
Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-
vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco
relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario
num determinado concelho relativamente ao risco no paıs (Portugal Continental)
As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e
consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem
acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999
Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os
metodos tradicionais para investigar questoes importantes relacionadas com estimacao de
riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia
temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis
nao observaveis tais como clima determinadas caracterısticas da populacao entre outras
Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser
pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a
construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios
ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al
2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-
tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes
21 Modelos bayesianos hierarquicos 21
espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e
temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a
suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos
pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos
dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-
doviarios
A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma
serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia
em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-
dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes
rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem
ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade
existente no dados Noland e Quddus (2004) Elvik (2011)
A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-
melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio
que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-
blema atribuıdo a comportamentos inadequados dos condutores associados a falencias
da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de
acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA
constitui a covariavel com maior poder explicativo da variacao observada No entanto
nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas
do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por
exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de
servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel
vendido e um indicador do volume de trafego e a densidade populacional um indicador de
urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais
o numero de habitantes a area geografica a densidade populacional o comprimento de
estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao
industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao
do solo com equipamento turıstico como sera abordado no Capıtulo 4
21 Modelos bayesianos hierarquicos
O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que
o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro
θ e o segundo traduz a distribuicao a priori para o parametro θ
22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica
na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-
delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-
nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo
que p(θ) =
intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =
1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa
estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-
formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros
Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade
associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-
tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia
a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori
nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-
tribuicao a priori padrao p(θ) (Paulino et al 2003)
Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte
estrutura
1o nıvel f(y|θ) funcao de verosimilhanca
2o nıvel p(θ|φ) distribuicao a priori dos parametros
3o nıvel p(φ) distribuicao a priori dos hiperparametros
Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e
evoluindo para modelos cada vez mais complexos
O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-
creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-
vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de
acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar
esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-
dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se
Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou
sejaYit|θit sim Poisson(Eitθit)
f(yit|θit) =(Eitθit)
yiteminusEitθit
yit
Eit = nitr = nit
sumij
Yitsumij
nit
21 Modelos bayesianos hierarquicos 23
onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit
representa o numero de veıculos com seguro e θit representa o risco relativo de acidente
rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja
se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia
de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de
acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)
A funcao de versimilhanca e dada por
L(θ|y) =prodit
f(yit|θit) =prodit
(Eitθit)yiteminusEitθit
yitpropprod
θyitit e
minussumit
Eitθit
e l(θ|y) = lnL(θ|y) propsumit
yit ln θitminussumit
Eitθit O estimador de maxima verosimilhanca
do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-
dardized Mortality Ratio1 - SMR) e dado por
θit = SMRit =YitEit
(211)
Note-se que V ar(SMRit) =V ar(Yit)
E2it
=θitEit
podendo-se fazer V ar(SMRit) =θitEit
=YitE2it
Um procedimento classico usual para identificar regioes de maior risco consiste na cons-
trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR
Apesar de util este procedimento tem algumas desvantagens Note-se que em areas
com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero
de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR
podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com
muita frequencia com dados desta natureza quando as unidades espaciais de analise sao
concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao
das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit
associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser
grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram
ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de
tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida
em que a respetiva variabilidade pode ser muito grande A variancia destes valores e
1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso
24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao
grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro
estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-
minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992
Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR
tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores
estimados com menos precisao As maiores variacoes do risco relativo nao estarao em
geral associadas com variacoes do risco subjacente a medida de exposicao mas serao
apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)
Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se
que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-
dade teorica subjacente ao modelo Poisson
A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados
(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do
modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado
que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al
2008 2005)
Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-
mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos
tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao
de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das
flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto
dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se
usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico
medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial
entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao
mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)
22 Modelos nao espaciais
Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh
e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis
atraves da funcao de ligacao usada para modelar a media
ln(θit) = α+
nβsump=1
βpxitp (221)
22 Modelos nao espaciais 25
onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel
e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um
nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual
considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a
priori p = 1 2 nβ i = 1 2 N e t = 1 2 T
No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-
adequadamente capturada pelas variaveis explicativas na funcao da media condicional
Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser
distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-
tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como
ln θit = α+
nβsump=1
βpxitp + vit (222)
onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p
Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que
foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-
los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares
generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)
Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-
dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao
a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo
Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples
de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma
fechada dado que esta mistura resulta de um modelo conjugado
Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao
Poisson e na distribuicao Binomial Negativa
O modelo Poisson Lognormal surge quando se admite que
vit sim Normal(0 σ2v) (223)
A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por
f(yit θNit σ
2v) =
1
σ2v
radic2π
EitθNit
y
int infin0
eminusEitθNit e
v
(ev)yminus1eminus v2
2σ2v dev
nao havendo forma explicıta com
26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
ln θNit = α+
nβsump=1
βpxitp (224)
E[Yit] = microNit eσ2v2 = Eitθ
Nit e
σ2v2 e V ar[Yit] = microNit e
σ2v2(
1 + (eσ2v minus 1)microNit e
minusσ2v2)
O modelo Poisson-Gama ou Binomial Negativo surge quando
exp(vit) sim Gama(φ φ) (225)
A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por
f(yit θBNit φ) =
Γ(yit + φ)
Γ(φ)yit
(φ
microBNit + φ
)φ(microBNit
microBNit + φ
)yitou seja
Yit|θBNit sim BN(EitθBNit φ)
com
ln θBNit = α+
nβsump=1
βpxitp (226)
E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit
(1 +
microBNitφ
) Note-se que quando φrarrinfin o
modelo Binomial Negativo reduz-se ao modelo Poisson
Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo
podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais
um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com
av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O
parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de
dispersao
O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-
plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre
unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-
quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito
afectadas (Miranda-Moreno et al 2007 Lord et al 2008)
Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)
A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-
pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os
23 Modelos espaciais 27
riscos relativos conjuntamente como um processo espacial atraves de uma especificacao
a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-
lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco
relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados
observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada
area e a soma de duas componentes que representam fatores espaciais e nao espaciais
No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica
de interesse em cada area tem distribuicao Poisson com media especıfica de cada area
As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre
a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento
das variaveis nao-observadas como em Bernardinelli et al (1995ab)
23 Modelos espaciais
Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia
espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos
mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao
associados uma distribuicao a priori conveniente
log(θit) = α+
nβsump=1
βpxitp + si (231)
Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de
notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario
quer para os modelos baseados na distribuicao de Poisson abreviadamente designados
de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa
abreviadamente designados de modelos BN com os devidos significados
Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que
representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos
atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori
associada
log(θit) = α+
nβsump=1
βpxitp + si + vi (232)
onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-
turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e
si sao mutuamente independentes viiidsim Normal(0 σ2
v) e si|sminusi sim Normal(si σ2smi)
28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
onde o sminusi indica o vetor s com o elemento si removido si =1
mi
sumi 6=j
wijsj e a media
dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e
wij = 0 caso contrario Deste modo mi =sumi 6=j
wij e o respetivo numero de vizinhos e
σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma
s tem distribuicao conjunta
f(s) prop (σ2s)minusn2 exp
minus 1
2σ2s
sumi6=j
(si minus sj)2wij
e (σ2v)minus1 sim Gama(av bv) (σ2
s)minus1 sim Gama(as bs) com av bv as e bs conhecidos
Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial
local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo
gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991
Banerjee et al 2004)
24 Modelos espaco-temporais
Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-
tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a
aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios
e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos
com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se
definiu na seccao anterior
Modelos espaco-temporais sem interacao
Nestes modelos tem-se log(θit) = α+
nβsump=1
βpxitp + si + vi + ψt
onde se considera
ψt sim Normal(0 σ2ψ) (241)
ou
ψt sim RW (1 σ2ψ) (242)
e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ
2s σ
2v σ
2ψ mutuamente
independentes
24 Modelos espaco-temporais 29
Alternativamente log(θit) = α+
nβsump=1
βpxitp + si + vi + γt
onde se considera
γ sim Normal(0 cγ) (243)
sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ
2v mutuamente
independentes (Knorr-Held 2000)
Modelos espaco-temporais com interacao
Neste caso log(θit) = α+
nβsump=1
βpxitp + si + vi + (γ + δi)t
onde se considera alternativamente
δi sim Normal(0 σ2δ ) (244)
ou
δi sim CAR(σ2δ ) (245)
e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com
aδ bδ conhecidos e α βp σ2s σ2
v σ2δ mutuamente independentes (Bernardinelli et al
1995b)
A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando
um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de
acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de
risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia
e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de
cada area e a media global α e δi representa a diferenca entre a tendencia temporal
local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0
a tendencia temporal local da area i e menos acentuada do que a tendencia temporal
global enquanto que quando δi gt 0 e mais acentuada
Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados
neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo
nao se encontra definida uma distribuicao a priori para um parametro considera-se a
distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior
30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Tabela 21 Modelos univariados
M log(θit) Distribuicao a priori Distribuicao a priori
dos parametros dos hiperparametros
1 α+
nβsump=1
βpxitp α sim Normal(0 cα)
βp sim Normal(0 cβ)
2 α+
nβsump=1
βpxitp + vi vi sim Normal(0 σ2v) σminus2
v sim Gama(av bv)
3 α+
nβsump=1
βpxitp + si si sim CAR(σ2s) σminus2
s sim Gama(as bs)
4 α+
nβsump=1
βpxitp + vi + si
5 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2
ψ sim Gama(aψ bψ)
6 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim RW (σ2ψ)
7 α+
nβsump=1
βpxitp + vi + si + γt γ sim Normal(0 cγ)
8 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2
δ sim Gama(aδ bδ)
9 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )
25 Modelos multivariados
Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-
mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes
modelos nao consideram a interdependencia que pode existir entre os riscos relativos
dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na
variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia
para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico
tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-
son capazes de considerar a relacao entre diferentes processos de contagem tais como
contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-
25 Modelos multivariados 31
son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta
abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de
diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o
numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo
k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit
condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou
seja
Ykit|θkit sim Poisson(Ekitθkit)
Modelos espaciais multivariados
1)log θkit = αk +
nβsump=1
βpxitp + ski
com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs
conhecidos
Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)
e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios
ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K
tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-
bilidade assume que a estrutura de associacao se separa numa componente nao espacial
e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta
de s e
s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)
Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)
D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de
vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK
definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre
os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao
espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se
o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo
improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou
modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin
et al (2005) Lawson (2009) Waller e Carlin (2010)
Para alem do modelo 1 foram implementados os modelos multivariados seguintes no
WinBUGS
32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)
3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)
4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e
dδ Rδ conhecidos
mas apenas se obteve convergencia para os modelos 1 e 4
Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =
bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =
001 0 0
0 001 0
0 0 001
26 Metodos de inferencia
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e
computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas
abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)
consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-
ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino
e Rue (2010a)
261 INLA
O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-
siana aproximada numa subclasse de modelos de regressao estruturados aditivamente
nomeadamente em modelos latentes gaussianos
Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z
que representa todas as componentes nao observaveis com distribuicao a priori Normal
Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-
mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-
buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia
exponencial A media microi de cada componente e relacionada com um preditor aditivo
estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor
incorpora aditivamente os efeitos de varias componentes
26 Metodos de inferencia 33
ηi = α+
nfsumj=1
f (j)(uij) +
nβsump=1
βpxip + εi (261)
onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-
cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u
podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis
contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-
torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos
podem ser representados atraves das funcoes f (j)()
Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-
mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por
suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a
priori dos hiperparametros nao tem de ser gaussianas
Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-
dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto
de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF
Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel
aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e
Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6
embora possa haver excecoes
Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro
nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos
parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-
sume que os dados observados sao condicionalmente independentes dado o campo latente
z tem-se que
f(y|xφ) =prodi
f(yi|ziφ)
Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca
do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos
φ
A distribuicao a posteriori e dada por
p(zφ|y) prop p(φ)p(z|φ)prodi
f(yi|ziφ) (262)
Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e
analiticamente tratavel
Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao
34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao
analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e
possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa
pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como
tempo computacional longo possibilidade de as amostras simuladas dos parametros se-
rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte
Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser
particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori
entre as componentes espacial ou espaco-temporal do campo latente
Em contraste o metodo de aproximacao INLA e apresentado como um metodo que
fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-
vamente pouco tempo
No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes
marginais a posteriori dos parametros de interesse
As distribuicoes marginais a posteriori pretendidas sao
p(zi|y) =
intφ
p(zi|φy)p(φ|y) dφ (263)
e
p(φj |y) =
intφj
p(φ|y) dφminusj (264)
A aproximacao de p(zi|y) e determinada usando a soma finita
p(zi|y) =sumk
p(zi|φky)p(φk|y)∆k (265)
onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-
vamente Esta soma e calculada por integracao numerica em pontos suporte φk com
pesos apropriados ∆k
A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e
obtida atraves da aproximacao de Laplace
p(φ|y) prop p(zφy)
pG(z|φy)
∣∣z=zlowast(φ) (266)
onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-
cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao
corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)
De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade
a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes
26 Metodos de inferencia 35
pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste
basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior
quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste
em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a
estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)
Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a
estrategia CCD a estrategia por omissao no R-INLA
Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a
aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace
simplificada
A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter
a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))
onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia
marginal Os autores referem que apesar de muito conveniente ao nıvel computacional
pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de
simetria das distribuicoes a posteriori marginais quer a ambos nıveis
Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais
demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-
place semelhante a 266 a p(zi|φy)
pLA(zi|φy) prop p(zφy)
pGG(zminusi|ziφy)
∣∣∣zminusi=zlowastminusi(ziφ) (267)
No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-
nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes
numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de
Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo
menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada
uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-
trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e
simetria Para mais detalhes ver Rue et al (2009)
Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre
os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao
de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos
O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-
parametros entre outras No entanto o seu potencial e reconhecidamente enorme e
encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-
tensoes com muita frequencia
36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
27 Ajustamento e medidas preditivas
Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o
criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio
combina uma medida de adequabilidade a media a posteriori da desvianca D com
uma medida de complexidade o numero efetivo de parametros pD sendo dado por
DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-
promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no
WinBUGS quer no R-INLA
No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos
aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-
vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive
Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-
tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle
e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-
delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para
detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)
As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)
p(yminusi)=
intf(yi|θyminusi)p(θ|yminusi) dθ
e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores
CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para
efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de
calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou
grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito
diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de
dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem
uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este
problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim
pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =
yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma
forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem
ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)
Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a
0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa
por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira
a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da
concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de
27 Ajustamento e medidas preditivas 37
referencia
Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls
(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))
ntimes T Esta medida e muito
utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os
valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo
3Aplicacoes
Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios
ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os
resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo
de aproximacao INLA atraves do R-INLA
Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-
sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel
usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos
no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao
apresentados os resultados obtidos no WinBUGS
Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a
analise individual de cada ano comparando-se os varios modelos e os resultados obtidos
no WinBUGS e no R-INLA tendo havido concordancia
Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial
40 Capıtulo 3 Aplicacoes
31 Associacao espacial
A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-
doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco
como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter
uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas
determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes
entre areas de maior risco e potenciais fatores
Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-
racterısticas que revelam alguns dos seus problemas Para alem da concentracao de
concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito
diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de
veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a
uma pequena mudanca no numero de acidentes
Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-
rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa
global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com
feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0
e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes
valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no
de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida
ao acaso pois os concelhos possuem condicoes identicas
Tendo em conta que o numero de veıculos com seguro varia muito por concelho este
comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-
ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem
medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito
instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis
ja que possuem variancias muito diferentes
A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura
31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero
de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro
para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas
versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em
2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho
da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com
tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que
assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se
31 Associacao espacial 41
ter uma percecao dessa variabilidade em cada concelho
Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000
Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000
42 Capıtulo 3 Aplicacoes
Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000
A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem
a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir
uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de
contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz
de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma
fronteira e wij = 0 caso contrario
As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e
o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em
areas pequenas em que o tamanho da medida de exposicao e diferente de area para
area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta
questao foram desenvolvidas diversas propostas alternativas para dados com populacoes
heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em
conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se
o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por
EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma
estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa
os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes
empırica da media marginal padronizado pela estimativa do desvio padrao da taxa
Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros
sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI
tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao
32 Modelos 43
do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao
aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de
EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado
no R atraves do pacote spdep e da funcao EBImoranmc()
Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano
Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859
Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000
Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente
por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos
testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo
p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na
Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para
acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao
espacial
32 Modelos
Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais
espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos
modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo
uma vez que forneceram melhores resultados como se pode verificar comparando os
valores das Tabelas 32mdash35
Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA
44 Capıtulo 3 Aplicacoes
No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo
da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo
A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos
de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente
pela analise dos resultados com o programa CODA do R (Plummer et al 2006)
No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-
tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada
computacionalmente menos intensa
Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266
P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205
P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204
P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204
Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 1 2063493 188 464 1351516 170 304 988082 169 222
BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201
BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201
BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201
As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos
espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos
com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo
Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial
Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3
1referente a Tabela 21
33 Modelos espaco-temporais 45
Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior
a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a
diferenca entre o numero de parametros e muito grande
No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos
os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero
correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se
pode ver mais adiante quando se usam os modelos espaco-temporais este problema e
ultrapassado
Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao
menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos
os tipos de acidentes
33 Modelos espaco-temporais
De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para
estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-
mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se
reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre
muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21
Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191
P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191
P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192
P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192
P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192
Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor
modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para
2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso
46 Capıtulo 3 Aplicacoes
o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela
35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo
1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash
e para o tipo 3 o modelo 6 mdash BN 3 6
Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191
BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191
BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192
BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193
BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193
Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e
do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores
sao os modelos Poisson
331 Associacao regional
Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao
geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar
informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-
plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos
nos riscos de acidentes
Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes
em milhares de habitantes P a area em centenas de km2 A a densidade populacional em
centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade
de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU
a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques
urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do
solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se
valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST
os valores sao por concelho e iguais em todos os anos
33 Modelos espaco-temporais 47
332 Selecao dos modelos
Foram implementados todos os modelos com todas as combinacoes entre as covariaveis
mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de
acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram
escolhidos os seguintes modelos
Tabela 36 DIC pD e mls para cada tipo de acidente
Tipo P DIC pD mls BN DIC pD mls
1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418
2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260
3 3 6 4 846237 20562 191 3 6 6 852362 19267 191
Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais
P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e
Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU
e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash
modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP
mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI
e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash
modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6
com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos
Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para
cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e
nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao
relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os
valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921
e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo
sao relativamente pequenas 961 594 e 076 respetivamente
Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao
contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis
covariaveis significativas e respetiva contribuicao para os resultados Assim fica para
trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais
significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em
48 Capıtulo 3 Aplicacoes
particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)
e uma covariavel considerada muito importante na modelacao estatıstica de acidentes
rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao
nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica
designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos
hoteleiros
333 Modelos para acidentes do tipo 1
Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172
log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t
e
log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t
No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente
para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos
de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem
o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o
zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor
HPD que contem o zero considera-se que a covariavel nao contribui significativamente
para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso
contrario considera-se que a covariavel contribui significativamente para a explicacao
da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado
que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124
obtendo-se o modelo Poisson 1 8 16 ou seja
log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t
Tabela 37 DIC pD e mls para acidentes tipo 1
Modelo DIC pD mls
P 1 8 1 1940548 47786 458
P 1 8 16 1939877 47789 458
BN 1 6 1 1861278 25154 419
BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
33 Modelos espaco-temporais 49
No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as
covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se
manter as covariaveis no modelo
334 Validacao dos modelos para acidentes do tipo 1
Validacao do modelo P 1 8 16 e do modelo BN 1 6 172
Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172
Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do
que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela
37 O valor da media do logscore tambem e significativamente menor de acordo com
o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores
PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O
valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo
BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes
sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do
tipo 1
335 Resultados obtidos com modelos para acidentes do tipo 1
Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172
A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um
efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma
50 Capıtulo 3 Aplicacoes
diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo
1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16
e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo
BN 1 6 172
Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172
Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max
SMR1 00000 07512 09656 10020 12360 32610
RR1 8 1 02290 07728 09663 09989 11870 28890
RR1 8 16 02274 07722 09628 09979 11860 28770
RR1 6 1 02886 07807 09599 10010 11890 24480
RR1 6 172 02852 07798 09589 09999 11870 24400
Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de
33 Modelos espaco-temporais 51
confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-
bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com
os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-
nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172
Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172
Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados
52 Capıtulo 3 Aplicacoes
os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo
P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000
Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para
o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312
se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de
33 Modelos espaco-temporais 53
suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos
erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais
Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000
Relativamente a introducao das covariaveis comprimento de estrada e quantidade de
combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia
dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis
explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao
explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados
espacialmente
Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1
Efeitos fixosmedia dp 0025q 0975q
α1 00580 00074 00435 00723
γ1 -00263 00030 -00321 -00204
Variancia dos efeitos aleatorios
σ2s1 05816 00591 04706 07001
σ2δ1
00019 00002 00015 00023
Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1
54 Capıtulo 3 Aplicacoes
mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-
plicacao da variacao associada aos efeitos temporais
Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel
vendido influenciam significativamente a variacao geografica dos riscos relativos sao
consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem
de forma positiva para a variacao os riscos o que significa que em regioes com maior
comprimento de estrada e em regioes com maior quantidade de combustıvel vendido
esta associado um aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16
Efeitos fixosmedia dp 0025q 0975q
α1 -00898 00354 -01595 -00207
b1C 00016 00004 00008 00024
b1V C 00003 00001 00002 00005
γ1 -00257 00030 -00315 -00198
Variancia dos efeitos aleatorios
σ2s1 05492 00560 04440 06615
σ2δ1
00019 00002 00015 00023
No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada
do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da
ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos
espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-
buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou
efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves
dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos
temporais σ2ψ1
se mantem o que implica que as covariaveis nao contribuem para a ex-
plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o
modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao
e significativa
Mais uma vez as covariaveis que influenciam significativamente a variacao geografica
dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-
variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que
33 Modelos espaco-temporais 55
regioes com maior comprimento de estrada regioes com maior ocupacao de solo com
equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento
turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos
os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-
mente para a estimacao dos riscos o que significa que em regioes com maior numero de
habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo
fixos todos os restantes efeitos
Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1
Efeitos fixosmedia dp 0025q 0975q
α1 -00429 00052 -00595 -00389
Parametro de dispersao φminus11 00298 00017 00267 00332
Variancia dos efeitos aleatorios
σ2s1 02603 00266 02108 03142
σ2ψ1
00090 00057 00029 00237
Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172
Efeitos fixosmedia dp 0025q 0975q
α1 -01348 00243 -01826 -00872
b1C 00013 00003 00007 00019
b1P -00135 00044 -00221 -00049
b1OSEUP 00001 000008 -000005 00003
b1OST 00001 000006 -0000003 00002
Parametro de dispersao φminus11 00300 00017 00269 00334
Variancia dos efeitos aleatorios
σ2s1 02438 00254 01966 02951
σ2ψ1
00090 00056 00029 00235
Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente
56 Capıtulo 3 Aplicacoes
espacial contribui fortemente para a variacao geografica do risco relativo O padrao e
muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes
com maior risco relativo estimado correspondem as regioes em que as estimativas dos
efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-
dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo
proximo de um correspondem as regioes em que as estimativas de si sao proximas de
zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade
HPD nao contem o zero e 633 para o modelo P 1 4 16
Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16
Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16
33 Modelos espaco-temporais 57
A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0
eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao
longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio
anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta
tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores
correspondente a diminuicao das estimativas dos riscos ao longo dos anos
Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16
Min 1oQ Mediana Media 3oQ Max
δ1 -00919 -00254 -00476 00768 00197 00133
eδ1 09125 09751 09954 10010 10200 11420
Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16
Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de
credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1
a tendencia temporal local e maior que a tendencia global sendo o decrescimento do
numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia
58 Capıtulo 3 Aplicacoes
temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia
temporal local e menor do que a global sendo o decrescimento mais acentuado No
mapa da Figura 315 pode ver-se a distribuicao destes concelhos
Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um
sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada
na Tabela A8 do Anexo A
Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172
Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172
Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos
mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial
33 Modelos espaco-temporais 59
contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado
e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com
menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si
sao proximas de zero Para este modelo a percentagem de estimativas dos valores de
s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente
a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos
seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais
acentuado nos cinco anos seguintes
Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172
Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo
BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um
aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os
restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-
gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos
estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel
contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i
no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54
Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a
percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento
turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como
os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de
60 Capıtulo 3 Aplicacoes
(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo
da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel
OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com
equipamentos turısticos vai de 0 a 038
Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172
Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172
Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior
33 Modelos espaco-temporais 61
que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos
com risco relativo significativamente maior que um
336 Modelos para acidentes do tipo 2
Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192
log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +
b2DPDP2it + s2i + (γ2 + δ2i)t
e
log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t
No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente
das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519
pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo
Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o
modelo P 2 9 16 ou seja
log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t
No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-
variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e
pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-
delo BN 2 9 4 ou seja
log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t
Tabela 314 DIC pD e mls para acidentes tipo 2
modelo DIC pD mls
P 2 9 1 1170386 35334 270
P 2 9 16 1169631 35476 270
BN 2 9 1 1156921 29101 261
BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
62 Capıtulo 3 Aplicacoes
337 Validacao dos modelos para acidentes do tipo 2
Validacao do modelo P 2 9 16 e do modelo BN 2 9 4
Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4
Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-
ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual
a 13956 O valor da media do logscore tambem e significativamente menor de acordo
com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos
valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura
322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para
o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes
sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do
tipo 2
338 Resultados obtidos com modelos para acidentes do tipo 2
Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4
A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as
estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre
um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das
estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados
a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores
esperados a posteriori obtidos com o modelo BN 2 9 4
33 Modelos espaco-temporais 63
Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4
Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os
modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max
SMR2 00000 05062 09180 11830 15740 87830
RR2 9 1 02237 06553 09651 11910 14980 77550
RR2 9 16 02218 06547 09624 11860 14970 77060
RR2 9 1 nb 02391 06636 09751 11870 14960 59240
RR2 9 4 nb 02363 06630 09720 11810 14850 59030
64 Capıtulo 3 Aplicacoes
Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo
P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes
33 Modelos espaco-temporais 65
do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000
Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000
66 Capıtulo 3 Aplicacoes
Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000
Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das
covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo
Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja
as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos
sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito
espacial
Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03511 00191 03135 03883
γ2 -00844 00037 -00918 -00771
Variancia dos efeitos aleatorios
σ2s2 09474 01054 07554 11648
σ2δ2
00099 00016 00070 00133
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-
plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao
33 Modelos espaco-temporais 67
para a variacao geografica das estimativas dos riscos e positiva em regioes com maior
comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao
para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos
Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16
Efeitos fixosmedia dp 0025q 0975q
α2 01790 00530 00741 02822
b2C 00020 00005 00009 00031
b2V C -00004 00003 -00010 00003
γ2 -00833 00038 -00906 -00759
Variancia dos efeitos aleatorios
σ2s2 09162 01019 07325 11282
σ2δ2
00099 00016 00015 00135
Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com
a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos
efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma
efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam
incluıdos no modelo P 2 9 1 atraves do efeito espacial
Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03529 00223 03090 03965
γ2 -00819 00044 -00906 -00733
Parametro de dispersao φminus11 00577 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07824 00925 06156 09748
σ2δ2
00051 00012 00031 00079
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
68 Capıtulo 3 Aplicacoes
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao
associada aos efeitos temporais Para alem disso como a contribuicao para a variacao
geografica das estimativas dos riscos e positiva em regioes com maior comprimento de
estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos
os restantes efeitos
Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4
Efeitos fixosmedia dp 0025q 0975q
α2 01961 00530 00741 02822
b2C 00017 00005 00008 00027
γ2 -00814 00044 -00900 -00727
Parametro de dispersao φminus11 00576 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07516 00894 05914 09385
σ2δ2
00052 00013 00031 00080
Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16
33 Modelos espaco-temporais 69
Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode
verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o
padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado
correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as
regioes com menor risco relativo estimado correspondem as regioes em que as estimativas
de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes
em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem
de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero
e 608
Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era
esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou
seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem
de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295
Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16
Min 1oQ Mediana Media 3oQ Max
δ2 -01805 -00411 00082 00003 00485 01532
eδ2 08358 09604 10090 10030 10500 11660
No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se
que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia
70 Capıtulo 3 Aplicacoes
temporal local maior do que a global e um decrescimento no numero de acidentes do tipo
2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local
menor que a global e um decrescimento mais acentuado
Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16
E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um
obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um que permite complementar esta informacao
Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-
temente para a variacao geografica do risco relativo como se pode observar no mapa da
Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-
mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes
com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao
proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i
cujo intervalo de credibilidade HPD nao contem o zero e 5665
33 Modelos espaco-temporais 71
Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4
Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4
Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4
Min 1oQ Mediana Media 3oQ Max
δ1 -01530 -00368 00052 00001 00402 01140
eδ1 08592 09646 10060 10020 10420 11210
72 Capıtulo 3 Aplicacoes
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca
no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de
78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de
valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa
da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a
global sendo o seu decrescimento menos acentuado que o decrescimento global havendo
uma minoria onde se passa o contrario
Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4
Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior
que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao
com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista
ordenada dos primeiros quinze concelhos
33 Modelos espaco-temporais 73
339 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6
log(θ3ij) = α3 + b3CCi + s3i + ψ3t
e
log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t
No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a
covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo
P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1
log(θ3ij) = α3 + s3i + ψ3t
No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade
populacional nao contem o zero por isso o modelo mantem-se
Tabela 322 DIC pD e mls para acidentes tipo 3
modelo DIC pD mls
P 3 6 1 846290 20551 191
P 3 6 4 846237 20562 191
BN 3 6 1 852438 19770 191
BN 3 6 6 852362 19267 191
3310 Validacao dos modelos para acidentes do tipo 3
Validacao do modelo P 3 6 1 e do modelo BN 3 6 6
Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e
menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072
Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos
valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia
preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo
74 Capıtulo 3 Aplicacoes
ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se
que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3
Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6
3311 Resultados obtidos com modelos para acidentes do tipo 3
Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6
Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max
SMR3 00000 04639 11050 15100 20490 156700
RR3 6 1 01363 08869 13050 14900 18430 95400
RR3 6 6 bn 01247 09020 13170 14850 18370 87310
Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo
obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-
vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores
esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos
valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e
Tabela 323
33 Modelos espaco-temporais 75
Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6
Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6
Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-
76 Capıtulo 3 Aplicacoes
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os
modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6
Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000
Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo
P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
33 Modelos espaco-temporais 77
Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000
Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem
comentarios acerca de associacao regional para este modelo
78 Capıtulo 3 Aplicacoes
No modelo BN observa-se que com a introducao da covariavel densidade populacional o
valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da
variancia dos efeitos temporais σ2ψ1t
se mantem Tabelas 325 e 326
Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02114 00152 01815 02410
Variancia dos efeitos aleatorios
σ2s3 06817 00802 05383 08499
σ2ψ3
00255 00157 00082 00660
Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02155 00158 01842 02464
Parametro de dispersao ψminus11 00455 00061 00348 00584
Variancia dos efeitos aleatorios
σ2s3 06497 00800 05070 08174
σ2ψ3
00255 00161 00081 00672
Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6
Efeitos fixosmedia dp 0025q 0975q
α3 02791 00217 02362 03215
bDP -00199 00048 -00294 -00105
Parametro de dispersao φminus11 00459 00061 00350 00588
Variancia dos efeitos aleatorios
σ2s3 05855 00749 04532 07440
σ2ψ3
00255 00161 00081 00672
Tal significa que a covariavel densidade populacional contribui para a explicacao da
33 Modelos espaco-temporais 79
variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao
da variacao temporal A contribuicao da covariavel densidade populacional e negativa
o que indica que em regioes com maior densidade populacional ocorre a contribuicao
para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos
No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a
sobredispersao nao e significativa
Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1
Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1
80 Capıtulo 3 Aplicacoes
O padrao espacial das estimativas do risco relativo e das estimativas da componente
espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras
342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao
positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos
efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem
o zero e 439 para o modelo P 3 6 1
No que respeita a componente temporal observa-se um decrescimento nos dois primeiros
anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento
nos ultimos cinco anos
Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1
Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco
relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a
lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-
tivamente maior que um na Tabela A9 do Anexo A
33 Modelos espaco-temporais 81
Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6
Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6
Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os
padroes revelados pelos mapas As regioes com maior contribuicao da componente es-
pacial para o aumento do risco relativo correspondem em geral a regioes com maiores
estimativas de risco relativo Tal significa que a componente espacial explica grande parte
da variacao das estimativas do risco relativo A percentagem de estimativas dos valores
de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1
82 Capıtulo 3 Aplicacoes
Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6
A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo
modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode
ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se
pode encontrar uma lista ordenada dos primeiros quinze concelhos
Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se
apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista
o tipo de interacao espaco-temporal
Tabela 327 Modelos univariados
Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal
1 BN 1 6 172 C+P+OSEPU+OST RW mdash
2 BN 2 9 4 C fixo CAR
3 P 3 6 1 mdash RW mdash
34 Modelos multivariados 83
34 Modelos multivariados
Os modelos multivariados usados foram
log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)
log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)
Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-
tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito
complexos nao parece haver um ganho substancial em usa-los
Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados
Modelos multivariados Modelos univariados
Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q
α1 00565 00181 00214 00914 00580 00074 00435 00723
α2 03423 00344 02735 04083 03511 00191 03135 03883
α3 05993 00331 05340 06644 06633 00247 06147 07115
γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204
γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771
γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907
Σu =
05551 03843 05519
03843 1042 05864
05519 05864 09113
Σδ =
00074 00035 00061
00035 00111 00059
00061 00059 00081
No entanto e interessante verificar que em termos de correlacao entre as estimativas
dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo
2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao
que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios
nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e
tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no
numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330
84 Capıtulo 3 Aplicacoes
Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal
Modelos com interacao Modelos sem interacao
media dp 0025q 0975q media dp 0025q 0975q
ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669
ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879
ρ23(θ) 06793 00242 06304 07252 06831 002647 07326
ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196
ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941
ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976
ρ12(δ) 03823 00894 01960 05465
ρ13(δ) 07979 00634 06487 08998
ρ23(δ) 06203 00938 04153 07829
Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias
AnoVıtimas mortais Feridos graves Feridos leves
24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif
2010 741 937 196 2637 2475 -162 43924 43890 -34
2011 689 891 202 2436 2265 -171 39726 39695 -31
34 Modelos multivariados 85
Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados
86 Capıtulo 3 Aplicacoes
Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
35 Aplicacao para acidentes rodoviarios nas estradas
secundarias
Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-
cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram
retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-
damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior
risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do
poder local
Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840
Total 175741 16909 3471 196121
Figura 350 Numero de acidentes tipo 1 por concelho
88 Capıtulo 3 Aplicacoes
Figura 351 Numero de acidentes tipo 2 por concelho
Figura 352 Numero de acidentes tipo 3 por concelho
No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados
Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89
de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos
Tabela 332 DIC pD e mls para cada tipo de acidente
Modelo DIC pD mls
BN 1 9 42 1614530 32359 363
BN 2 9 246 924765 27530 208
P 3 6 30 581058 11747 131
351 Modelo para acidentes do tipo 1
Modelo Binomial Negativo 1 9 42
log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t
Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a
variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do
modelo
352 Validacao do modelo para acidentes do tipo 1
Validacao do modelo BN 1 9 42
Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42
O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-
pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O
90 Capıtulo 3 Aplicacoes
valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem
um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-
ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42
e o melhor modelo para acidentes do tipo 1
353 Resultados obtidos com o modelo para acidentes do tipo 1
Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42
Efeitos fixosmedia dp 0025q 0975q
α1 -03518 00346 -04202 -02843
b1C 00012 00004 00005 00019
b1OST 00001 000007 -000005 00002
γ1 -00128 00026 -00179 -00077
Parametro de dispersao φminus11 00287 00021 00248 00328
Variancia dos efeitos aleatorios
σ2s1 03982 00445 03180 04909
σ2δ1
00026 00007 00015 00040
Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91
As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico
influenciam significativamente a variacao geografica dos riscos relativos e portanto sao
consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de
forma positiva para a variacao dos riscos o que significa que em regioes com maior
comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma
contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes
efeitos
Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-
derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura
temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao
envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial
se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de
risco relativo Figuras 354 e 316
Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42
Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco
relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um
92 Capıtulo 3 Aplicacoes
354 Modelo para acidentes do tipo 2
Modelo Binomial Negativo 2 9 246
log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +
s2i + (γ2 + δ2i)t2
Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de
todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938
pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e
manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja
log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2
Tabela 334 DIC pD e mls
Modelo DIC pD mls
BN 2 9 86 924868 24786 208
355 Validacao do modelo para acidentes do tipo 2
Validacao do modelo BN 2 9 86
Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86
O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo
Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93
do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto
proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e
95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor
modelo para acidentes do tipo 2
356 Resultados obtidos com o modelo para acidentes do tipo 2
Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86
Efeitos fixosmedia dp 0025q 0975q
α2 -01198 00480 -02147 -00266
b1OSI 00002 000008 000007 00004
b1OSEPU 00003 00002 000001 00006
b1DP 00084 00066 -00046 00215
γ1 -01198 00480 -02147 -00266
Parametro de dispersao
φminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 10557 01336 08161 13345
σ2δ1
00094 00023 00057 00147
A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-
nos e a densidade populacional influenciam significativamente a variacao geografica dos
riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-
variaveis contribuem de forma positiva para a variacao dos riscos o que significa que
em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo
com equipamentos e parques urbanos e a regioes com maior densidade populacional ha
contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes
do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a
mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao
Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que
os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos
94 Capıtulo 3 Aplicacoes
concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns
conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas
do risco relativo sao os mesmos
Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86
Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95
A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com
o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que
consta na Tabela A11
357 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 30
log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt
Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU
contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo
358 Validacao do modelo para acidentes do tipo 3
Validacao do modelo P 3 6 30
Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30
Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da
distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-
mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores
igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva
e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para
acidentes do tipo 3
96 Capıtulo 3 Aplicacoes
359 Resultados obtidos com o modelo para acidentes do tipo 3
Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30
Efeitos fixosmedia dp 0025q 0975q
α2 00104 00520 -00923 01117
b3A 00258 00116 00031 00049
b3OSEPU -00001 00001 -00004 000006
Parametro de dispersao
ψminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 03598 00687 02422 05084
σ2ψ1
00246 00163 0007 00666
Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30
A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam
significativamente a variacao geografica dos riscos relativos sendo consideradas na es-
timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97
a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial
em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes
com maior area geografica ha uma contribuicao para o aumento das estimativas do risco
relativo mantendo fixos todos os restantes efeitos
O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de
trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-
trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico
mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No
entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos
Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30
E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo
modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que
consta na Tabela A11
Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-
mente a abordagem global e a abordagem local
98 Capıtulo 3 Aplicacoes
Tabela 337 Comparacao entre a abordagem local e a global
Abordagem Tipo Melhor Covariaveis Efeito Interacao
Modelo temporal espaco-temporal
Local 1 BN 1 9 42 C+OST fixo CAR
Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash
Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR
Gloal 2 BN 2 9 4 C fixo CAR
Local 3 P 3 6 30 A+OSEUP aleatorio mdash
Global 3 P 3 6 1 mdash aleatorio mdash
4Discussao e conclusoes
Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia
de dependencia espacial de tendencia temporal e de associacao regional em dados de
acidentes rodoviarios
Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-
delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por
areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar
diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao
espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel
recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados
com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de
trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de sobredispersao de associacao posi-
tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-
mentos e parques urbanos e uma associacao regional negativa com a populacao
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
100 Capıtulo 4 Discussao e conclusoes
bredispersao e de associacao regional positiva com o comprimento de estrada
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente
Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com o comprimento de estrada e com
a area de ocupacao do solo para turismo
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com a area de ocupacao de solo para
a industria com a area de ocupacao do solo com equipamentos e parques urbanos
e com a densidade populacional
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente de associacao regional
positiva com a area e de associacao regional negativa com a area de ocupacao de
solo com equipamentos e parques urbanos
Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-
se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas
Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com
interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao
do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido
o modelo Poisson com efeito temporal aleatorio
Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos
modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-
tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se
capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes
espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-
formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que
as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto
e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas
as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de
valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais
elevados diminuiram ou seja os valores extremos foram suavizados
101
Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos
dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-
gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi
possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia
temporal global Este e um tipo de resultado muito importante na fase de aplicacao
pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter
exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas
Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-
minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as
covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam
incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-
fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal
Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores
usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal
considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para
todos os anos em estudo
Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos
mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-
pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a
ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-
cativamente maior que um bem como as dos concelhos com valores consideravelmente
menores do que a unidade
Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-
timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises
por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-
pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de
estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-
nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o
TDMA de modo a introduzi-las no modelo
Os modelos multivariados constituiram um esforco computacional elevado nao tendo
havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises
comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi
possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes
tipos de acidentes
Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves
do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo
uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-
ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA
102 Capıtulo 4 Discussao e conclusoes
pela extrema concordancia de resultados pela facilidade de implementacao dos modelos
pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez
de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem
duvida muito mais acessıvel
Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-
dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de
um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-
patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de
recolha e definicao das variaveis de interesse A implementacao estes modelos tambem
pode ser efetuada atraves do R-INLA
Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir
como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-
dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite
efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-
gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade
dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas
geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios
constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel
mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-
sabilidade de todosrdquo
ACaracterizacao da regiao de estudo
A1 Portugal Continental
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes
administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados
em 18 distritos
O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a
partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na
pagina do Instituto Geografico Portugues - httpwwwigeopt
A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o
map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-
hancas no WinBUGS
104 Apendice A Caracterizacao da regiao de estudo
Figura A1 ID dos concelhos do Norte de Portugal Continental
A1 Portugal Continental 105
Figura A2 ID dos concelhos do Sul de Portugal Continental
106 Apendice A Caracterizacao da regiao de estudo
A1 Portugal Continental 107
108 Apendice A Caracterizacao da regiao de estudo
A2 Numero de acidentes
Tabela A1 Estatısticas resumo de acidentes tipo 1
Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200
Tabela A2 Estatısticas resumo de acidentes tipo 2
Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800
Tabela A3 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100
A2 Numero de acidentes 109
Numero de acidentes que ocorreram nas estradas secundarias
Tabela A4 Estatısticas resumo de acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900
Tabela A5 Estatısticas resumo de acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800
Tabela A6 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700
110 Apendice A Caracterizacao da regiao de estudo
A3 Covariaveis
bull Populacao - P
Tabela A7 Estatısticas resumo da covariavel populacao
Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700
Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)
A3 Covariaveis 111
bull Area - A
Figura A4 Area em centenas de km2 por concelho (Fonte INE)
bull Densidade Populacional - DP
Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)
112 Apendice A Caracterizacao da regiao de estudo
bull Comprimento de Estrada - C
Figura A6 Quilometros de estrada por concelho (Fonte EP)
bull Quantidade de combustıvel vendido - VC
Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)
A3 Covariaveis 113
bull Ocupacao urbana do solo - OSU
Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
bull Ocupacao industrial do solo - OSI
Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)
114 Apendice A Caracterizacao da regiao de estudo
bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU
Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)
bull Ocupacao do solo com equipamento turıstico - OST
Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
A4 15 concelhos 115A
415
con
celh
os
Tab
ela
A8
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o1
Mold
elo
P1
816
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alb
ergaria
-a-V
elh
a3
Castro
Marim
Alc
acer
do
Sal
Grandola
Castro
Marim
Castro
Marim
Castro
Marim
Alb
ergaria
-a-V
elh
aV
ouzela
4A
lcacer
do
Sal
Castro
Marim
Castro
Marim
Grandola
Grandola
Alb
ergaria
-a-V
elh
aC
astro
Marim
Alc
acer
do
Sal
5V
izela
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
Vila
Velh
ade
Rodao
Pedrogao
Grande
6C
ondeix
a-a
-Nova
Azam
buja
Azam
buja
Azam
buja
Obid
os
Penela
Penela
Vila
Velh
ade
Rodao
7A
zam
buja
Viz
ela
Alj
ezur
Obid
os
Penela
Obid
os
Alj
ezur
Penela
8Silves
Alj
ezur
Obid
os
Condeix
a-a
-Nova
Azam
buja
Grandola
Obid
os
Alj
ezur
9A
lbufe
ira
Silves
Pom
bal
Pom
bal
Pom
bal
Vila
Velh
ade
Rodao
Pedrogao
Grande
Obid
os
10
Alj
ezur
Obid
os
Palm
ela
Penela
Alb
ergaria
-a-V
elh
aP
om
bal
Vouzela
Castro
Marim
11
Palm
ela
Pom
bal
Benavente
Palm
ela
Condeix
a-a
-Nova
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oE
sposende
12
Benavente
Benavente
Silves
Benavente
Vila
Velh
ade
Rodao
Azam
buja
Pom
bal
Montem
or-o
-Velh
o13
Pom
bal
Palm
ela
Penela
Vagos
Benavente
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
Tabua
14
Obid
os
Alb
ufe
ira
Olh
ao
Silves
Palm
ela
Condeix
a-a
-Nova
Esposende
Oliveir
ado
Bair
ro
15
Marin
ha
Grande
Olh
ao
Vagos
Olh
ao
Montem
or-o
-Velh
oP
edrogao
Grande
Tabua
Cham
usca
Mold
elo
BN
16
172
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
3C
astro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
4G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
5O
bid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
6C
ondeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
7A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
8P
om
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
9B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
10
Penela
Penela
Penela
Penela
Penela
Penela
Penela
Penela
11
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
12
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
13
Palm
ela
Alb
ergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
a14
Alb
ergaria
-a-V
elh
aP
alm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
15
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
o
116 Apendice A Caracterizacao da regiao de estudo
Tab
ela
A9
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o2
Modelo
P2
916
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ouriq
ue
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Alj
ustrel
4A
lcacer
do
Sal
Alc
acer
do
Sal
Avis
Nis
aO
urem
Nis
aA
ljustrel
Avis
5A
vis
Avis
Alc
acer
do
Sal
Rio
Maio
rN
isa
Alj
ustrel
Nis
aM
ourao
6C
ham
usca
Nis
aN
isa
Alj
ezur
Alc
acer
do
Sal
Mourao
Mourao
Nis
a7
Santarem
Cham
usca
Alj
ezur
Alc
acer
do
Sal
Alj
ustrel
Pedrogao
Grande
Pedrogao
Grande
Pedrogao
Grande
8V
ila
Nova
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rA
lcacer
do
Sal
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
da
Barquin
ha
da
Barquin
ha
9N
isa
Santarem
Vila
Nova
Pedrogao
Grande
Mourao
Ourem
Alc
acer
do
Sal
Proenca-a
-Nova
da
Barquin
ha
10
Alm
eir
imV
endas
Novas
Pedrogao
Grande
Mourao
Pedrogao
Grande
Ferreir
ado
Ale
ntejo
Proenca-a
-Nova
Alc
acer
do
Sal
11
Gole
ga
Montem
or-o
-Novo
Alj
ustrel
Vila
Nova
Ferreir
ado
Ale
ntejo
Rio
Maio
rG
randola
Idanha-a
-Nova
da
Barquin
ha
12
Vendas
Novas
Alj
ezur
Santarem
Cham
usca
Montem
or-o
-Novo
Montem
or-o
-Novo
Rio
Maio
rG
randola
13
Gavia
oG
avia
oM
ontem
or-o
-Novo
Montem
or-o
-Novo
Vila
Nova
Grandola
Ourem
Alm
odovar
da
Barquin
ha
14
Palm
ela
Gole
ga
Mourao
Ferreir
ado
Ale
ntejo
Grandola
Proenca-a
-Nova
Montem
or-o
-Novo
Montem
or-o
-Novo
15
Montem
or-o
-Novo
Alm
eir
imV
endas
Novas
Grandola
Cham
usca
Vila
Nova
Vila
Velh
ade
Rodao
Celo
ric
oda
Beir
ada
Barquin
ha
Modelo
BN
29
4
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ourem
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Avis
Alj
ustrel
4A
vis
Avis
Rio
Maio
rA
ljezur
Ourem
Nis
aA
ljustrel
Avis
5A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Nis
aN
isa
Alj
ustrel
Nis
aN
isa
6C
ham
usca
Nis
aN
isa
Alc
acer
do
Sal
Alc
acer
do
Sal
Ourem
Mourao
Mourao
7V
ila
Nova
Cham
usca
Alj
ezur
Rio
Maio
rA
ljustrel
Alc
acer
do
Sal
Alc
acer
do
Sal
Pedrogao
Grande
da
Barquin
ha
8Santarem
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rM
ourao
Pedrogao
Grande
Alc
acer
do
Sal
9N
isa
Santarem
Vila
Nova
Mourao
Mourao
Pedrogao
Grande
Ferreir
aFerreir
ada
Barquin
ha
do
Ale
ntejo
do
Ale
ntejo
10
Montem
or-o
-Novo
Alj
ezur
Alj
ustrel
Vila
Nova
Pedrogao
Grande
Rio
Maio
rO
urem
Proenca-a
-Nova
da
Barquin
ha
11
Vendas
Novas
Montem
or-o
-Novo
Santarem
Cham
usca
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
Rio
Maio
rC
elo
ric
oda
Beir
a12
Gole
ga
Alj
ustrel
Montem
or-o
-Novo
Pedrogao
Grande
Montem
or-o
-Novo
Montem
or-o
-Novo
Proenca-a
-Nova
Ourem
13
Salv
aterra
de
Magos
Vendas
Novas
Mourao
Montem
or-o
-Novo
Vila
Nova
Grandola
Montem
or-o
-Novo
Grandola
da
Barquin
ha
14
Alm
eir
imM
ourao
Pedrogao
Grande
Ferreir
aC
ham
usca
Vila
Nova
Grandola
Idanha-a
-Nova
do
Ale
ntejo
da
Barquin
ha
15
Alj
ezur
Salv
aterra
de
Magos
Ferreir
ado
Ale
ntejo
Grandola
Grandola
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aM
ontem
or-o
-Novo
A4 15 concelhos 117
Tab
ela
A1
015
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o3
Modelo
P3
61
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
Ferreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9C
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a10
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
11
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
12
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
13
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Modelo
BN
36
6
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9A
zam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
10
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
11
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a12
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
13
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
118 Apendice A Caracterizacao da regiao de estudoT
abel
aA
11
15co
nce
lhos
com
esti
mati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
Acid
entes
tip
o1
-M
odelo
BN
19
42
2000
2001
2002
2003
2004
2005
2006
2007
1M
arin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Ilhavo
Ilhavo
Ilhavo
Ilhavo
2Il
havo
Ilhavo
Ilhavo
Ilhavo
Marin
ha
Grande
Marin
ha
Grande
Vagos
Vagos
3A
lbufe
ira
Alb
ufe
ira
Vagos
Vagos
Vagos
Vagos
Marin
ha
Grande
Ferreir
ado
Zezere
4P
ortim
ao
Portim
ao
Alb
ufe
ira
Portim
ao
Portim
ao
Ferreir
ado
Zezere
Ferreir
ado
Zezere
Marin
ha
Grande
5V
agos
Vagos
Portim
ao
Porto
Porto
Portim
ao
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
6P
orto
Porto
Porto
Alb
ufe
ira
Ferreir
ado
Zezere
Porto
Porto
Montem
or-o
-Velh
o7
Faro
Penic
he
Penic
he
Penic
he
Penic
he
Penic
he
Portim
ao
Alp
iarca
8L
oule
Faro
Faro
Faro
Alb
ufe
ira
Oliveir
ado
Bair
ro
Montem
or-o
-Velh
oP
orto
9P
enic
he
Loule
Viz
ela
Ferreir
ado
Zezere
Coim
bra
Montem
or-o
-Velh
oP
enic
he
Penic
he
10
Odiv
ela
sO
div
ela
sC
oim
bra
Coim
bra
Faro
Coim
bra
Coim
bra
Coim
bra
11
Viz
ela
Viz
ela
Odiv
ela
sV
izela
Montem
or-o
-Velh
oA
lbufe
ira
Alp
iarca
Portim
ao
12
Olh
ao
Coim
bra
Loule
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Faro
Pom
bal
Pom
bal
13
Nazare
Olh
ao
Ferreir
ado
Zezere
Odiv
ela
sV
izela
Aveir
oA
veir
oA
veir
o14
Coim
bra
Setubal
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Aveir
oP
om
bal
Faro
Vis
eu
15
Setubal
Cantanhede
Setubal
Aveir
oP
om
bal
Viz
ela
Murtosa
Lis
boa
Acid
entes
tip
o2
-M
odelo
BN
29
86
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ourem
Ourem
Ourem
Ourem
Ourem
S
J
Madeir
a2
Rio
Maio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rFerreir
aZ
O
dem
ira
Odem
ira
3A
lmeir
imFerreir
aZ
Ferreir
aZ
Ferreir
aZ
Ferreir
aZ
R
ioM
aio
rFerreir
aZ
Ferreir
aZ
4
Ferreir
ado
Zezere
Alm
eir
imB
raganca
Braganca
Braganca
Odem
ira
S
J
Madeir
aV
izela
5Santarem
Braganca
Avis
Odem
ira
Odem
ira
Mourao
Braganca
Braganca
6L
isboa
Lis
boa
Odem
ira
Mourao
Mourao
Braganca
Rio
Maio
rO
urem
7C
ham
usca
Santarem
Lis
boa
Avis
Avis
S
J
Madeir
aA
lmodovar
Alm
odovar
8B
raganca
Cham
usca
Mourao
Lis
boa
Vim
ioso
Avis
Viz
ela
Tondela
9P
alm
ela
Avis
Santarem
Cham
usca
Ala
ndroal
Vim
ioso
Tondela
Chaves
10
Salv
aterra
de
Magos
Palm
ela
Cham
usca
Palm
ela
S
J
Madeir
aA
lmodovar
Chaves
Rio
Maio
r11
Avis
Salv
aterra
de
Magos
Alm
eir
imSantarem
Alm
odovar
Chaves
Elv
as
Guim
araes
12
Ilhavo
Odem
ira
Palm
ela
Ala
ndroal
Elv
as
Ala
ndroal
Serta
13
Vila
Nova
da
Barquin
ha
Mourao
Salv
aterra
de
Magos
Elv
as
Palm
ela
Tondela
Palm
ela
14
Nazare
Vila
Nova
da
Barquin
ha
Ala
ndroal
Alm
eir
imC
ham
usca
Elv
as
Portim
ao
15
Abrantes
Ala
ndroal
Lagos
Salv
aterra
de
Magos
Lis
boa
Palm
ela
Loule
Acid
entes
tip
o3
-M
odelo
P3
630
2000
2001
2002
2003
2004
2005
2006
2007
1O
dem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
2M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
3V
imio
so
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Cantanhede
4F
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
o5
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
6M
iranda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
7A
lmodovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
8Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
9A
lcoutim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
10
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
11
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
12
Alc
ochete
Alc
ochete
Alc
ochete
Macedo
de
Cavale
iros
Alc
ochete
Alc
ochete
13
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Vagos
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
14
Vagos
Vagos
Vagos
Cantanhede
Vagos
Vagos
15
Cantanhede
Cantanhede
Cantanhede
Alc
ochete
Cantanhede
Cantanhede
Referencias Bibliograficas
Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes
in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625
ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt
Defaultaspxtabid=220amplanguage=pt-PT
ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx
fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT
Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population
density Statistics in Medicine 18(16) 2147ndash2162
Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety
performance indicators by using a multivariate generalized linear mixed model Journal
of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517
Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis
for Spatial Data Chapman amp Hall
Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease
maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431
Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini
M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med
14(21-22) 2433ndash2443
Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis
of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007
Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems
Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236
Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-
tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20
101007BF00116466
120 Referencias bibliograficas
Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis
with R Springer
Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed
Models Journal of the American Statistical Association 88(421) 9ndash25
Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane
roads Accident Analysis amp Prevention 39(4) 657 ndash 670
Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a
velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos
PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico
Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em
Seguranca Rodoviaria Technical report IST and LNEC
Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-
Temporally Correlated Survival Data In Bayesian Statistics 7
Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data
Analysis Chapman amp Hall
Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative
Risks for Use in Disease Mapping Biometrics 43 671ndash681
Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data
Biometrics 65 1254ndash1261
Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao
em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo
20economico20e20social20dos20acidentes_versao20para20internet
Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in
Europe Applied Spatial Analysis 1 133ndash150
Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level
Example of Belgium Journal of Safety Research 39(4) 417 ndash 427
El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate
Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828
Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety
Accident Analysis amp Prevention 40(6) 1964 ndash 1969
Referencias bibliograficas 121
Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis
and Prevention 43 253ndash264
Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall
Gelfand A E (1996) Model determination using sampling-based methods In W
Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice
chapter 9 (pp 145ndash161) Chapman amp
Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive
models for spatial data analysis Biostatistics 4(1) 11ndash15
Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis
Chapman amp Hall
Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for
the analysis of spatial data An application to disease mapping Journal of Statistical
Planning and Inference 75(2) 305 ndash 318
Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and
Estimation Journal of the American Statistical Association 102(477) 359ndash378
Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical
Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808
Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps
with Application to German Mortality Data httpepububuni-muenchende
Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive
Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical
Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD
Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR
Models for Areal Data Biometrics 61(4) 950ndash961
Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease
risk Statistics In Medicine 19(17-18) 2555ndash2567
Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space
Statistics in Medicine 17(18) 2045ndash2060
Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-
demiology CRC Press Taylor amp Francis
122 Referencias bibliograficas
Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-
mann P e Divino F (2000) Disease mapping models an empirical evaluation
Statistics in Medicine 19(17-18) 2217ndash2241
Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-
temporal patterns of intra-city motor vehicle craches Journal of Transport Geography
15 274ndash285
Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical
models in road safety countermeasure effectiveness studies in Iowa Accident Analysis
amp Prevention 40(4) 1531 ndash 1542
Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-
Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis
amp Prevention 40(3) 1123 ndash 1134
Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small
sample size on the estimation of the fixed dispersion parameter of Poisson-gamma
models for modeling motor vehicle crashes A Bayesian perspective Safety Science
46(5) 751 ndash 770
Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-
persion parameters of Poisson-gamma models on empirical Bayes estimates Accident
Analysis amp Prevention 40(4) 1441 ndash 1457
Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-
inflated regression models of motor vehicle crashes balancing statistical fit and theory
Accident Analysis amp Prevention 37(1) 35 ndash 46
Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal
regression model for prediction of crash counts by severity using Bayesian methods
Accident Analysis amp Prevention 40(3) 964 ndash 975
MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident
and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028
Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P
Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive
Statistical Methods (pp 99ndash114) Springer
Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-
tent Gaussian models using integrated nested Laplace approximations A manual for
Referencias bibliograficas 123
the inla program Technical report Norwegian University of Science and Technology
Trondheim
McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall
Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-
provements Decision parameter treatability concept statistical criterion and spatial
dependence Accident Analysis amp Prevention 37(4) 699 ndash 720
Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A
Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57
Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures
for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201
Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle
crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468
Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties
in england Accident Analysis amp Prevention 36(6) 973 ndash 984
OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications
world_health_statistics2008en
OMS (2009) Global status report on road safety httpwhqlibdocwhoint
publications20099789241563840_engpdf
Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao
Calouste Gubenkian
Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes
factors Biometrika 77(3) 455ndash466
Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-
tistics 9(3) 523ndash539
Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis
and output analysis for MCMC R News 6(1) 7ndash11
Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and
heterogeneity An analysis of London crash data Accident Analysis amp Prevention
40(4) 1486 ndash 1497
124 Referencias bibliograficas
R Development Core Team (2008) R A Language and Environment for Statistical
Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-
07-0
Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology
Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications
Chapman amp HallCRC
Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent
gaussian models by using integrated nested laplace approximations Journal of the
Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392
Schrodle B e Held L (2011) A primer on disease mapping and ecological regression
using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2
Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment
and Posterior Inference Journal of Statistical Software 21(11) 1ndash37
Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial
models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)
246 ndash 273
Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian
measures of model complexity and fit J R Statist Soc B 64 583ndash639
Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and
Marginal Densities Journal of the American Statistical Association 81 82ndash86
Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian
Journal of Statistics 31 221ndash229
Wakefield J (2007) Disease mapping and spatial regression with count data Biostat
8(2) 158ndash183
Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press
Taylor amp Francis
Siglas e Acronimos
A Area geografica
AE Autoestrada
ANSR Autoridade Nacional de Seguranca Rodoviaria
BN Binomial Negativo
BT Brigada de Transito
BOA An R Package for MCMC Output Convergence
Assessment and Posterior Inference
BUGS Bayesian Using Gibbs Sampling
C Comprimento de estrada
CARE Community database on accidents on the roads in Europe
CE Codigo de Estrada
CODA Convergence Diagnosis and Output Analysis for MCMC
CPO Conditional Predictive Ordinates
DIC Deviance Information Criterion
DP Densidade populacional
EN Estrada Nacional
ENSR Estrategia Nacional de Seguranca Rodoviaria
GNR Guarda Nacional Republicana
HPD Highest Probability Density
IC Itinerario Complementar
INLA Integrated Nested Laplace Approximations
IP Itinerario Principal
MCMC Markov Chains Monte Carlo
mls Mean logarithmic score
OMS Organizacao Mundial de Saude
ONU Organizacao das Nacoes Unidas
OSEPU Ocupacao do solo com equipamentos e parques urbanos
OSI Ocupacao industrial do solo
OST Ocupacao do solo com equipamento turıstico
OSU Ocupacao urbana do solo
pD Numero efetivo de parametros
PIT Probability Integral Transformation
PMOT Plano Municipal de Ordenamento do Territorio
PMSR Planos Municipais de Seguranca Rodoviaria
PSP Polıcia de Seguranca Publica
R A Language and Environment for Statistical Computing
SafetyNET Projeto europeu European Traffic Information System -
Data Colletion and Analysis Tools for Policy Making
SMR Standard Morbility Ratio
UE Uniao Europeia
WinBUGS versao em ambiente Windows do programa BUGS
VC Quantidade de combustıvel vendido
Conteudo
Lista de Tabelas xiv
Lista de Figuras xv
Introducao 1
1 Nocoes sobre seguranca rodoviaria 9
11 Risco em seguranca rodoviaria 9
12 Caracterizacao dos dados de acidentes 10
13 Caracterizacao da medida de exposicao 14
2 Modelacao estatıstica de acidentes rodoviarios 19
21 Modelos bayesianos hierarquicos 21
22 Modelos nao espaciais 24
23 Modelos espaciais 27
24 Modelos espaco-temporais 28
25 Modelos multivariados 30
26 Metodos de inferencia 32
261 INLA 32
27 Ajustamento e medidas preditivas 36
3 Aplicacoes 39
31 Associacao espacial 40
32 Modelos 43
33 Modelos espaco-temporais 45
331 Associacao regional 46
332 Selecao dos modelos 47
333 Modelos para acidentes do tipo 1 48
334 Validacao dos modelos para acidentes do tipo 1 49
335 Resultados obtidos com modelos para acidentes do tipo 1 49
xii Conteudos
336 Modelos para acidentes do tipo 2 61
337 Validacao dos modelos para acidentes do tipo 2 62
338 Resultados obtidos com modelos para acidentes do tipo 2 62
339 Modelos para acidentes do tipo 3 73
3310 Validacao dos modelos para acidentes do tipo 3 73
3311 Resultados obtidos com modelos para acidentes do tipo 3 74
34 Modelos multivariados 83
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
351 Modelo para acidentes do tipo 1 89
352 Validacao do modelo para acidentes do tipo 1 89
353 Resultados obtidos com o modelo para acidentes do tipo 1 90
354 Modelo para acidentes do tipo 2 92
355 Validacao do modelo para acidentes do tipo 2 92
356 Resultados obtidos com o modelo para acidentes do tipo 2 93
357 Modelos para acidentes do tipo 3 95
358 Validacao do modelo para acidentes do tipo 3 95
359 Resultados obtidos com o modelo para acidentes do tipo 3 96
4 Discussao e conclusoes 99
A Caracterizacao da regiao de estudo 103
A1 Portugal Continental 103
A2 Numero de acidentes 108
A3 Covariaveis 110
A4 15 concelhos 115
Referencias Bibliograficas 119
Lista de Tabelas
11 Numero total de cada tipo de acidentes rodoviarios por ano 11
12 Estatısticas resumo do numero de veıculos com seguro em milhares 14
21 Modelos univariados 30
31 Valores do ındice EBI para cada tipo de acidente por ano 43
32 Valores DIC e mls dos modelos Poisson sem covariaveis 44
33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis 44
34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis 45
35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais sem
covariaveis 46
36 DIC pD e mls para cada tipo de acidente 47
37 DIC pD e mls para acidentes tipo 1 48
38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1 50
39 Estatısticas resumo dos parametros do modelo P 1 8 1 53
310 Estatısticas resumo dos parametros do modelo P 1 8 16 54
311 Estatısticas resumo dos parametros do modelo BN 1 6 1 55
312 Estatısticas resumo dos parametros do modelo BN 1 6 172 55
313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16 57
314 DIC pD e mls para acidentes tipo 2 61
315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2 63
316 Estatısticas resumo para os parametros do modelo P 2 9 1 66
317 Estatısticas resumo para os parametros do modelo P 2 9 16 67
318 Estatısticas resumo para os parametros do modelo NB 2 9 1 67
319 Estatısticas resumo para os parametros do modelo NB 2 9 4 68
320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16 69
321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4 71
322 DIC pD e mls para acidentes tipo 3 73
323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3 74
xiv Lista de Tabelas
324 Estatısticas resumo dos parametros do modelo P 3 6 1 78
325 Estatısticas resumo dos parametros do modelo BN 3 6 1 78
326 Estatısticas resumo dos parametros do modelo BN 3 6 6 78
327 Modelos univariados 82
328 Estatısticas resumo para os parametros do modelo espaco-temporal mul-
tivariado e dos modelos univariados 83
329 Correlacoes dos modelos multivariados com interacao e sem interacao
espaco-temporal 84
330 Vıtimas a 24 horas e vıtimas a 30 dias 84
331 Numero total de cada tipo de acidentes rodoviarios por ano 87
332 DIC pD e mls para cada tipo de acidente 89
333 Estatısticas resumo dos parametros do modelo BN 1 9 42 90
334 DIC pD e mls 92
335 Estatısticas resumo dos parametros do modelo BN 2 9 86 93
336 Estatısticas resumo dos parametros do modelo P 3 6 30 96
337 Comparacao entre a abordagem local e a global 98
A1 Estatısticas resumo de acidentes tipo 1 108
A2 Estatısticas resumo de acidentes tipo 2 108
A3 Estatısticas resumo de acidentes tipo 3 108
A4 Estatısticas resumo de acidentes tipo 1 109
A5 Estatısticas resumo de acidentes tipo 2 109
A6 Estatısticas resumo de acidentes tipo 3 109
A7 Estatısticas resumo da covariavel populacao 110
A8 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 1 115
A9 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 2 116
A10 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 para acidentes tipo 3 117
A11 15 concelhos com estimativas de risco relativo significativamente maiores
que 1 118
Lista de Figuras
1 Dez principais causas de morte no mundo 2
2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria 4
11 Numero de acidentes tipo 1 por concelho 12
12 Numero de acidentes tipo 2 por concelho 12
13 Numero de acidentes tipo 3 por concelho 13
14 Numero de veıculos com seguro em milhares por concelho e por ano 14
15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007 15
16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007 16
17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007 16
31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 de
acidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano
2000 41
32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de
veıculos com seguro no ano 2000 41
33 Valores estimados dos SMR1 e respetivos intervalos de confianca para
cada concelho no ano 2000 42
34 Histograma dos valores de EBI simulados e valor de EBI observado para
acidentes tipo 1 e para ano 2000 43
35 Histograma das diferencas entre as medias dos logscores 48
36 Histograma dos valores PIT ajustados para acidentes tipo 1 49
37 Box plot dos valores estimados para acidentes tipo 1 50
38 Amplitude dos intervalos para acidentes tipo 1 51
39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 1 51
310 Valores estimados dos SMR1 e respetivos intervalos de confianca para o
ano 2000 52
xvi Lista de Figuras
311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 52
312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com o
modelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000 53
313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo P 1 8 16 56
314 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco temporal para acidentes tipo 1 obtidos com o modelo
P 1 8 16 56
315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo P 1 8 16 57
316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 6 172 58
317 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172 58
318 Valores esperados a posteriori da contribuicao das covariaveis C e P obti-
dos com o modelo BN 1 6 172 59
319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos com
o modelo BN 1 6 172 60
320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 6 172 60
321 Histograma das diferencas entre as medias dos logscores 61
322 Histograma dos valores PIT ajustados para acidentes tipo 2 62
323 Box plot dos valores estimados para acidentes tipo 2 63
324 Amplitude dos intervalos para acidentes tipo 2 64
325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori dos acidentes tipo 2 64
326 Valores estimados dos SMR2 e respetivos intervalos de confianca para o
ano 2000 65
327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 65
328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com o
modelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000 66
329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo P 2 9 16 68
330 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
P 2 9 16 69
Lista de Figuras xvii
331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2
de 2000 a 2007 obtidos com o modelo P 2 9 16 70
332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 4 71
333 Valores esperados a posteriori da componente espacial e da componente
de interacao espaco-temporal para acidentes tipo 2 obtidos com o modelo
BN 2 9 4 71
334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 4 72
335 Histograma dos valores PIT ajustados para acidentes tipo 3 74
336 Box plot dos valores estimados para acidentes tipo 3 75
337 Amplitude dos intervalos para acidentes tipo 3 75
338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados a
posteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6 76
339 Valores estimados dos SMR3 e respetivos intervalos de confianca para o
ano 2000 76
340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 77
341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com o
modelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000 77
342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 1 79
343 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo P 3 6 1 79
344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3
de 2000 a 2007 obtidos com o modelo P 3 6 1 80
345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo BN 3 6 6 81
346 Valores esperados a posteriori da componente espacial e da componente
temporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6 81
347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo BN 3 6 6 82
348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos univariados e com os modelos multivariados 85
349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidos
com os modelos multivariados 86
350 Numero de acidentes tipo 1 por concelho 87
351 Numero de acidentes tipo 2 por concelho 88
xviii Lista de Figuras
352 Numero de acidentes tipo 3 por concelho 88
353 Histograma dos valores PIT ajustados para acidentes tipo 1 89
354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003
e 2007 obtidos com o modelo BN 1 9 42 90
355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de
2000 a 2007 obtidos com o modelo BN 1 9 42 91
356 Histograma dos valores PIT justados para acidentes tipo 2 92
357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003
e 2007 obtidos com o modelo BN 2 9 86 94
358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de
2000 a 2007 obtidos com o modelo BN 2 9 86 94
359 Histograma dos valores PIT ajustados para acidentes tipo 3 95
360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003
e 2007 obtidos com o modelo P 3 6 30 96
361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de
2000 a 2007 obtidos com o modelo P 3 6 30 97
A1 ID dos concelhos do Norte de Portugal Continental 104
A2 ID dos concelhos do Sul de Portugal Continental 105
A3 Numero de habitantes por concelho e por ano 110
A4 Area por concelho 111
A5 Densidade populacional por concelho 111
A6 Quilometros de estrada por concelho 112
A7 Quantidade de combustıvel vendido por concelho 112
A8 Superfıcie de ocupacao urbana do solo por concelho 113
A9 Superfıcie de ocupacao industrial do solo por concelho 113
A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos por
concelho 114
A11 Superfıcie de ocupacao do solo com equipamento turıstico por concelho 114
ldquoThe road to wisdom - Well itacutes plain and simple to express
Err and err and err again but less and less and lessrdquo
Piet Hein (1996)
Introducao
A primeira vıtima mortal por acidente rodoviario conhecida no mundo foi uma senhora
de 44 anos Bridget Driscoll que foi atropelada a 17 de Agosto de 1896 por um veıculo
automovel em Londres O condutor foi julgado e o veredicto do juri foi o de que se
tratava de uma morte acidental tendo os jurados deixado a seguinte recomendacao
ldquoThis must never happen againrdquo Mais de um seculo passado e segundo o 1o
Relatorio Global da Seguranca Rodoviaria da Organizacao Mundial de Saude de 2009
OMS (2009) morrem todos os anos mais de 12 milhoes de pessoas devido a acidentes
rodoviarios das quais quase metade sao peoes ciclistas e motociclistas Para alem disso
entre 20 a 50 milhoes de pessoas ficam feridas Os acidentes rodoviarios estao entre as
tres primeiras causas de morte na faixa etaria dos 5 aos 44 anos sendo a primeira causa
na faixa dos 15 aos 29 anos Em termos economicos face a maior morbilidade nas faixas
etarias mais activas os custos com os acidentes rodoviarios representam de 1 a 3 do
PIB mundial
A Organizacao Mundial de Saude (OMS) estima que se nao forem tomadas as medidas
necessarias os acidentes rodoviarios poderao passar da nona causa de morte em 2004
para a quinta causa de morte em 2030
2 Introducao
2004
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Infecoes respiratorias
4 Doencas pulmonares
5 Diarreias
6 HIVAIDS
7 Tuberculose
8Cancro do pulmao
dos bronquios e da traqueia
9 Acidentes rodoviarios
10Recem-nascidos prematuros
e de peso baixo
HH
2030
Ordem Doenca ou ferimento
1 Doencas cardiovasculares
2 Doencas vasculares cerebrais
3 Doencas pulmonares
4 Infecoes respiratorias
5 Acidentes rodoviarios
6Cancro do pulmao
dos bronquios e da traqueia
7 Diabetes mellitus
8 Doencas do coracao hipertensas
9 Cancro do estomago
10 HIVAIDS
Figura 1 Dez principais causas de morte no mundo comparacao entre 2004 e 2030Fonte World Heath Statistics 2008 (OMS 2008)
No que respeita a Uniao Europeia (UE) a mortalidade e a morbilidade tem vindo a
decrescer no entanto apesar do aparente panorama global favoravel os nıveis de segu-
ranca rodoviaria ainda sao inadmissıveis com cerca de 30 100 mortes anuais Para alem
disso como se preve o aumento significativo do volume de circulacao rodoviaria se nao
forem conseguidas melhorias importantes relativamente ao risco de morte por acidentes
rodoviarios a curto prazo esta tendencia descendente podera vir a ser invertida
No caso especıfico de Portugal segundo o Relatorio 2011 da Autoridade Nacional de
Seguranca Rodoviaria (ANSR) houve 35 541 acidentes com vıtimas dos quais 2 641 aci-
dentes com mortos ou feridos graves e 636 acidentes com mortos Em termos de custos
socio-economicos estima-se que se percam cerca de 25 milhoes de euros por ano com a
sinistralidade rodoviaria em Portugal o que representa cerca de 15 do PIB (Donario
e Santos 2012)
O sistema de trafego rodoviario um subsistema do sistema de transportes e formado
por um trinomio constituıdo por indivıduos por elementos mecanicos e por uma in-
fraestrutura que interagem num quadro normativo legal Os indivıduos sao aos utentes
rodoviarios nomeadamente condutores peoes e passageiros Os elementos mecanicos
correspondem aos veıculos e as respetivas cargas A infraestrutura corresponde a estrada
e ao ambiente rodoviario envolvente O objetivo do funcionamento deste sistema e a
deslocacao de pessoas ou bens em condicoes de seguranca e de economia de recursos
Introducao 3
(ambientais e economicos) por meios rodoviarios Num sistema ideal a deslocacao de
pessoas ou bens nao estaria sujeita ao perigo de resultados prejudiciais caracterizando-se
por uma seguranca absoluta Assim a nocao de seguranca pode ser descrita como uma
qualidade que permite ao sistema funcionar com uma quantidade aceitavelmente pequena
de perdas e deste modo a seguranca rodoviaria constitui um indicador da eficacia do
sistema de trafego rodoviario No entanto a sinistralidade rodoviaria produto da inse-
guranca deste sistema complexo tem consequencias devastadoras em termos humanos
sociais e economicos (Cardoso 2007)
Numa sociedade industrializada a mobilidade terrestre e indispensavel mas acarreta
consequencias gravıssimas como poluicao do ar poluicao sonora congestionamentos
consumo de energias sinistralidade rodoviaria entre outras Estas consequencias moti-
vam a preocupacao e a acao das populacoes e das autoridades Sem pretender fazer uma
descricao exaustiva importa contudo indicar algumas das acoes que foram implemen-
tadas a nıvel mundial
minus Em 1962 a OMS reconheceu a dimensao mundial do problema da seguranca ro-
doviaria
minus Em 1974 foi adotada uma resolucao da OMS que classifica os acidentes rodoviarios
como um problema de saude publica
minus Em 2003 a Organizacao das Nacoes Unidas tomou medidas face a crise global da
seguranca rodoviaria conjuntamente com a OMS e o Banco Mundial
minus Em 2004 o Dia Mundial da Saude foi dedicado a seguranca rodoviaria
minus Em 2007 realizou-se a Primeira Semana Global da Seguranca Rodoviaria das
Nacoes Unidas
minus Em 2009 foi elaborado o 1o Relatorio Mundial Sobre o Estado da Seguranca
Rodoviaria
minus Em 2010 a ONU proclamou o perıodo de 2011 a 2020 como a Decada Mundial de
Acao para a Seguranca Rodoviaria
Estas acoes internacionais comuns tem como pilar a gestao da seguranca rodoviaria
Pretendem nao apenas contribuir para minimizar as consequencias causadas pelos aci-
dentes rodoviarios mas tambem permitir a implementacao de projetos de mobilidade
responsavel e sustentavel Portanto visam promover as boas praticas e a educacao para
uma cidadania responsavel o melhoramento das infraestruturas viarias a seguranca dos
veıculos e uma resposta pos acidente mais rapida e eficaz A pratica de uma polıtica
sustentada de longo prazo torna-se particularmente urgente perante a dimensao deste
flagelo Consequentemente nos ultimos anos tem havido um forte investimento na area
da seguranca rodoviaria em projetos de investigacao e cooperacao aos nıveis cientıfico e
tecnologico A investigacao tem incidido particularmente em seis grandes areas recolha
uniformizada de dados o projeto de novas estradas ou de reabilitacao das existentes
4 Introducao
projetos de veıculos integrando equipamentos de seguranca ativa e passiva o controlo do
trafego e a sinalizacao o comportamento do condutor e as aplicacoes de telematica para
veıculos tambem designada por sistemas inteligentes de transportes
A tıtulo de exemplo a adesao de Portugal a UE em 1986 permitiu um enorme desen-
volvimento do paıs associado ao cumprimento de metas europeias Assim nos ultimos
30 anos a infraestrutura rodoviaria sofreu grandes melhoramentos em termos de quan-
tidade qualidade e tipologia O parque automovel aumentou consideravelmente e foi
progressivamente modernizado tendo sido acompanhado por um aumento do numero
de condutores Contudo apesar dos ındices de sinistralidade rodoviaria em Portugal
terem sido historicamente muito elevados Portugal apresentou a melhor evolucao de
toda a Europa dos 25 nos ultimos 30 anos Mais ainda nos ultimos 15 anos conseguiu
aproximar-se significativamente da media europeia (ANRS 2009) Como se pode ver
na Figura 2 verifica-se uma tendencia decrescente na mortalidade rodoviaria associada
a implementacao de algumas medidas especıficas
Figura 2 Evolucao do numero de vıtimas mortais e medidas de seguranca rodoviaria emPortugal Fonte (ANSR 2010)
As estatısticas registadas suscitaram o interesse de investigadores e de polıticos para
compreender melhor a complexidade de fatores relacionados com os acidentes rodoviarios
e em determinar se um dado problema de seguranca rodoviaria e local (nacional ou
regional) ou se e partilhado por todos os paıses europeus Assim tem havido uma
consideravel investigacao direcionada para o desenvolvimento de modelacao estatıstica
de dados de acidentes rodoviarios
Em Portugal a investigacao no domınio da modelacao tem sido realizada sobretudo
pelo LNEC No entanto apesar dos desenvolvimentos produzidos nas ultimas decadas e
Introducao 5
do crescente interesse da sociedade pelo tema da seguranca rodoviaria verificam-se ainda
lacunas serias na modelacao da sinistralidade Tais lacunas constituem um fecundo e util
domınio para desenvolvimento de atividades de investigacao O ambito desta tese e
portanto a modelacao estatıstica de dados de acidentes rodoviarios
Os modelos desenvolvidos devem servir como referencia na implementacao de acoes cor-
retivas destinadas a diminuir o numero de acidentes rodoviarios No sentido de agilizar
progressivamente a execucao dessas acoes foram identificados varios fatores capazes de
melhorar a qualidade e a comparabilidade dos dados Entre muitos interessa referir em
particular a uniformizacao das definicoes de varios termos e de informacoes relacionadas
com acidentes rodoviarios incluıdos nas estatısticas e nas bases de dados
As bases de dados de acidentes rodoviarios constituem um suporte essencial para uma
melhor avaliacao dos problemas da seguranca rodoviaria para a identificacao de areas de
intervencao prioritarias bem como para uma monitorizacao eficaz das medidas correti-
vas aplicadas Tendo sido reconhecida a sua importancia ao nıvel europeu foi aprovada
em 1993 a criacao de uma base de dados comunitaria de acidentes rodoviarios ocorri-
dos na UE (CARE - Community database on accidents on the roads in Europe) No
projeto integrado SafetyNET (European Traffic Information System - Data Colletion
and Analysis Tools for Policy Making1) que visou o desenvolvimento de um sistema de
informacao para apoio as polıticas de seguranca rodoviaria europeia uma das tarefas
principais consistiu em definir os requisitos em termos de dados sobre exposicao ao risco
e em definir os indicadores de seguranca Estas definicoes sao usadas no Capıtulo 1 como
ponto de partida para a modelacao estatıstica usada nesta tese
A informacao e os dados sobre acidentes tem um atributo geografico podendo ser orga-
nizados em sistemas de informacao geografica (SIG) desde que devidamente georeferen-
ciados O interesse da organizacao de dados em SIG e mais evidente no caso dos modelos
desagregados nos quais e potenciada a utilizacao de novas ferramentas de regressao espa-
cial e a identificacao das correlacoes de fatores geograficos com a ocorrencia dos acidentes
o que facilita a identificacao dos fatores causais e de intervencoes corretivas
As tecnicas mais habituais para o desenvolvimentos destes modelos sao a regressao es-
tatıstica e os metodos de reconhecimento de padroes ligados a Inteligencia Artificial
como as redes neuronais os algoritmos geneticos e a teoria dos conjuntos fuzzy
A proposta apresentada nesta tese insere-se no ambito dos modelos de regressao es-
tatıstica Em geral foram detetados varios problemas na estimacao dos parametros
de interesse tais como sobredispersao variaveis de confundimento nao mensuraveis ou
desconhecidas dependencia espacial e depedencia temporal que continuam a constituir
objecto de investigacao Tem sido propostas varias alternativas para abordar estes pro-
blemas como por exemplo
1httpeceuropaeutransportwcmroad_safetyersosafetynetcontentsafetynethtm
6 Introducao
minus modelos lineares generalizados baseados na distribuicao de Poisson
minus modelos baseados na distribuicao Binomial Negativa para contemplar a existencia
de sobredispersao
minus modelo Poisson zero-inflacionado ou modelo Binomial Negativo zero-inflacionado
para analisar dados de acidentes com sobredispersao e excesso de zeros
minus modelos de nıveis multiplos estruturados
minus modelos bayesianos hierarquicos
minus incorporacao de correlacao espacial e dependencia temporal nos modelos
A estimacao do numero esperado de acidentes continua a ser um problema em aberto nao
existindo um metodo que resolva todas as questoes inerentes No entanto e generalizada
a referencia a superioridade dos metodos bayesianos (Cardoso 2007 Elvik 2008)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre
os metodos tradicionais Outros estudos ainda mostram que os modelos bayesianos
hierarquicos que tem sido pesquisados no ambito do mapeamento de doencas tambem
podem ser usados para a analise especıfica de acidentes rodoviarios ao nıvel de areas (Li
et al 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al 2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de captar
a variabilidade das estimativas em areas pequenas enquanto revelam padroes espaciais
e tendencias temporais por permitirem a incorporacao de efeitos espaciais e temporais
atraves da informacao a priori produzindo assim estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004)
O desenvolvimento computacional verificado nas ultimas decadas permitiu o avanco da
estatıstica bayesiana e da analise espacial de dados e a sua aplicacao generalizada a
problemas em areas bastante diversas Deste modo foi possıvel ultrapassar a maior
barreira da Estatıstica Bayesiana nomeadamente a complexidade de calculos que a sua
formalizacao exige pois por volta de 1990 surgiram os metodos MCMC (Markov Chains
Monte Carlo) na computacao bayesiana
A aplicacao da metodologia bayesiana a problemas com estrutura complexa tornou-se
nao so possıvel como passou a ser a metodologia de eleicao para estudar modelos que
envolvam nıveis multiplos com efeitos aleatorios e estruturas de dependencia complexas
O seu crescimento ao nıvel das aplicacoes tem sido extraordinario
O programa WinBUGS versao em ambiente Windows do programa BUGS (Bayesian Using
Gibbs Sampling) ja possui um pacote adicional com tecnicas de Estatıstica Espacial o
GeoBUGS e analises complementares de covergencia podem ser efectuadas recorrendo ao
Introducao 7
CODA Plummer et al (2006) e ao BOA Smith (2007)
Por sua vez o R R Development Core Team (2008) tambem ja possui uma serie de
pacotes com tecnicas de Estatıstica Espacial entre eles o geoR e o geoRlm (geoestatıstica)
o spdep (dados de area) o splancs e o spatstat (analise de padroes pontuais) Em
particular o projecto R-Spatial desenvolve metodos para tratar dados espaciais
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC ver por exemplo Gamerman (1997) e computacionalmente muito in-
tensa e acarreta alguns problemas Por esta razao novas abordagens tem sido propostas
Uma abordagem recente proposta em Rue et al (2009) consiste na inferencia bayesiana
aproximada via INLA (Integrated Nested Laplace Approximations) e e uma alternativa
determinıstica aos metodos de simulacao MCMC Apesar de tambem possuir algumas
limitacoes tem um desempenho muito mais rapido que o WinBUGS em muitas situacoes
de concordancia
Todas as analises envolvidas no metodo INLA estao implementadas num programa que
pode ser usado no R atraves do pacote R-INLAMartino e Rue (2010b) e que pode ser
descarregado em wwwr-inlaorg Desta forma a inferencia bayesiana para modelos
hierarquicos complexos tornou-se muito mais acessıvel
Nesta tese os modelos usados foram implementados no WinBUGSGeoBUGS e no R-INLA
Objetivos
Um dos objetivos gerais consiste em utilizar a abordagem bayesiana atraves de mode-
los hierarquicos para tracar inferencias de interesse relativo a problemas de seguranca
rodoviaria em areas geograficas diferentes
Pretende-se averiguar questoes relacionadas com a estimacao dos parametros de interesse
tais como sobredispersao variaveis de confundimento nao mensuraveis dependencia es-
pacial e depedencia temporal
Os modelos assim desenvolvidos permitem a identificacao dos concelhos de Portugal
Continental de maior risco relativamente ao paıs e a analise da associacao concelhia com
potenciais fatores de risco ou de exposicao
Pretende-se conseguir uma metodologia de aplicacao que permita efetuar comparacoes
nao so ao nıvel nacional ou regional mas tambem ao nıvel internacional
Um objetivo especıfico consiste na utilizacao da nova metodologia Integrated Nested La-
place Approximations atraves da exploracao do pacote R-INLA
8 Introducao
Estrutura da tese
No Capıtulo 1 apresentam-se algumas definicoes usadas em seguranca rodoviaria e a
caracterizacao dos dados usados nesta tese
No Capıtulo 2 descreve-se em detalhe a metodologia utilizada e os diferentes modelos
No Capıtulo 3 aplicam-se os modelos bayesianos hierarquicos a dados espaco-temporais
de sinistralidade rodoviaria registados em Portugal Continental
No Capıtulo 4 apresentam-se as conclusoes tecem-se algumas consideracoes no sentido
de melhorar o ajuste dos modelos propostos e recomendacoes para trabalhos futuros
No Anexo A faz-se a caracterizacao da regiao de estudo
No CD em anexo encontram-se todos os codigos usados nesta tese
1Nocoes sobre seguranca rodoviaria
11 Risco em seguranca rodoviaria
O numero de acidentes rodoviarios por gravidade ou o numero de vıtimas sao indicadores
de seguranca informativos muito importantes No entanto quando se pretende fazer
comparacoes entre areas geograficas diferentes tem que se comparar os indicadores de
acordo com uma determinada medida Para isso pode usar-se uma medida de seguranca
rodoviaria basica que se designa por risco ou taxa Assim o risco de ocorrencia de
acidente rodoviario e dado pela taxa de ocorrencia de acidentes ou seja
risco=numero esperado de acidentesmedida de exposicao
A medida de exposicao e o numero de ocasioes em que pode ocorrer um acidente e cor-
responde ao numeros de vezes em que os utentes rodoviarios estao expostos a possıvel
ocorrencia de um acidente o que pode ser associado ao numero de situacoes de in-
teracao entre os elementos do sistema rodoviario Portanto o numero de ocasioes e a
melhor medida de exposicao teorica mas na pratica e desconhecida Entao torna-se ne-
cessario recorrer a medidas de exposicao mais praticas que possam ser mais ou menos
proximas do conceito teorico de exposicao e que podem apresentar diferentes vantagens
e limitacoes A medida de exposicao pode estar diretamente relacionada com o trafego
10 Capıtulo 1 Nocoes sobre seguranca rodoviaria
atraves do comprimento de estrada do numero de veıculos ou preferencialmente da
distancia percorrida pelos veıculos (expressa em veıculos times km) alternativamente pode
estar associada a populacao de risco atraves do numero de habitantes do numero de
condutores do comprimento dos percursos efetuados pelas pessoas (expresso em pessoas
times km) do tempo de percurso ou do numero de percursos O numero de veıculos timesquilometro e indicado como a medida de exposicao mais apropriada para estimar o risco
de acidente sob a otica da eficacia tecnologica do sistema No entanto na ausencia
de informacao sobre o numero de veıculos times quilometro o numero de veıculos e indi-
cado como sendo a mais apropriada pois esta reflete o nıvel de motorizacao ou seja o
numero de veıculos por mil habitantes A populacao e uma medida de exposicao util para
a avaliacao do risco em termos de saude publica com a vantagem de haver uma grande
disponibilidade de informacao desagregada o que permite analisar as especificidades de
varios grupos populacionais As restantes medidas indicadas apresentam atualmente
muitas limitacoes1
Nao ha uma regra geral para se saber qual e a ldquomelhorrdquo medida de exposicao que se
deve usar A escolha da medida de exposicao e condicionada pelo objetivo pretendido
e pela disponibilidade de informacao Em seguranca rodoviaria quando se analisa a
relacao entre numero de mortes e numero de habitantes pode considerar-se que se trata
de uma abordagem epidemiologica e quando se analisa a relacao entre numero de mortes
e numero de veıculos que se trata de uma abordagem de trafego Nesta tese seguiu-
se a abordagem de trafego pois usou-se o numero de veıculos atraves do numero de
veıculos com seguro como principal medida de exposicao Em larga medida tal deveu-se
a indisponibilidade de dados sobre a distancia percorrida desagregada por concelho
12 Caracterizacao dos dados de acidentes
Os dados ulitizados nesta tese referem-se a acidentes rodoviarios com vıtimas por distrito
e por concelho durante o perıodo de 2000 a 2007 As unidades espaciais consideradas
sao os 278 concelhos de Portugal Continental e os dados encontram-se desagregados pela
gravidade das vıtimas Nesta seccao faz-se a caracterizacao destes dados e da medida de
exposicao usada No Anexo A pode ver-se o mapa com os concelhos e os respetivos iden-
tificadores mais informacao sobre os dados de acidentes sobre a medida de exposicao
usada e sobre as covariaveis usadas
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes ad-
ministrativas nomeadamente 4060 freguesias agrupadas em 278 concelhos por sua vez
1httpeceuropaeutransportwcmroad_safetyersosafetynetfixedWP2SN-CETE-WP2-D2
205-v3_finalpdf
12 Caracterizacao dos dados de acidentes 11
agrupados em 18 distritos A unidade espacial de interesse neste trabalho e o concelho
A distribuicao espacial dos concelhos nao e uniforme uma vez que os mais pequenos
se encontram no litoral norte sendo consequentemente mais proximos uns dos outros
Este aspeto e indicativo das diferencas existentes em Portugal Continental no que diz
respeito a caracterizacao dos concelhos2
Tabela 11 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Ano Tipo 1 Tipo 2 Tipo 3 Total2000 37261 5448 1450 441592001 36707 4498 1316 425212002 37253 3643 1323 422192003 36601 3672 1222 414952004 34569 3327 1033 389292005 33041 3028 995 370642006 32127 2767 786 356802007 32085 2461 765 35311
Total 279644 28844 8890 317378
Em relacao a gravidade das vıtimas considera-se segundo as definicoes da ANSR
minus Acidente Ocorrencia na via publica ou que nela tenha origem envolvendo pelo
menos um veıculo do conhecimento das entidades fiscalizadoras (GNR GNRBT
e PSP) e da qual resultem vıtimas ou danos materiais
minus Vıtima Ser humano que em consequencia de acidente sofra danos corporais
minus Morto ou vıtima mortal Vıtima de acidente cujo obito ocorra no local do
acidente ou no seu percurso ate a unidade de saude No perıodo em analise para
obter o numero de mortos a 30 dias (o que corresponde a definicao internacional)
aplica-se um coeficiente multiplicativo de 114 ao numero de mortos
minus Ferido grave Vıtima de acidente cujos danos corporais obriguem a um perıodo
de hospitalizacao superior a 24 horas
minus Ferido leve Vıtima de acidente que nao seja considerada ferido grave
minus Acidente com vıtimas Acidente do qual resulte pelo menos uma vıtima
minus Acidente mortal Acidente do qual resulte pelo menos um morto
minus Acidentes com feridos graves Acidente do qual resulte pelo menos um ferido
grave nao tendo ocorrido qualquer morte
minus Acidentes com feridos leves Acidente do qual resulte pelo menos um ferido
leve e em que nao se tenham registado mortos nem feridos graves
2ver Anexo A
12 Capıtulo 1 Nocoes sobre seguranca rodoviaria
Assim de acordo com estas definicoes designam-se por acidente do tipo 1 os acidentes
com feridos leves por acidentes do tipo 2 os acidentes com feridos graves e por acidentes
do tipo 3 os acidentes mortais
Figura 11 Numero de acidentes tipo 1 por concelho
Figura 12 Numero de acidentes tipo 2 por concelho
12 Caracterizacao dos dados de acidentes 13
Figura 13 Numero de acidentes tipo 3 por concelho
Como se pode ver pela Tabela 11 e quer pelos box plot3 nas Figuras 11ndash13 o numero
de acidentes rodoviarios diminuiu ao longo dos anos de estudo em todos os tipos de
acidentes
Um dos objetivos deste trabalho consiste na identificacao dos concelhos de maior e menor
risco relativo de ocorrencia de acidente rodoviario Assim e necessaria a comparacao
entre os concelhos em termos de determinadas medidas de risco Uma forma exploratoria
muito usada para comparar areas e a construcao de mapas tematicos mdash os coropletos
mdash baseados nas medidas calculadas Uma vez que Portugal Continental e os seus 278
concelhos constituem uma regiao dividida em subregioes irregulares nao e recomendado
o uso de mapas baseados em contagens pois estas dependem da medida de exposicao de
cada area Nesta tese apesar de numa fase inicial se ter utilizado o numero de habitantes
decidiu-se utilizar como medida de exposicao o numero de veıculos com seguro Para
permitir comparacoes tendo em conta os diferentes tamanhos da medida de exposicao no
espaco ou no tempo as contagens devem ser padronizadas para gerar riscos de acidentes
Isto e especialmente importante porque apesar do numero de acidentes ser relacionado
com os fatores de exposicao e escasso o numero de intervencoes de seguranca rodoviaria
que lhes podem ser dirigidas sem afetar negativamente o funcionamento do sistema de
3ver Anexo A
14 Capıtulo 1 Nocoes sobre seguranca rodoviaria
trafego Nesta fase inicial as contagens sao padronizadas apenas tendo em conta a
variabilidade da medida de exposicao em funcao do espaco ou do tempo
13 Caracterizacao da medida de exposicao - numero
de veıculos com seguro
Tabela 12 Estatısticas resumo do numero de veıculos com seguro em milhares
Ano Min 1oQ Mediana Media 3oQ Max2000 103 379 759 1833 2052 463202001 074 382 776 1823 2060 417802002 081 417 858 1993 2236 465902003 062 357 737 1677 2009 343902004 066 379 789 1753 2098 350502005 069 396 821 1811 2166 358802006 072 406 846 1869 2212 357902007 078 436 902 2030 2366 37730
Figura 14 Numero de veıculos com seguro em milhares por concelho e por ano (FonteIPS)
13 Caracterizacao da medida de exposicao 15
O numero de veıculos com seguro varia bastante de concelho para concelho como se pode
verificar atraves da Tabela 12 onde sao apresentadas as respetivas estatısticas resumo
por ano e da Figura 14 onde se podem analisar os box plot de cada ano Note-se que
cerca de 75 dos concelhos possui uma medida de exposicao cujo tamanho e em media
inferior a 20 522 veıculos ao longo do perıodo de tempo em estudo
Uma vez caracterizada a medida de exposicao usada pode definir-se para o concelho
i i = 1 n e para o ano t t = 1 T o numero de acidentes rodoviarios Yit o
numero de veıculos com seguro nit e a taxa de ocorrencia de acidente rodoviario rit =
100 times Yitnit Nas Figuras 15ndash17 apresentam-se os mapas das taxas de ocorrencia de
acidente rodoviario para acidentes do tipo 1ndash3
Estes mapas fornecem uma descricao da distribuicao espacial das taxas de acidentes por
concelho e mostram a existencia de concelhos vizinhos que possuem taxas semelhantes
e que essas taxas parecem nao se ditribuirem aleatoriamente pelos diversos concelhos
sugerindo a existencia de correlacao espacial
Para acidentes do tipo 1 ha uma concentracao de concelhos com taxas muito elevadas na
faixa litoral enquanto que no interior do paıs ha concentracao de concelhos com taxas
mais baixas
Figura 15 Taxa de acidentes tipo 1 nos anos 2000 2003 e 2007
Para acidentes do tipo 2 a concentracao de concelhos com taxas muito elevadas verifica-
se mais no centro e no sul e a concentracao de concelhos com taxas mais baixas verifica-se
mais no norte do paıs Para acidentes do tipo 3 a concentracao de concelhos com taxas
muito elevadas tambem se verifica mais no centro e no sul mas tambem numa faixa a
16 Capıtulo 1 Nocoes sobre seguranca rodoviaria
nordeste Mais uma vez se verifica que no norte do paıs ha concentracao de concelhos
com taxas mais baixas
Figura 16 Taxa de acidentes tipo 2 nos anos 2000 2003 e 2007
Figura 17 Taxa de acidentes tipo 3 nos anos 2000 2003 e 2007
No entanto estes mapas podem ser bastante afetados pela grande variabilidade das taxas
usadas Note-se que em areas com tamanho de medida de exposicao pequeno qualquer
mudanca mınima no numero de ocorrencias implicara uma mudanca consideravel na res-
petiva taxa podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao
13 Caracterizacao da medida de exposicao 17
ocorre com muita frequencia com dados de contagem com muitos valores escassos e
ate zeros em algumas areas e quando as unidades espaciais de analise sao concelhos ou
unidades geograficas ainda menores Nestes casos as medidas de exposicao das areas
pequenas serao na sua maioria bastante pequenas e o numero observado de acidentes
associado bastante pequeno logo o valor da respetiva taxa sera grande Para alem disso
nao ha diferenciacao entre regioes onde nao foram observadas ocorrencias Assim quando
as areas de estudo sao pequenas e o fenomeno e raro estes mapas podem ser bastante
afetados pela variabilidade das taxas sendo dominados pelas pequenas areas (Carlin e
Louis 1998 Bernardinelli e Montomoli 1992 Held e Becker 1999) Para superar estas
dificuldades os metodos bayesianos tem sido largamente propostos Estes metodos tem
como ideia central o uso de informacao das areas vizinhas que compoem a regiao de es-
tudo para estimar o risco de cada area Desta forma o risco de cada area e estimado de
forma mais precisa e os mapas resultantes sao mais suaves e mais informativos (Carlin e
Louis 1998 Ghosh et al 1999) Nesta tese usam-se os modelos bayesianos hierarquicos
desenvolvidos no ambito do mapeamento de doencas e na estatıstica espacial de acordo
com Banerjee et al (2004) descritos no Capıtulo 2
2Modelacao estatıstica de acidentes rodoviarios
Os primeiros modelos usados na modelacao estatıstica de acidentes rodoviarios foram
baseados na Regressao Multipla com as suposicoes usuais de erros nao correlacionados
normalmente distribuıdos e homocedasticos No entanto foi rapidamente reconhecido
que este nao e o processo mais adequado para modelar a ocorrencia de acidentes ro-
doviarios ja que efetivamente a sinistralidade rodoviaria caracteriza-se pela existencia
de um elevado numero de oportunidades para a ocorrencia de acidentes associada a uma
probabilidade muito pequena de ocorrencias efetivas e pela relativa independencia entre
os acontecimentos Consequentemente o modelo de Poisson ou outros modelos para da-
dos de contagens sao modelos mais apropriados para este tipo de estudos
Assim os modelos lineares generalizados baseados no modelo de Poisson por exemplo
constituem a metodologia de excelencia na modelacao deste tipo de dados (Caliendo
et al 2007 Cardoso 1996)
Muitos fatores que afetam os acidentes rodoviarios tais como polıticas de uso do solo
caracterısticas demograficas e caracterısticas da rede viaria tem efeitos a uma escala
espacial Os acidentes rodoviarios tem sido estudados em diferentes unidades espaciais
desde pontos georeferenciados (por exemplo intersecoes) a diferentes nıveis de area tais
como segmentos de estrada codigos postais ou concelhos etc E deste modo razoavel
explorar o uso dos modelos espaciais na ocorrencia de acidentes rodoviarios A disponi-
20 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
bilidade de dados de transporte e socioeconomicos ao nıvel municipal e apontada como
uma vantagem importante para o uso de modelos a este nıvel No entanto esta unidade
espacial pode apresentar dados escassos com valores baixos de contagem de ocorrencias
ate mesmo zeros em muitas areas Para alem disso usualmente a medida de exposicao
apresenta tamanhos consideravelmente diferentes de concelho para concelho havendo
muitos concelhos com tamanho de medida de exposicao muito pequeno Esta situacao
verifica-se no universo analisado neste trabalho no qual se considera o numero de veıculos
com seguro como medida de exposicao Desta forma este trabalho centra-se na estimacao
de riscos relativos em areas pequenas
No conceito de areas pequenas sao consideradas as situacoes quer de tamanho de me-
dida de exposicao pequeno quer amostras pequenas Em anos recentes a necessidade
de estatısticas para areas pequenas cresceu consideravelmente em todo o mundo Isto
deve-se entre outras coisas ao seu crescente uso na formulacao de polıticas e progra-
mas na alocacao de fundos governamentais e no planeamento regional Determinados
atos legislativos de governos nacionais designadamente a promocao das intervencoes lo-
cais (municipais ou de freguesia) criaram uma crescente necessidade de estatısticas para
areas pequenas e esta tendencia ira provavelmente continuar
Entende-se por risco relativo o risco de ocorrencia de um evento numa dada area relati-
vamente a todo o conjunto de areas Em particular neste trabalho entende-se por risco
relativo de ocorrencia de acidente rodoviario o risco de ocorrencia de acidente rodoviario
num determinado concelho relativamente ao risco no paıs (Portugal Continental)
As tecnicas classicas de modelacao podem produzir estimativas com grande variancia e
consequentemente erros padrao nao fiaveis As tecnicas de modelacao espacial permitem
acomodar estas caracterısticas invulgares (Knorr-Held e Besag 1998 Ghosh et al 1999
Aguero-Valverde e Jovanis 2006 Eksler 2008 MacNab 2004)
Estudos recentes mostram que os modelos bayesianos hierarquicos tem vantagens sobre os
metodos tradicionais para investigar questoes importantes relacionadas com estimacao de
riscos variaveis de confundimento nao mensuraveis dependencia espacial e dependencia
temporal em especial em areas pequenas Isto e particularmente util no caso de variaveis
nao observaveis tais como clima determinadas caracterısticas da populacao entre outras
Outros estudos ainda mostram que os modelos bayesianos hierarquicos que estao a ser
pesquisados no ambito do mapeamento de doencas tambem podem ser usados para a
construcao especıfica de mapas de risco com base nos modelos para acidentes rodoviarios
ao nıvel de area (Li et al 2007 2008 Lord e Park 2008 Miaou e Song 2005 Rue et al
2009)
Estes modelos em especial os que se baseiam nos modelos generalizados de Poisson com
efeitos aleatorios espaciais e temporais sao largamente indicados como capazes de cap-
tar a variabilidade das estimativas em areas pequenas enquanto que revelam padroes
21 Modelos bayesianos hierarquicos 21
espaciais e tendencias temporais por permitirem a incorporacao de efeitos espaciais e
temporais atraves da informacao a priori produzindo estimativas mais estaveis (Ghosh
et al 1999 Miaou et al 2003 Eksler e Lassarre 2008) Estes metodos facilitam a
suavizacao espacial dos dados quando as regioes sob estudo envolvem areas de tamanhos
pequenos de medida de exposicao isto e areas que apresentam muito poucos eventos
dado um fenomeno de eventos raros como por exemplo a ocorrencia de acidentes ro-
doviarios
A heterogeneidade verificada nos acidentes rodoviarios pode estar relacionada com uma
serie de fatores tais como a rede viaria a medida de exposicao usada e a demografia
em particular ao nıvel de areas pequenas A investigacao de factores de risco relaciona-
dos com a seguranca rodoviaria tem um papel muito importante na analise de acidentes
rodoviarios e na definicao de programas para a sua prevencao Assim tambem devem
ser levadas em conta covariaveis que possam contibuir para a explicacao da variabilidade
existente no dados Noland e Quddus (2004) Elvik (2011)
A avaliacao das causas que condicionam a seguranca rodoviaria portuguesa aponta a se-
melhanca do verificado noutros paıses para multiplos fatores relacionados com o trinomio
que forma o sistema de trafego rodoviario No entanto na maioria dos casos e um pro-
blema atribuıdo a comportamentos inadequados dos condutores associados a falencias
da propria infra-estrutura rodoviaria Um dos fatores mais influentes na frequencia de
acidentes e o trafego medio diario anual (TMDA) Varios estudos referem que o TDMA
constitui a covariavel com maior poder explicativo da variacao observada No entanto
nao foi possıvel obte-la ao nıvel de desagregacao exigido nesta tese Outras caracterısticas
do trafego sao referidas como fatores influentes na ocorrencia de acidentes como por
exemplo o grau de ocupacao da via o quociente entre o volume de trafego e o volume de
servico e a percentagem de pesados Tambem e referido que a quantidade de combustıvel
vendido e um indicador do volume de trafego e a densidade populacional um indicador de
urbanizacao (Cardoso 2007) Nesta tese so foi possıvel usar nove covariaveis regionais
o numero de habitantes a area geografica a densidade populacional o comprimento de
estrada a quantidade de combustıvel vendido a ocupacao urbana do solo a ocupacao
industrial do solo a ocupacao do solo com equipamentos e parques urbanos e a ocupacao
do solo com equipamento turıstico como sera abordado no Capıtulo 4
21 Modelos bayesianos hierarquicos
O modelo bayesiano padrao e definido atraves de uma hierarquia de dois nıveis em que
o primeiro nıvel traduz a distribuicao amostral dos dados y condicional ao parametro
θ e o segundo traduz a distribuicao a priori para o parametro θ
22 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Os modelos bayesianos hierarquicos sao modelos bayesianos com uma estrutura hierarquica
na distribuicao a priori Formalmente um modelo bayesiano hierarquico e um mo-
delo bayesiano f(y|θ) p(θ) onde p(θ) e decomponıvel nas distribuicoes condicio-
nais p1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1) e na distribuicao marginal pl(φl) de modo
que p(θ) =
intp1(θ|φ1) p2(φ1|φ2) plminus1(φlminus2|φlminus1)pl(φl) dφ1 dφl onde φi i =
1 l representa os l hiperparametros A decomposicao da distribuicao a priori numa
estrutura hierarquica e fundamental quando nao e possıvel quantificar exatamente a in-
formacao a priori e se pretende incorporar a incerteza acerca dos hiperparamentros
Apesar desta decomposicao facilitar a escolha da distribuicao a priori a dificuldade
associada a especificacao dos hiperparametros faz com que a hierarquia termine com dis-
tribuicoes nao informativas raramente se afigurando util na pratica alongar a hierarquia
a mais do que tres nıveis E de notar que mas especificacoes nas distribuicoes a priori
nos nıveis superiores ao segundo tem menor impacto do que mas especificacoes da dis-
tribuicao a priori padrao p(θ) (Paulino et al 2003)
Portanto os modelos usados neste trabalho correspondem a modelos com a seguinte
estrutura
1o nıvel f(y|θ) funcao de verosimilhanca
2o nıvel p(θ|φ) distribuicao a priori dos parametros
3o nıvel p(φ) distribuicao a priori dos hiperparametros
Deste modo procede-se a apresentacao desses modelos comecando pelo mais simples e
evoluindo para modelos cada vez mais complexos
O numero de acidentes rodoviarios pode ser modelado como uma variavel aleatoria dis-
creta nao negativa Tipicamente a probabilidade de ocorrencia e muito baixa relati-
vamente a um numero de ldquoprovasrdquo associado muito grande Deste modo os dados de
acidentes rodoviarios sao resultantes de um processo de contagem sendo natural modelar
esse processo com um processo de Poisson Assim seja Yit o numero observado de aci-
dentes na regiao i = 1 n no ano t = 1 T Como primeira abordagem considere-se
Yit condicionalmente independentes e com distribuicao Poisson de media microit = Eitθit ou
sejaYit|θit sim Poisson(Eitθit)
f(yit|θit) =(Eitθit)
yiteminusEitθit
yit
Eit = nitr = nit
sumij
Yitsumij
nit
21 Modelos bayesianos hierarquicos 23
onde Eit representa uma estimativa do numero esperado de acidentes rodoviarios nit
representa o numero de veıculos com seguro e θit representa o risco relativo de acidente
rodoviario Desta forma θit quantifica o desvio local de ocorrencia de acidente ou seja
se o risco relativo e superior a 1 num determinado concelho entao o risco de ocorrencia
de acidente nesse concelho e superior ao risco global isto e ao risco de ocorrencia de
acidente rodoviario no paıs (Mitra e Washington 2007 Hauer 2001)
A funcao de versimilhanca e dada por
L(θ|y) =prodit
f(yit|θit) =prodit
(Eitθit)yiteminusEitθit
yitpropprod
θyitit e
minussumit
Eitθit
e l(θ|y) = lnL(θ|y) propsumit
yit ln θitminussumit
Eitθit O estimador de maxima verosimilhanca
do risco relativo θit usualmente designado por Razao de Mortalidade Padronizada (Stan-
dardized Mortality Ratio1 - SMR) e dado por
θit = SMRit =YitEit
(211)
Note-se que V ar(SMRit) =V ar(Yit)
E2it
=θitEit
podendo-se fazer V ar(SMRit) =θitEit
=YitE2it
Um procedimento classico usual para identificar regioes de maior risco consiste na cons-
trucao de mapas tematicos mdash os coropletos mdash dos valores das estimativas dos SMR
Apesar de util este procedimento tem algumas desvantagens Note-se que em areas
com tamanho de medida de exposicao pequeno qualquer mudanca mınima no numero
de ocorrencias implicara uma mudanca consideravel na estimativa do respetivo SMR
podendo essa mudanca ser devida a mera flutuacao aleatoria Esta situacao ocorre com
muita frequencia com dados desta natureza quando as unidades espaciais de analise sao
concelhos ou unidades geograficas ainda menores Nestes casos as medidas de exposicao
das areas pequenas serao na sua maioria bastante pequenas e o valor esperado Eit
associado bastante pequeno logo o valor da estimativa do respetivo SMR tendera a ser
grande Para alem disso o estimador nao diferencia entre regioes onde nao se observaram
ocorrencias atribuindo sempre o valor zero a todas Assim ocorrencias raras ou areas de
tamanho de medida de exposicao pequeno podem gerar estimadores pobres na medida
em que a respetiva variabilidade pode ser muito grande A variancia destes valores e
1Em rigor nao se devia usar esta designacao mas dado que se encontra bastante difundida na litera-tura optou-se pelo seu uso
24 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
grande nas areas pequenas e pequena nas areas com tamanho de medida de exposicao
grande Consequentemente quando as areas de estudo sao pequenas e o fenomeno e raro
estes mapas podem ser bastante afetados pela variabilidade destas estimativas sendo do-
minados pelas pequenas areas (Carlin e Louis 1998 Bernardinelli e Montomoli 1992
Held e Becker 1999 Wakefield 2007) Os valores extremos das estimativas dos SMR
tendem a ocorrer nas areas pequenas e os valores extremos do mapa podem ser os valores
estimados com menos precisao As maiores variacoes do risco relativo nao estarao em
geral associadas com variacoes do risco subjacente a medida de exposicao mas serao
apenas flutuacao aleatoria casual (Rao 2003 Lawson et al 2000)
Para alem deste problema em geral verifica-se que V ar(Yit) gt E(Yit) ou seja verifica-se
que existe sobredispersao na contagem de acidentes rodoviarios em relacao a variabili-
dade teorica subjacente ao modelo Poisson
A sobredispersao pode ser causada por diversos fatores tais como agregacao dos dados
(data clustering) correlacao espacial ou temporal nao consideradas ma especificacao do
modelo variaveis nao observadas ou nao observaveis entre outras mas tem sido mostrado
que e grandemente atribuıvel a natureza real do processo de sinistralidade (Lord et al
2008 2005)
Para superar estas dificuldades os metodos bayesianos empıricos e os metodos completa-
mente bayesianos (full bayesian methods) tem sido largamente propostos Estes metodos
tem como ideia central o uso de informacao das areas vizinhas que compoem a regiao
de estudo para estimar o risco de uma area pequena com vista a diminuir o efeito das
flutuacoes aleatorias nao associadas ao risco Como principal consequencia o conjunto
dos riscos relativos de todas as areas e estimado de forma mais precisa do que quando se
usam por exemplo os SMR Isto e pode diminuir-se substancialmente o erro quadratico
medio total da estimacao dos riscos Desta forma por incorporarem a correlacao espacial
entre areas vizinhas atraves da modelacao de efeitos aleatorios os mapas resultantes sao
mais suaves e mais informativos (Carlin e Louis 1998 Ghosh et al 1999)
22 Modelos nao espaciais
Em dados desta natureza e usual recorrer aos modelos lineares generalizados McCullagh
e Nelders (1989) mais propriamente ao modelo de Poisson introduzindo covariaveis
atraves da funcao de ligacao usada para modelar a media
ln(θit) = α+
nβsump=1
βpxitp (221)
22 Modelos nao espaciais 25
onde α e βpxitp sao efeitos fixos com α o intercepto xitp e o valor da p-esima covariavel
e βp o correspondente parametro Do ponto de vista bayesiano ha que acrescentar um
nıvel relativo a distribuicao a priori para os parametros do modelo Assim e habitual
considerar que α sim Normal(0 cα) βp sim Normal(0 cβ) com α e βp independentes a
priori p = 1 2 nβ i = 1 2 N e t = 1 2 T
No entanto a sobredispersao pode resultar da heterogeneidade nao observavel que e in-
adequadamente capturada pelas variaveis explicativas na funcao da media condicional
Embora a fonte de dispersao nos acontecimentos de dados de contagem nao possa ser
distinguida a sua presenca pode ser ajustada pela introducao de uma componente es-
tocastica na relacao anterior de forma a que a equacao 221 possa ser escrita como
ln θit = α+
nβsump=1
βpxitp + vit (222)
onde vit e um erro aleatorio que se assume nao correlacionado com xit para todo o i t p
Pode-se pensar em vit como uma combinacao de efeitos das variaveis nao observadas que
foram omitidas no modelo ou como outra fonte de aleatoriedade Este tipo de mode-
los com efeitos fixos e efeitos aleatorios e usualmente designado por modelos lineares
generalizados mistos ou simplesmente por modelos mistos (Breslow e Clayton 1993)
Apesar de terem sido desenvolvidos diferentes modelos mistos para acomodar a sobre-
dispersao as distribuicoes mais usadas para modelar dados de acidentes rodoviarios sao
a distribuicao Lognormal e a distribuicao Binomial Negativa correspondente ao modelo
Poisson-Gama (Lord e Miranda-Moreno 2008) Esta ultima oferece uma forma simples
de acomodar a sobredispersao especialmente porque a distribuicao marginal tem forma
fechada dado que esta mistura resulta de um modelo conjugado
Por todas estas razoes sao usados neste trabalho modelos baseados na distribuicao
Poisson e na distribuicao Binomial Negativa
O modelo Poisson Lognormal surge quando se admite que
vit sim Normal(0 σ2v) (223)
A funcao densidade de probabilidade da estrutura Poisson Lognormal descrita e dada por
f(yit θNit σ
2v) =
1
σ2v
radic2π
EitθNit
y
int infin0
eminusEitθNit e
v
(ev)yminus1eminus v2
2σ2v dev
nao havendo forma explicıta com
26 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
ln θNit = α+
nβsump=1
βpxitp (224)
E[Yit] = microNit eσ2v2 = Eitθ
Nit e
σ2v2 e V ar[Yit] = microNit e
σ2v2(
1 + (eσ2v minus 1)microNit e
minusσ2v2)
O modelo Poisson-Gama ou Binomial Negativo surge quando
exp(vit) sim Gama(φ φ) (225)
A funcao densidade de probabilidade da estrutura Poisson-Gama descrita e dada por
f(yit θBNit φ) =
Γ(yit + φ)
Γ(φ)yit
(φ
microBNit + φ
)φ(microBNit
microBNit + φ
)yitou seja
Yit|θBNit sim BN(EitθBNit φ)
com
ln θBNit = α+
nβsump=1
βpxitp (226)
E[Yit] = microBNit = EitθBNit e V ar[Yit] = microBNit
(1 +
microBNitφ
) Note-se que quando φrarrinfin o
modelo Binomial Negativo reduz-se ao modelo Poisson
Os hiperparametros σminus2v do modelo Poisson Lognormal e φ do modelo Binomial Negativo
podem ser conhecidos ou pode decompor-se a distribuicao a priori acrescentando mais
um nıvel de hierarquia atribuindo-lhes uma distribuicao (σ2v)minus1 sim Gama(av bv) com
av e bv conhecidos e φ sim Gama(aφ bφ) com aφ e bφ conhecidos respetivamente O
parametro σminus2v e designado por parametro de dispersao e φ por inverso do parametro de
dispersao
O modelo misto e capaz de controlar a heterogeneidade nao explicada causada por exem-
plo por variaveis omissas mas pode nao ser capaz de captar a dependencia espacial entre
unidades espaciais (Li et al 2008 Quddus 2008) Mais uma vez em situacoes de pe-
quenas areas ou pequeno tamanho de amostra as estimativas podem ainda ser muito
afectadas (Miranda-Moreno et al 2007 Lord et al 2008)
Uma alternativa para lidar com este problema foi proposta por Clayton e Kaldor (1987)
A ideia consiste em modelar os riscos relativos atraves do procedimento bayesiano im-
pondo uma estrutura de relacao espacial plausıvel entre as areas ou seja modelar os
23 Modelos espaciais 27
riscos relativos conjuntamente como um processo espacial atraves de uma especificacao
a priori espacial de modo a captar a correlacao entre areas vizinhas Por outras pa-
lavras usar a informacao das areas vizinhas a uma certa area para estimar o seu risco
relativo Mais tarde Besag et al (1991) propuseram uma abordagem em que os dados
observados sao modelados a custa de dois nıveis Num deles o risco relativo de cada
area e a soma de duas componentes que representam fatores espaciais e nao espaciais
No outro dados este risco a priori e a medida de exposicao a contagem da caracterıstica
de interesse em cada area tem distribuicao Poisson com media especıfica de cada area
As distribuicoes a priori podem ser escolhidas de modo a refletir o conhecimento sobre
a ocorrencia de acidentes rodoviarios nas unidades espaciais incluindo o conhecimento
das variaveis nao-observadas como em Bernardinelli et al (1995ab)
23 Modelos espaciais
Quando ha alguma evidencia de heterogeneidade devida a existencia de dependencia
espacial entre as diversas areas essa correlacao espacial pode ser incorporada nos modelos
mistos atraves de um efeito aleatorio si na media condicional Esses efeitos aleatorio terao
associados uma distribuicao a priori conveniente
log(θit) = α+
nβsump=1
βpxitp + si (231)
Para efeitos de simplificacao de notacao e sempre que nao de origem a confusao de
notacao θit passa a representar o risco relativo de ocorrencia de acidente rodoviario
quer para os modelos baseados na distribuicao de Poisson abreviadamente designados
de modelos Poisson quer para os modelos baseados na distribuicao Binomial Negativa
abreviadamente designados de modelos BN com os devidos significados
Tambem e de modo semelhante ao que se fez anteriormente um efeito aleatorio que
representa a heterogeneidade nao estruturada pode ser incorporado nos modelos mistos
atraves de um efeito aleatorio vi na media condicional com uma distribuicao a priori
associada
log(θit) = α+
nβsump=1
βpxitp + si + vi (232)
onde vi e si sao os efeitos espaciais em que vi representa a heterogeneidade nao estru-
turada e si representa a heterogeneidade espacialmente estruturada Assume-se que vi e
si sao mutuamente independentes viiidsim Normal(0 σ2
v) e si|sminusi sim Normal(si σ2smi)
28 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
onde o sminusi indica o vetor s com o elemento si removido si =1
mi
sumi 6=j
wijsj e a media
dos efeitos espaciais na vizinhaca de cada area i com wij = 1 se i e j sao vizinhos e
wij = 0 caso contrario Deste modo mi =sumi 6=j
wij e o respetivo numero de vizinhos e
σ2s representa a variancia dos efeitos aleatorios espacialmente estruturados Desta forma
s tem distribuicao conjunta
f(s) prop (σ2s)minusn2 exp
minus 1
2σ2s
sumi6=j
(si minus sj)2wij
e (σ2v)minus1 sim Gama(av bv) (σ2
s)minus1 sim Gama(as bs) com av bv as e bs conhecidos
Assim esta-se a admitir que que si sim CAR(σ2s) o qual acomoda a variacao espacial
local estruturada no logaritmo do risco relativo atraves de um modelo autoregressivo
gaussiano intrınseco tambem designado por ICAR (Besag 1974 Besag et al 1991
Banerjee et al 2004)
24 Modelos espaco-temporais
Nos modelos espaco-temporais a componente aleatoria incorpora efeitos espaciais e efei-
tos temporais sendo aqui apresentados apenas alguns que se consideram adequados a
aplicacao usada Nomeadamente consideram-se modelos com efeitos temporais aleatorios
e modelos com efeitos temporias fixos modelos sem interacao espaco-temporal e modelos
com interacao espaco-temporal Em relacao aos efeitos espaciais considera-se o que se
definiu na seccao anterior
Modelos espaco-temporais sem interacao
Nestes modelos tem-se log(θit) = α+
nβsump=1
βpxitp + si + vi + ψt
onde se considera
ψt sim Normal(0 σ2ψ) (241)
ou
ψt sim RW (1 σ2ψ) (242)
e onde (σ2ψ)minus1 sim Gama(aψ bψ) com aψ bψ conhecidos e α βp σ
2s σ
2v σ
2ψ mutuamente
independentes
24 Modelos espaco-temporais 29
Alternativamente log(θit) = α+
nβsump=1
βpxitp + si + vi + γt
onde se considera
γ sim Normal(0 cγ) (243)
sendo γt o termo de tendencia linear temporal cγ conhecido e α βp σ2s σ
2v mutuamente
independentes (Knorr-Held 2000)
Modelos espaco-temporais com interacao
Neste caso log(θit) = α+
nβsump=1
βpxitp + si + vi + (γ + δi)t
onde se considera alternativamente
δi sim Normal(0 σ2δ ) (244)
ou
δi sim CAR(σ2δ ) (245)
e onde δi e um efeito aleatorio de interacao espaco-temporal (σ2δ )minus1 sim Gama(aδ bδ) com
aδ bδ conhecidos e α βp σ2s σ2
v σ2δ mutuamente independentes (Bernardinelli et al
1995b)
A interpretacao de si e de δi e apresentada por Bernardinelli et al (1995b) considerando
um modelo sem covariaveis e sem componente espacialmente nao estruturada Assim de
acordo com o modelo de Bernardinelli et al (1995b) a cada area e atribuıdo um perfil de
risco proprio ao longo do tempo cujo interceto e dado pela soma α+ si e cuja tendencia
e dada pela soma γ + δi Mais ainda si representa a diferenca entre a media local de
cada area e a media global α e δi representa a diferenca entre a tendencia temporal
local de cada area e a tendencia temporal global γ Como consequencia quando δi lt 0
a tendencia temporal local da area i e menos acentuada do que a tendencia temporal
global enquanto que quando δi gt 0 e mais acentuada
Na Tabela 21 pode-se ver um resumo de todos os modelos univariados considerados
neste trabalho Para simplificacao de apresentacao da tabela sempre que num modelo
nao se encontra definida uma distribuicao a priori para um parametro considera-se a
distribuicao que foi especificada para esse parametro no modelo com ındice (M) inferior
30 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
Tabela 21 Modelos univariados
M log(θit) Distribuicao a priori Distribuicao a priori
dos parametros dos hiperparametros
1 α+
nβsump=1
βpxitp α sim Normal(0 cα)
βp sim Normal(0 cβ)
2 α+
nβsump=1
βpxitp + vi vi sim Normal(0 σ2v) σminus2
v sim Gama(av bv)
3 α+
nβsump=1
βpxitp + si si sim CAR(σ2s) σminus2
s sim Gama(as bs)
4 α+
nβsump=1
βpxitp + vi + si
5 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim Normal(0 σ2ψ) σminus2
ψ sim Gama(aψ bψ)
6 α+
nβsump=1
βpxitp + vi + si + ψt ψt sim RW (σ2ψ)
7 α+
nβsump=1
βpxitp + vi + si + γt γ sim Normal(0 cγ)
8 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim Normal(0 σ2δ ) σminus2
δ sim Gama(aδ bδ)
9 α+
nβsump=1
βpxitp + vi + si + (γ + δi)t δi sim CAR(σ2δ )
25 Modelos multivariados
Os modelos apresentados ate aqui sao modelos univariados pois aplicam-se individual-
mente a cada um dos tipos de gravidade de acidente rodoviario No entanto estes
modelos nao consideram a interdependencia que pode existir entre os riscos relativos
dos diferentes tipos de acidentes rodoviarios A identificacao de padroes similares na
variacao espacial de tipos de acidentes numa analise conjunta pode fornecer evidencia
para determinadas relacoes que nao se encontra acessıvel a partir da analise de um unico
tipo Tem sido propostas na literatura generalizacoes multivariadas do modelo de Pois-
son capazes de considerar a relacao entre diferentes processos de contagem tais como
contagens de acidentes de tipos de gravidade diferentes (Tunaru 2002 Bailey e Hew-
25 Modelos multivariados 31
son 2004 Song et al 2006 Ma et al 2008 El-Basyouny e Sayed 2009) Com esta
abordagem pretende-se modelar simultaneamente o numero de acidentes rodoviarios de
diferentes tipos Assim considera-se Ykit o numero de acidentes rodoviarios e Eitk o
numero esperado padronizado de acidentes rodoviarios na area i no instante t do tipo
k i = 1 2 n t = 1 2 T k = 1 2 K Tal como ate aqui considere-se Ykit
condicionalmente independentes e com distribuicao Poisson de media microkit = Ekitθkit ou
seja
Ykit|θkit sim Poisson(Ekitθkit)
Modelos espaciais multivariados
1)log θkit = αk +
nβsump=1
βpxitp + ski
com αk sim Normal(0 cα) ski sim MCAR(1Σs) Σminus1s sim Wishart(ds Rs) e cα ds Rs
conhecidos
Usando a generalizacao do modelo CAR univariado definida em Carlin e Banerjee (2003)
e Gelfand e Vounatsou (2003) considera-se um modelo conjunto para os efeitos aleatorios
ski sob uma suposicao de separabilidade que permite modelar a associacao entre os K
tipos de acidentes rodoviarios enquanto se mantem a dependencia espacial A separa-
bilidade assume que a estrutura de associacao se separa numa componente nao espacial
e numa componente espacial Mais precisamente assume-se que a distribuicao conjunta
de s e
s sim Nnk(0 [Σminus1 otimes (D minus αW )]minus1) (251)
Esta distribuicao e designada por MCAR(αΣ) onde s = (s1 sK) si = (s1k snk)
D e uma matriz diagonal de dimensao ntimesn cujos elementos correspondem ao numero de
vizinhos da regiao i W e a matriz de adjacencia Σminus1 e uma matriz de dimensao KtimesK
definida positiva que pode ser interpretada como a matriz de precisao nao espacial entre
os tipos de acidentes e otimes denota o produto de Kronecker O parametro de autocorrelacao
espacial α isin [0 1] assegura que a distribuicao conjunta e propria quando α = 1 obtem-se
o modelo MCAR improprio e quando α = 0 obtem-se o modelo independente O modelo
improprio MCAR(1Σ) e referido como modelo autoregressivo intrınseco multivariado ou
modelo MIAR e encontra-se implementado no WinBUGS atraves da funcao mvcar Jin
et al (2005) Lawson (2009) Waller e Carlin (2010)
Para alem do modelo 1 foram implementados os modelos multivariados seguintes no
WinBUGS
32 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
2) log(θkit) = αk + ski + ψkt ψkt simMNormal(0Σt)
3) log(θkit) = αk + ski + γkt γk sim Normal(0 bγ)
4) log(θkit) = αk + ski + (γk + δki)t δki sim MCAR(1Σδ) Σminus1δ sim Wishart(dδ Rδ) e
dδ Rδ conhecidos
mas apenas se obteve convergencia para os modelos 1 e 4
Em todas a situacoes apresentadas usa-se av = as = aψ = aδ = 05 bv = bs = bψ =
bδ = 00005 cα = cβ = cγ = 1000 ds = dδ = k e Rs = Rδ =
001 0 0
0 001 0
0 0 001
26 Metodos de inferencia
A abordagem mais comum para a inferencia bayesiana baseada nos metodos de si-
mulacao MCMC (Markov Chains Monte Carlo) ver por exemplo Gamerman (1997) e
computacionalmente muito intensa e acarreta alguns problemas Por esta razao novas
abordagens tem sido propostas Uma abordagem recente proposta em Rue et al (2009)
consiste na inferencia bayesiana aproximada via INLA (Integrated Nested Laplace Appro-
ximations) e e uma alternativa determinıstica aos metodos de simulacao MCMCMartino
e Rue (2010a)
261 INLA
O metodo de aproximacao INLA e uma nova abordagem para efetuar inferencia baye-
siana aproximada numa subclasse de modelos de regressao estruturados aditivamente
nomeadamente em modelos latentes gaussianos
Estes modelos sao modelos hierarquicos que incorporam um campo aleatorio gaussiano z
que representa todas as componentes nao observaveis com distribuicao a priori Normal
Nestes modelos assume-se que a variavel resposta y com componentes yi condicional-
mente independente a z = (z1 znz ) e a qualquer outro hiperparametro com distri-
buicao nao necessariamente gaussiana tem uma distribuicao que pertence a famılia
exponencial A media microi de cada componente e relacionada com um preditor aditivo
estruturado ηi atraves de uma funcao de ligacao g() ou seja g(microi) = ηi Este preditor
incorpora aditivamente os efeitos de varias componentes
26 Metodos de inferencia 33
ηi = α+
nfsumj=1
f (j)(uij) +
nβsump=1
βpxip + εi (261)
onde βp representam os efeitos lineares das covariaveis x f (j)() sao funcoes desconhe-
cidas das covariaveis u e εi sao efeitos aleatorios nao estruturados As covariaveis u
podem tomar muitas formas diferentes nomeadamente efeitos nao lineares de variaveis
contınuas tendencias temporais efeitos sasonais intercetos e declives iid efeitos alea-
torios especıficos de grupos e efeitos aleatorios espaciais Todos estes diferentes efeitos
podem ser representados atraves das funcoes f (j)()
Assim o modelo latente gaussiano e definido por z = ηi f (j) α βp com di-
mensao nz = n + nf + 1 + nβ funcao densidade p(z|φ) gaussiana com media por
suposicao zero e matriz de precisao Q(φ) com hiperparametros φ As distribuicoes a
priori dos hiperparametros nao tem de ser gaussianas
Em Rue et al (2009) assume-se que z usualmente de grande dimensao admite proprie-
dades de independencia condicional ou seja que zi|zminusi so depende de um subconjunto
de zminusi Deste modo o campo z e um campo aleatorio gaussiano markoviano (GMRF
Gaussian Markov Random Field) com matriz de precisao Q esparsa Assim e possıvel
aplicar metodos numericos para matrizes esparsas que sao muito mais rapidos (Rue e
Held 2005) Assume-se ainda que o numero de hiperparametros m e pequeno m le 6
embora possa haver excecoes
Considera-se a estrutura hierarquica com tres nıveis ja referida em que o primeiro
nıvel corresponde ao modelo das observacoes f(y|zφ) o segundo nıvel ao modelo dos
parametros p(z|φ) e o terceiro nıvel ao modelo dos hiperparametros p(φ) Como se as-
sume que os dados observados sao condicionalmente independentes dado o campo latente
z tem-se que
f(y|xφ) =prodi
f(yi|ziφ)
Tanto a matriz de covariancia do campo gaussiano z como a funcao de verosimilhanca
do modelo para yi|z podem ser controladas por alguns hiperparametros desconhecidos
φ
A distribuicao a posteriori e dada por
p(zφ|y) prop p(φ)p(z|φ)prodi
f(yi|ziφ) (262)
Como muitas vezes a verosimilhanca nao tem forma gaussiana esta distribuicao nao e
analiticamente tratavel
Modelos espaciais e espaco-temporais como os que foram introduzidos na seccao 21 sao
34 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
construıdos como modelos bayesianos com tres nıveis Para estes modelos a determinacao
analıtica das distribuicoes marginais a posteriori dos parametros desconhecidos nao e
possıvel Como ja foi referido a solucao habitual para se obterem as estimativas passa
pelo uso dos metodos de simulacao MCMC que possuem alguns problemas tais como
tempo computacional longo possibilidade de as amostras simuladas dos parametros se-
rem altamente correlacionadas e possibilidade de as estimativas terem um erro de Monte
Carlo grande A aplicacao dos metodos MCMC aos modelos espaco-temporais pode ser
particularmente difıcil pois existe com frequencia uma forte dependencia a posteriori
entre as componentes espacial ou espaco-temporal do campo latente
Em contraste o metodo de aproximacao INLA e apresentado como um metodo que
fornece aproximacoes muito precisas das distribuicoes marginais a posteriori em relati-
vamente pouco tempo
No que se segue e feita uma breve explicacao de como o metodo calcula as distribuicoes
marginais a posteriori dos parametros de interesse
As distribuicoes marginais a posteriori pretendidas sao
p(zi|y) =
intφ
p(zi|φy)p(φ|y) dφ (263)
e
p(φj |y) =
intφj
p(φ|y) dφminusj (264)
A aproximacao de p(zi|y) e determinada usando a soma finita
p(zi|y) =sumk
p(zi|φky)p(φk|y)∆k (265)
onde p(zi|φky) e p(φk|y) representam as aproximacoes de p(zi|φy) e p(φ|y) respeti-
vamente Esta soma e calculada por integracao numerica em pontos suporte φk com
pesos apropriados ∆k
A aproximacao da distribuicao marginal a posteriori dos hiperparametros p(φ|y) e
obtida atraves da aproximacao de Laplace
p(φ|y) prop p(zφy)
pG(z|φy)
∣∣z=zlowast(φ) (266)
onde o denominador pG(z|φy) representa a aproximacao a Normal da distribuicao condi-
cional completa de z p(z|φy) e zlowast(φ) a respetiva moda calculada em φ Esta razao
corresponde a aproximacao de Laplace introduzida em Tierney e Kadane (1986)
De acordo com Rue et al(2009) e suficiente explorar numericamente esta densidade
a posteriori aproximada atraves de pontos suporte adequados φk para 266 Estes
26 Metodos de inferencia 35
pontos podem ser definidos atraves de duas estrategias Uma das estrategias consiste
basicamente em definir um grelha de pontos que cubra a area onde se encontra a maior
quantidade de massa de p(φ|y) designada de estrategia GRID A outra estrategia consiste
em definir um pequeno conjunto de pontos num espaco m-dimensional de maneira a
estimar a curvatura de p(φ|y) designada estrategia por CCD (Central Composite Design)
Os autores referem que a estrategia GRID e mais precisa mas mais demorada sendo a
estrategia CCD a estrategia por omissao no R-INLA
Para obter a aproximacao p(zi|φy) sao propostas tres estrategias nomeadamente a
aproximacao a Normal a aproximacao de Laplace completa e a aproximacao de Laplace
simplificada
A aproximacao a Normal e considerada a mais simples e a mais rapida e consiste em obter
a distribuicao marginal de pG(z|φy) ou seja pG(zi|φy) = Normal(microi(φ) σ2i (φ))
onde microi(φ) e a media da aproximcao a Normal e σ2i (φ) e a correspondente variancia
marginal Os autores referem que apesar de muito conveniente ao nıvel computacional
pode haver erros nesta estrategia quer ao nıvel da localizacao quer ao nıvel da falta de
simetria das distribuicoes a posteriori marginais quer a ambos nıveis
Alternativamente e proposta uma estrategia mais intensa ao nıvel computacional e mais
demorada mas tipicamente muito exata e que consiste em usar a aproximacao de La-
place semelhante a 266 a p(zi|φy)
pLA(zi|φy) prop p(zφy)
pGG(zminusi|ziφy)
∣∣∣zminusi=zlowastminusi(ziφ) (267)
No entanto esta estrategia e considerada demasiado exigente uma vez que o denomi-
nador tem que ser recalculado para cada zi e φ Assim efectuando varias simplicacoes
numericas de forma a tornar a aproximacao mais viavel foi obtida a aproximacao de
Laplace simplificada pSLA(zi|φy) Esta alternativa e considerada menos intensa logo
menos demorada com apenas uma ligeira perda de exatidao Basicamente e efetuada
uma expansao em serie de Taylor de pLA(zi|φy) em torno de zi = microi(φ) Esta es-
trategia permite tambem corrigir a aproximacao a Normal em relacao a localizacao e
simetria Para mais detalhes ver Rue et al (2009)
Como tem sido verificado em varias aplicacoes existe uma excelente concordancia entre
os resultados obtidos com os metodos MCMC e com o metodo INLA para a aproximacao
de Laplace simplificada e para a aproximacao de Laplace completa neste tipo de modelos
O metodo INLA tem algumas limitacoes como por exemplo a dimensao dos hiper-
parametros entre outras No entanto o seu potencial e reconhecidamente enorme e
encontra-se a ser explorado de forma intensiva e dinamica surgindo atualizacoes e ex-
tensoes com muita frequencia
36 Capıtulo 2 Modelacao estatıstica de acidentes rodoviarios
27 Ajustamento e medidas preditivas
Para comparar os varios modelos em termos de complexidade e adequabilidade usa-se o
criterio DIC (Deviance Information Criterion) (Spiegelhalter et al 2002) Este criterio
combina uma medida de adequabilidade a media a posteriori da desvianca D com
uma medida de complexidade o numero efetivo de parametros pD sendo dado por
DIC = D + pD Assim o modelo com o menor valor de DIC fornece o melhor com-
promisso entre adequabilidade e complexidade Este criterio pode ser obtido quer no
WinBUGS quer no R-INLA
No entanto o criterio DIC pode subpenalizar modelos complexos com muitos efeitos
aleatorios (Plummer 2008) Alternativamente pode usar-se algumas medidas prediti-
vas nomeadamente as ordenadas preditivas condicionais CPOs (Conditional Predictive
Ordinates) e as transformacoes uniformizantes PITs (Probability Integral Transforma-
tion) que podem ser obtidas no R-INLA(Martino e Rue 2010b Held et al 2010 Schrodle
e Held 2011) As medidas preditivas podem ser usadas quer para validar e comparar mo-
delos (Gelman et al 1995 Gelfand 1996 Carlin e Louis 1998 Rao 2003) quer para
detetar possıvel outliers ou observacoes surpreendentes (Pettit e Young 1990)
As CPOs sao definidas por CPOi = p(yi|yminusi) =p(y)
p(yminusi)=
intf(yi|θyminusi)p(θ|yminusi) dθ
e sao discutidas entre outros por Pettit e Young (1990) e Gelfand (1996) Valores
CPOi invulgarmente pequenos ou grandes indicam uma observacao surpreendente Para
efeitos de comparacao as CPOs devem ser calibradas e um possıvel procedimento de
calibracao e o calculo da transformacao uniformizante ou seja PITi = P (ynewi le yi|yminusi)(Gneiting e Raftery 2007) Tambem neste caso valores invulgarmente pequenos ou
grandes indicam possıveis outliers Mais ainda um histograma de valores PIT muito
diferente da distribuicao Uniforme pode indicar um modelo questionavel No caso de
dados de contagens a distribuicao preditiva e discreta e os valores PIT nao sao seguem
uma distribuicao uniforme sob a hipotese nula do verdadeiro modelo Para superar este
problema varios autores sugeriram uma versao nao aleatoria dos valores PIT Assim
pode-se usar os PITs ajustados definidos como PITi = P (ynewi le yi|yminusi)minus05timesP (ynewi =
yi|yminusi) Estes valores PIT ajustados podem ser interpretados exactamente da mesma
forma que nas aplicacoes com dados contınuos mas como medida de diagnostico devem
ser combinados com regras adequadas de pontuacao (scoring) (Czado et al 2009)
Tambem Gelfand (1996) sugere o calculo da percentagem dos valores PIT superiores a
0025 e inferiores a 0975 ou seja 0025 le P (ynewi le yi|yminusi) le 0975 que se designa
por concordancia preditiva Basicamente esta percentagem reflete de alguma maneira
a discrepancia entre o modelo e os dados Deste modo quanto maior for o valor da
concordancia preditiva melhor devera ser o modelo sendo 95 um possıvel valor de
27 Ajustamento e medidas preditivas 37
referencia
Pode-se ainda usar uma outra medida obtida a custa das CPOs nomeadamente o mls
(mean logarithmic score ) definido por mls= minussumi=1(log(CPOi))
ntimes T Esta medida e muito
utilizada e valores baixos indicam um modelo melhor Tambem se podem comparar os
valores de mls de diferentes modelos atraves de um teste de permutacao de Monte Carlo
3Aplicacoes
Os modelos bayesianos hierarquicos foram aplicados a dados de acidentes rodoviarios
ao nıvel do concelho em Portugal Continental de 2000 a 2007 e compararam-se os
resultados obtidos pelos metodos MCMC atraves do GeoBUGS do WinBUGS e pelo metodo
de aproximacao INLA atraves do R-INLA
Uma vez que foram usados muitos modelos optou-se por apresentar apenas alguns re-
sultados de forma a nao sobrecarregar o texto Assim nos modelos em que foi possıvel
usar quer o R-INLA quer o WinBUGS optou-se por apresentar apenas os resultados obtidos
no R-INLA e para os modelos multivariados como so foi possıvel usar o WinBUGS sao
apresentados os resultados obtidos no WinBUGS
Numa fase inicial foram aplicados modelos lineares generalizados de Poisson e foi feita a
analise individual de cada ano comparando-se os varios modelos e os resultados obtidos
no WinBUGS e no R-INLA tendo havido concordancia
Dada a importancia da correlacao espacial foi efetuada uma analise exploratoria espacial
40 Capıtulo 3 Aplicacoes
31 Associacao espacial
A analise exploratoria da distribuicao espacial do risco de ocorrencia de acidente ro-
doviario e iniciada atraves da visualizacao de mapas de determinadas medidas de risco
como se pode ver da Figura 15 a Figura 17 A partir destes mapas e possıvel obter
uma descricao inicial da distribuicao espacial dos acidentes rodoviarios explorar areas
determinantes e fatores desconhecidos bem como formular hipoteses sobre associacoes
entre areas de maior risco e potenciais fatores
Os mapas baseados nas taxas ou equivalentemente nos SMR tambem apresentam ca-
racterısticas que revelam alguns dos seus problemas Para alem da concentracao de
concelhos com taxas identicas tambem se observam alguns concelhos com taxas muito
diferentes das dos seus vizinhos Em particular nos concelhos em que o numero de
veıculos com seguro e pequeno estas estimativas podem variar drasticamente devido a
uma pequena mudanca no numero de acidentes
Por exemplo considerem-se dois concelhos vizinhos e similares como o concelho de Bar-
rancos i = 32 e o concelho de Mourao i = 35 com n32 = 1029 e n35 = 1348 A taxa
global de acidentes do tipo 2 e aproximadamente 007 para acidentes rodoviarios com
feridos graves isto e r asymp 00007 entao E32 asymp 072 e E35 asymp 095 Verifica-se que Y32 = 0
e Y35 = 4 consequentemente SMR32 = 0 e SMR35 asymp 423 Ou seja de acordo com estes
valores o risco relativo no concelho de Mourao e quatro vezes superior ao do paıs e no
de Barrancos nao ha risco algum No entanto a diferenca e muito provavelmente devida
ao acaso pois os concelhos possuem condicoes identicas
Tendo em conta que o numero de veıculos com seguro varia muito por concelho este
comportamento e preocupante uma vez que o grau de variabilidade aleatoria esta asso-
ciado ao tamanho das unidades geograficas de analise Dado que varias regioes possuem
medidas de exposicao de tamanho pequeno as respetivas estimativas de risco sao muito
instaveis Em termos estatısticos as estimativas das diversas areas nao sao comparaveis
ja que possuem variancias muito diferentes
A dependencia da variancia com o tamanho da medida de exposicao e visıvel na Figura
31 que mostra um grafico de dispersao da estimativa da variancia do SMR do numero
de acidentes do tipo 1 mdash SMR1 mdash versus o logaritmo do numero de veıculos com seguro
para os concelhos de Portugal em 2000 A 32 mostra um grafico de dispersao das taxas
versus o logaritmo do numero de veıculos com seguro para os concelhos de Portugal em
2000 Como se pode ver na grande maioria dos concelhos quanto menor e o tamanho
da medida de exposicao maior e a variabilidade das taxas Verifica-se que as areas com
tamanho de medida de exposicao pequeno possuem taxas com maior variancia e que
assumem os valores extremos entre os observados Pela observacao da Figura 33 pode-se
31 Associacao espacial 41
ter uma percecao dessa variabilidade em cada concelho
Figura 31 Relacao entre as estimativas da variancia dos estimadores dos SMR1 deacidentes tipo 1 e o logaritmo do numero de veıculos com seguro no ano 2000
Figura 32 Relacao entre as taxas de acidentes tipo 1 e o logaritmo do numero de veıculoscom seguro no ano 2000
42 Capıtulo 3 Aplicacoes
Figura 33 Valores estimados dos SMR1 e respetivos intervalos de confianca para cadaconcelho no ano 2000
A visualizacao dos mapas e os problemas detetados com os modelos mais simples sugerem
a existencia de correlacao espacial Para estudar esta questao torna-se necessario definir
uma estrutura de vizinhanca Neste trabalho e usada a estrutura de vizinhanca de
contiguidade simples entre areas Assim a matriz de vizinhanca ou neste caso a matriz
de adjacencia W e tal que wij = 1 se i e j sao vizinhos no sentido de partilharem uma
fronteira e wij = 0 caso contrario
As medidas de associacao espacial para areas mais usadas sao o ındice I de Moran e
o ındice C de Geary Banerjee et al (2004) No entanto para dados de contagem em
areas pequenas em que o tamanho da medida de exposicao e diferente de area para
area as suposicoes subjacentes sao violadas (Bivand et al 2008) Para contornar esta
questao foram desenvolvidas diversas propostas alternativas para dados com populacoes
heterogeneas Inclusive foram desenvolvidos ajustes ao ındice de Moran que levam em
conta os efeitos das variancias no tamanho das populacoes Em particular destaca-se
o Indice Bayesiano Empırico (Assuncao e Reis 1999) que os autores designaram por
EBI (Empirical Bayes Index ) Este ındice tem a vantagem de ter praticamente a mesma
estrutura e a mesma interpretacao do ındice de Moran No entanto em vez da taxa
os autores sugerem que se use um desvio da taxa em relacao a estimativa de Bayes
empırica da media marginal padronizado pela estimativa do desvio padrao da taxa
Estas estimativas sao obtidas por um metodo Bayes empırico em que os hiperparametros
sao estimados pelo metodos dos momentos Tal como o ındice I de Moran o ındice EBI
tende a ser positivo quando existe correlacao espacial Os autores sugerem a comparacao
32 Modelos 43
do valor observado do ındice EBI com uma distribuicao empırica obtida por permutacao
aleatoria O pseudo p-value obtido e dado pela proporcao de casos em que os valores de
EBI simulados excedem o valor EBI observado Este ındice encontra-se implementado
no R atraves do pacote spdep e da funcao EBImoranmc()
Tabela 31 Valores do ındice EBIpara cada tipo de acidente por ano
Ano Tipo 1 Tipo 2 Tipo 32000 02931 04992 029692001 03235 04109 034772002 02900 03009 035802003 02884 03288 034812004 03291 03893 029352005 03401 03017 032022006 02800 02817 025212007 02941 03098 01859
Figura 34 Histograma dos valores de EBIsimulados e valor de EBI observado paraacidentes tipo 1 e para ano 2000
Na Tabela 31 encontram-se valores do ındice EBI obtidos para cada tipo de acidente
por ano Foram tambem obtidos os histogramas dos valores EBI simulados relativos aos
testes de permutacao para cada tipo de acidente por ano Em todos os anos o pseudo
p-value obtido e 0001 e uma vez que os resultados sao semelhantes so se apresenta na
Figura 34 o histograma dos valores de EBI simulados e valor de EBI observado para
acidentes do tipo 1 e para o ano 2000 Estes resultados sugerem a existencia de correlacao
espacial
32 Modelos
Foram efetuados varios estudos onde foram analisados varios modelos nao espaciais
espaciais e espaco-temporais No entanto so sao apresentados os resultados relativos aos
modelos espaco-temporais baseados no modelo Poisson e no modelo Binomial Negativo
uma vez que forneceram melhores resultados como se pode verificar comparando os
valores das Tabelas 32mdash35
Os modelos foram implementados no WinBUGSGeoBUGS e no R-INLA
44 Capıtulo 3 Aplicacoes
No WinBUGS foram geradas duas cadeias com valores iniciais diferentes com vista ao estudo
da convergencia O perıodo de aquecimento variou consoante a complexidade do modelo
A convergencia das cadeias foi monitorizada pelo exame visual das cadeias pelos graficos
de autocorrelacao pelos graficos da estatıstica de Gelman-Rubin e complementarmente
pela analise dos resultados com o programa CODA do R (Plummer et al 2006)
No R-INLA usou-se a estrategia de integracao aproximada Simplified Laplace Approxima-
tion A estrategia usada para a escolha dos pontos foi a estrategia CCD que e considerada
computacionalmente menos intensa
Tabela 32 Valores DIC e mls dos modelos Poisson sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 1 3793581 562 856 2152059 148 Inf 1180943 115 266
P k 2 2295917 27181 539 1420409 25425 Inf 900251 22894 205
P k 3 2295361 26565 539 1420296 23850 Inf 898677 19901 204
P k 4 2295399 26666 539 1419794 24165 Inf 898431 20401 204
Tabela 33 Valores DIC e mls dos modelos Binomial Negativo sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 1 2063493 188 464 1351516 170 304 988082 169 222
BN k 2 1905027 25410 428 1223664 24261 276 895446 22045 201
BN k 3 1903859 23748 428 1222606 21159 275 893284 18229 201
BN k 4 1903674 24048 428 1221984 21813 275 892987 18891 201
As Tabelas 32ndash35 contem os valores do criterio DIC pD e mls para os varios modelos
espaciais e nao espaciais Como se pode verificar os valores DIC mais baixos sao obtidos
com os modelos espaciais nomeadamente P k 3 mdash modelo Poisson M31 P k 4mdash modelo
Poisson M4 BN k 3mdash modelo Binomial Negativo M3 e BN k 4mdash modelo Binomial
Negativo M4 definidos Tabela 21 e onde k representa o tipo de acidente k = 1 2 3
1referente a Tabela 21
33 Modelos espaco-temporais 45
Como a diferenca entre os valores obtidos com estes modelos e muito pequena (inferior
a 5) optou-se pelo modelo Poisson M3 e pelo modelo BN M3 respetivamente pois a
diferenca entre o numero de parametros e muito grande
No caso de acidentes do tipo 2 verifica-se que os valores de mls sao infinitos para todos
os modelos Poisson Com efeito para o concelho 52-Lisboa o valor da CPO e zero
correspondendo a uma observacao mal ajustada pelos modelos2 No entanto como se
pode ver mais adiante quando se usam os modelos espaco-temporais este problema e
ultrapassado
Em relacao ao modelo Poisson e ao modelo BN verifica-se que os valores de DIC sao
menores no caso dos modelos BN sugerindo que estes modelos sao melhores para todos
os tipos de acidentes
33 Modelos espaco-temporais
De acordo com as caracterısticas de dados sugeridos na literatura da especialidade para
estudos desta natureza os dados usados neste trabalho sao considerados ricos espacial-
mente mas pobres a nıvel temporal uma vez que embora referentes a 278 areas apenas se
reportam 8 anos (Miaou et al 2003) Por esta razao foram apenas considerados entre
muitos os modelos espaco-temporais apresentados no capıtulo anterior ver Tabela 21
Tabela 34 Valores DIC e mls dos modelos Poisson espaco-temporais sem covariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
P k 5 2033698 27267 472 1218172 24535 280 846345 20599 191
P k 6 2033695 27265 472 1218168 24523 280 846288 20552 191
P k 7 2135866 26668 498 1240734 23932 286 851182 20001 192
P k 8 1940548 47786 458 1172413 38818 271 851144 22294 192
P k 9 1942647 47016 458 1170386 35334 270 851497 20854 192
Observando a Tabela 34 verifica-se que de acordo com o DIC e com o mls o melhor
modelo Poisson para acidentes do tipo 1 e o modelo espaco-temporal 8 mdash P 1 8 mdash para
2Houve situacoes em que isto aconteceu por causa do metodo de calculo usado pelo R-INLA eresolveram-se recorrendo ao comando inlacpo No entanto nao foi este o caso
46 Capıtulo 3 Aplicacoes
o tipo 2 o modelo 9 mdash P 2 9 mdash e para o tipo 3 o modelo 6 mdash P 3 6 A partir da Tabela
35 verifica-se que de acordo com o DIC e com o mls o melhor modelo BN para o tipo
1 e o modelo espaco-temporal 6 mdash BN 1 6 mdash para o tipo 2 o modelo 9 mdash BN 2 9 mdash
e para o tipo 3 o modelo 6 mdash BN 3 6
Tabela 35 Valores DIC e mls dos modelos Binomial Negativo espaco-temporais semcovariaveis
Tipo 1 Tipo 2 Tipo 3
DIC1 pD1 mls1 DIC2 pD2 mls2 DIC3 pD3 mls3
BN k 5 1861293 25182 419 1172933 23006 264 852523 19820 191
BN k 6 1861278 25154 419 1172910 23028 264 852438 19770 191
BN k 7 1887073 24171 424 1181068 22284 266 856745 19176 192
BN k 8 1870915 33484 421 1163769 32056 262 856972 20628 193
BN k 9 1870045 31179 421 1156921 29101 261 857111 19815 193
Entre os dois tipos de modelos os valores sugerem que no caso de acidentes do tipo 1 e
do tipo 2 os melhores sao os modelos BN e no caso de acidentes do tipo 3 os melhores
sao os modelos Poisson
331 Associacao regional
Com o aumento na qualidade e quantidade das bases de dados dos sistemas de informacao
geografica (SIG) disponıveis na internet as organizacoes publicas podem disponibilizar
informacao que permite incorporar covariaveis adicionais nos modelos de acidentes ex-
plorando por exemplo as interacoes do uso de solo e dos transportes e os seus efeitos
nos riscos de acidentes
Nesta tese foram usadas oito covariaveis relativas aos concelhos o numero de habitantes
em milhares de habitantes P a area em centenas de km2 A a densidade populacional em
centenas de habitantes por km2 DP o comprimento de estrada em km C a quantidade
de combustıvel vendido em milhares de toneladas VC a ocupacao urbana do solo OSU
a ocupacao industrial do solo OSI a ocupacao do solo com equipamentos e parques
urbanos OSEPU a ocupacao do solo com equipamento turıstico OST As ocupacoes do
solo sao expressas em centenas de km2 Para as covariaveis P A DP e VC obtiveram-se
valores por concelho e por ano mas para as covariaveis C OSU OSI OSEPU e OST
os valores sao por concelho e iguais em todos os anos
33 Modelos espaco-temporais 47
332 Selecao dos modelos
Foram implementados todos os modelos com todas as combinacoes entre as covariaveis
mas sem interacao entre elas Mais uma vez a escolha dos modelos para cada tipo de
acidentes rodoviarios foi feita de acordo com o DIC e com o mls Deste modo foram
escolhidos os seguintes modelos
Tabela 36 DIC pD e mls para cada tipo de acidente
Tipo P DIC pD mls BN DIC pD mls
1 1 8 124 1939792 47805 458 1 6 172 1860317 25043 418
2 2 9 300 1169657 35476 270 2 9 192 1156327 29155 260
3 3 6 4 846237 20562 191 3 6 6 852362 19267 191
Assim no caso de acidentes do tipo 1 foram selecionados os modelos espaco-temporais
P 1 8 124 mdash modelo Poisson M8 com a incorporacao das covariaveis C VC OSEPU e
Amdash e BN 1 6 172 mdash modelo BN M6 com a incorporacao das covariaveis C P OSEPU
e OSTmdash no caso de acidentes do tipo 2 foram selecionados os modelos P 2 9 300 mdash
modelo Poisson M9 com a incorporacao das covariaveis C VC OSEPU OSI OST e DP
mdash e BN 2 9 192 mdash modelo BN M9 com a incorporacao das covariaveis C OSEPU OSI
e OST mdash e no caso de acidentes do tipo 3 foram selecionados os modelos P 3 6 4 mdash
modelo Poisson M6 com a incorporacao da covariavel Cmdash e BN 3 6 6 mdash modelo BN M6
com a incorporacao da covariavel DP mdash Mais adiante serao apresentados estes modelos
Note-se que os valores DIC maximos obtidos em cada conjunto de modelos Poisson para
cada tipo de acidentes sao nos modelos P 1 8 1940546 nos modelos P 2 8 1170426 e
nos modelos P 3 6 847025 As diferencas entre o valor mınimo e o valor maximo sao
relativamente pequenas 754 769 e 788 respetivamente No caso dos modelos BN os
valores DIC maximos sao nos modelos BN 1 2 1861278 nos modelos BN 2 6 1156921
e nos modelos BN 3 2 852438 As diferencas entre o valor mınimo e o valor maximo
sao relativamente pequenas 961 594 e 076 respetivamente
Apesar destes valores muito proximos que sugerem que a introducao das covariaveis nao
contribui para um melhor ajustamento dos modelos pretendeu-se analisar as possıveis
covariaveis significativas e respetiva contribuicao para os resultados Assim fica para
trabalho futuro a recolha de outras covariaveis que possam contribuir de forma mais
significativa para melhorar as estimativas fornecidas pelos modelos selecionados Em
48 Capıtulo 3 Aplicacoes
particular como ja foi referido ao longo desta tese o trafego diario medio anual (TDMA)
e uma covariavel considerada muito importante na modelacao estatıstica de acidentes
rodoviarios acreditando-se que os resultados serao mais aliciantes com a sua incorporacao
nos modelos Outra covariavel potencialmente interessante refere-se a actividade turıstica
designadamente o numero de camas ou o valor das taxas de ocupacao de equipamentos
hoteleiros
333 Modelos para acidentes do tipo 1
Modelo Poisson 1 8 124 e Modelo Binomial Negativo 1 6 172
log(θ1ij) = α1 + b1CC1i + b1V CV Cit + b1OSEPUOSEPUi + b1AAit + s1i + (γ1 + δ1i)t
e
log(θ1ij) = α1 + b1CC1i + b1PPit + b1OSEPUOSEPUi + b1OSTOSTi + s1i + ψ1t
No modelo Poisson as covariaveis que aparentemente nao contribuem significativamente
para a explicacao da variacao do risco relativo sao OSEPU e A uma vez que os intervalos
de credibilidade HPD (Highest Posterior Density) para os respetivos coeficientes contem
o zero Sempre que esta situacao se verificar determina-se o menor HPD que contem o
zero para cada um dos respetivos coeficientes Se p le 08 com p=cobertura do menor
HPD que contem o zero considera-se que a covariavel nao contribui significativamente
para a explicacao da variacao do risco relativo e retira-se a covariavel do modelo caso
contrario considera-se que a covariavel contribui significativamente para a explicacao
da variacao do risco relativo e mantem-se a covariavel no modelo Neste caso dado
que pOSEPU = 0342 pA = 0783 as covariaveis sao retiradas do modelo Poisson 1 6 124
obtendo-se o modelo Poisson 1 8 16 ou seja
log(θ1ij) = α1 + b1CCi + b1V CV Cit + s1i + (γ1 + δ1i)t
Tabela 37 DIC pD e mls para acidentes tipo 1
Modelo DIC pD mls
P 1 8 1 1940548 47786 458
P 1 8 16 1939877 47789 458
BN 1 6 1 1861278 25154 419
BN 1 6 172 1860317 25015 418Figura 35 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
33 Modelos espaco-temporais 49
No modelo BN embora o intervalo de credibilidade para o coeficiente correspondente as
covariaveis OSEPU e OST contenha o zero como pOSEPU = 0805 e pOST = 0944 decidiu-se
manter as covariaveis no modelo
334 Validacao dos modelos para acidentes do tipo 1
Validacao do modelo P 1 8 16 e do modelo BN 1 6 172
Figura 36 Histograma dos valores PIT ajustados para o modelo P 1 8 16 e para omodelo BN 1 6 172
Verifica-se que o valor DIC para o modelo BN 1 6 172 e consideravelmente menor do
que para o modelo P 1 8 16 sendo a diferenca entre os valores igual a 7956 Tabela
37 O valor da media do logscore tambem e significativamente menor de acordo com
o teste de permutacao efetuado cujo p-value e 0 Figura 35 O histograma dos valores
PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura 36 O
valor de concordancia preditiva obtido para o modelo P 1 8 16 foi 802 e para o modelo
BN 1 6 172 foi 946 sendo superior para o modelo BN Portanto todas estas indicacoes
sugerem conjuntamente que o modelo BN 1 2 172 e o melhor modelo para acidentes do
tipo 1
335 Resultados obtidos com modelos para acidentes do tipo 1
Resultados obtidos com o modelo P 1 8 16 e com o modelo BN 1 6 172
A Figura 37 e a Tabela 38 mostram que as estimativas do risco relativo sofrem um
efeito de contracao no sentido em que ocorre um aumento dos valores mais baixos e uma
50 Capıtulo 3 Aplicacoes
diminuicao nos valores mais elevados das estimativas dos SMR para acidentes do tipo
1 SMR1 em relacao aos valores esperados a posteriori obtidos com o modelo P 1 8 16
e destes valores em relacao aos valores esperados a posteriori obtidos com o modelo
BN 1 6 172
Figura 37 Box plot dos valores estimados dos SMR1 e dos riscos relativos esperados aposteriori para acidentes tipo 1 obtidos com os modelos P 1 8 1 P 1 8 16 BN 1 6 1 eBN 1 6 172
Tabela 38 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max
SMR1 00000 07512 09656 10020 12360 32610
RR1 8 1 02290 07728 09663 09989 11870 28890
RR1 8 16 02274 07722 09628 09979 11860 28770
RR1 6 1 02886 07807 09599 10010 11890 24480
RR1 6 172 02852 07798 09589 09999 11870 24400
Nas Figuras 38ndash39 encontra-se representado o valor da amplitude dos intervalos de
33 Modelos espaco-temporais 51
confianca para as estimativas dos SMR1 e o valor da amplitude dos intervalos de credi-
bilidade dos riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com
os modelos P 1 8 16 e BN 1 6 172 para todo o perıodo de estudo verificando-se a dimi-
nuicao da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 38 Amplitude dos intervalos de confianca para as estimativas dos SMR1 e ampli-tude dos intervalos de credibilidade dos riscos relativos esperados a posteriori de acidentestipo 1 obtidos com os modelos Poisson 1 8 16 e Binomial Negativo 1 6 172
Figura 39 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 1 obtidos com os modelos P 1 8 16 e BN 1 6 172
Na Figura 310 estao representados os valores estimados dos SMR1 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 311 estao representados
52 Capıtulo 3 Aplicacoes
os riscos relativos esperados a posteriori dos acidentes do tipo 1 obtidos com o modelo
P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 310 Valores estimados dos SMR1 e respetivos intervalos de confianca para oano 2000
Figura 311 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo P 1 8 16 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 312 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 1 obtidos com o modelo BN 1 6 172 e respetivos intervalos de credibilidade para
o ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 310ndash312
se verifica a diminuicao da amplitude dos intervalos Estes fatores mostram o efeito de
33 Modelos espaco-temporais 53
suavizacao das estimativas a diminuicao da respetiva variabilidade e a diminuicao dos
erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-temporais
Figura 312 Riscos relativos esperados a posteriori de acidentes tipo 1 obtidos com omodelo BN 1 6 172 e respetivos intervalos de credibilidade para o ano 2000
Relativamente a introducao das covariaveis comprimento de estrada e quantidade de
combustıvel vendido nos modelos Poisson verifica-se que o valor estimado da variancia
dos efeitos espaciais σ2s1 diminui Tabelas 39 e 310 Tal significa que as covariaveis
explicam de alguma forma efeitos aleatorios nao observados ou efeitos sistematicos nao
explicados que estariam incluıdos no modelo P 1 8 1 atraves dos efeitos estruturados
espacialmente
Tabela 39 Estatısticas resumo dos parametros do modelo P 1 8 1
Efeitos fixosmedia dp 0025q 0975q
α1 00580 00074 00435 00723
γ1 -00263 00030 -00321 -00204
Variancia dos efeitos aleatorios
σ2s1 05816 00591 04706 07001
σ2δ1
00019 00002 00015 00023
Verifica-se tambem que o valor estimado da tendencia temporal media global γ1 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ1
54 Capıtulo 3 Aplicacoes
mantem-se o que implica que a introducao das covariaveis no modelo nao afeta a ex-
plicacao da variacao associada aos efeitos temporais
Assim uma vez que as covariaveis comprimento de estrada e quantidade de combustıvel
vendido influenciam significativamente a variacao geografica dos riscos relativos sao
consideradas na estimacao dos modelos Neste caso as duas covariaveis contribuem
de forma positiva para a variacao os riscos o que significa que em regioes com maior
comprimento de estrada e em regioes com maior quantidade de combustıvel vendido
esta associado um aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Tabela 310 Estatısticas resumo dos parametros do modelo P 1 8 16
Efeitos fixosmedia dp 0025q 0975q
α1 -00898 00354 -01595 -00207
b1C 00016 00004 00008 00024
b1V C 00003 00001 00002 00005
γ1 -00257 00030 -00315 -00198
Variancia dos efeitos aleatorios
σ2s1 05492 00560 04440 06615
σ2δ1
00019 00002 00015 00023
No caso dos modelos BN verifica-se que com a incorporacao do comprimento de estrada
do numero de habitantes da ocupacao do solo com equipamentos e parques urbanos e da
ocupacao do solo com equipamentos turısticos o valor estimado da variancia dos efeitos
espaciais σ2s1 diminui Tabelas 311 e 312 Isto pode significar que as covariaveis contri-
buem para a explicacao da variacao espacial do risco relativo devida a efeitos aleatorios ou
efeitos sistematicos nao explicados que estariam incluıdos no modelo BN 1 6 172 atraves
dos efeitos espaciais Tambem se verifica que o valor estimado da variancia dos efeitos
temporais σ2ψ1
se mantem o que implica que as covariaveis nao contribuem para a ex-
plicacao da variacao associada aos efeitos temporais Como o valor DIC e menor para o
modelo BN do que para o modelo Poisson equivalente considera-se que a sobredispersao
e significativa
Mais uma vez as covariaveis que influenciam significativamente a variacao geografica
dos riscos relativos sao consideradas na estimacao dos modelos Neste caso as tres co-
variaveis contribuem de forma positiva para a estimacao dos riscos o que significa que
33 Modelos espaco-temporais 55
regioes com maior comprimento de estrada regioes com maior ocupacao de solo com
equipamentos e parques urbanos e regioes com maior ocupacao de solo com equipamento
turıstico contribuem para o aumento das estimativas de riscos mantendo fixos todos
os restantes efeitos No entanto a covariavel numero de habitantes contribui negativa-
mente para a estimacao dos riscos o que significa que em regioes com maior numero de
habitantes ha contribuicao para a diminuicao das estimativas do risco relativo mantendo
fixos todos os restantes efeitos
Tabela 311 Estatısticas resumo dos parametros do modelo BN 1 6 1
Efeitos fixosmedia dp 0025q 0975q
α1 -00429 00052 -00595 -00389
Parametro de dispersao φminus11 00298 00017 00267 00332
Variancia dos efeitos aleatorios
σ2s1 02603 00266 02108 03142
σ2ψ1
00090 00057 00029 00237
Tabela 312 Estatısticas resumo dos parametros do modelo BN 1 6 172
Efeitos fixosmedia dp 0025q 0975q
α1 -01348 00243 -01826 -00872
b1C 00013 00003 00007 00019
b1P -00135 00044 -00221 -00049
b1OSEUP 00001 000008 -000005 00003
b1OST 00001 000006 -0000003 00002
Parametro de dispersao φminus11 00300 00017 00269 00334
Variancia dos efeitos aleatorios
σ2s1 02438 00254 01966 02951
σ2ψ1
00090 00056 00029 00235
Pela visualizacao dos mapas das Figuras 313 e 315 pode verificar-se que a componente
56 Capıtulo 3 Aplicacoes
espacial contribui fortemente para a variacao geografica do risco relativo O padrao e
muito semelhante e os conjuntos de regioes estao bem definidos Note-se que as regioes
com maior risco relativo estimado correspondem as regioes em que as estimativas dos
efeitos espaciais si sao positivas as regioes com menor risco relativo estimado correspon-
dem as regioes em que as estimativas de si sao negativas e as regioes com risco relativo
proximo de um correspondem as regioes em que as estimativas de si sao proximas de
zero A percentagem de estimativas dos valores de s1i cujo intervalo de credibilidade
HPD nao contem o zero e 633 para o modelo P 1 4 16
Figura 313 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo P 1 8 16
Figura 314 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco temporal para acidentes tipo 1 obtidos com o modelo P 1 8 16
33 Modelos espaco-temporais 57
A tendencia temporal global e decrescente uma vez que γ1 = minus00257 ou seja γ1 lt 0
eγ1 lt 1 Tabela 310 Portanto o numero de acidentes rodoviarios do tipo 1 decresce ao
longo dos anos em estudo como ja era esperado A diferenca no decrescimento medio
anual e dada por (1 minus exp(γ1)) times 100 ou seja neste caso e de 26 por ano Esta
tendencia decrescente tambem e visıvel nos mapas pela diminuicao dos tons das cores
correspondente a diminuicao das estimativas dos riscos ao longo dos anos
Tabela 313 Estatısticas resumo da interacao espaco-temporal do modelo P 1 8 16
Min 1oQ Mediana Media 3oQ Max
δ1 -00919 -00254 -00476 00768 00197 00133
eδ1 09125 09751 09954 10010 10200 11420
Figura 315 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo P 1 8 16
Em relacao a interacao espaco-temporal a percentagem de valores δ1i cujo intervalo de
credibilidade HPD nao contem o zero e 378 Nos concelhos em que δ1i gt 0 eδ1i gt 1
a tendencia temporal local e maior que a tendencia global sendo o decrescimento do
numero de acidentes menos acentuado Nos concelhos onde δ1i = 0 eδ1i = 1 a tendencia
58 Capıtulo 3 Aplicacoes
temporal local e igual a global Nos concelhos onde δ1i lt 0 eδ1i lt 1 a tendencia
temporal local e menor do que a global sendo o decrescimento mais acentuado No
mapa da Figura 315 pode ver-se a distribuicao destes concelhos
Na Figura 315 e possıvel identificar alguns dos concelhos com risco relativo superior a um
sendo esta informacao completada com a lista de ordenacao dos concelhos apresentada
na Tabela A8 do Anexo A
Figura 316 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 6 172
Figura 317 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 1 obtidos com o modelo BN 1 6 172
Tambem com a aplicacao do modelo BN 1 6 172 pode verificar-se pela visualizacao dos
mapas da Figura 316 e do mapa a esquerda na Figura 317 que a componente espacial
33 Modelos espaco-temporais 59
contribui fortemente para a variacao geografica do risco relativo pois o padrao e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo estimado
e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes com
menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si
sao proximas de zero Para este modelo a percentagem de estimativas dos valores de
s1i cujo intervalo de credibilidade HPD nao contem o zero e 5935 Relativamente
a componente temporal observa-se um ligeiro decrescimento nos dois primeiros anos
seguido de um aumento consideravel no terceiro ano e depois um decrescimento mais
acentuado nos cinco anos seguintes
Figura 318 Valores esperados a posteriori da contribuicao das covariaveis C e P obtidoscom o modelo BN 1 6 172
Na Figura 318 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
comprimento de estrada para a variacao dos riscos relativos estimada pelo modelo
BN 1 6 172 Como o respetivo coeficiente e positivo a covariavel contribui com um
aumento de (exp(bCCi) minus 1) times 100 do risco relativo da regiao i fixando-se todos os
restantes efeitos Esta contribuicao vai de 0 a 53 O mapa da direita reflete a percenta-
gem estimada de contribuicao da covariavel populacao para a variacao os riscos relativos
estimada pelo modelo BN 1 6 172 Como o respetivo coeficiente e negativo a covariavel
contribui com um decrescimo de (1 minus exp(bPPit)) times 100 do risco relativo da regiao i
no ano t fixando-se todos os restantes efeitos Esta contribuicao vai de 0015 a 54
Na Figura 319 o mapa da esquerda reflete a percentagem de contribuicao da covariavel
ocupacao de solo com equipamentos e parques urbanos e o mapa da direita reflete a
percentagem estimada de contribuicao da covariavel ocupacao do solo com equipamento
turıstico para a variacao dos riscos relativos estimadas pelo modelo BN 1 6 172 Como
os respetivos coeficientes sao positivos as covariaveis contribuem com um aumento de
60 Capıtulo 3 Aplicacoes
(exp(bOSEPUOSEPUi)minus 1)times 100 e de (exp(bOSTOSTi)minus 1)times 100 do risco relativo
da regiao i respetivamente fixando-se todos os restantes efeitos No caso da covariavel
OSEPU essa contribuicao vai de 0 a 212 e no caso da covariavel ocupacao do solo com
equipamentos turısticos vai de 0 a 038
Figura 319 Valores esperados a posteriori das covariaveis OSEPU e OST obtidos como modelo BN 1 6 172
Figura 320 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 6 172
Observando a Figura 320 e possıvel identificar alguns concelhos com risco relativo maior
33 Modelos espaco-temporais 61
que um Na Tabela A8 do Anexo A encontra-se uma lista ordenada dos quinze concelhos
com risco relativo significativamente maior que um
336 Modelos para acidentes do tipo 2
Modelo Poisson 2 9 300 e Modelo Binomial Negativo 2 9 192
log(θ2ij) = α2 + b2CCi + b2V CV Cit + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi +
b2DPDP2it + s2i + (γ2 + δ2i)t
e
log(θ2ij) = α2 + b2CCi + b2OSEPUOSEPUi + b2OSIOSIi + b2OSTOSTi + s2i + (γ2 + δ2i)t
No modelo Poisson o intervalo de credibilidade HPD para o correspondente coeficiente
das covariaveis OSEPUOSI OST DP e VC contem o zero Assim como pOSEPU = 0519
pOSI = 0605 pOST = 0524 e pDP = 0012 decidiu-se retirar estas covariaveis do modelo
Poisson P 2 9 300 e como pVC = 0811 decidiu-se manter esta covariavel obtendo-se o
modelo P 2 9 16 ou seja
log(θ2ij) = α2 + b2CCi + b2V CV Cij + s2i + (γ2 + δ2i)t
No modelo BN o intervalo de credibilidade para o correspondente coeficiente das co-
variaveis OSEPU e OSI contem o zero Assim como pOSEPU = 0268 pOSI = 0025 e
pOST = 0551 decidiu-se retirar as covariaveis do modelo BN 2 9 192 obtendo-se o mo-
delo BN 2 9 4 ou seja
log(θ2ij) = α2 + b2CCi + s2i + (γ2 + δ2i)t
Tabela 314 DIC pD e mls para acidentes tipo 2
modelo DIC pD mls
P 2 9 1 1170386 35334 270
P 2 9 16 1169631 35476 270
BN 2 9 1 1156921 29101 261
BN 2 9 4 1156430 29016 260 Figura 321 Histograma das diferencas entre asmedias dos logscores obtidas por permutacao e a di-ferenca entre as medias observada
62 Capıtulo 3 Aplicacoes
337 Validacao dos modelos para acidentes do tipo 2
Validacao do modelo P 2 9 16 e do modelo BN 2 9 4
Figura 322 Histograma dos valores PIT ajustados para o modelo P 2 9 16 e para omodelo BN 2 9 4
Analisando a Tabela 314 verifica-se que o valor DIC para o modelo BN 2 9 4 e conside-
ravelmente menor do que para o modelo P 2 9 16 sendo a diferenca entre os valores igual
a 13956 O valor da media do logscore tambem e significativamente menor de acordo
com o teste de permutacao efetuado cujo p-value e 001 Figura 321 O histograma dos
valores PIT ajustados tem um aspeto mais proximo da distribuicao Uniforme Figura
322 O valor da concordancia preditiva obtido com o modelo P 2 9 16 foi 894 e para
o modelo BN 2 9 4 foi 9505 logo e superior para o modelo BN Todas estas indicacoes
sugerem conjuntamente que o modelo BN 2 9 4 e o melhor modelo para acidentes do
tipo 2
338 Resultados obtidos com modelos para acidentes do tipo 2
Resultados obtidos com o modelo P 2 9 16 e com o modelo BN 2 9 4
A partir dos resultados observados na Figura 323 e na Tabela 315 verifica-se que as
estimativas do risco relativo sofrem um efeito de contracao no sentido em que ocorre
um aumento dos valores mais baixos e uma diminuicao nos valores mais elevados das
estimativas dos SMR para acidentes do tipo 2 SMR2 em relacao aos valores esperados
a posteriori obtidos com o modelo P 2 9 16 e destes valores em relacao aos valores
esperados a posteriori obtidos com o modelo BN 2 9 4
33 Modelos espaco-temporais 63
Figura 323 Box plot dos valores estimados dos SMR2 e dos riscos relativos esperadosa posteriori para acidentes tipo 2 obtidos com os modelos P 2 9 1 P 2 9 16 NB 2 9 1 eNB 2 9 4
Nas Figuras 324ndash325 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR2 e o valor da amplitude dos intervalos de credibi-
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com os
modelos P 2 9 16 e BN 2 9 4 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Tabela 315 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max
SMR2 00000 05062 09180 11830 15740 87830
RR2 9 1 02237 06553 09651 11910 14980 77550
RR2 9 16 02218 06547 09624 11860 14970 77060
RR2 9 1 nb 02391 06636 09751 11870 14960 59240
RR2 9 4 nb 02363 06630 09720 11810 14850 59030
64 Capıtulo 3 Aplicacoes
Na Figura 326 estao representados os valores estimados dos SMR2 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 327 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 2 obtidos com o modelo
P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
Figura 324 Amplitude dos intervalos de confianca para as estimativas dos SMR2 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori dosacidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Figura 325 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori dos acidentes tipo 2 obtidos com os modelos P 2 9 16 e BN 2 9 4
Na Figura 328 estao representados os riscos relativos esperados a posteriori dos acidentes
33 Modelos espaco-temporais 65
do tipo 2 obtidos com o modelo BN 2 9 4 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 326ndash328 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Figura 326 Valores estimados dos SMR2 e respetivos intervalos de confianca para oano 2000
Figura 327 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo P 2 9 16 e respetivos intervalos de credibilidade para o ano 2000
66 Capıtulo 3 Aplicacoes
Figura 328 Riscos relativos esperados a posteriori de acidentes tipo 2 obtidos com omodelo BN 2 9 4 e respetivos intervalos de credibilidade para o ano 2000
Pela analise do valores das Tabelas 316 e 317 verifica-se que com a introducao das
covariaveis comprimento de estrada e quantidade do combustıvel vendido no modelo
Poisson o valor estimado da variancia dos efeitos espaciais σ2s2 diminui Ou seja
as covariaveis explicam de alguma forma efeitos aleatorios nao observados ou efeitos
sistematicos nao explicados que estariam incluıdos no modelo P 2 9 1 atraves do efeito
espacial
Tabela 316 Estatısticas resumo para os parametros do modelo P 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03511 00191 03135 03883
γ2 -00844 00037 -00918 -00771
Variancia dos efeitos aleatorios
σ2s2 09474 01054 07554 11648
σ2δ2
00099 00016 00070 00133
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a introducao das covariaveis no modelo nao afecta a ex-
plicacao da variacao associada aos efeitos temporais Para alem disso como a contribuicao
33 Modelos espaco-temporais 67
para a variacao geografica das estimativas dos riscos e positiva em regioes com maior
comprimento de estrada e regioes com maior venda de combustıvel ocorre a contribuicao
para o aumento das estimativas do risco relativo mantendo fixos os restantes efeitos
Tabela 317 Estatısticas resumo para os parametros do modelo P 2 9 16
Efeitos fixosmedia dp 0025q 0975q
α2 01790 00530 00741 02822
b2C 00020 00005 00009 00031
b2V C -00004 00003 -00010 00003
γ2 -00833 00038 -00906 -00759
Variancia dos efeitos aleatorios
σ2s2 09162 01019 07325 11282
σ2δ2
00099 00016 00015 00135
Tambem no caso dos modelos BN se pode ver atraves das Tabelas 318 e 319 que com
a incorporacao da covariavel comprimento de estrada o valor estimado da variancia dos
efeitos espaciais σ2s2 diminui Tal significa que a covariavel explica de alguma forma
efeitos aleatorios nao observados ou efeitos sistematicos nao explicados que estariam
incluıdos no modelo P 2 9 1 atraves do efeito espacial
Tabela 318 Estatısticas resumo para os parametros do modelo NB 2 9 1
Efeitos fixosmedia dp 0025q 0975q
α2 03529 00223 03090 03965
γ2 -00819 00044 -00906 -00733
Parametro de dispersao φminus11 00577 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07824 00925 06156 09748
σ2δ2
00051 00012 00031 00079
Verifica-se tambem que o valor estimado da tendencia temporal media global γ2 e pra-
68 Capıtulo 3 Aplicacoes
ticamente igual e que o valor estimado da variancia da interacao espaco-temporal σ2δ2
mantem-se Isto significa que a covariavel nao contribui para a explicacao da variacao
associada aos efeitos temporais Para alem disso como a contribuicao para a variacao
geografica das estimativas dos riscos e positiva em regioes com maior comprimento de
estrada ha contribuicao para o aumento das estimativas do risco relativo mantendo fixos
os restantes efeitos
Tabela 319 Estatısticas resumo para os parametros do modelo NB 2 9 4
Efeitos fixosmedia dp 0025q 0975q
α2 01961 00530 00741 02822
b2C 00017 00005 00008 00027
γ2 -00814 00044 -00900 -00727
Parametro de dispersao φminus11 00576 00052 00480 00682
Variancia dos efeitos aleatorios
σ2s2 07516 00894 05914 09385
σ2δ2
00052 00013 00031 00080
Figura 329 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo P 2 9 16
33 Modelos espaco-temporais 69
Em relacao a componente espacial observando os mapas das Figuras 329 e 330 pode
verificar-se que contribui fortemente para a variacao geografica do risco relativo pois o
padrao e muito semelhante Note-se que as regioes com maior risco relativo estimado
correspondem as regioes em que as estimativas dos efeitos espaciais si sao positivas as
regioes com menor risco relativo estimado correspondem as regioes em que as estimativas
de si sao negativas e as regioes com risco relativo proximo de um correspondem as regioes
em que as estimativas de si sao proximas de zero Para o modelo P 2 6 16 a percentagem
de estimativas dos valores de s2i cujo intervalo de credibilidade HPD nao contem o zero
e 608
Figura 330 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo P 2 9 16
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00833 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Tabela 317 Portanto o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo como ja era
esperado A diferenca no decrescimento medio anual e dada por (1minusexp(γ1))times100 ou
seja neste caso e de 8 por ano Em relacao a interacao espaco-temporal a percentagem
de valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 295
Tabela 320 Estatısticas resumo da interacao espaco-temporal do modelo P 2 9 16
Min 1oQ Mediana Media 3oQ Max
δ2 -01805 -00411 00082 00003 00485 01532
eδ2 08358 09604 10090 10030 10500 11660
No mapa da Figura 330 observa-se nitidamente regioes bem definidas podendo dizer-se
que os concelhos do norte e os concelhos mais a sul do paıs apresentam uma tendencia
70 Capıtulo 3 Aplicacoes
temporal local maior do que a global e um decrescimento no numero de acidentes do tipo
2 menos acentuado e que os concelhos do centro possuem uma tendencia temporal local
menor que a global e um decrescimento mais acentuado
Figura 331 Box plot dos riscos relativos esperados a posteriori dos acidentes tipo 2 de2000 a 2007 obtidos com o modelo P 2 9 16
E possıvel identificar alguns concelhos com estimativa de risco relativo maior que um
obtidos com o modelo P 2 9 16 atraves da Figura 331 Na Tabela A9 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um que permite complementar esta informacao
Com o modelo BN 2 6 4 tambem se verificou que a componente espacial contribui for-
temente para a variacao geografica do risco relativo como se pode observar no mapa da
Figura 332 e no mapa a esquerda na Figura 333 nos quais o padrao espacial e muito
semelhante Mais uma vez ha associacao entre regioes com maior risco relativo esti-
mado e regioes em que as estimativas dos efeitos espaciais si sao positivas entre regioes
com menor risco relativo estimado e regioes em que as estimativas de si sao negativas e
entre regioes com risco relativo proximo de um e regioes em que as estimativas de si sao
proximas de zero Para este modelo a percentagem de estimativas dos valores de s2i
cujo intervalo de credibilidade HPD nao contem o zero e 5665
33 Modelos espaco-temporais 71
Figura 332 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 4
Figura 333 Valores esperados a posteriori da componente espacial e da componente deinteracao espaco-temporal para acidentes tipo 2 obtidos com o modelo BN 2 9 4
Tabela 321 Estatısticas resumo da interacao espaco-temporal do modelo BN 2 9 4
Min 1oQ Mediana Media 3oQ Max
δ1 -01530 -00368 00052 00001 00402 01140
eδ1 08592 09646 10060 10020 10420 11210
72 Capıtulo 3 Aplicacoes
Tambem neste caso a tendencia temporal global e decrescente uma vez que γ2 =
minus00814 ou seja γ1 lt 0 e consequentemente eγ1 lt 1 Como era de esperar o numero
de acidentes rodoviarios do tipo 2 decresce ao longo dos anos em estudo A diferenca
no decrescimento medio anual e dada por (1minus exp(γ1))times 100 ou seja neste caso e de
78 por ano Tabela 319 Em relacao a interacao espaco-temporal a percentagem de
valores δ2i cujo intervalo de credibilidade HPD nao contem o zero e 281 e pelo mapa
da Figura 333 a maioria das regioes apresenta uma tendencia temporal local inferior a
global sendo o seu decrescimento menos acentuado que o decrescimento global havendo
uma minoria onde se passa o contrario
Figura 334 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 4
Tambem e possıvel identificar alguns concelhos com estimativas de risco relativo maior
que um obtidas com o modelo BN 2 9 4 ver Figura 334 e completar esta informacao
com a informacao contida na Tabela A9 do Anexo A onde se pode encontrar uma lista
ordenada dos primeiros quinze concelhos
33 Modelos espaco-temporais 73
339 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 4 e Modelo Binomial Negativo 3 6 6
log(θ3ij) = α3 + b3CCi + s3i + ψ3t
e
log(θ3ij) = α3 + b3DPDPit + s3i + ψ3t
No modelo Poisson o intervalo de credibilidade HPD para o parametro correspondente a
covariavel C contem o zero e como pC = 0685 decidiu-se retirar a covariavel do modelo
P 3 6 4 Assim o modelo escolhido e o modelo sem covariaveis o modelo 3 6 1
log(θ3ij) = α3 + s3i + ψ3t
No modelo BN o intervalo de credibilidade HPD para o coeficiente da covariavel densidade
populacional nao contem o zero por isso o modelo mantem-se
Tabela 322 DIC pD e mls para acidentes tipo 3
modelo DIC pD mls
P 3 6 1 846290 20551 191
P 3 6 4 846237 20562 191
BN 3 6 1 852438 19770 191
BN 3 6 6 852362 19267 191
3310 Validacao dos modelos para acidentes do tipo 3
Validacao do modelo P 3 6 1 e do modelo BN 3 6 6
Fazendo a analise dos resultados verifica-se que o valor DIC para o modelo P 3 6 1 e
menor do que para o modelo BN 3 6 6 sendo a diferenca entre os valores igual a 6072
Tabela 322 O valor da media do logscore e igual par os dois modelos O histograma dos
valores PIT ajustados tem um aspeto semelhante Figura 335 O valor da concordancia
preditiva obtido com o modelo P 3 6 1 foi 94 e com o modelo BN 3 6 6 foi 96 sendo
74 Capıtulo 3 Aplicacoes
ligeiramente superior para o modelo BN 3 6 6 Com base nestas indicacoes considera-se
que o modelo P 3 6 6 e o melhor modelo para acidentes do tipo 3
Figura 335 Histograma dos valores PIT ajustados para o modelo P 3 6 1 e do modeloBN 3 6 6
3311 Resultados obtidos com modelos para acidentes do tipo 3
Resultados obtidos com o modelo P 3 6 1 e com o modelo BN 3 6 6
Tabela 323 Estatısticas resumo das estimativas do risco relativo para acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max
SMR3 00000 04639 11050 15100 20490 156700
RR3 6 1 01363 08869 13050 14900 18430 95400
RR3 6 6 bn 01247 09020 13170 14850 18370 87310
Tambem no caso dos acidentes do tipo 3 verifica-se que as estimativas do risco relativo
obtidas com os modelos escolhidos sofrem um efeito de contracao dando-se uma sua-
vizacao das estimativas dos SMR para acidentes do tipo 3 SMR3 em relacao aos valores
esperados a posteriori obtidos com os modelos Poisson e destes valores em relacao aos
valores esperados a posteriori obtidos com os modelos Binomial Negativo Figura 336 e
Tabela 323
33 Modelos espaco-temporais 75
Figura 336 Box plot dos valores estimados dos SMR3 e dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com o modelo P 3 6 1 com o modelo BN 3 6 1 ecom o modelo BN 3 6 6
Figura 337 Amplitude dos intervalos de confianca para as estimativas dos SMR3 eamplitude dos intervalos de credibilidade dos riscos relativos esperados a posteriori deacidentes do tipo 3 obtidos com os modelos P 3 6 1 e B 3 6 6
Nas Figuras 337ndash338 encontra-se representado o valor da amplitude dos intervalos de
confianca para as estimativas dos SMR3 e o valor da amplitude dos intervalos de credibi-
76 Capıtulo 3 Aplicacoes
lidade dos riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com os
modelos P 3 6 1 e BN 3 6 6 para todo o perıodo de estudo verificando-se a diminuicao
da amplitude dos intervalos entre as diferentes estimativas do risco relativo
Figura 338 Amplitude dos intervalos de credibilidade dos riscos relativos esperados aposteriori de acidentes tipo 3 obtidos com os modelos P 3 6 1 e BN 3 6 6
Figura 339 Valores estimados dos SMR3 e respetivos intervalos de confianca para oano 2000
Na Figura 339 estao representados os valores estimados dos SMR3 e respetivos intervalos
de confianca para o ano 2000 e para cada concelho Na Figura 340 estao representados
os riscos relativos esperados a posteriori dos acidentes do tipo 3 obtidos com o modelo
P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000 e para cada concelho
33 Modelos espaco-temporais 77
Figura 340 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo P 3 6 1 e respetivos intervalos de credibilidade para o ano 2000
Figura 341 Riscos relativos esperados a posteriori de acidentes tipo 3 obtidos com omodelo BN 3 6 6 e respetivos intervalos de credibilidade para o ano 2000
Na Figura 341 estao representados os riscos relativos esperados a posteriori dos acidentes
do tipo 3 obtidos com o modelo BN 3 6 6 e respetivos intervalos de credibilidade para o
ano 2000 e para cada concelho Tambem atraves da observacao das Figuras 339ndash341 se
verifica a diminuicao da amplitude dos intervalos Mais uma vez se mostra atraves destes
fatores o efeito de suavizacao das estimativas a diminuicao da respetiva variabilidade e
a diminuicao dos erros padrao efetuados pelos modelos bayesianos hierarquicos espaco-
temporais
Dado que no caso do modelo Poisson foi escolhido o modelo sem covariaveis nao se tecem
comentarios acerca de associacao regional para este modelo
78 Capıtulo 3 Aplicacoes
No modelo BN observa-se que com a introducao da covariavel densidade populacional o
valor estimado da variancia dos efeitos espaciais σ2s3 diminui e que o valor estimado da
variancia dos efeitos temporais σ2ψ1t
se mantem Tabelas 325 e 326
Tabela 324 Estatısticas resumo dos parametros do modelo P 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02114 00152 01815 02410
Variancia dos efeitos aleatorios
σ2s3 06817 00802 05383 08499
σ2ψ3
00255 00157 00082 00660
Tabela 325 Estatısticas resumo dos parametros do modelo BN 3 6 1
Efeitos fixosmedia dp 0025q 0975q
α3 02155 00158 01842 02464
Parametro de dispersao ψminus11 00455 00061 00348 00584
Variancia dos efeitos aleatorios
σ2s3 06497 00800 05070 08174
σ2ψ3
00255 00161 00081 00672
Tabela 326 Estatısticas resumo dos parametros do modelo BN 3 6 6
Efeitos fixosmedia dp 0025q 0975q
α3 02791 00217 02362 03215
bDP -00199 00048 -00294 -00105
Parametro de dispersao φminus11 00459 00061 00350 00588
Variancia dos efeitos aleatorios
σ2s3 05855 00749 04532 07440
σ2ψ3
00255 00161 00081 00672
Tal significa que a covariavel densidade populacional contribui para a explicacao da
33 Modelos espaco-temporais 79
variacao espacial mas que a introducao das covariaveis no modelo nao afeta a explicacao
da variacao temporal A contribuicao da covariavel densidade populacional e negativa
o que indica que em regioes com maior densidade populacional ocorre a contribuicao
para a diminuicao das estimativas de risco relativo mantendo fixos os restantes efeitos
No entanto o valor DIC do correspondente modelo Poisson e inferior sugerindo que a
sobredispersao nao e significativa
Figura 342 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 1
Figura 343 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo P 3 6 1
80 Capıtulo 3 Aplicacoes
O padrao espacial das estimativas do risco relativo e das estimativas da componente
espacial e muito semelhante e bem definido como se pode observar nos mapas das Figuras
342 e 343 Os conjuntos de regioes sao bastante vincados havendo uma forte associacao
positiva entre os valores das estimativas do risco relativo e os valores das estimativas dos
efeitos espaciais A percentagem de estimativas dos valores de s3i cujo HPD nao contem
o zero e 439 para o modelo P 3 6 1
No que respeita a componente temporal observa-se um decrescimento nos dois primeiros
anos seguido de um aumento consideravel no terceiro ano seguido de um decrescimento
nos ultimos cinco anos
Figura 344 Box plots dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 1
Atraves da Figura 344 podem identificar-se alguns concelhos com estimativas do risco
relativo obtidas com o modelo P 3 3 1 maiores que um Tambem se pode consultar a
lista ordenada dos primeiros quinze concelhos com estimativas do risco relativo significa-
tivamente maior que um na Tabela A9 do Anexo A
33 Modelos espaco-temporais 81
Figura 345 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo BN 3 6 6
Figura 346 Valores esperados a posteriori da componente espacial e da componentetemporal para acidentes tipo 3 obtidos com o modelo BN 3 6 6
Analisando os mapas das Figuras 345 e 346 verifica-se uma forte associacao entre os
padroes revelados pelos mapas As regioes com maior contribuicao da componente es-
pacial para o aumento do risco relativo correspondem em geral a regioes com maiores
estimativas de risco relativo Tal significa que a componente espacial explica grande parte
da variacao das estimativas do risco relativo A percentagem de estimativas dos valores
de s3i cujo HPD nao contem o zero e 378 para o modelo P 3 6 1
82 Capıtulo 3 Aplicacoes
Figura 347 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo BN 3 6 6
A identificacao de concelhos com estimativas de risco relativo superior a um obtidas pelo
modelo BN 3 6 6 e possıvel atraves da observacao da Figura 347 Esta informcao pode
ser complementada com a informcao disponıvel na Tabela A10 do Anexo A onde se
pode encontrar uma lista ordenada dos primeiros quinze concelhos
Na Tabela 327 faz-se um resumo da analise efetuada nas seccoes anteriores onde se
apresenta o modelo selecionado as covariaveis o tipo de efeito temporal e caso exista
o tipo de interacao espaco-temporal
Tabela 327 Modelos univariados
Tipo Melhor Modelo Covariaveis Efeito temporal Interacao espaco-temporal
1 BN 1 6 172 C+P+OSEPU+OST RW mdash
2 BN 2 9 4 C fixo CAR
3 P 3 6 1 mdash RW mdash
34 Modelos multivariados 83
34 Modelos multivariados
Os modelos multivariados usados foram
log(θikj) = αk + sik αk sim Normal(0 0001) sik simMCAR(1Σs)
log(θikj) = αk + sik + (γk + δik)tjk δik simMCAR(1Σδ)
Os resultados obtidos com os modelos multivariados sao semelhantes aos resultados ob-
tidos com os modelos univariados Tabela 328 e Figura 348 Sendo modelos muito
complexos nao parece haver um ganho substancial em usa-los
Tabela 328 Estatısticas resumo para os parametros do modelo espaco-temporal multi-variado e dos modelos univariados
Modelos multivariados Modelos univariados
Efeitos fixosmedia dp 0025q 0975q media dp 0025q 0975q
α1 00565 00181 00214 00914 00580 00074 00435 00723
α2 03423 00344 02735 04083 03511 00191 03135 03883
α3 05993 00331 05340 06644 06633 00247 06147 07115
γ1 -00259 00012 -00283 -00234 -00263 00030 -0321 -00204
γ2 -00827 00034 -00894 -00760 -00844 00037 -00918 -00771
γ3 -00923 00052 -01026 -00822 -01003 00049 -01098 -00907
Σu =
05551 03843 05519
03843 1042 05864
05519 05864 09113
Σδ =
00074 00035 00061
00035 00111 00059
00061 00059 00081
No entanto e interessante verificar que em termos de correlacao entre as estimativas
dos riscos dos diferentes tipos de acidentes a correlacao e maior entre acidentes do tipo
2 e acidentes do tipo 3 Tabela 329 e Figura 349 podendo haver correspondencia ao
que acontece em termos de vıtimas a 24 horas e vıtimas a 30 dias Segundo os relatorios
nacionais de 2010 e 2011 da ANSR para vıtimas a 30 dias e para vıtimas a 24 horas e
tambem nos relatorios mensais de 2012 disponıveis pode verificar-se que o aumento no
numero de vıtimas mortais a 30 dias deve-se essencialmente a feridos graves 330
84 Capıtulo 3 Aplicacoes
Tabela 329 Correlacoes dos modelos multivariados com interacao e sem interacaoespaco-temporal
Modelos com interacao Modelos sem interacao
media dp 0025q 0975q media dp 0025q 0975q
ρ12(θ) 04282 00183 03919 04634 04276 00207 03852 04669
ρ13(θ) 05626 00231 05164 06068 05392 00251 04891 05879
ρ23(θ) 06793 00242 06304 07252 06831 002647 07326
ρ12(u) 05035 00560 03894 06078 05280 00498 04255 06196
ρ13(u) 07753 00379 06930 08409 07244 00393 06408 07941
ρ23(u) 06009 00552 04847 07005 06007 00525 04920 06976
ρ12(δ) 03823 00894 01960 05465
ρ13(δ) 07979 00634 06487 08998
ρ23(δ) 06203 00938 04153 07829
Tabela 330 Vıtimas a 24 horas e vıtimas a 30 dias
AnoVıtimas mortais Feridos graves Feridos leves
24 horas 30 dias dif 24 horas 30 dias dif 24 horas 30 dias dif
2010 741 937 196 2637 2475 -162 43924 43890 -34
2011 689 891 202 2436 2265 -171 39726 39695 -31
34 Modelos multivariados 85
Figura 348 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos univariados e com os modelos multivariados
86 Capıtulo 3 Aplicacoes
Figura 349 Comparacao dos valores esperados a posteriori dos riscos relativos obtidoscom os modelos multivariados
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 87
35 Aplicacao para acidentes rodoviarios nas estradas
secundarias
Nesta seccao prentende-se fazer o estudo de acidentes que ocorreram em estradas se-
cundarias Trata-se de uma analise incidindo sobretudo no trafego local Para tal foram
retirados os acidentes que ocorreram nas estradas da Rede Rodoviaria Nacional nomea-
damente nas AE IP IC e EN O objetivo e o de averiguar quais os concelhos de maior
risco relativo ao nıvel da estradas que se encontram maioritariamente sob a jurisdicao do
poder local
Tabela 331 Numero total de cada tipo de acidentes rodoviarios por ano (Fonte LNEC)
Tipo 1 Tipo 2 Tipo 3 Total2000 23262 3260 561 270832001 22761 2560 521 258422002 22794 2125 490 254092003 22403 2113 458 249742004 21832 1966 417 242152005 20896 1796 406 230982006 20687 1647 326 226602007 21106 1442 292 22840
Total 175741 16909 3471 196121
Figura 350 Numero de acidentes tipo 1 por concelho
88 Capıtulo 3 Aplicacoes
Figura 351 Numero de acidentes tipo 2 por concelho
Figura 352 Numero de acidentes tipo 3 por concelho
No Anexo A podem ser consultadas as tabelas com as estatısticas resumo destes dados
Mais uma vez a escolha dos modelos para cada tipo de acidentes rodoviarios foi feita
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 89
de acordo com o DIC e com o mls Deste modo foram escolhidos os seguintes modelos
Tabela 332 DIC pD e mls para cada tipo de acidente
Modelo DIC pD mls
BN 1 9 42 1614530 32359 363
BN 2 9 246 924765 27530 208
P 3 6 30 581058 11747 131
351 Modelo para acidentes do tipo 1
Modelo Binomial Negativo 1 9 42
log(θ1ij) = α1 + b1CC1i + b1OSTOSTi + s1i + (γ1 + δ1i)t
Neste modelo o intervalo de credibilidade HPD para o coeficiente correspondente a
variavel OST contem o zero mas como pOST = 0823 nao se retira a covariavel do
modelo
352 Validacao do modelo para acidentes do tipo 1
Validacao do modelo BN 1 9 42
Figura 353 Histograma dos valores PIT ajustados para o modelo BN 1 9 42
O valor DIC para o modelo BN 1 9 42 e consideravelmente menor do que para o corres-
pondente modelo Poisson selecionado sendo a diferenca entre os valores igual a 3269 O
90 Capıtulo 3 Aplicacoes
valor da media do logscore tambem e menor O histograma dos valores PIT ajustados tem
um aspeto proximo da distribuicao Uniforme Figura 353 e o valor da concordancia pre-
ditiva e 945 Tomando em conta estas indicacoes considera-se que o modelo BN 1 9 42
e o melhor modelo para acidentes do tipo 1
353 Resultados obtidos com o modelo para acidentes do tipo 1
Tabela 333 Estatısticas resumo dos parametros do modelo BN 1 9 42
Efeitos fixosmedia dp 0025q 0975q
α1 -03518 00346 -04202 -02843
b1C 00012 00004 00005 00019
b1OST 00001 000007 -000005 00002
γ1 -00128 00026 -00179 -00077
Parametro de dispersao φminus11 00287 00021 00248 00328
Variancia dos efeitos aleatorios
σ2s1 03982 00445 03180 04909
σ2δ1
00026 00007 00015 00040
Figura 354 Riscos relativos esperados a posteriori de acidentes tipo 1 em 2000 2003 e2007 obtidos com o modelo BN 1 9 42
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 91
As covariaveis comprimento de estrada e ocupacao do solo com equipamento turıstico
influenciam significativamente a variacao geografica dos riscos relativos e portanto sao
consideradas na estimacao do modelo Neste caso as duas covariaveis contribuem de
forma positiva para a variacao dos riscos o que significa que em regioes com maior
comprimento de estrada e regioes com maior ocupacao de solo para turismo ha uma
contribuicao para o aumento das estimativas do risco mantendo fixos todos os restantes
efeitos
Na analise de trafego global efetuada na seccao anterior o modelo BN 1 6 172 foi consi-
derado o melhor modelo para acidentes do tipo 2 Logo os modelos tem uma estrutura
temporal diferente mas o comprimento de estrada e a ocupacao industrial do solo estao
envolvidas na estimacao de ambos Comparativamente observa-se que o padrao espacial
se mantem mas que ha uma alteracao na ordenacao dos concelhos com estimativas de
risco relativo Figuras 354 e 316
Figura 355 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 1 de2000 a 2007 obtidos com o modelo BN 1 9 42
Obsevando a Figura 355 e possıvel identificar alguns concelhos com estimativas do risco
relativo maior que um obtidas com o modelo BN 1 9 42 Na Tabela A11 do Anexo A
encontra-se uma lista ordenada dos quinze concelhos com risco relativo significativamente
maior que um
92 Capıtulo 3 Aplicacoes
354 Modelo para acidentes do tipo 2
Modelo Binomial Negativo 2 9 246
log(θ2ij) = α2 + b2CC2i + b2OSIOSIi + b2OSUOSUi + b2OSEPUOSEPUi + b2DPDPit +
s2i + (γ2 + δ2i)t2
Neste modelo os intervalos de credibilidade HPD para os coeficientes de regressao de
todas as covariaveis contem o zero No entanto como pC = 0673 pOSI = 0938
pOSU = 0375 pOSEPU = 0835 e pDP = 0887 decidiu-se retirar as covariaveis C e OSU e
manter as restantes no modelo obtendo-se o modelo BN 2 9 86 ou seja
log(θ2ij) = α2 + b2OSIOSIi + b2OSEPUOSEPUi + b2DPDPit + s2i + (γ2 + δ2i)t2
Tabela 334 DIC pD e mls
Modelo DIC pD mls
BN 2 9 86 924868 24786 208
355 Validacao do modelo para acidentes do tipo 2
Validacao do modelo BN 2 9 86
Figura 356 Histograma dos valores PIT ajustados para o modelo BN 2 9 86
O valor DIC para o modelo BN 2 9 86 e consideravelmente menor do que para o modelo
Poisson selecionado sendo a diferenca entre os valores igual a 5687 O valor da media
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 93
do logscore tambem e menor O histograma dos valores PIT ajustados tem um aspeto
proximo da distribuicao Uniforme Figura 356 e o valor da concordancia preditiva e
95 De acordo com estas indicacoes considera-se que o modelo BN 2 9 86 e o melhor
modelo para acidentes do tipo 2
356 Resultados obtidos com o modelo para acidentes do tipo 2
Tabela 335 Estatısticas resumo dos parametros do modelo BN 2 9 86
Efeitos fixosmedia dp 0025q 0975q
α2 -01198 00480 -02147 -00266
b1OSI 00002 000008 000007 00004
b1OSEPU 00003 00002 000001 00006
b1DP 00084 00066 -00046 00215
γ1 -01198 00480 -02147 -00266
Parametro de dispersao
φminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 10557 01336 08161 13345
σ2δ1
00094 00023 00057 00147
A ocupacao industrial do solo a ocupacao do solo com equipamentos e parques urba-
nos e a densidade populacional influenciam significativamente a variacao geografica dos
riscos relativos logo sao consideradas na estimacao do modelo Neste caso as tres co-
variaveis contribuem de forma positiva para a variacao dos riscos o que significa que
em regioes com maior ocuacao de solo industrial regioes com maior ocupacao de solo
com equipamentos e parques urbanos e a regioes com maior densidade populacional ha
contribuicao para o aumento das estimativas do risco relativo mantendo fixos todos os
restantes efeitos
Na analise de trafego global efetuada na seccao anterior o melhor modelo para acidentes
do tipo 2 considerado foi o modelo BN 2 9 4 Neste caso tratam-se de modelos com a
mesma componente temporal mas com diferentes covariaveis envolvidas na estimacao
Analisando as Figuras 357 e 332 observa-se que o padrao espacial e semelhante que
os valores das estimativas sao proximas mas que ha uma alteracao na ordenacao dos
94 Capıtulo 3 Aplicacoes
concelhos com maiores estimativas de risco relativo E curioso observar que ha alguns
conjuntos de concelhos que se mantem Em geral os concelhos com menores estimativas
do risco relativo sao os mesmos
Figura 357 Riscos relativos esperados a posteriori de acidentes tipo 2 em 2000 2003 e2007 obtidos com o modelo BN 2 9 86
Figura 358 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 2 de2000 a 2007 obtidos com o modelo BN 2 9 86
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 95
A identificacao de alguns concelhos com estimativas de maior risco relativo obtidas com
o modelo BN 2 9 86 pode ser feita atraves da Figura 358 e completada com a lista que
consta na Tabela A11
357 Modelos para acidentes do tipo 3
Modelo Poisson 3 6 30
log(θ3ij) = α3 + b3AAit + b3OSEPUOSEPUi + s3iψt
Embora o intervalo de credibilidade para o parametro correspondente a covariavel OSEPU
contenha o zero como pOSEPU = 0848 decidiu-se manter a covariavel no modelo
358 Validacao do modelo para acidentes do tipo 3
Validacao do modelo P 3 6 30
Figura 359 Histograma dos valores PIT ajustados para o modelo P 3 6 30
Apesar do histograma dos valores PIT ajustados ter um aspeto que nao se aproxima da
distribuicao Uniforme Figura 359 o valor DIC para o modelo P 3 6 30 e consideravel-
mente menor do que para o modelo BN selecionado sendo a diferenca entre os valores
igual a 3711 O valor da media do logscore e igual e o valor da concordancia preditiva
e 93 Todas estas indicacoes sugerem que o modelo P 3 6 30 e o melhor modelo para
acidentes do tipo 3
96 Capıtulo 3 Aplicacoes
359 Resultados obtidos com o modelo para acidentes do tipo 3
Tabela 336 Estatısticas resumo dos parametros do modelo P 3 6 30
Efeitos fixosmedia dp 0025q 0975q
α2 00104 00520 -00923 01117
b3A 00258 00116 00031 00049
b3OSEPU -00001 00001 -00004 000006
Parametro de dispersao
ψminus11 00687 00075 00550 00842
Variancia dos efeitos aleatorios
σ2s1 03598 00687 02422 05084
σ2ψ1
00246 00163 0007 00666
Figura 360 Riscos relativos esperados a posteriori de acidentes tipo 3 em 2000 2003 e2007 obtidos com o modelo P 3 6 30
A area geografica e a ocupacao do solo com equipamentos e parques urbanos influenciam
significativamente a variacao geografica dos riscos relativos sendo consideradas na es-
timacao dos modelos Neste caso as tres covariaveis contribuem de forma positiva para
35 Aplicacao para acidentes rodoviarios nas estradas secundarias 97
a variacao dos riscos o que significa que a regioes com maior ocupacao de solo industrial
em regioes com maior ocupacao de solo com equipamentos e parques urbanos e a regioes
com maior area geografica ha uma contribuicao para o aumento das estimativas do risco
relativo mantendo fixos todos os restantes efeitos
O modelo P 3 6 1 foi considerado o melhor modelo para acidentes do tipo 3 na analise de
trafego global efetuada na seccao anterior Tratam-se de dois modelos com a mesma es-
trutura temporal mas o primeiro nao tem covariaveis O padrao espacial e muito identico
mas a ordenacao dos concelhos com estimativas de maior risco relativo e diferente No
entanto em geral os concelhos com menores estimativas de risco relativo sao os mesmos
Figura 361 Box plot dos riscos relativos esperados a posteriori de acidentes tipo 3 de2000 a 2007 obtidos com o modelo P 3 6 30
E possıvel identificar os concelhos com estimativas de maior risco relativo obtidas pelo
modelo P 3 6 30 atraves da Figura 355 e da lista dos primeiros quinze concelhos que
consta na Tabela A11
Na Tabela 337 faz-se um resumo comparativo entre as abordagens usadas designada-
mente a abordagem global e a abordagem local
98 Capıtulo 3 Aplicacoes
Tabela 337 Comparacao entre a abordagem local e a global
Abordagem Tipo Melhor Covariaveis Efeito Interacao
Modelo temporal espaco-temporal
Local 1 BN 1 9 42 C+OST fixo CAR
Global 1 BN 1 9 172 C+P+OSEPU+OST aleatorio mdash
Local 2 BN 2 9 86 OSI+OSEPU+DP fixo CAR
Gloal 2 BN 2 9 4 C fixo CAR
Local 3 P 3 6 30 A+OSEUP aleatorio mdash
Global 3 P 3 6 1 mdash aleatorio mdash
4Discussao e conclusoes
Atraves da utilizacao de modelos bayesianos hierarquicos foi possıvel analisar a existencia
de dependencia espacial de tendencia temporal e de associacao regional em dados de
acidentes rodoviarios
Internacionalmente os modelos espaco-temporais tem sido largamente usados para mo-
delar acidentes rodoviarios numa situacao em que a regiao de estudo e composta por
areas geograficas muito diferentes Tal tem-se verificado quando se pretende efetuar
diagnosticos de seguranca rodoviaria para identificacao de fatores de risco com variacao
espacial Neste trabalho face as caracterısticas do conjunto de dados que foi possıvel
recolher foram usadas duas abordagens procurando diferenciar os aspetos relacionados
com o trafego local daqueles relacionados com a totalidade do trafego Na abordagem de
trafego global atraves da estimacao dos riscos relativos verificou-se o seguinte
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de sobredispersao de associacao posi-
tiva com o comprimento de estrada com a area de ocupacao do solo com equipa-
mentos e parques urbanos e uma associacao regional negativa com a populacao
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
100 Capıtulo 4 Discussao e conclusoes
bredispersao e de associacao regional positiva com o comprimento de estrada
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente
Na abordagem de trafego local atraves da estimacao dos riscos relativos verificou-se que
minus os dados de acidentes rodoviarios do tipo 1 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com o comprimento de estrada e com
a area de ocupacao do solo para turismo
minus os dados de acidentes rodoviarios do tipo 2 revelaram a existencia de dependencia
espacial de tendencia temporal decrescente de interacao espaco-temporal de so-
bredispersao de associacao regional positiva com a area de ocupacao de solo para
a industria com a area de ocupacao do solo com equipamentos e parques urbanos
e com a densidade populacional
minus os dados de acidentes rodoviarios do tipo 3 apenas revelaram a existencia de de-
pendencia espacial e de tendencia temporal decrescente de associacao regional
positiva com a area e de associacao regional negativa com a area de ocupacao de
solo com equipamentos e parques urbanos
Houve semelhancas nos resultados obtidos nas duas abordagens como pode exemplificar-
se atraves da escolha do modelo BN para modelar acidentes do tipo 1 e 2 em ambas
Para alem disso no caso dos acidentes do tipo 2 os modelos escolhidos sao modelos com
interacao espaco-temporal e as covariaveis comprimento de estrada e a area de ocupacao
do solo com turismo fazem parte do modelo Para acidentes do tipo 3 foi sempre escolhido
o modelo Poisson com efeito temporal aleatorio
Nesta tese confirmaram-se as orientacoes indicadas em outros estudos relativamente aos
modelos bayesianos hierarquicos ou seja estes modelos mostraram-se capazes de cap-
tar a variabilidade das estimativas em areas pequenas e simultaneamente mostraram-se
capazes de revelar padroes de dependencia espacial tendencias temporais e interacoes
espaco-temporais por permitirem a incorporacao de efeitos aleatorios atraves de in-
formacao a priori Estes modelos facilitaram a suavizacao espacial dos dados ainda que
as regioes sob estudo possuam areas de tamanhos pequenos de medida de exposicao isto
e areas que apresentam pouca ocorrencia observada de acidentes rodoviarios Em todas
as situacoes estudadas as estimativas sofreram um efeito de contracao do intervalo de
valores obtidos no sentido em que os valores mais baixos aumentaram e os valores mais
elevados diminuiram ou seja os valores extremos foram suavizados
101
Os modelos conseguiram captar a efetiva tendencia temporal decrescente verificada nos
dados usados pois em todos as situacoes em que existe tendencia temporal esta e ne-
gativa Nas situacoes em que foram escolhidos modelos com interacao espaco-tempo foi
possıvel analisar regioes com tendencia temporal local inferior ou superior a tendencia
temporal global Este e um tipo de resultado muito importante na fase de aplicacao
pratica dos modelos na medida em que permite identificar quer as zonas que estao a ter
exito na mitigacao da sinistralidade quer aquelas que estao a ser menos bem sucedidas
Quando houve incorporacao de covariaveis no modelo verificou-se que houve uma di-
minuicao da estimativa da variancia dos efeitos espaciais Isto pode significar que as
covariaveis explicam de alguma forma efeitos aleatorios nao observados que estariam
incluıdos nos modelos atraves dos efeitos espaciais No entanto esta incorporacao nao in-
fluenciou as variancias dos efeitos temporais e dos efeitos de interaccao espaco-temporal
Pensa-se que isso se deva ao facto de essas covariaveis serem estaticas isto e os valores
usados na analise nao variarem ao longo do tempo Mais ainda o perıodo temporal
considerado nesta tese permitiu usar a mesma estrutura de dependencia espacial para
todos os anos em estudo
Foi assim possıvel construir mapas que refletem a variacao espacial do riscos relativos
mapas que refletem a contribuicao para essa variacao espacial das regioes vizinhas e ma-
pas que refletem a contribuicao das covariaveis Tambem foi possıvel obter listas com a
ordenacao dos concelhos com risco relativo de ocorrencia de acidente rodoviario signifi-
cativamente maior que um bem como as dos concelhos com valores consideravelmente
menores do que a unidade
Como trabalho futuro pretende-se continuar a explorar a associacao regional na es-
timacao dos riscos relativos Ha muitas questoes ainda por explorar e muitas analises
por efetuar como por exemplo uma abordagem de saude publica em que se usa a po-
pulacao como medida de exposicao ou uma analise por tipo de veıculos ou por tipo de
estrada A disponibilidade progressiva de dados ao nıvel desejado permite esta conti-
nuidade Pretende-se ainda recolher covariaveis mais influentes como por exemplo o
TDMA de modo a introduzi-las no modelo
Os modelos multivariados constituiram um esforco computacional elevado nao tendo
havido um ganho substancial na sua utilizacao pelo que nao se avancou para mais analises
comparativas Apenas se exploraram modelos Poisson sem covariaveis Ainda assim foi
possıvel averiguar a correlacao entre as estimativas dos riscos relativos dos diferentes
tipos de acidentes
Por outro lado o metodo INLA ou mais propriamente a sua implementacao no R atraves
do R-INLA tornou muito mais facil a aplicacao dos modelos univariados constituindo
uma alternativa muito competitiva relativamente ao WinBUGS O presente estudo foi ini-
ciado com a utilizacao do WinBUGS no entanto este foi preterido em relacao ao INLA
102 Capıtulo 4 Discussao e conclusoes
pela extrema concordancia de resultados pela facilidade de implementacao dos modelos
pela facilidade de correspondencia entre outros programas e acima de tudo pela rapidez
de desempenho A implementacao dos modelos bayesianos hierarquicos tornou-se sem
duvida muito mais acessıvel
Tambem como trabalho futuro pretende-se aplicar os modelos lineares dinamicos a aci-
dentes rodoviarios No entanto para aplicar estes modelos ha necessidade de dispor de
um perıodo temporal maior e esses dados terao de ser adequadamente coligidos e com-
patibilizados ja que e elevada a possibilidade de ter havido alteracoes nos metodos de
recolha e definicao das variaveis de interesse A implementacao estes modelos tambem
pode ser efetuada atraves do R-INLA
Espera-se que esta tese contribua para o desenvolvimento de modelos que possam servir
como referencia na adocao de acoes corretivas destinadas a diminuir o numero de aci-
dentes rodoviarios Designadamente passa-se a dispor de uma ferramenta que permite
efectuar diagnosticos comparativos entre municıpios que complementarao com vanta-
gem os atuais diagnosticos especıficos Com a melhoria da qualidade e da quantidade
dos dados usados pode ser possıvel alcancar a tao desejada comparabilidade entre areas
geograficas diferentes quer dentro de paıses quer entre paıses Os acidentes rodoviarios
constituem um tema de estudo importante atual e continuado e a sua dimensao a nıvel
mundial torna-o num desafio constante Afinal rdquoa seguranca rodoviaria e uma respon-
sabilidade de todosrdquo
ACaracterizacao da regiao de estudo
A1 Portugal Continental
Portugal Continental tem uma area de 89 0843 km2 e encontra-se divido em regioes
administrativas 4060 freguesias agrupadas em 278 concelhos por sua vez agrupados
em 18 distritos
O mapa de Portugal Continental em formato shapefile usado neste trabalho foi obtido a
partir da CAOP2009 - Carta Administrativa Oficial de Portugal de 2009 disponıvel na
pagina do Instituto Geografico Portugues - httpwwwigeopt
A shapefile foi tratada no ArcGIS - ESRI ArcGIS 93 - de forma a ser possıvel usar o
map2WinGUS - httpmaps2winbugssourceforgenet - para gerar a matriz de vizin-
hancas no WinBUGS
104 Apendice A Caracterizacao da regiao de estudo
Figura A1 ID dos concelhos do Norte de Portugal Continental
A1 Portugal Continental 105
Figura A2 ID dos concelhos do Sul de Portugal Continental
106 Apendice A Caracterizacao da regiao de estudo
A1 Portugal Continental 107
108 Apendice A Caracterizacao da regiao de estudo
A2 Numero de acidentes
Tabela A1 Estatısticas resumo de acidentes tipo 1
Ano Min 1oQ Mediana Media 3oQ Max2000 000 2125 5500 13400 14180 2698002001 000 2125 5850 13200 15020 2269002002 000 2400 6150 13400 15250 2414002003 200 2700 6300 13170 14600 2288002004 100 2400 5650 12430 14650 2286002005 100 2225 5600 11890 14280 2205002006 000 2200 5050 11560 14100 2247002007 000 2200 5500 11540 14580 220200
Tabela A2 Estatısticas resumo de acidentes tipo 2
Ano Min 1oQ Mediana Media 3oQ Max2000 000 225 800 1960 2300 704002001 000 200 700 1618 2100 418002002 000 200 600 1310 1775 351002003 000 300 700 1321 1600 350002004 000 300 600 1197 1600 308002005 000 200 500 1089 1500 304002006 000 200 500 995 1300 236002007 000 200 500 885 1200 13800
Tabela A3 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 522 700 57002001 000 100 300 473 600 45002002 000 100 300 476 700 42002003 000 100 300 440 600 43002004 000 100 200 372 500 27002005 000 100 200 358 500 34002006 000 100 200 283 400 20002007 000 025 200 275 400 2100
A2 Numero de acidentes 109
Numero de acidentes que ocorreram nas estradas secundarias
Tabela A4 Estatısticas resumo de acidentes tipo 1
Min 1oQ Mediana Media 3oQ Max2000 000 800 2550 8368 7950 2627002001 000 900 2550 8187 8100 2219002002 000 925 3000 8199 8875 2344002003 000 1000 2950 8059 8600 2220002004 000 1000 2650 7853 8600 2221002005 000 900 2750 7517 8125 2154002006 000 1100 2650 7441 8400 2197002007 000 1000 2800 7592 8450 212900
Tabela A5 Estatısticas resumo de acidentes tipo 2
Min 1oQ Mediana Media 3oQ Max2000 000 100 300 1173 1000 695002001 000 100 200 921 1000 411002002 000 100 200 764 900 344002003 000 100 300 760 800 346002004 000 100 300 707 800 306002005 000 100 200 646 700 302002006 000 100 200 592 700 233002007 000 100 200 519 600 13800
Tabela A6 Estatısticas resumo de acidentes tipo 3
Min 1oQ Mediana Media 3oQ Max2000 000 000 100 202 200 55002001 000 000 100 187 200 42002002 000 000 100 176 300 40002003 000 000 100 165 200 42002004 000 000 100 150 200 27002005 000 000 100 146 200 32002006 000 000 100 117 200 19002007 000 000 050 105 175 1700
110 Apendice A Caracterizacao da regiao de estudo
A3 Covariaveis
bull Populacao - P
Tabela A7 Estatısticas resumo da covariavel populacao
Ano Min 1st Qu Median Mean 3rd Qu Max2000 1884 8258 16100 35180 37030 5684002001 1880 8214 16080 35440 37620 5590002002 1863 8114 16280 35710 38130 5498002003 1841 8068 16230 35940 38660 5400002004 1825 7965 16310 36130 39230 5295002005 1806 7874 16230 36270 39760 5198002006 1767 7790 16240 36370 40270 5098002007 1730 7748 16430 36430 40350 499700
Figura A3 Numeros de habitantes em milhares por concelho e por ano (Fonte INE)
A3 Covariaveis 111
bull Area - A
Figura A4 Area em centenas de km2 por concelho (Fonte INE)
bull Densidade Populacional - DP
Figura A5 Densidade populacional em centenas de habitantes por km2 porconcelho(Fonte INE)
112 Apendice A Caracterizacao da regiao de estudo
bull Comprimento de Estrada - C
Figura A6 Quilometros de estrada por concelho (Fonte EP)
bull Quantidade de combustıvel vendido - VC
Figura A7 Quantidade de combustıvel vendido em milhares de toneladas por concelhoe por ano (Fonte DGEG)
A3 Covariaveis 113
bull Ocupacao urbana do solo - OSU
Figura A8 Superfıcie de ocupacao urbana do solo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
bull Ocupacao industrial do solo - OSI
Figura A9 Superfıcie de ocupacao industrial do solo identificado nos PMOT em cente-nas de km2 por concelho (Fonte INE)
114 Apendice A Caracterizacao da regiao de estudo
bull Ocupacao do solo com equipamentos e parques urbanos - OSEPU
Figura A10 Superfıcie de ocupacao do solo para equipamentos e parques urbanos iden-tificado nos PMOT em centenas de km2 por concelho (Fonte INE)
bull Ocupacao do solo com equipamento turıstico - OST
Figura A11 Superfıcie de uso do solo para turismo identificado nos PMOT em centenasde km2 por concelho (Fonte INE)
A4 15 concelhos 115A
415
con
celh
os
Tab
ela
A8
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o1
Mold
elo
P1
816
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alb
ergaria
-a-V
elh
a3
Castro
Marim
Alc
acer
do
Sal
Grandola
Castro
Marim
Castro
Marim
Castro
Marim
Alb
ergaria
-a-V
elh
aV
ouzela
4A
lcacer
do
Sal
Castro
Marim
Castro
Marim
Grandola
Grandola
Alb
ergaria
-a-V
elh
aC
astro
Marim
Alc
acer
do
Sal
5V
izela
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
Vila
Velh
ade
Rodao
Pedrogao
Grande
6C
ondeix
a-a
-Nova
Azam
buja
Azam
buja
Azam
buja
Obid
os
Penela
Penela
Vila
Velh
ade
Rodao
7A
zam
buja
Viz
ela
Alj
ezur
Obid
os
Penela
Obid
os
Alj
ezur
Penela
8Silves
Alj
ezur
Obid
os
Condeix
a-a
-Nova
Azam
buja
Grandola
Obid
os
Alj
ezur
9A
lbufe
ira
Silves
Pom
bal
Pom
bal
Pom
bal
Vila
Velh
ade
Rodao
Pedrogao
Grande
Obid
os
10
Alj
ezur
Obid
os
Palm
ela
Penela
Alb
ergaria
-a-V
elh
aP
om
bal
Vouzela
Castro
Marim
11
Palm
ela
Pom
bal
Benavente
Palm
ela
Condeix
a-a
-Nova
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oE
sposende
12
Benavente
Benavente
Silves
Benavente
Vila
Velh
ade
Rodao
Azam
buja
Pom
bal
Montem
or-o
-Velh
o13
Pom
bal
Palm
ela
Penela
Vagos
Benavente
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
Tabua
14
Obid
os
Alb
ufe
ira
Olh
ao
Silves
Palm
ela
Condeix
a-a
-Nova
Esposende
Oliveir
ado
Bair
ro
15
Marin
ha
Grande
Olh
ao
Vagos
Olh
ao
Montem
or-o
-Velh
oP
edrogao
Grande
Tabua
Cham
usca
Mold
elo
BN
16
172
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
3C
astro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
4G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
5O
bid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
Obid
os
6C
ondeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Alj
ezur
Alj
ezur
Alj
ezur
7A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Condeix
a-a
-Nova
Condeix
a-a
-Nova
Condeix
a-a
-Nova
8P
om
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
Pom
bal
9B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
10
Penela
Penela
Penela
Penela
Penela
Penela
Penela
Penela
11
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
12
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
Vagos
13
Palm
ela
Alb
ergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
aA
lbergaria
-a-V
elh
a14
Alb
ergaria
-a-V
elh
aP
alm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
Palm
ela
15
Montem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
oM
ontem
or-o
-Velh
o
116 Apendice A Caracterizacao da regiao de estudo
Tab
ela
A9
15
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o2
Modelo
P2
916
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ouriq
ue
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Alj
ustrel
4A
lcacer
do
Sal
Alc
acer
do
Sal
Avis
Nis
aO
urem
Nis
aA
ljustrel
Avis
5A
vis
Avis
Alc
acer
do
Sal
Rio
Maio
rN
isa
Alj
ustrel
Nis
aM
ourao
6C
ham
usca
Nis
aN
isa
Alj
ezur
Alc
acer
do
Sal
Mourao
Mourao
Nis
a7
Santarem
Cham
usca
Alj
ezur
Alc
acer
do
Sal
Alj
ustrel
Pedrogao
Grande
Pedrogao
Grande
Pedrogao
Grande
8V
ila
Nova
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rA
lcacer
do
Sal
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
da
Barquin
ha
da
Barquin
ha
9N
isa
Santarem
Vila
Nova
Pedrogao
Grande
Mourao
Ourem
Alc
acer
do
Sal
Proenca-a
-Nova
da
Barquin
ha
10
Alm
eir
imV
endas
Novas
Pedrogao
Grande
Mourao
Pedrogao
Grande
Ferreir
ado
Ale
ntejo
Proenca-a
-Nova
Alc
acer
do
Sal
11
Gole
ga
Montem
or-o
-Novo
Alj
ustrel
Vila
Nova
Ferreir
ado
Ale
ntejo
Rio
Maio
rG
randola
Idanha-a
-Nova
da
Barquin
ha
12
Vendas
Novas
Alj
ezur
Santarem
Cham
usca
Montem
or-o
-Novo
Montem
or-o
-Novo
Rio
Maio
rG
randola
13
Gavia
oG
avia
oM
ontem
or-o
-Novo
Montem
or-o
-Novo
Vila
Nova
Grandola
Ourem
Alm
odovar
da
Barquin
ha
14
Palm
ela
Gole
ga
Mourao
Ferreir
ado
Ale
ntejo
Grandola
Proenca-a
-Nova
Montem
or-o
-Novo
Montem
or-o
-Novo
15
Montem
or-o
-Novo
Alm
eir
imV
endas
Novas
Grandola
Cham
usca
Vila
Nova
Vila
Velh
ade
Rodao
Celo
ric
oda
Beir
ada
Barquin
ha
Modelo
BN
29
4
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2O
uriq
ue
Ourem
Ourem
Ourem
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
3R
ioM
aio
rR
ioM
aio
rA
vis
Avis
Avis
Avis
Avis
Alj
ustrel
4A
vis
Avis
Rio
Maio
rA
ljezur
Ourem
Nis
aA
ljustrel
Avis
5A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Nis
aN
isa
Alj
ustrel
Nis
aN
isa
6C
ham
usca
Nis
aN
isa
Alc
acer
do
Sal
Alc
acer
do
Sal
Ourem
Mourao
Mourao
7V
ila
Nova
Cham
usca
Alj
ezur
Rio
Maio
rA
ljustrel
Alc
acer
do
Sal
Alc
acer
do
Sal
Pedrogao
Grande
da
Barquin
ha
8Santarem
Vila
Nova
Cham
usca
Alj
ustrel
Rio
Maio
rM
ourao
Pedrogao
Grande
Alc
acer
do
Sal
9N
isa
Santarem
Vila
Nova
Mourao
Mourao
Pedrogao
Grande
Ferreir
aFerreir
ada
Barquin
ha
do
Ale
ntejo
do
Ale
ntejo
10
Montem
or-o
-Novo
Alj
ezur
Alj
ustrel
Vila
Nova
Pedrogao
Grande
Rio
Maio
rO
urem
Proenca-a
-Nova
da
Barquin
ha
11
Vendas
Novas
Montem
or-o
-Novo
Santarem
Cham
usca
Ferreir
ado
Ale
ntejo
Ferreir
ado
Ale
ntejo
Rio
Maio
rC
elo
ric
oda
Beir
a12
Gole
ga
Alj
ustrel
Montem
or-o
-Novo
Pedrogao
Grande
Montem
or-o
-Novo
Montem
or-o
-Novo
Proenca-a
-Nova
Ourem
13
Salv
aterra
de
Magos
Vendas
Novas
Mourao
Montem
or-o
-Novo
Vila
Nova
Grandola
Montem
or-o
-Novo
Grandola
da
Barquin
ha
14
Alm
eir
imM
ourao
Pedrogao
Grande
Ferreir
aC
ham
usca
Vila
Nova
Grandola
Idanha-a
-Nova
do
Ale
ntejo
da
Barquin
ha
15
Alj
ezur
Salv
aterra
de
Magos
Ferreir
ado
Ale
ntejo
Grandola
Grandola
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aM
ontem
or-o
-Novo
A4 15 concelhos 117
Tab
ela
A1
015
con
celh
osco
mes
tim
ati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
para
aci
den
tes
tip
o3
Modelo
P3
61
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
Ferreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9C
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a10
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
11
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
12
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
13
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Modelo
BN
36
6
2000
2001
2002
2003
2004
2005
2006
2007
1O
uriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
Ouriq
ue
2G
randola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
3A
lcacer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
Alc
acer
do
Sal
4Ferreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
aFerreir
ado
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
do
Ale
ntejo
5V
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
aV
ila
Velh
ade
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
de
Rodao
6B
enavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
Benavente
7M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
8A
ljezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
Alj
ezur
9A
zam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
Azam
buja
10
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
11
Celo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
aC
elo
ric
oda
Beir
a12
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
13
Silves
Silves
Silves
Silves
Silves
Silves
Silves
Silves
14
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
Idanha-a
-Nova
15
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
Nis
aN
isa
118 Apendice A Caracterizacao da regiao de estudoT
abel
aA
11
15co
nce
lhos
com
esti
mati
vas
de
risc
ore
lati
vosi
gnifi
cati
vam
ente
maio
res
qu
e1
Acid
entes
tip
o1
-M
odelo
BN
19
42
2000
2001
2002
2003
2004
2005
2006
2007
1M
arin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Marin
ha
Grande
Ilhavo
Ilhavo
Ilhavo
Ilhavo
2Il
havo
Ilhavo
Ilhavo
Ilhavo
Marin
ha
Grande
Marin
ha
Grande
Vagos
Vagos
3A
lbufe
ira
Alb
ufe
ira
Vagos
Vagos
Vagos
Vagos
Marin
ha
Grande
Ferreir
ado
Zezere
4P
ortim
ao
Portim
ao
Alb
ufe
ira
Portim
ao
Portim
ao
Ferreir
ado
Zezere
Ferreir
ado
Zezere
Marin
ha
Grande
5V
agos
Vagos
Portim
ao
Porto
Porto
Portim
ao
Oliveir
ado
Bair
ro
Oliveir
ado
Bair
ro
6P
orto
Porto
Porto
Alb
ufe
ira
Ferreir
ado
Zezere
Porto
Porto
Montem
or-o
-Velh
o7
Faro
Penic
he
Penic
he
Penic
he
Penic
he
Penic
he
Portim
ao
Alp
iarca
8L
oule
Faro
Faro
Faro
Alb
ufe
ira
Oliveir
ado
Bair
ro
Montem
or-o
-Velh
oP
orto
9P
enic
he
Loule
Viz
ela
Ferreir
ado
Zezere
Coim
bra
Montem
or-o
-Velh
oP
enic
he
Penic
he
10
Odiv
ela
sO
div
ela
sC
oim
bra
Coim
bra
Faro
Coim
bra
Coim
bra
Coim
bra
11
Viz
ela
Viz
ela
Odiv
ela
sV
izela
Montem
or-o
-Velh
oA
lbufe
ira
Alp
iarca
Portim
ao
12
Olh
ao
Coim
bra
Loule
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Faro
Pom
bal
Pom
bal
13
Nazare
Olh
ao
Ferreir
ado
Zezere
Odiv
ela
sV
izela
Aveir
oA
veir
oA
veir
o14
Coim
bra
Setubal
Montem
or-o
-Velh
oO
liveir
ado
Bair
ro
Aveir
oP
om
bal
Faro
Vis
eu
15
Setubal
Cantanhede
Setubal
Aveir
oP
om
bal
Viz
ela
Murtosa
Lis
boa
Acid
entes
tip
o2
-M
odelo
BN
29
86
2000
2001
2002
2003
2004
2005
2006
2007
1O
urem
Ourem
Ourem
Ourem
Ourem
Ourem
Ourem
S
J
Madeir
a2
Rio
Maio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rR
ioM
aio
rFerreir
aZ
O
dem
ira
Odem
ira
3A
lmeir
imFerreir
aZ
Ferreir
aZ
Ferreir
aZ
Ferreir
aZ
R
ioM
aio
rFerreir
aZ
Ferreir
aZ
4
Ferreir
ado
Zezere
Alm
eir
imB
raganca
Braganca
Braganca
Odem
ira
S
J
Madeir
aV
izela
5Santarem
Braganca
Avis
Odem
ira
Odem
ira
Mourao
Braganca
Braganca
6L
isboa
Lis
boa
Odem
ira
Mourao
Mourao
Braganca
Rio
Maio
rO
urem
7C
ham
usca
Santarem
Lis
boa
Avis
Avis
S
J
Madeir
aA
lmodovar
Alm
odovar
8B
raganca
Cham
usca
Mourao
Lis
boa
Vim
ioso
Avis
Viz
ela
Tondela
9P
alm
ela
Avis
Santarem
Cham
usca
Ala
ndroal
Vim
ioso
Tondela
Chaves
10
Salv
aterra
de
Magos
Palm
ela
Cham
usca
Palm
ela
S
J
Madeir
aA
lmodovar
Chaves
Rio
Maio
r11
Avis
Salv
aterra
de
Magos
Alm
eir
imSantarem
Alm
odovar
Chaves
Elv
as
Guim
araes
12
Ilhavo
Odem
ira
Palm
ela
Ala
ndroal
Elv
as
Ala
ndroal
Serta
13
Vila
Nova
da
Barquin
ha
Mourao
Salv
aterra
de
Magos
Elv
as
Palm
ela
Tondela
Palm
ela
14
Nazare
Vila
Nova
da
Barquin
ha
Ala
ndroal
Alm
eir
imC
ham
usca
Elv
as
Portim
ao
15
Abrantes
Ala
ndroal
Lagos
Salv
aterra
de
Magos
Lis
boa
Palm
ela
Loule
Acid
entes
tip
o3
-M
odelo
P3
630
2000
2001
2002
2003
2004
2005
2006
2007
1O
dem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
Odem
ira
2M
ertola
Mertola
Mertola
Mertola
Mertola
Mertola
Mertola
3V
imio
so
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Vim
ioso
Cantanhede
4F
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
oF
C
astelo
Rodrig
o5
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
Castro
Marim
6M
iranda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
Mir
anda
do
Douro
7A
lmodovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
Alm
odovar
8Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
Sabugal
9A
lcoutim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
Alc
outim
10
Grandola
Grandola
Grandola
Grandola
Grandola
Grandola
11
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
Santia
go
do
Cacem
12
Alc
ochete
Alc
ochete
Alc
ochete
Macedo
de
Cavale
iros
Alc
ochete
Alc
ochete
13
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
Vagos
Macedo
de
Cavale
iros
Macedo
de
Cavale
iros
14
Vagos
Vagos
Vagos
Cantanhede
Vagos
Vagos
15
Cantanhede
Cantanhede
Cantanhede
Alc
ochete
Cantanhede
Cantanhede
Referencias Bibliograficas
Aguero-Valverde J e Jovanis P P (2006) Spatial analysis of fatal and injury crashes
in Pennsylvania Accident Analysis amp Prevention 38(3) 618 ndash 625
ANRS (2009) Estrategia Nacional para a Seguranca Rodoviaria httpwwwansrpt
Defaultaspxtabid=220amplanguage=pt-PT
ANSR (2010) Relatorio Nacional 2010 httpwwwansrptLinkClickaspx
fileticket=NjkEYZKyDto3damptabid=315ampmid=989amplanguage=pt-PT
Assuncao R M e Reis E A (1999) A new proposal to adjust Moranrsquos I for population
density Statistics in Medicine 18(16) 2147ndash2162
Bailey T C e Hewson P J (2004) Simultaneous modelling of multiple traffic safety
performance indicators by using a multivariate generalized linear mixed model Journal
of the Royal Statistical Society Series A (Statistics in Society) 167(3) 501ndash517
Banerjee S Carlin B P e Gelfand A E (2004) Hierarquical Modeling and Analysis
for Spatial Data Chapman amp Hall
Bernardinelli L Clayton D e Montomoli C (1995a) Bayesian estimates of disease
maps How important are priors Statistics in Medicine 14(21-22) 2411ndash2431
Bernardinelli L Clayton D Pascutto C Montomoli C Ghislandi M e Songini
M (1995b) Bayesian analysis of space-time variation in disease risk Statist Med
14(21-22) 2433ndash2443
Bernardinelli L e Montomoli C (1992) Empirical Bayes versus Fully Bayesian Analysis
of Geographical Variation in Disease Risk Statistics in Medicine 11 983ndash1007
Besag J (1974) Spatial Interaction and the Statistical Analysis of Lattice Systems
Journal of the Royal Statistical Society Series B (Methodological) 36(2) 192ndash236
Besag J York J e Mollie A (1991) Bayesian image restoration with two applica-
tions in spatial statistics Annals of the Institute of Statistical Mathematics 43 1ndash20
101007BF00116466
120 Referencias bibliograficas
Bivand R S Pebesma E J e Gomez-Rubio V (2008) Applied Spatial Data Analysis
with R Springer
Breslow N E e Clayton D (1993) Approximate Inference in Generalized Linear Mixed
Models Journal of the American Statistical Association 88(421) 9ndash25
Caliendo C Guida M e Parisi A (2007) A crash-prediction model for multilane
roads Accident Analysis amp Prevention 39(4) 657 ndash 670
Cardoso J P L (1996) Estudo das relacoes entre as caracterısticas da estrada a
velocidade e os acidentes rodoviarios Aplicacao a estradas de duas vias e dois sentidos
PhD thesis Universidade Tecnica de Lisboa - Instituto Superior Tecnico
Cardoso J P L (2007) Metodos Racionais de Apoio a Intervencao da Engenharia em
Seguranca Rodoviaria Technical report IST and LNEC
Carlin B P e Banerjee S (2003) Hierarchical Multivariate CAR Models for Spatio-
Temporally Correlated Survival Data In Bayesian Statistics 7
Carlin B P e Louis T A (1998) Bayes and Empirical Bayes Methods for Data
Analysis Chapman amp Hall
Clayton D e Kaldor J (1987) Empirical Bayes Estimates of Age-standardized Relative
Risks for Use in Disease Mapping Biometrics 43 671ndash681
Czado C Gneiting T e Held L (2009) Predictive Model Assessment for Count Data
Biometrics 65 1254ndash1261
Donario A e Santos R (2012) Custo economico e social dos acidentes de viacao
em portugal httpwwwpgrptgrupo_soltasActualidades2012Custo
20economico20e20social20dos20acidentes_versao20para20internet
Eksler V (2008) Exploring Spatial Structure behind the Road Mortality of Regions in
Europe Applied Spatial Analysis 1 133ndash150
Eksler V e Lassarre S (2008) Evolution of road risk disparities at small-scale level
Example of Belgium Journal of Safety Research 39(4) 417 ndash 427
El-Basyouny K e Sayed T (2009) Collision prediction models using multivariate
Poisson-lognormal regression Accident Analysis amp Prevention 41(4) 820 ndash 828
Elvik R (2008) The predictive validity of empirical Bayes estimates of road safety
Accident Analysis amp Prevention 40(6) 1964 ndash 1969
Referencias bibliograficas 121
Elvik R (2011) Assessing causality in multivariate accident models Accident Analysis
and Prevention 43 253ndash264
Gamerman D (1997) Markov Chain Monte Carlo Chapman amp Hall
Gelfand A E (1996) Model determination using sampling-based methods In W
Gilks S Richardson e D Spiegelhalter (Eds) Markov Chain Monte Carlo in Practice
chapter 9 (pp 145ndash161) Chapman amp
Gelfand A E e Vounatsou P (2003) Proper multivariate conditional autoregressive
models for spatial data analysis Biostatistics 4(1) 11ndash15
Gelman A Carlin J B Stern H S e Rubin D B (1995) Bayesian Data Analysis
Chapman amp Hall
Ghosh M Natarajan K Waller L A e Kim D (1999) Hierarchical Bayes GLMs for
the analysis of spatial data An application to disease mapping Journal of Statistical
Planning and Inference 75(2) 305 ndash 318
Gneiting T e Raftery A E (2007) Strictly Proper Scoring Rules Prediction and
Estimation Journal of the American Statistical Association 102(477) 359ndash378
Hauer E (2001) Overdispersion in modelling accidents on road sections and in Empirical
Bayes estimation Accident Analysis amp Prevention 33(6) 799 ndash 808
Held L e Becker N (1999) Bayesian Modelling of Spatial Heterogeneity in Disease Maps
with Application to German Mortality Data httpepububuni-muenchende
Held L Schrodle B e Rue H (2010) Posterior and Cross-validatory Predictive
Checks A Comparison of MCMC and INLA In T Kneib e G Tutz (Eds) Statistical
Modelling and Regression Structures (pp 91ndash110) Physica-Verlag HD
Jin X Carlin B P e Banerjee S (2005) Generalized Hierarchical Multivariate CAR
Models for Areal Data Biometrics 61(4) 950ndash961
Knorr-Held L (2000) Bayesian modelling of inseparable space-time variation in disease
risk Statistics In Medicine 19(17-18) 2555ndash2567
Knorr-Held L e Besag J (1998) Modelling risk from a disease in time and space
Statistics in Medicine 17(18) 2045ndash2060
Lawson A B (2009) Bayesian Disease Mapping Hierarchical Modeling in Spatial Epi-
demiology CRC Press Taylor amp Francis
122 Referencias bibliograficas
Lawson A B Biggeri A B Boehning D Lesaffre E Viel J-F Clark A Schlatt-
mann P e Divino F (2000) Disease mapping models an empirical evaluation
Statistics in Medicine 19(17-18) 2217ndash2241
Li L Zhu L e Sui D Z (2007) A gis-based bayesian approach for analyzing spatial-
temporal patterns of intra-city motor vehicle craches Journal of Transport Geography
15 274ndash285
Li W Carriquiry A Pawlovich M e Welch T (2008) The choice of statistical
models in road safety countermeasure effectiveness studies in Iowa Accident Analysis
amp Prevention 40(4) 1531 ndash 1542
Lord D Guikema S D e Geedipally S R (2008) Application of the Conway-Maxwell-
Poisson generalized linear model for analyzing motor vehicle crashes Accident Analysis
amp Prevention 40(3) 1123 ndash 1134
Lord D e Miranda-Moreno L F (2008) Effects of low sample mean values and small
sample size on the estimation of the fixed dispersion parameter of Poisson-gamma
models for modeling motor vehicle crashes A Bayesian perspective Safety Science
46(5) 751 ndash 770
Lord D e Park P Y-J (2008) Investigating the effects of the fixed and varying dis-
persion parameters of Poisson-gamma models on empirical Bayes estimates Accident
Analysis amp Prevention 40(4) 1441 ndash 1457
Lord D Washington S P e Ivan J N (2005) Poisson Poisson-gamma and zero-
inflated regression models of motor vehicle crashes balancing statistical fit and theory
Accident Analysis amp Prevention 37(1) 35 ndash 46
Ma J Kockelman K M e Damien P (2008) A multivariate Poisson-lognormal
regression model for prediction of crash counts by severity using Bayesian methods
Accident Analysis amp Prevention 40(3) 964 ndash 975
MacNab Y C (2004) Bayesian spatial and ecological models for small-area accident
and injury analysis Accident Analysis amp Prevention 36(6) 1019 ndash 1028
Martino S e Rue H (2010a) Case studies in bayesian computation using INLA In P
Mantovan e P Secchi (Eds) Complex Data Modeling and Computationally Intensive
Statistical Methods (pp 99ndash114) Springer
Martino S e Rue H (2010b) Implementing approximate Bayesian inference for la-
tent Gaussian models using integrated nested Laplace approximations A manual for
Referencias bibliograficas 123
the inla program Technical report Norwegian University of Science and Technology
Trondheim
McCullagh P e Nelders J (1989) Generalised Linear Models Chapman amp Hall
Miaou S-P e Song J J (2005) Bayesian ranking of sites for engineering safety im-
provements Decision parameter treatability concept statistical criterion and spatial
dependence Accident Analysis amp Prevention 37(4) 699 ndash 720
Miaou S-P Song J J e Mallick B K (2003) Roadway Traffic Crash Mapping A
Space-Time Modeling Approach Journal of Transportion and Statistics 6 33ndash57
Miranda-Moreno L F Labbe A e Fu L (2007) Bayesian multiple testing procedures
for hotspot identification Accident Analysis amp Prevention 39(6) 1192 ndash 1201
Mitra S e Washington S (2007) On the nature of over-dispersion in motor vehicle
crash prediction models Accident Analysis amp Prevention 39(3) 459 ndash 468
Noland R B e Quddus M A (2004) A spatially disaggregate analysis of road casualties
in england Accident Analysis amp Prevention 36(6) 973 ndash 984
OMS (2008) World Health Statistics 2008 httpwwwwhointghopublications
world_health_statistics2008en
OMS (2009) Global status report on road safety httpwhqlibdocwhoint
publications20099789241563840_engpdf
Paulino C D Turkman M A e Murteira B (2003) Estatıstica Bayesiana Fundacao
Calouste Gubenkian
Pettit L I e Young K D S (1990) Measuring the effect of observations on Bayes
factors Biometrika 77(3) 455ndash466
Plummer M (2008) Penalized loss functions for Bayesian model comparison Biosta-
tistics 9(3) 523ndash539
Plummer M Best N Cowles K e Vines K (2006) CODA Convergence diagnosis
and output analysis for MCMC R News 6(1) 7ndash11
Quddus M A (2008) Modelling area-wide count outcomes with spatial correlation and
heterogeneity An analysis of London crash data Accident Analysis amp Prevention
40(4) 1486 ndash 1497
124 Referencias bibliograficas
R Development Core Team (2008) R A Language and Environment for Statistical
Computing R Foundation for Statistical Computing Vienna Austria ISBN 3-900051-
07-0
Rao J (2003) Small Area Estimation Wiley Series in Survey Methodology
Rue H e Held L (2005) Gaussian Markov Random Fields Theory and Applications
Chapman amp HallCRC
Rue H Martino S e Chopin N (2009) Approximate bayesian inference for latent
gaussian models by using integrated nested laplace approximations Journal of the
Royal Statistical Society Series B (Statistical Methodology) 71(2) 319ndash392
Schrodle B e Held L (2011) A primer on disease mapping and ecological regression
using INLA Computational Statistics 26 241ndash258 101007s00180-010-0208-2
Smith B J (2007) boa An R Package for MCMC Output Convergence Assessment
and Posterior Inference Journal of Statistical Software 21(11) 1ndash37
Song J Ghosh M Miaou S e Mallick B (2006) Bayesian multivariate spatial
models for roadway traffic crash mapping Journal of Multivariate Analysis 97(1)
246 ndash 273
Spiegelhalter D J Best N G Carlin B P e van der Linde A (2002) Bayesian
measures of model complexity and fit J R Statist Soc B 64 583ndash639
Tierney L e Kadane J B (1986) Accurate Aproximations for Posterior Moments and
Marginal Densities Journal of the American Statistical Association 81 82ndash86
Tunaru R (2002) Hierarchical Bayesian Models for Multiple Count Data Austrian
Journal of Statistics 31 221ndash229
Wakefield J (2007) Disease mapping and spatial regression with count data Biostat
8(2) 158ndash183
Waller L e Carlin B (2010) Disease Mapping chapter 14 (pp 217ndash243) CRC Press
Taylor amp Francis