13
UNIVERSIDADE FEDERAL DO PARANÁ LETICIA VIEIRA DA ROCHA MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA CURITIBA 2019

MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

UNIVERSIDADE FEDERAL DO PARANÁ

LETICIA VIEIRA DA ROCHA

MORTALIDADE INFANTIL NA BAHIA - 2010:

UMA ANÁLISE DE REGRESSÃO LINEAR MÚLTIPLA

CURITIBA

2019

Page 2: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

1

Resumo

A partir de um recorte do cenário socioeconômico da Bahia no ano 2010 o presente trabalho descreve oprocesso de ajuste de um modelo de regressão linear múltipla tomando como variável resposta a mortalidadeinfantil e como variáveis explicativas o Índice de Desenvolvimento Humano Municipal (IDHM); Índice deGini; percentual de crianças vivendo em situação de extrema pobreza; percentual da população que viveem domicílios com banheiro e água encanada; taxa de prováveis casos de dengue; percentual da populaçãode mulheres no intervalo de faixa etária de 10 a 17 anos que tiveram filhos. Como os resíduos do ajusteinicial não atenderam os pressupostos de homocedasticidade e normalidade, foram realizados os procedimentosde transformação (BoxCox) e seleção (StepWise) de variáveis. O modelo final apresentou normalidade,heterocedasticidade regular e um R-quadrado-ajustado de 0,424. Foram identificados possíveis observações deinfluência e outliers, além de forte correlação entre covariáveis. Verificou-se, então, que a regressão múltiplanão é o modelo que melhor descreve os dados, indicando-se que a obtenção de melhores resultados seja pormeio de um modelo de Poisson ou outro que descreva variáveis de contagem.

Introdução

A Rede Intergerencial de Informações para a Saúde (RIPSA) conceitua “mortalidade infantil” como umindicador que expressa o número de óbitos de menores de um ano de idade por mil nascidos vivos, na populaçãoresidente em determinado espaço geográfico, no ano considerado. Tal indicador é usado para expressar emlinhas gerais as condições de desenvolvimento socioeconômico e infraestrutura ambiental; reflete ainda aqualidade dos recursos disponíveis para atenção à saúde materna e da população infantil. Segundo o últimoCenso realizado em 2010 a Bahia (BA) ocupava o quarto lugar dentre os estados mais populosos do Brasil,com 14.016.906 habitantes, ficando atrás apenas de São Paulo (SP), Minas Gerais (MG) e Rio de Janeiro (RJ).Em contrapartida a Bahia ocupava o 22° lugar no ranking estadual de Índice de Desenvolvimento Humano(IDH) do mesmo ano, enquanto SP, MG e RJ estavam entre os 10 primeiros.

Nesse contexto, esse trabalho propõe uma análise da taxa de mortalidade infantil a partir dos dados doCenso 2010 tendo como espaço geográfico de interesse o estado baiano. É enfoque deste trabalho descreverum modelo de regressão linear múltipla que melhor expresse a relação da taxa de mortalidade infantil dosmunicípios da Bahia com todas ou algumas das seguintes covariáveis: Índice de Desenvolvimento HumanoMunicipal(IDHM); Índice de Gini; percentual de crianças vivendo em situação de extrema pobreza; percentualda população que vive em domicílios com banheiro e água encanada; taxa de prováveis casos de dengue;percentual da população de mulheres no intervalo de faixa etária de 10 a 17 anos que tiveram filhos. Paraavaliar se a covariável fará ou não parte do modelo será também apresentado o método de seleção. A análisefoi realizada com o recurso computacional R version 3.5.1 (2018-07-02).

Material e Métodos:

Com o objetivo de tornar esse trabalho reproduzível, considera-se importante uma breve exposição acercados dados, do material e dos métodos utilizados.

Origem dos Dados:

Os dados foram selecionados por 3 meios de consulta. Para análise de aspectos populacionais dosmunicípios da Bahia foi consultada a plataforma online do IBGE. Para a seleção da variável resposta e outras 5covariáveis de cunho econômico e sanitário foi consultada a base de dados do portal Atlas do DesenvolvimentoHumano do Brasil, que permite consulta de indicadores de demografia, educação, renda, trabalho, habitação evulnerabilidade para os municípios brasileiros. E também foi consultada a base de dados do DataSUS paraseleção da variável relacionada aos prováveis casos de dengue ocorridos na Bahia. Destaca-se que todos osdados estão em conformidade com o Censo 2010.

Método

Tendo em vista que há uma provável multiplicidede de fatores demográficos, educacionais, financeiros,habitacionais e sociais que interagem na conjuntura brasileira (e portanto baiana), assim, também sendo

Page 3: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

2

prováveis fatores relacionados à determinante demográfica “taxa de mortalidade infantil”, considerou-seadequado usar como método a modelagem de uma regressão linear múltipla para explicar a relação de algumasvariáveis de cunho principalmente econômico e sanitário com a mortalidade infantil. Esse método é usadopara estudar a relação de uma variável resposta com variáveis explicativas. A princípio o modelo contémtodas as variáveis conforme descrição a seguir:

Modelo Completo

Y = β0 + β1x1 + β2x2 + β3x3 + β4x4 + β5x5 + β6x6

Onde:

Variável Resposta (variável dependente):

• “mort_inf” (Y) = Taxa de mortalidade infantil dos municípios do estado da Bahia no ano 2010,representa o número de crianças que não sobreviveram ao primeiro ano de vida em cada 1000 criançasnascidas vivas. Nessa variável está incluso a mortalidade neonatal precoce (0 a 6 dias), neonatal tardia(7 a 27 dias) e pós-neonatal (28 a 364 dias).

Variáveis Explicativas (covariáveis):

• “IDHM” (x1): Índice de Desenvolvimento Humano Municipal (IDHM) dos respectivos muni-cípios da Bahia no ano 2010. Esse indice é resultante da média geométrica dos índices das dimensõesRenda, Educação e Longevidade, com pesos iguais.

• “GINI” (x2): Índice de Gini de indivíduos que vivem em domicílios particulares permanentes nosmunicípios baianos no ano 2010. Esse índice mede o grau de desigualdade existente na distribuição deindivíduos segundo a renda domiciliar per capita. Seu valor varia de 0, quando não há desigualdade (arenda domiciliar per capita de todos os indivíduos tem o mesmo valor), a 1, quando a desigualdade émáxima (apenas um indivíduo detém toda a renda).

• “per_inf_extpobre” (x3): Percentual de crianças vivendo em situação de extrema pobrezanos municípios da Bahia no ano 2010.

• “per_agua_bwc” (x4): Percentual da população dos municípios baianos que vive em domi-cílios com banheiro e água encanada no ano 2010. É calculado a partir da razão entre a populaçãoque vive em domicílios particulares permanentes com água encanada em pelo menos um de seus cômodos,com banheiro exclusivo, e a população total residente em domicílios particulares permanentes. A águapode ser proveniente de rede geral, de poço, de nascente ou de reservatório abastecido por água daschuvas ou carro-pipa. Banheiro exclusivo é definido como cômodo que dispõe de chuveiro ou banheira eaparelho sanitário.

• “taxa_dengue” (x5): Taxa de casos prováveis de dengue registrados nos municípios da Bahiano ano de 2010. Representa a quantidade de casos a cada 1000 habitantes.

• “per_maes_1017” (x6): Percentual da população de mulheres de 10 a 17 anos que tiveramfilhos residentes na Bahia no ano 2010.

Mortalidade Infantil na Bahia

A Bahia é o 5º maior estado brasileiro com 5, 65 × 105 km2 e em 2010 segundo o Censo a população era1, 4 × 107 habitantes, densidade demográfica de 24,82 habitantes/km2, cerca de 72,08% dos habitantes moravamem regiões urbanas, enquanto os outros 27,92% em zonas rurais. A Bahia é composta por 417 municípios,dos quais 89,69% tem menos do que 50.000 habitantes o que os denota como “cidades pequenas” segundoclassificação do IBGE. Percebe-se, então, forte concentração populacional em, principalmente, sua capitalSalvador com aproximadamente 19,1% de seus habitantes, seguido por Feira de Santana com aproximadamente4%. A taxa de mortalidade infantil média para o estado em 2010 foi 26, como pode ser visto na figura 1. Astabelas 1 e 2 apresentam os valores das variáveis explicativas associadas aos municípios com menores e commaiores taxas de mortalidade infantil, respectivamente.

Page 4: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

3

15 20 25 30 35 40

Fig. 1: Taxa de Mortalidade Infantil na Bahia 2010

Tab. 1: Variáveis explicativas do município com a menor taxa de mortalidade infantil

Município GINI Água Mães Mort.Inf. IDHM Ext.P Dengue

337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3

Tab. 2: Variáveis explicativas dos municípios com as maiores taxas de mortalidade infantil

Município GINI Água Mães Mort.Inf. IDHM Ext.P Dengue

51 Bonito 0,50 66 7,0 41 0,56 25 21,6259 Mirangaba 0,51 58 2,7 41 0,54 42 0,0368 Saúde 0,55 62 3,4 41 0,55 38 1,7410 Várzea Nova 0,50 62 5,8 41 0,56 35 4,0

Modelo Ajustado Inicial

Anteriormente ao ajuste inicial verificou-se um modelo unitário entre variável resposta e cada uma dasrespectivas covariáveis. Todas, com excessão da taxa de dengue, foram significativas ao nível alfa de 5%.Mesmo assim, quis-se inicialmente ter um modelo com todas as variáveis, pois a taxa de dengue ainda poderiater significância conforme o efeito das demais covariáveis. Foi utilizada a função lm do R, que se baseia noMétodo dos Mínimos Quadrados, o algoritmo estima os valores dos betas tal que a soma dos quadrados dosresíduos do modelo ajustado seja mínima. O resultado preliminar do ajuste inicial é apresentado na tabela 3 efigura 2 a seguir.

Tab. 3: Ajuste inicial - Modelo inicial com todas as variáveis

Estimate Std. Error t value Pr(>|t|)

(Intercept) 82,66 5,00 16,54 0,00mortinf$IDHM -100,70 9,38 -10,73 0,00mortinf$GINI 7,92 5,95 1,33 0,18mortinf$per_inf_extpobre -0,09 0,04 -2,61 0,01mortinf$per_agua_bwc 0,02 0,02 1,08 0,28mortinf$taxa_dengue 0,05 0,03 1,97 0,05mortinf$per_maes_1017 0,03 0,14 0,24 0,81

Page 5: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

4

15 20 25 30 35

−10

05

Fitted values

Res

idua

ls

Residuals vs Fitted130410259

−3 −2 −1 0 1 2 3

−2

01

23

Theoretical Quantiles

Sta

ndar

dize

d re

sidu

als Normal Q−Q

130410259

15 20 25 30 35

0,0

0,5

1,0

1,5

Fitted values

Sta

ndar

dize

d re

sidu

als Scale−Location

130410259

0,00 0,05 0,10 0,15 0,20 0,25

−3

−1

13

Leverage

Sta

ndar

dize

d re

sidu

als

Cook's distance0,5

0,5

Residuals vs Leverage

164251276

Fig. 2: Ajuste 0 - Modelo Inicial com todas as variáveis

No ajuste inicial, ao nível de significância de 5%, as variáveis explicativas: índice de GINI; porcentagem dapopulação que reside em domicílios com banheiro e água encanada; e percentual de mulheres entre 10 e 17anos que já tiveram filhos não apresentaram efeitos parciais relevantes. Já as demais podem ser interpretadasda seguinte maneira, em média a taxa de mortalidade infantil aumenta em uma unidade com a queda de-100,70 unidades do IDHM, mantendo-se o efeito das demais covariáveis fixas. O mesmo raciocínio segue paraum declínio do percentual em menos 0,09% de crianças extremamente probres. Em contrapartida espera-seum aumento médio de uma unidade na taxa de mortalidade infantil quando a taxa de dengue cresce em 0,05mantendo demais covariáveis fixas.

Na figura 2, gráfico superior esquerdo é possível observar ausência de aleatoriedade na disposição dosresíduos, a medida que a média cresce, a variância aumenta, demonstrando heterocedasticidade. No QQ-plot,gráfico superior direito da figura, há fuga evidente dos resíduos padronizados nos extremos da reta. O gráficoinferior esquerdo também apresenta evidência de heterocedasticidade. Enquanto o gráfico inferior direitoapresenta possíveis outliers.

Para comprovar os indícios vistos graficamente na figura 2, testou-se se os resíduos do modelo ajustadoinicial não atendem aos pressupostos de homocedasticidade e normalidade, para tal, realizou-se o Teste daVariância Não Constante e o teste de Shapiro Wilk, respectivamente.

Page 6: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

5

Teste de Homocedasticidade dos Resíduos

Teste de Variância Não Constante

H0: σ20 = σ2

1 = σ22 = σ2

3 =σ24 = σ2

5 = σ26

H1 : σ2i 6= σ2

j para pelo menos um par de covariáveis com i 6= j.

Conforme o teste de Variância Não Constante para um nível de 5 % de significância,

o p-valor de 1e-11 indica que rejeitamos a hipótese nula, ou seja, há diferença

entre as variâncias de resíduos de pelo menos um par de covariáveis.

Teste de Normalidade dos Resíduos

Teste de shapiro Wilk

H0 : ε ∼ Normal(n, σ2)

H1 : erro tem outra distribuição que não a Normal.

Conforme o teste de Shapiro Wilk, ao nível de 5 % de significância, o p-valor de

1,88954500379511e-05 indica que a hipótese nula é rejeitada, ou seja, não há evidências

suficientes para afirmar que os resíduos do ajuste 0 seguem uma distribuição Normal.

Modelo Transformado

Transformação dos dados

Uma primeira alternativa escolhida para tentar contornar o problema de não atendimento aos pressupostosfoi a transformação de dados, para isso utilizou-se o método BoxCox, o qual indica transformação da variávelresposta de Y para Y ∗ = Y λ. O teste que indicou uma transformação da ordem de lambda -0,55, o qual pôdeser arredondado para -0,5 por pertencer ao intervalo de confiança de 95%, apresentado na figura 3, assim atransformação definida foi o inverso da raíz quadrada. Feita a transformação indicada, pôde-se partir paraajuste de um novo modelo, descrito por:

Y ∗ = β∗

0 + β∗

1x1 + β∗

2x2 + β∗

3x3 + β∗

4x4 + β∗

5x5 + β∗

6x6

Os resultados do modelo são apresentados na tabela 4 e figura 3.

Tab. 4: Ajuste 1 - Modelo inicial transformado e com todas as variáveis

Estimate Std. Error t value Pr(>|t|)

(Intercept) -0,02 0,02 -1,31 0,19mortinf$IDHM 0,38 0,03 11,26 0,00mortinf$GINI -0,01 0,02 -0,25 0,81mortinf$per_inf_extpobre 0,00 0,00 1,88 0,06mortinf$per_agua_bwc 0,00 0,00 -1,05 0,29mortinf$taxa_dengue 0,00 0,00 -2,29 0,02mortinf$per_maes_1017 0,00 0,00 -0,58 0,56

Conforme o teste de Variância Não Constante para um nível de 5 % de significância, o

p-valor de 1e-11 indica que rejeitamos a hipótese nula, ou seja, há diferença entre as

variâncias de resíduos de pelo menos um par de covariáveis.

Conforme o teste de Shapiro Wilk, ao nível de 5 % de significância, o p-valor de

0,180238020575066 indica que não há evidências suficientes para rejeitar a hipótese nula,

ou seja, pode-se considerar que os resíduos do ajuste 1 apresentam distribuição Normal.

Apesar da notável melhora do comportamento dos resíduos do ajuste 1 em termos de variância maisestável e melhor aderência à reta da normalidade, em comparação ao do ajuste inicial, ainda o teste de

Page 7: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

6

−2 −1 0 1 2

−56

0−

520

λ

log−

Like

lihoo

d

95%

Fig. 3: BoxCox Ajuste 0 - Intervalo de confiança para lambda

homocedasticidade retorna não significativo, mas nota-se normalidade. Nesse ponto, percebe-se que o modelopode estar mal especificado, ou seja, que tal conjunto de covariáveis não seja o mais adequado para explicar avariável resposta e que, portanto, pode-se reduzi-lo e fazer um recorte ainda mais restrito do caso.

Modelo Reduzido

A reescolha das variáveis, dentro do conjunto das apresentadas nesse trabalho, visou eliminar redundânciase eliminar aquelas que tenham alto erro de medida. Para tanto utilizou-se o método StepWise e o critério deinformação de Akaike (AIC). Tal método avalia a partir do modelo com todas as covariáveis, qual a variávelcom menor AIC e a retira do modelo, no passo seguinte reavalia o modelo mais enxuto, novamente retira acovariável com menor AIC, ou recoloca a variável retirada em passos anteriores, a depender do nível AIC,assim sucessivamente até que nenhuma covariável tenha que ser adicionada ou retirada.

O modelo reestabelecido é descrito por:

Y = β0 + β1x1 + β2x2 + β3x3 + β5x5

Os resultados desse modelo são apresentados na tabela 5.

Tab. 5: Ajuste 2 - Modelo reestabelecido

Estimate Std. Error t value Pr(>|t|)

(Intercept) 83,061 4,601 18,1 0,000mortinf$IDHM -98,357 8,278 -11,9 0,000mortinf$GINI 8,047 5,700 1,4 0,159mortinf$per_inf_extpobre -0,106 0,032 -3,3 0,001mortinf$taxa_dengue 0,049 0,025 2,0 0,052

Conforme o teste de Variância Não Constante para um nível de 5 % de significância, o p-valor

de 2,2e-11 indica que rejeitamos a hipótese nula, ou seja, há diferença entre as variâncias de

resíduos de pelo menos um par de covariáveis.

Conforme o teste de Shapiro Wilk, ao nível de 5 % de significância, o p-valor de

1,88954500379511e-05 indica que a hipótese nula é rejeitada, ou seja, não ha evidências

suficientes para afirmar que os resíduos do ajuste 2 seguem uma distribuição Normal.

Page 8: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

7

0,18 0,20 0,22 0,24

−0,

040,

02

Fitted values

Res

idua

ls

Residuals vs Fitted284178163

−3 −2 −1 0 1 2 3

−2

02

Theoretical Quantiles

Sta

ndar

dize

d re

sidu

als Normal Q−Q

284178163

0,18 0,20 0,22 0,24

0,0

1,0

Fitted values

Sta

ndar

dize

d re

sidu

als

Scale−Location284178163

0,00 0,05 0,10 0,15 0,20 0,25

−2

02

Leverage

Sta

ndar

dize

d re

sidu

als

Cook's distance0,5

0,5

Residuals vs Leverage

250163284

Fig. 4: Ajuste 3 - Modelo reduzido transformado

Modelo Reduzido Transformado

Verifica-se que o ajuste 2 também não atende aos pressupostos de homocedasticidade e normalidade. Comotentativa final para esse enquadramento foi realizada novamente uma transformação de variável. Utilizou-se omesmo lambda da transformação anterior, inverso da raiz.

Y ∗ = βť0 + βť

1x1 + βť2x2 + βť

3x3 + βť5x5

Os resultados do modelo são apresentados na tabela 6 e figura 4.

Tab. 6: Ajuste 3 - Modelo 3 transformado e com variáveis selecionadas pelo StepWise

Estimate Std. Error t value Pr(>|t|)

(Intercept) -0,03 0,02 -1,66 0,10mortinf$IDHM 0,38 0,03 12,62 0,00mortinf$GINI -0,01 0,02 -0,38 0,70mortinf$per_inf_extpobre 0,00 0,00 2,62 0,01mortinf$taxa_dengue 0,00 0,00 -2,30 0,02

Conforme o teste de Variância Não Constante para um nível de 5 % de significância, o p-valor de

1e-11 indica que rejeitamos a hipótese nula, ou seja, há diferença entre

Page 9: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

8

0,50 0,55 0,60 0,65 0,70 0,75

0,16

0,22

mortinf$IDHM

mor

tinf1

Data Model

0,40 0,45 0,50 0,55 0,60 0,65 0,70

0,16

0,22

mortinf$GINI

mor

tinf1

Data Model

10 20 30 40 50 60

0,16

0,22

mortinf$per_inf_extpobre

mor

tinf1

Data Model

0 20 40 60 80

0,16

0,22

mortinf$taxa_denguem

ortin

f1

Data Model

0,18 0,20 0,22 0,24

0,16

0,22

Fitted values

mor

tinf1

Data Model

Marginal Model Plots

Fig. 5: Modelos Marginais do Ajuste 3

as variâncias de resíduos de pelo menos um par de covariáveis.

Conforme o teste de Shapiro Wilk, ao nível de 5 % de significância, o p-valor de

0,168015198785437 indica que não há evidências suficientes para rejeitar a hipótese

nula, ou seja, pode-se considerar que os resíduos do ajuste 3 apresentam distribuição

Normal.

Vê-se normalidade, mas ainda não se atinge homocedasticidade. No caso desse modelo podemos interpretaro ajuste como para cada 0,38 unidades a mais no inverso da raíz quadrada do IDHM, esperamos que o inversoda raíz quadrada da taxa de mortalidade infantil aumente em uma unidade, dado o efeito fixo de demaiscovariáveis. O mesmo raciocínio se aplica ao percentual de crianças em extrema pobreza, para cada aumentode 0,0003034 dessa covariável espera-se aumento médio em uma unidade na variável resposta transformada,considerando demais covariáveis fixas. Para uma queda de 0,007804 no índice de Gini, ou uma queda que0.0002087 na taxa de dengue, em ambos casos com demais covariáveis fixas, espera-se que em média a taxa demortalidade infantil elevada ao inverso da raíz quadrada aumente uma unidade. Pelo não atendimento deambos os pressupostos, não há como fazer testes de hipótese e construir intervalos de confiança. Ressalta-seque o coeficiente R-quadrado-ajustado para esse ajuste foi de 0,424.

Page 10: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

9

A figura 5 traz os gráficos de modelos marginais. Os gráficos mostram a relação marginal entre a variávelresposta e cada variável explicativa. Cada gráfico contém o gráfico de dispersão das duas variáveis e a funçãode ajuste suavizada para os dados. Nota-se que o comportamento das funções não são similares em cada umdos gráficos, denotando que o modelo não está muito bem ajustado.

Tab. 7: Coeficientes dos ajustes

Ajuste3 s/163 s/250 s/284

(Intercept) -0,03 -0,03 -0,03 -0,03SE 0,02 0,02 0,02 0,02

- - - -mortinf$IDHM 0,38 0,38 0,38 0,37SE 0,03 0,03 0,03 0,03

- - - -mortinf$GINI -0,01 -0,01 -0,02 -0,01SE 0,02 0,02 0,02 0,02

- - - -mortinf$per_inf_extpobre 0,00 0,00 0,00 0,00SE 0,00 0,00 0,00 0,00

- - - -mortinf$taxa_dengue 0,00 0,00 0,00 0,00SE 0,00 0,00 0,00 0,00

- - - -

É possível ver na figura 6, pelo gráfico da Distância de Cook, que as observações 163 e 250 são possíveispontos de influência. Enquanto que pelo gráfico dos resíduos studentizados se identifica a observação 284como um possível outlier. A tabela 7 traz a comparação de modelos sem essas observações, nela é possívelverificar que ao retirar a observação 284 os erros padrões diminuem. Fica então a pauta para investigaçãofutura se essa redução é suficiente para retirar a observação da amostra. Além disso, pode-se ver na figura 7que várias variáveis do modelo tem correlação forte (valores absolutos superiores a 0.5). Também se sugerepara maior aprofundamento da questão um estudo de multicolinearidade das variáveis.

Page 11: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

10

0,00

0,01

0,02

0,03

0,04

0,05

Coo

k's

dist

ance

250163

−2

−1

0

1

2

3

Stu

dent

ized

res

idua

ls

284178

0,6

0,8

1,0

1,2

1,4

Bon

ferr

oni p

−va

lue

12

0,00

0,05

0,10

0,15

0,20

0,25

hat−

valu

es

0 100 200 300 400

75

130

Diagnostic Plots

Index

Fig. 6: Possíveis pontos de influência e outliers

Page 12: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

11

−1

−0,8

−0,6

−0,4

−0,2

0

0,2

0,4

0,6

0,8

1

GINI

ÁGUA

MÃES 10−17

MORT INFA

IDHM

EXT POBRE

DENGUE

−0,03

0,03

−0,16

0,23

0,27

0

0,05

−0,3

0,61

−0,59

−0,03

0,1

−0,07

−0,18

0

−0,59

0,3

0,04

−0,65

0,04 0,06

Fig. 7: Correlação e covariáveis consideradas no modelo inicial

Page 13: MORTALIDADE INFANTIL NA BAHIA - 2010: UMA ANÁLISE DE ...taconeli/CE07119/G9p1.pdfMunicípio GINI Água Mães Mort.Inf. IDHM Ext.P Dengue 337 Salvador 0,63 95 2,2 15 0,76 7,3 2,3 Tab

12

Considerações Finais

A Bahia é um estado amplo e bem fragmentado, são 417 municípios, sendo que sua capital sozinha chega aconter quase um quinto da população estadual. A grande concentração populacional nas cidades desenvolvidas,bem como outros fatores sociais e sanitários afetam o índice de mortalidade infantil dos municípios baianos.

Nesse trabalho, tentou-se construir um modelo de regressão lianear múltipla que descrevesse bem a variávelresposta “mortalidade infantil” a partir de covariáveis que fizessem um recorte na situação econômica ede saneamento do estado, por município, no ano de 2010. O modelo começou considerando as seguintescovariáveis: Índice de Desenvolvimento Humano Municipal(IDHM); Índice de Gini; percentual de criançasvivendo em situação de extrema pobreza; percentual da população que vive em domicílios com banheiro eágua encanada; taxa de prováveis casos de dengue; percentual da população de mulheres no intervalo de faixaetária de 10 a 17 anos que tiveram filhos; mas após primeiro ajuste verificou-se que os resíduos não atendiamaos pressupostos necessários de serem validados para que se pudesse realizar testes de hipóteses e construçãode intervalos de confiança.

Para contornar o problema de não homocedasticidade e não normalidade foram usados os métodos deredefinição da estrutura do modelo (método StepWise) e transformação de variável (boxcox). Foram tiradasdo modelo as variáveis percentual da população que vive em domicílios com banheiro e água encanada epercentual da população de mulheres no intervalo de faixa etária de 10 a 17 anos que tiveram filhos. Atransformação utilizada foi o inverso da raíz quadrada.

Tanto para o modelo inicial como para o último, verificou-se que uma regressão linear múltipla nãodescreve o melhor modelo para uma situação tão complexa quanto a mortalidade infantil e que, como a taxade mortalidade se trata de uma variável de contagem, talvez seja mais apropriado ajustar um modelo Poissonou mesmo algum outro modelo próprio para dados de contagem.

Referências

ATLAS DE DESENVOLVIMENTO DO BRASIL. Disponível em: http://www.atlasbrasil.org.br/2013/pt/consulta/.Acesso em: 06/05/2019“)

“DATASUS. Disponível em:http://www2.datasus.gov.br/DATASUS/index.php?area=0203&id=29878153”,“.Acesso em:08/05/2019.

INSTITUTO BRASILEIRO DE GEOGRAFIA E ESTATÍSTICA (IBGE) - Total População Bahia.Dispoível em:ftp://ftp.ibge.gov.br/Censos/. . . 2010/. . . /total_populacao_bahia.pdf.

REDE INTERAGENCIAL DE INFORMAÇÕES PARA SAÚDE (RIPSA) - Indicadores. Disponí-vel em: http://www.ripsa.org.br/vhl/indicadores-e-dados-basicos-para-a-saude-no-brasil-idb/.Acesso em:08/05/2019.