26
UMA ESTIMATIVA DO IMPACTO DOS GASTOS COM PROGRAMAS ASSISTENCIAS NA ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL TATIENE CORREIA DE SOUZA AND FRANCISCO CRIBARI–NETO RESUMO. Este artigo tem como objetivo avaliar o impacto dos gastos em programas assistenciais na eleição presidencial de 2006. Esta avaliação é realizada considerando dois tipos de modelos de regressão: linear e beta. Utilizamos o modelo de regressão linear para explicar o número de votos válidos do presidente Lula no segundo turno da eleição de 2006 e modelo de regressão beta para explicar diferença entre as proporções de votos válidos do presidente Lula nos segundos turnos das eleições de 2006 e 2002 e também sua proporção de votos válidos no segundo turno da eleição de 2006. Com- parando os gastos nos programas assistenciais em 2006 e 2002, nota-se que em 2006 o gasto em tais programas foi muito maior do que em 2002. Nós estimamos que este au- mento acarretou um aumento médio na votação do presidente de aproximadamente 7% no segundo turno da eleição presidencial de 2006. 1. I NTRODUÇÃO No Brasil, em 2002, havia alguns programas sociais que beneficiavam cerca de cinco milhões de famílias, como, por exemplo, o Bolsa-Escola, vinculado ao Ministério da Educação, o Auxílio-Gás, vinculado ao Ministério de Minas e Energia e o Cartão-Ali- mentação, vinculado ao Ministério da Saúde. O Programa Bolsa-Família consistiu na unificação e amplificação desses programas sociais num único programa social, com cadastro e administração centralizados no Ministério do Desenvolvimento Social e Combate à Fome. O Bolsa-Escola foi um programa educacional brasileiro idealizado pelo prefeito de Campinas, no Estado de São Paulo, José Roberto Magalhães Teixeira, implantado na- quele município durante sua gestão no ano de 1994. O objetivo era pagar uma bolsa às famílias de jovens e crianças de baixa renda como estímulo para que essas frequen- tassem a escola regularmente. O programa Bolsa-Escola federal foi implementado em 2001 pelo governo do então presidente Fernando Henrique Cardoso. O Auxílio-Gás foi um programa de distribuição de renda implementado pelo Governo Federal brasileiro em 2001 para atender aos beneficiários da Rede de Proteção Social. O Cartão-Alimen- tação foi um programa de transferência de renda para aquisição de alimentos por meio Date: 30 de abril de 2010. Key words and phrases. Eleição presidencial, modelo de regressão beta, modelo de regressão linear, programas assistenciais. 1

UMA ESTIMATIVA DO IMPACTO DOS GASTOS COM … · gramas assistenciais de 2006 e 2002. Na segunda modelagem, desejamos explicar a proporção de votos obtida pelo presidente Lula em

Embed Size (px)

Citation preview

UMA ESTIMATIVA DO IMPACTO DOS GASTOS COM PROGRAMAS ASSISTENCIASNA ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL

TATIENE CORREIA DE SOUZA AND FRANCISCO CRIBARI–NETO

RESUMO. Este artigo tem como objetivo avaliar o impacto dos gastos em programasassistenciais na eleição presidencial de 2006. Esta avaliação é realizada considerandodois tipos de modelos de regressão: linear e beta. Utilizamos o modelo de regressãolinear para explicar o número de votos válidos do presidente Lula no segundo turno daeleição de 2006 e modelo de regressão beta para explicar diferença entre as proporçõesde votos válidos do presidente Lula nos segundos turnos das eleições de 2006 e 2002 etambém sua proporção de votos válidos no segundo turno da eleição de 2006. Com-parando os gastos nos programas assistenciais em 2006 e 2002, nota-se que em 2006 ogasto em tais programas foi muito maior do que em 2002. Nós estimamos que este au-mento acarretou um aumento médio na votação do presidente de aproximadamente7% no segundo turno da eleição presidencial de 2006.

1. INTRODUÇÃO

No Brasil, em 2002, havia alguns programas sociais que beneficiavam cerca de cincomilhões de famílias, como, por exemplo, o Bolsa-Escola, vinculado ao Ministério daEducação, o Auxílio-Gás, vinculado ao Ministério de Minas e Energia e o Cartão-Ali-mentação, vinculado ao Ministério da Saúde. O Programa Bolsa-Família consistiu naunificação e amplificação desses programas sociais num único programa social, comcadastro e administração centralizados no Ministério do Desenvolvimento Social eCombate à Fome.

O Bolsa-Escola foi um programa educacional brasileiro idealizado pelo prefeito deCampinas, no Estado de São Paulo, José Roberto Magalhães Teixeira, implantado na-quele município durante sua gestão no ano de 1994. O objetivo era pagar uma bolsaàs famílias de jovens e crianças de baixa renda como estímulo para que essas frequen-tassem a escola regularmente. O programa Bolsa-Escola federal foi implementado em2001 pelo governo do então presidente Fernando Henrique Cardoso. O Auxílio-Gás foium programa de distribuição de renda implementado pelo Governo Federal brasileiroem 2001 para atender aos beneficiários da Rede de Proteção Social. O Cartão-Alimen-tação foi um programa de transferência de renda para aquisição de alimentos por meio

Date: 30 de abril de 2010.Key words and phrases. Eleição presidencial, modelo de regressão beta, modelo de regressão linear,

programas assistenciais.1

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 2

de cartão magnético, destinado às famílias atendidas pelo Programa Fome Zero. O ob-jetivo final deste programa era garantir a emancipação socioeconômica das famíliasassistidas. Por fim, o programa Bolsa-Alimentação foi criado por José Serra e teve iní-cio, em módulo piloto, em julho de 2001. Foi lançado nacionalmente em setembro de2001. Esse programa era voltado para famílias com gestantes, mães em amamentaçãoe crianças até 6 anos de idade, de baixa renda e em risco nutricional, sendo de carátercomplementar à Bolsa-Escola, voltada às famílias com crianças em idade escolar.

O programa Bolsa-Família foi instituído pela Medida Provisória no 132, de 20 de ou-tubro de 2003, posteriormente convertida na Lei no 10.836, de 9 de janeiro de 2004. OBolsa-Família unificou os seguintes programas de transferência de renda do GovernoFederal: Bolsa-Escola, Auxílio-Gás, Cartão-Alimentação e Bolsa-Alimentação.

O Programa Bolsa-Família oferece às famílias três tipos de benefícios, são eles: bási-co, variável e variável para jovem. O benefício básico é concedido às famílias em situa-ção de extrema pobreza. Os benefícios variável e variável para jovem são destinadosàs famílias que se encontram em situação de pobreza ou extrema pobreza, contudo,famílias que apresentam em sua composição gestante, nutrizes, crianças ou adoles-centes até 15 anos de idade recebem o benefício variável, enquanto famílias que te-nham adolescentes entre 16 e 17 anos de idade recebem o benefício chamado variávelpara jovem. O Bolsa-Família é executado pelos municípios. Cabe à prefeitura realizaro cadastramento das famílias, por meio do Cadastro Único dos Programas Sociais doGoverno Federal, o CadÚnico. A seleção das famílias elegíveis, no entanto, é feita peloMinistério do Desenvolvimento Social e Combate à Fome (MDS).

O atual presidente do Brasil, que é filiado ao Partido dos Trabalhadores (PT), LuizInácio Lula da Silva, foi cinco vezes candidato à presidência da República do Brasil. Elefoi derrotado nas três primeiras tentativas, em 1989, 1994 e 1998. Em 1989, foi vencidopelo candidato Fernando Collor de Mello e nas duas vezes seguintes, pelo candidatoFernando Henrique Cardoso. Nas eleições presidenciais de 2002 e 2006, Lula disputoucom José Serra e Geraldo Alckmin, respectivamente, ambos filiados ao Partido da So-cial Democracia Brasileira (PSDB). Lula se tornou presidente da República no segundoturno da eleição presidencial de 2002 e foi reeleito no segundo turno da eleição de2006.

Com a maior votação já recebida por um candidato no Brasil até então, em 2002,Lula foi eleito presidente da República. Sua votação foi quase o dobro da obtida porFernando Henrique Cardoso em cada uma das vezes em que foi eleito. Partindo deuma elevada popularidade, durante o governo de 2002, o presidente viu sua aceitaçãoruir em meio a denúncias de corrupção. No início de 2006, Lula conseguiu reagir,desviando-se dos escândalos e voltou a ter altos índices de popularidade. Em 29 deoutubro de 2006, Lula foi reeleito, com mais de 58 milhões de votos, a maior votaçãorecebida por um candidato em eleições no país. Comparando as eleições de 2002 e2006, em termos de percentuais, a votação em Lula no segundo turno foi praticamentea mesma, em torno de 61%.

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 3

O desempenho eleitoral do presidente causou uma grande discussão sobre o com-portamento eleitoral. Notou-se que o perfil dos eleitores de Lula havia sofrido altera-ção. Na sua primeira vitória (2002), Lula obteve melhor desempenho nas regiões maisurbanizadas e desenvolvidas enquanto que em 2006 o voto migrou para lugares maisatrasados e menos urbanizados (Canêdo–Pinheiro, 2010). Hunter & Power (2007) con-cluíram que grandes disparidades regionais e a baixa penetração de revistas e jornaisfizeram com que parte dos eleitores, em especial, os mais pobres, não tivesse conhe-cimento das denúncias de corrupção que ocorreram durante o governo do presidenteLula. Segundo Zucco (2008), há evidências de que no Brasil o candidato a presiden-te ligado ao governo sempre obtém desempenho eleitoral relativamente melhor emregiões menos desenvolvidas.

No que tange à relação entre gastos em programas assistenciais e o desempenhodo presidente Lula na eleição de 2006, há uma grande discussão sobre o impacto doBolsa-Família no resultado da eleição presidencial de 2006. Os resultados ainda sãodíspares. Marques et al. (2009) afirmam que tal programa teve papel decisivo na vitóriado presidente, enquanto que Carraro et al. (2009) sugerem que o programa não foi de-terminante para a reeleição de Lula. Com a finalidade de avaliar o impacto dos progra-mas assistenciais sobre o resultado da eleição presidencial de 2006, dividimos a nossaanálise em três partes. Primeira, o nosso interesse é explicar a diferença entre a pro-porção de votos nos segundos turnos das eleições presidenciais de 2006 e 2002. Nessamodelagem consideramos a diferença entre os gastos, em milhões de reais, nos pro-gramas assistenciais de 2006 e 2002. Na segunda modelagem, desejamos explicar aproporção de votos obtida pelo presidente Lula em 2006. Para tal, levamos em con-sideração os gastos, em milhões de reais, nos programas assistenciais naquele ano.Na terceira e última modelagem, o nosso objetivo é explicar o número de votos válidosrecebidos pelo presidente Lula em 2006. Vale ressaltar que nas duas primeiras modela-gens, a variável de interesse é uma proporção, sendo assim, faz-se necessário o uso demodelos adequados para situações em que a variável resposta é desta natureza, dadoos modelos lineares não são adequados. Nessas modelagens, utilizamos o modelo deregressão beta proposto por Ferrari & Cribari–Neto (2004). Na literatura há alguns au-tores que fazem uso de modelos de regressão linear para descrever variáveis respostaque assumem a forma de proporções, por exemplo, Zucco (2008), Carraro et al. (2009)e Marques et al. (2009). Além das contribuições acima citadas, estimamos o impactodos gastos com programas assistenciais sobre o resultado na eleição presidencial de2006.

Além desta introdução, este artigo está dividido em cinco seções. Na Seção 2, apre-sentamos o modelo de regressão beta, bem como algumas medidas de avaliação daqualidade do ajuste. Na Seção 3, descrevemos os dados utilizados. Na Seção 4, especi-ficamos os três modelos de regressão considerados, bem como as inferências associa-das. Por fim, a seção 5 conclui o artigo.

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 4

2. O MODELO

A distribuição beta é a distribuição mais utilizada para modelar experimentos alea-tórios que produzem resultados no intervalo (0,1). Paolino (2001), Kieschnick & Mc-Cullough (2003), Ferrari & Cribari–Neto (2004), Ospina et al. (2006), Smithson & Verkui-len (2006) e Espinheira et al. (2008a, b) utilizaram modelos de regressão para situaçõesem que a variável resposta segue a distribuição beta. Em tais modelos, assume-se quea resposta média é relacionada com um preditor linear por meio de uma função deligação. O preditor linear envolve covariáveis e parâmetros de regressão desconheci-dos. Estes modelos também são indexados por um parâmetro de dispersão, que emcertas situações pode variar ao longo das observações (Smithson & Verkuilen, 2006;Espinheira et al. 2008a, 2008b; Simas et al. 2009).

Ferrari & Cribari–Neto (2004) propuseram uma parametrização alternativa para adensidade beta que permite a modelagem da média da resposta através de uma es-trutura de regressão e que envolve também um parâmetro de precisão. A função dedensidade beta nessa reparametrização tem a forma

f (y ;µ,φ) =Γ(φ)

Γ(µφ)Γ((1−µ)φ)yµφ−1(1− y)(1−µ)φ−1, 0< y < 1, (2.1)

em que 0 <µ< 1 e φ> 0. Aqui, E(y) =µ e var(y) = V (µ)1+φ , sendo V (µ) =µ(1−µ) a ‘função

de variância’, em que µ é a média da variável resposta e φ pode ser interpretado comoum parâmetro de precisão.

Neste artigo utilizaremos uma outra parametrização para o parâmetro de precisão.

Seguindo Stasinopoulos et al. (2006), escrevemos σ2=

1(1+φ) , ou seja, φ =

1−σ2

σ2 . Noteque σ é o parâmetro de dispersão. Logo, a densidade em (2.1) é dada por

f (y ;µ,σ) =Γ

(1−σ2

σ2

)

Γ

(µ1−σ2

σ2

((1−µ) 1−σ2

σ2

) yµ(

1−σ2

σ2

)−1

(1− y)(1−µ)

(1−σ2

σ2

)−1

, (2.2)

em que 0 < µ < 1 e 0 < σ < 1. Note que nessa parametrização os dois parâmetros queindexam a densidade assumem valores no intervalo unitário padrão (0,1).

Assumiremos que a variável resposta está restrita ao intervalo (0,1). Quando a res-posta assume valores no intervalo (a,b), com a e b conhecidos (−∞ < a < b < ∞),podemos modelar a variável (y −a)/(b −a), que é uma padronização que permite tra-balhar com a densidade (2.2) no intervalo (0,1).

Sejam y1, . . . , yn variáveis aleatórias independentes, em que cada yt , t = 1, . . . ,n, pos-sui densidade (2.2), a média µt e o parâmetro de dispersão σt sendo desconhecidos.O modelo proposto por Ferrari & Cribari–Neto (2004) é obtido assumindo que a médiade yt pode ser escrita como

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 5

g (µt ) =k∑

i=1xtiβi = ηt ,

em que β= (β1, . . . ,βk )T é um vetor de parâmetros desconhecidos (β ∈Rk ) e xt1, . . . , xtk

são observações de k (k < n) covariáveis. Por fim, g (·), a função de ligação g : (0,1) →R,é estritamente monótona e duas vezes diferenciável. Assim, temos que µt = g−1(ηt ) e

var(yt ) = var(g−1(ηt ))/(

1+1−σ2

t

σ2t

). Admitimos que o parâmetro de dispersão σt é dado

por

h(σt ) =q∑

j=1zt jγ j = νt , (2.3)

em que γ = (γ1, . . . ,γq )T é um vetor de parâmetros desconhecidos, zt1, . . . , ztq são ob-servações de q covariáveis (q < n), assumidas fixas e conhecidas, e h(·) é uma funçãoestritamente monótona e duas vezes diferenciável. Há várias possíveis escolhas paraas funções de ligação g (·) e h(·), por exemplo, podemos utilizar as especificações logite probit, entre outras. Para maiores detalhes sobre funções de ligação, ver McCullagh& Nelder (1989). Uma interpretação dos parâmetros que definem a estrutura de re-gressão beta é obtida quando a função de ligação é logit. Neste caso, a média de yt , µt ,pode ser escrita como

µt =exT

t β

1+exTt β

,

em que xTt = (xt1, . . . , xtk ), t = 1, . . . ,n. Neste contexto, os parâmetros do modelo de re-

gressão beta têm importantes interpretações. Suponha que o valor da i-ésima variávelindependente aumenta em c unidades e que todas as outras variáveis independentespermanecem constantes. Seja µ† a média da variável y sob o novo valor da covariávele seja µ a média da variável y sob os valores das covariáveis originais. Sendo assim, arazão de chances (odds ratio) é dada por

ecβi=

µ†/(1−µ†)

µ/(1−µ),

ou seja, ecβi é a razão de chances.O logaritmo da função de verossimilhança a partir de uma amostra de n observações

independentes é

`(β,γ) =n∑

t=1`t (µt ,σt ),

em que

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 6

`t (µt ,σt ) = logΓ

(1−σ2

t

σ2t

)− logΓ

(µt

1−σ2t

σ2t

)

− logΓ

((1−µt )

1−σ2t

σ2t

)+

(µt

1−σ2t

σ2t

−1

)log yt

+

((1−µt )

1−σ2t

σ2t

−1

)log(1− yt ).

Logo, para i = 1 . . . ,k, a função escore para βi é dada por

∂`(β,γ)

∂βi=

n∑

t=1

∂`t (µt ,σt )

µt

dµt

dηt

∂ηt

∂βi, (2.4)

em que dµt /dηt = 1/g ′(µt ) e

∂`t (µt ,σt )

∂µt=

1−σ2t

σ2t

(y∗

t −µ∗

t ), (2.5)

com y∗

t = log yt1−yt

e µ∗

t =ψ(µt

1−σ2t

σ2t

)−ψ

((1−µt )

1−σ2t

σ2t

), em que ψ(·) é a função digama.

Logo,

∂`(β,γ)

∂βi=

n∑

t=1

(1−σ2t )

σ2t

(y∗

t −µ∗

t )1

g ′(µt )xti . (2.6)

Podemos escrever o vetor Uβ(β,γ), a função escore de β= (β1, . . . ,βk )T , em forma ma-tricial como

Uβ(β,γ) = X TΣT (y∗

−µ∗),

em que Σ= diag{

1−σ21

σ21

, . . . , 1−σ2n

σ2n

}e µ∗

= (µ∗

1 , . . . ,µ∗

n)T .

Considerando as derivadas em relação aos parâmetros que modelam a dispersão,γ j , j = 1 . . . , q , temos que

∂`(β,γ)

∂γ j=

n∑

t=1

∂`t (µt ,σt )

∂σt

dσt

dνt

∂νt

∂γ j, (2.7)

em que dσt /dνt = 1/h′(σt ) e

∂`t (µt ,σt )

∂σ j=−

2

σ3t

[µt (y∗

t −µ∗

t )+ log(1− yt )+ψ

(1−σ2

t

σ2t

)

−ψ

((1−µt )

1−σ2t

σ2t

)].

Então,

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 7

∂`(β,γ)

∂γ j=

n∑

t=1at

1

h′(σt )zt j ,

em que

at =−

2

σ3t

[µt (y∗

t −µ∗

t )+ log(1− yt )+ψ

(1−σ2

t

σ2t

)

−ψ

((1−µt )

1−σ2t

σ2t

)].

Podemos escrever o vetor Uγ(β,γ), a função escore de γ = (γ1, . . . ,γk )T , matricial-mente como

Uγ(β,γ) = Z T Ha,

em que H = diag{1/h′(σ1), . . . ,1/h′(σt )

}.

A matriz de informação de Fisher conjunta dos vetores β e γ é dada pelos valoresesperados das segundas derivadas do logaritmo da função de verossimilhança. Parao modelo de regressão beta na parametrização aqui usada, a matriz da informação deFisher para o vetor paramétrico θ = (βT ,γT )T pode ser escrita como

K (θ) = K (β,γ) =

(Kββ Kβγ

Kγβ Kγγ

),

em que Kββ = X TΣW X , Kβγ = (Kγβ)T

= X T C T H Z e Kγγ= Z T D∗Z .Os estimadores de máxima verossimilhança de β e γ são obtidos pela solução do

sistema formado por Uβ(β,γ) = 0 e Uγ(β,γ) = 0. Tais estimadores não possuem formafechada. Assim, eles têm que ser obtidos numericamente pela maximização da funçãode log-verossimilhança com auxílio de um algoritmo de otimização não-linear.

Usando a expressão padrão para a inversa de matrizes particionadas, temos que ainversa da matriz da informação de Fisher é dada por

K (θ)−1= K (β,γ)−1

=

(K ββ∗

K βγ∗

K γβ∗

K γγ∗

)

,

em que

K ββ∗

= (X TΣW X −X T C T H Z (Z T D∗Z )−1 Z T HT C X )−1,

onde W = diag{w∗

1 , . . . , w∗

n }, com

wt =1−σ2

t

σ2t

[ψ′

(µt

1−σ2t

σ2t

)+ψ′

((1−µt )

1−σ2t

σ2t

)](1

g ′(µt )

)2

,

C = diag{c1, . . . ,cn}, com

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 8

ct =2

σ3t

(1−σ2

t

σ2t

)[µtψ

(µt

1−σ2t

σ2t

)− (1−µt )ψ′

((1−µt )

1−σ2t

σ2t

)]

e D∗= diag{d∗

1 , . . . ,d∗

n }, com

d∗

t =

4

σ6t

[−ψ′

(1−σ2

t

σ2t

)+µ2

t ψ′

(µt

1−σ2t

σ2t

)+ (1−µt )2ψ′

((1−µt )

1−σ2t

σ2t

)] 1

{h′(σt )}2 ,

K βγ∗

= (K γβ∗

)T=−K ββ

∗X T C T H Z (Z T D∗Z )−1

e

K γγ∗

= (Z T D∗Z )−1{Iq + (Z T HT C X )K ββ∗

X T C T H Z (Z T D∗Z )−1}.

Sob certas condições de regularidade, temos que, para tamanhos de amostras gran-des, a distribuição conjunta de β e γ é aproximadamente normal (k +q)-multivariada:

γ

)∼N

((β

γ

),K (θ)−1

),

aproximadamente, sendo β e γ os estimadores de máxima verossimilhança de β e γ,respectivamente.

2.1. Algumas medidas de diagnóstico e adequabilidade para modelos de regressãobeta. A análise de diagnóstico teve início com a análise de resíduos objetivando de-tectar pontos mal ajustados ou aberrantes e avaliar indícios de afastamento das su-posições sobre o modelo. A análise de resíduos pode basear-se nos resíduos ordináriosou em suas várias padronizações. Técnicas gráficas baseadas em resíduos são fre-quentementes adotadas para análise de diagnósticos.

Espinheira et al. (2008a) propuseram um resíduo para o modelo de regressão beta econstaram que o mesmo tipicamente apresenta desempenho superior ao resíduo pro-posto por Ferrari & Cribari-Neto (2004), especialmente no sentido de identificar obser-vações influentes para as estimativas das médias. O resíduo ponderado padronizado 2proposto por esses autores, r pp , é dado por

r ppt =

y∗

t − µ∗

t√υt (1−h∗

t t ), (2.8)

em que υt =ψ′

(µt

1−σ2t

σ2t

)+ψ′

((1− µt )

1−σ2t

σ2t

), h∗

t t é o t-ésimo elemento da diagonal prin-

cipal de W Σ1/2

X (X TΣW X )−1 X T (ΣW )1/2 e Σ= diag

{1−σ2

1

σ21

, . . . , 1−σ2n

σ2n

}. Aqui, µt = g−1(ηt ) =

g−1(x′

t β) e σ2t = h−1(νt ) = h−1(z ′

t γ), em que xt e zt são as t-ésimas linhas de X e Z .Para verificar a qualidade global do ajuste de um modelo é útil ter uma medida

análoga ao coeficiente de determinação, R2, utilizado em modelos lineares de regressão.Ferrari e Cribari-Neto (2004) propuseram uma medida global chamada de pseudo R2,

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 9

que é definida como o quadrado do coeficiente de correlação entre η e g (y). Na evolu-ção dos métodos de diagnóstico uma etapa que se mostrou relevante foi a detecção deobservações que exercem efeito desproporcional no ajuste. Neste contexto, encontram-se a distância de Cook e a alavancagem generalizada.

A distância de Cook (1977) objetiva quantificar o impacto de uma observação parti-cular nas estimativas dos coeficientes de regressão a partir de sua exclusão do conjuntode dados. Este tipo de diagnóstico pode ser feito utilizando o método de influêncialocal desenvolvido por Cook (1986). A análise de influência local visa avaliar conjunta-mente o impacto das observações sob pequenas pertubações no modelo ou nos dados.A proposta de influência local apresentada por Cook (1986) tem sido vastamente uti-lizada em modelagens de regressão.

A distância de Cook aproximada para o modelo de regressão beta definido em (2.1)apresentada em Espinheira et al. (2008a) é dada por

LD t =h∗

t t

1−h∗

t t(r pp

t )2,

em que r ppt é o resíduo ponderado padronizado 2 definido em (2.8).

3. DESCRIÇÃO DOS DADOS

A Tabela 1 apresenta uma breve descrição das variáveis utilizadas. As fontes dosdados são Zucco (2008), o Tribunal Superior Eleitoral (TSE) e o Instituto Brasileiro deGeografia (IBGE).

Na Tabela 2 apresentamos algumas estatísticas descritivas: mínimo, primeiro quar-til (Q1/4), mediana, média, terceiro quartil (Q3/4) e máximo das variáveis utilizadas. 1

Algumas conclusões podem ser extraídas da Tabela 2. Considerando a variável G I N I ,temos que há grande disparidade no que tange à concentração de renda. Os municí-pios menos desenvolvidos apresentam coeficiente de Gini superior a 0.80, enquantoque para os mais desenvolvidos este coeficiente é menos da metade de tal valor.

Em 50% dos municípios brasileiros a proporção de votos válidos do presidente Lulano segundo turno da eleição de 2006 foi superior a 0.60 (Tabela 2). A menor rendaper capita da amostra é de 30.43 reais e a maior, 954.00 reais. O percentual de analfa-betismo nos municípios mais desenvolvidos é menos de 1%; nos menos desenvolvidoseste percentual ultrapassa 50%. O terceiro quartil da variável NBR ANCO é 0.675. Istosignifica que 75% dos municípios têm percentual da população não-brancos igual oumenor que 0.67%.

Destacamos que o menor valor que o coeficiente de Gini assumiu foi registrado noEstado do Rio Grande do Sul, no município de Santa Maria do Herval, e o maior, noEstado do Amazonas, no município de Jutaí. Além disso, destacamos ainda que nomunicípio de Manaquiri (Amapá) a proporção de votos do presidente Lula foi quase

1As estatísticas descritivas para as seis primeiras variáveis são calculadas com base em 4222 obser-vações, ao passo que para as três últimas variáveis foram utilizados 4191 dados.

ELE

IÇÃ

OP

RE

SIDE

NC

IAL

DE

2006N

OB

RA

SIL10

TABELA 1. Descrição das variáveis utilizadas.

Variável DefiniçãoLU L A2006 Proporção de votos válidos de Lula no segundo turno da eleição de 2006LU L A2002 Proporção de votos válidos de Lula no segundo turno da eleição de 2002U RB Proporção da população vivendo em áreas urbanas em 2000AN ALF Proporção de analfabetos entre pessoas acima de 15 anos de idade em 2000GOV PT Variável dummy: 1 se governador do PT em 2006, 0 caso contrárioPRE F PT Variável dummy: 1 se prefeito do PT em 2006, 0 caso contrárioRE ND A Renda per capita em 2000G I N I Índice de desigualdade de Gini em 2000NBR ANCO Proporção da população que declarou ser não-branca em 2000PE NT Proporção da população de orientação religiosa pentecostalPOP2005 População estimada do município em 2005

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 11

TABELA 2. Estatísticas descritivas das variáveis utilizadas.

Variável mínimo Q1/4 mediana média Q3/4 máximoLU L A2002 0.125 0.457 0.540 0.541 0.626 0.934LU L A2006 0.196 0.486 0.619 0.618 0.758 0.960U RB 0.038 0.407 0.592 0.590 0.778 1.000AN ALF 0.009 0.112 0.175 0.213 0.316 0.590RE ND A 30.43 89.28 163.20 170.00 236.90 954.06G I N I 0.360 0.520 0.560 0.560 0.600 0.820NBR ANCO 0.000 0.221 0.476 0.454 0.675 0.966PE NT 0.001 0.038 0.069 0.080 0.109 0.461POP2005 823 5572 11700 35850 23850 10930000

cinco vezes maior do que no município de São Marcos (Rio Grande do Sul). Na eleiçãopresidencial de 2002, a proporção de votos válidos obtidos pelo presidente Lula foi umpouco menor do que em 2006.

Em 2002, existiam três programas assistenciais, a saber: Bolsa-Escola, Bolsa-Ali-mentação e Auxílio-Gás. O valor máximo gasto nos programas assistenciais em 2002foi registrado no município de Salvador, na Bahia. Em média foram gastos aproxi-madamente 106 mil reais por município. Vale ressaltar que os gastos considerados em2002 foram deflacionados utilizando o IPCA - Índice de Preços ao Consumidor Amplo.Tais dados se encontram, assim, a preços constantes de 2006.

Em 2006, além dos três programas assistenciais existentes em 2002, também exis-tiam o Cartão-Alimentação e o Bolsa-Família. O valor médio dos gastos no municípiosbrasileiros em 2006 foi quase um milhão e meio de reais. No município de São Pauloforam gastos mais de 130 milhões de reais enquanto que no município de Águas de SãoPedro foram gastos aproximadamente 4.9 mil reais. Um dos nossos interesses nesteartigo reside em quantificar o impacto da diferença entre os gastos nos programas as-sistenciais em 2006 e 2002 sobre o resultado da eleição presidencial de 2006. Em 2006foram gastos 5.864 bilhões de reais a mais do que em 2002 em programas assistenciais.

A Tabela 3 apresenta a diferença entre as proporções de votos válidos dos candidatosLula e Alckmin no segundo turno das eleição presidencial de 2006 por Estado (δV OT OS).A Tabela 3 apresenta ainda a diferença entre o valor total dos benefícios nos anosde 2006 e 2002 (δG AST O) e a quantidade de municípios atendidos em cada Estadobrasileiro em 2006. A proporção de votos do candidato do PSDB foi maior do que ado candidato do PT nas regiões Sul e Centro-Oeste (exceto no Estado de Goiás), e nosEstado de São Paulo e Roraima. A correlação entre as covariáveis δV OT OS e δG AST Oé positiva, em torno de 0.37. Podemos observar ainda que os estados mais beneficia-dos com aumento de gastos assistenciais foram: Bahia, Minas Gerais, Ceará, São Pauloe Pernambuco. Por exemplo, no Estado da Bahia, em 2006 foram gastos aproximada-mente 793 milhões de reais a mais do que em 2002, enquanto que no Estado do Amapá

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 12

esta diferença foi de um pouco mais de 3 milhões de reais. Considerando o Brasil comoo todo, no segundo turno da eleição presidencial de 2006 Lula obteve 61% dos votosválidos e Geraldo Alckmin, 39%, ou seja, a diferença foi de 22%.

TABELA 3. Diferença das proporções de votos válidos recebidos peloscandidatos Lula e Alckmin no segundo turno da eleição presidencial de2006 (δV OT OS), diferença entre os valores totais de benefícios, em mi-lhões de reais, em 2006 e 2002 (δG AST O), e quantidade de municípiosatendidos em 2006 (Municípios).

Estados δV OT OS δG AST O MunicípiosBA 56.164 793.556 324MG 30.384 682.108 790CE 64.759 574.589 169SP −4.522 539.333 396PE 56.966 495.733 161MA 69.264 333.419 111PB 50.020 267.420 189PR −1.502 263.554 353RS −10.706 257.072 411PA 20.244 234.504 89RJ 39.374 186.469 78AL 22.894 185.050 80RN 39.454 164.775 127PI 54.649 164.490 113

AM 73.604 129.591 47ES 31.086 98.917 66SE 20.134 98.193 55SC −9.068 80.823 262MT −0.616 72.534 105MS −10.032 62.808 69TO 40.536 44.197 84GO 9.562 42.102 87RO 10.656 41.685 30AC 4.724 30.634 13RR −22.988 17.608 7AP 40.800 3.204 6

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 13

4. ESPECIFICAÇÃO DOS MODELOS

Nesta seção apresentaremos três modelagens empíricas relacionadas à eleição pre-sidencial no Brasil. De início, o nosso interesse é explicar a diferença entre as pro-porções de votos válidos do presidente Lula nos segundos turnos nas eleições de 2006e 2002. Na segunda modelagem, a variável resposta (y) é a proporção de votos válidosdo presidente Lula no segundo turno da eleição de 2006. Por fim, objetivamos explicara quantidade de votos do presidente na eleição de 2006. Para estimar os modelos de re-gressão nas duas primeira modelagens, utilizamos o modelo de regressão beta (Ferrari& Cribari–Neto, 2004). Na terceira modelagem, usamos o modelo de regressão linear.O procedimento computacional foi desenvolvido utilizando o software estatístico R.

Na seleção das covariáveis utilizadas para explicar cada uma das três variáveis res-postas acima citadas utilizamos o critério de seleção de modelo AIC (Akaike’s informa-tion criterion), que foi proposto por Akaike (1974).

Inicialmente, ao usar o modelo de regressão beta, nosso interesse é verificar se adispersão é fixa, ou seja, se há ou não estrutura de regressão para o parâmetro de dis-persão. Para tanto empregamos o teste score (Espinheira, 2007) e concluímos que adispersão é variável nos dois casos. Sendo assim, além de modelar a média, há ne-cessidade de modelar a dispersão. No terceiro enfoque, nosso interesse inicial é verifi-car a presença de heteroscedasticidade, o que pode ser feito aplicando-se um teste deheteroscedasticidade. O teste empregado no terceiro enfoque foi o teste de Koenker(1981), considerando-se a hipótese nula de homoscedasticidade. Este teste rejeitoua hipótese de que as variâncias dos erros são iguais aos níveis usuais de significân-cia. Dada a evidência de heteroscedasticidade, a realização de testes de hipótese so-bre os parâmetros lineares dos modelos é conduzida empregando-se estatísticas deteste quasi-t baseadas em um estimador para a matriz de covariâncias do estimadorde MQO que é consistente sob heteroscedasticidade de forma desconhecida.

4.1. Diferença entre as proporções de votos válidos do presidente Lula nas eleiçõesde 2006 e 2002. Neste primeiro modelo a variável de interesse, δy , é a diferença entreas proporções de votos válidos do presidente Lula nos segundos turnos das eleições de2006 e 2002. As covariáveis selecionadas foram δG AST O, G I N I , RE ND A, GOV PT ,PRE F PT , U RB , AN ALF e RE ND A2. A covariável δG AST O representa a diferençaentre a soma dos gastos com programas assistenciais e no Bolsa-Família em 2006 e asoma dos gastos com programas assistenciais em 2002.

Da forma como definimos a variável de interesse, não podemos garantir um dospressupostos do modelo de regressão beta, ou seja, que δy está restrita ao intervalo(0,1). Para contornar tal situação, fizemos uma transformação na variável resposta. Atransformação foi δy∗

= (δy−a)/(b−a), em que a =−1 e b = 1. Esta padronização nosgarante que a variável resposta está restrita ao intervalo (0,1). A variável resposta nestecaso apresenta valor mínimo igual a 0.279, valor máximo igual a 0.883 e mediana iguala 0.526. Na Figura 1 estão apresentados o histograma e o box-plot da variável depen-dente δy∗. É possível notar que a distribuição dessa variável é assimétrica, portanto, é

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 14

necessário considerar um modelo adequado, i.e., um modelo que capture a assimetria.Assim sendo, utilizamos o modelo de regressão beta.

δy*

0.0 0.2 0.4 0.6 0.8 1.0

01

23

4

0.3 0.4 0.5 0.6 0.7 0.8 0.9

δy*

FIGURA 1. Histograma e gráfico box-plot da diferença entre as pro-porções de votos válidos do presidente Lula nas eleições de 2006 e 2002.

O modelo de interesse selecionado é

logit(µ∗

t ) =β0 +β1δG AST Ot +β2G I N It +β3RE ND At +β4GOV PTt

+β5PRE F PTt +β6U RBt +β7 AN ALFt +β8RE ND A2t ,

logit(σt ) = γ0 +γ1G I N It +γ2RE ND At +γ3U RBt +γ4 AN ALFt ,

t = 1, . . . ,4222.Através da análise dos coeficientes estimados para o modelo selecionado (ver Tabela

4) é possível verificar que a covariável δG AST O influencia positivamente a diferençaentre as proporções de votos de Lula em 2006 e 2002. As covariáveis G I N I , U RB eAN ALF também exercem efeito positivo na diferença das proporções de votos, aopasso que, as covariáveis RE ND A, GOV PT e PRE F PT exercem efeito negativo. Osmunicípios mais urbanizados tendem a apresentar maiores diferenças entre as pro-porções de votos em 2006 e 2002. Dentre as covariáveis selecionadas, a que menosexerce influência sobre a variável resposta é RE ND A. Considerando a estrutura de re-gressão para o parâmetro de dispersão, temos que à medida que as covariáveis RE ND Ae U RB diminuem a dispersão diminui, ou seja, os municípios que apresentam menores

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 15

rendimentos e os municípios com menores taxa de urbanização tendem a apresen-tar resposta menos dispersa. Medimos a intensidade da não-constância da dispersãodos dados através da seguinte quantidade λ= max(σt )/min(σt ). Para o modelo de re-gressão beta considerado temos λ= 6.74. Correspondentemente, a razão entre a maiore a menor precisão estimadas é 47.16 . O pseudo R2 obtido foi 0.677.

TABELA 4. Estimativas pontuais e p-valores. Diferença entre as pro-porções de votos válidos do presidente Lula em 2006-2002.

Covariável β p-valor γ p-valorINTERCEPTO −0.283 0.000 −2.436 0.000δG AST O 2.420e −03 0.000 — —G I N I 0.3434 0.000 1.200 0.000RE ND A −1.755e −03 0.000 −0.002 0.000GOV PT −0.136 0.000 — —PRE F PT −0.031 0.004 — —U RB 0.161 0.000 −0.358 0.000AN ALF 1.908 0.000 0.447 0.009RE ND A2 1.492e −06 0.000 — —

A Tabela 5 apresenta os impactos estimados da covariável δG AST O, em bilhões dereais, sobre a diferença entre as votações do presidente Lula em 2006 e 2002 e seus res-pectivos erros-padrão obtidos via bootstrap. Como foi citado anteriormente, fizemosuma transformação na variável resposta de tal forma que δy∗

∈ (0,1), assim sendo,

a relação entre δy∗ e δy é dada por δy∗=

δy+12 , ou ainda δy = 2δy∗

− 1. Sabemosque µ∗

= E(δy∗) = 12E(δy)+ 1

2 . Então, para calcular o impacto da covariável δG AST Osobre a diferença entre as proporções de votos do presidente nos segundos turnos daseleições presidenciais nos anos de 2002 e 2006, precisamos levar em consideração taltransformação, ou seja,

∂E(δyt )

∂δG AST Ot=

∂E(2δy∗

t −1)

∂δG AST Ot= 2

∂E(δy∗

t )

∂δG AST Ot= 2

∂µ∗

t

∂δG AST Ot,

em que

µ∗

t = g−1(β0 +β1δG AST Ot +β2G I N It +β3RE ND At +β4GOV PTt

+β5PRE F PTt +β6U RBt +β7 AN ALFt +β8RE ND A2t ).

Para mensurar este impacto, consideramos algumas situações diferentes, são elas:a covariável RE ND A é fixada no primeiro, segundo e terceiro quartis, enquanto queas outras covariáveis são fixadas na mediana, exceto as covariáveis δG AST O, GOV PTe PRE F PT . Consideramos o método bootstrap paramétrico para cada obtenção do

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 16

erro-padrão associado a cada impacto. Para este cálculo consideramos 1000 réplicasde bootstrap. Sumarizamos a seguir o procedimento bootstrap adotado.

(1) Para cada t = 1, . . . ,n, geramos y∗

t da densidade beta com parâmetros µt e σt .(2) Estimamos a regressão beta usando como resposta y∗

= (y∗

1 , . . . , y∗

n ) conjunta-mente com os regressores originais.

(3) Considerando as estimativas obtidas no item anterior, calculamos o impactoda covariável δG AST O, ou seja, estimamos

∂E(δyt ,b )

∂δG AST Ot=

∂E(2δy∗

t ,b −1)

∂δG AST Ot= 2

∂E(δy∗

t ,b )

∂δG AST Ot.

(4) Repetimos os passos (1) a (3) B vezes.(5) Considerando os 1000 impactos estimados, calculamos a raiz quadrada de sua

variância, ou seja, o erro-padrão.

A covariável δG AST O foi fixada em zero, e as duas covariáveis dummies foram fixa-das em zero e um, alternadamente. Várias conclusões podem ser extraídas da Tabela5. No cenário em que nem o governador e nem o prefeito eram do PT, isto é, as co-variáveis GOV PT e PRE F PT assumem valor zero, e quando menos de 25% dos mu-nicípios considerados tinham renda per capita menor do que R$ 30.43, temos que umaumento de um bilhão de reais nos gastos assistenciais conduz a um aumento médiode votação de 1.213%, o erro-padrão associado a este impacto sendo de apenas 0.263.Vale destacar que em 2006 foram gastos 5.864 bilhões de reais a mais do que em 2002.Assim, o aumento de 5.864 bilhões de reais acarretou um aumento médio na votaçãodo presidente Lula de 7.113%. Considerando este mesmo cenário, mas levando emconsideração os municípios que apresentam renda per capita superior a R$ 236.90, oaumento médio é um pouco maior: 7.342%. Em todos os casos considerados, pode-mos notar que o erro-padrão obtido através do método boostrap é pequeno.

TABELA 5. Impactos estimados da diferença entre gastos nos programasassistenciais em 2006 e 2002, em bilhões de reais, sobre a resposta médiae respectivos erros-padrão obtidos via bootstrap.

Situações RENDA=Q1/4 RENDA=Q2/4 RENDA=Q3/4

GOVPT=0, PREFPT=0 1.213 (0.263) 1.241 (0.269) 1.252 (0.272)GOVPT=1, PREFPT=1 1.250 (0.271) 1.251 (0.271) 1.235 (0.267)GOVPT=1, PREFPT=0 1.247 (0.270) 1.252 (0.272) 1.242 (0.269)GOVPT=0, PREFPT=1 1.223 (0.266) 1.246 (0.271) 1.253 (0.272)

Com o intuito de verificar possíveis afastamentos das suposições feitas para o mode-lo, a Figura 2 apresenta os gráficos dos resíduos ponderados padronizados 2 versus osíndices das observações e também o gráfico da probabilidade normal com envelopessimulados. O modelo de regressão parece estar bem ajustado, dado que apenas 24

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 17

resíduos encontram-se fora dos limites (−3,3); isto corresponde a menos de 1% donúmero total de municípios considerados neste estudo. Uma vez que os resíduos, emgeral, permanecem dentro das bandas de confiança dos envelopes simulados, não háindícios de afastamento da suposição de que o modelo de regressão beta é adequadopara os dados.

0 1000 2000 3000 4000

−4

−2

02

4

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++

++++++++++++++++++++++

+++++++++++++

++++++

+++

+

+

0 1 2 3

01

23

45

FIGURA 2. Gráfico dos resíduos ordinários padronizados 2 versus osíndices das observações e gráfico da probabilidade normal com en-velopes simulados.

Com o objetivo de complementar a análise de resíduos realizada anteriormente,construímos os gráficos da distância de Cook versus os valores preditos e da alavan-cagem generalizada versus valores preditos, que estão apresentados na Figura 3. No-tamos que no gráfico da distância de Cook a observação 51, que corresponde ao mu-nicípio de Águas de São Pedro, encontra-se destacada das demais. No gráfico da ala-vancagem generalizada, duas observações se destacam em relação às demais, são elas:51 e 3680, que correspondem aos municípios de Águas de São Pedro e São Paulo, res-pectivamente. Vale destacar que o maior valor da diferença entre a soma dos gastoscom programas assistenciais e no Bolsa-Família em 2006 e a soma dos programas as-sistenciais em 2002 corresponde ao município de São Paulo e o menor valor, a Águas deSão Pedro. Excluímos individualmente as observações 51 e 3680, contudo as variaçõespercentuais nas estimativas dos parâmetros foram relativamente pequenas.

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 18

0.3 0.4 0.5 0.6 0.7 0.8 0.9

02

46

810

µ

51

0.3 0.4 0.5 0.6 0.7 0.8 0.9

0.0

0.1

0.2

0.3

0.4

µ

368051

FIGURA 3. Gráficos da distância de Cook e da alavancagem generalizada.

4.2. Proporção de votos válidos do presidente Lula em 2006. No segundo modelode regressão beta considerado a variável resposta (y) é a proporção de votos válidosdo presidente Lula no segundo turno da eleição de 2006. As covariáveis selecionadasforam G AST O, RE ND A, GOV PT , U RB , AN ALF , NBR ANCO, PE NT e o logaritmoda covariável POP2005 (log POP2005). Vale destacar que a covariável G AST O repre-senta a soma dos gastos nos programas assistenciais remanescentes e no Bolsa-Famíliaem 2006. Aqui, o valor mínimo assumido pela variável resposta é 0.196 e o máximo,0.959. Para este estudo foram considerados 4191 municípios brasileiros. É importantedestacar que todas as covariáveis selecionadas são significantes aos níveis nominaisusuais. A Figura 4 apresenta o histograma e o box-plot da variável resposta. É pos-sível notar que a distribuição da proporção de votos válidos do presidente Lula é as-simétrica.

O modelo selecionado é dado por

logit(µt ) =β0 +β1G AST Ot +β2RE ND At +β3GOV PTt +β4U RBt +β5 AN ALFt

+β6NBR ANCOt +β7log POP2005t +β8PE NTt ,

logit(σt ) = γ0 +γ1U RBt +γ2NBR ANCOt +γ3PE NTt ,

t = 1, . . . ,4191.Na Tabela 6 estão apresentados os coeficientes estimados do modelo regressão beta.

De acordo com os resultados apresentados a seguir, as covariáveis G AST O,U RB , AN ALF ,

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 19

δy

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

0.2 0.4 0.6 0.8

δy

FIGURA 4. Histograma e box-plot da proporção de votos válidos dopresidente Lula no segundo turno da eleição presidencial de 2006.

NBR ANCO e log POP2005 exercem efeito positivo sobre a proporção dos votos váli-dos do presidente Lula em 2006, ao passo que covariáveis RE ND A, GOV PT e PE NTexercem efeito negativo. Tudo mais permanecendo constante, a votação de Lula é su-perior em municípios com maior participação de negros, pardos e índios na popu-lação, o que era de se esperar dado o apelo de seu primeiro governo no diz respeitoàs desigualdades raciais (Zucco, 2008). Os municípios que apresentam maiores pro-porções de analfabetos tendem a apresentar maiores proporções de votos para o pres-idente. Assim como na Seção 4.1, dentre as covariáveis selecionadas, a que menosexerce influência sobre a variável resposta é a renda per capita. Considerando a es-trutura de regressão para o parâmetro de dispersão, à medida que a covariável U RBdiminui, a dispersão diminui, ou seja, os municípios que apresentam menores taxa deurbanização tendem a apresentar votações menos dispersas.

No nosso estudo, o efeito da covariável G AST O em programas assistenciais remanes-centes e no Bolsa-Família foi um pouco maior do que em Canêdo–Pinheiro (2010) eZucco (2008). Os dois autores consideram a variável resposta como sendo a proporçãode votos de Lula, contudo, diferentemente deste artigo e de Canêdo–Pinheiro (2010),Zucco (2008) considerou o resultado da eleição no primeiro turno e concluiu que oaumento de um ponto percentual no número de beneficiários do programa Bolsa-Família eleva em 0.358 ponto percentual a votação de Lula. Em Canêdo–Pinheiro(2010) este incremento é um pouco maior (0.548).

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 20

TABELA 6. Estimativas pontuais e p-valores. Proporção de votos válidosdo presidente Lula em 2006.

Covariável β p-valor γ p-valorINTERCEPTO −0.482 0.000 −1.457 0.000G AST O 0.010 0.000 — —RE ND A −0.003 0.000 — —GOV PT −0.315 0.000 — —U RB 0.242 0.000 −0.289 0.000AN ALF 1.297 0.000 — —NBR ANCO 1.021 0.000 0.523 0.000log POP2005 0.071 0.000 — —PE NT −1.402 0.000 1.386 0.000

Aqui também calculamos o impacto da covariável G AST O, em bilhões de reais, so-bre a votação do presidente Lula em 2006 e o seu respectivo erro-padrão obtido viabootstrap. Os resultados referentes a este impacto encontram-se na Tabela 7. Paramensurar este impacto consideramos o cenário em que o governador do municípioera do PT (GOV PT = 1) bem como o cenário em que o governador não era do PT(GOV PT = 0); além disso, consideramos a covariável RE ND A fixada no primeiro, nosegundo e no terceiro quartis; por fim, consideramos que as outras covariáveis sãofixadas nas suas respectivas medianas, exceto a covariável G AST O, que é fixada emzero. No cenário em que o governador não era do PT, isto é, a covariável GOV PT as-sume valor zero, e menos de 25% dos municípios considerados têm renda per capitamenor do que R$ 30.43, temos que um aumento de um bilhão de reais nos gastos con-duz a uma aumento médio de votação de 4.624% com erro-padrão igual a 0.903. Con-siderando este mesmo cenário, mas levando em consideração os municípios em queapresentam renda per capita superior a R$235.50, o aumento médio na votação de Lulaé aproximadamente 1% menor do que no caso anterior. De acordo com os resultadosapresentados, o fato do governador pertencer ao PT contribui de forma negativa paraa votação do candidato Lula. Ao considerarmos a situação em GOV PT = 1, temos queo impacto da covariável G AST O é menor do que quando consideramos a situação emque GOV PT = 0, mas vale ressaltar que na prática este efeito teve pouca influência noresultado final, na medida em que em 2006 o PT governava apenas três Estados (Acre,Piauí e Mato Grosso do Sul), como notado por Canêdo–Pinheiro (2010).

Tomando o Brasil como um todo, Canêdo–Pinheiro (2010) conclui que o efeito doprograma Bolsa-Família sobre a votação do presidente Lula em 2006 foi de três pontospercentuais. De acordo com a Tabela 7, temos que o impacto do gasto em programasassistenciais remanescentes e no Bolsa-Família foi maior do que 3% na votação dopresidente Lula, exceto na situação em que consideramos que o governador do Estadoera filiado ao PT e os municípios com renda per capita maior do que R$ 954.60.

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 21

TABELA 7. Impactos estimados do gasto no Bolsa-Família e nos progra-mas assistenciais em 2006 sobre a resposta média e respectivos erros-padrão obtidos via bootstrap.

Situações RE ND A =Q1/4 RE ND A =Q2/4 RE ND A =Q3/4

GOVPT=0 4.624 (0.903) 4.083 (0.794) 3.549 (0.689)GOVPT=1 3.680 (0.725) 3.164 (0.621) 2.675 (0.524)

A Figura 5 apresenta o gráfico dos resíduos ponderados padronizados 2 versus osíndices das observações, bem como o gráfico de probabilidade normal com envelopessimulados. A partir desta figura, podemos observar que, apesar de apenas poucos resí-duos se encontrarem fora dos limites (−3,3), observando o gráfico do envelope temosque o modelo não apresenta um ajuste tão bom quanto o modelo apresentado naseção anterior. O pseudo R2 é 0.592. Para complementar a avaliação do modelo ajus-tado, construímos os gráficos da distância de Cook versus os valores preditos e da ala-vancagem generalizada versus os valores preditos, que estão apresentados na Figura 6.Através dos gráficos da distância de Cook e da alavancagem generalizada, a observação3652, que corresponde ao município de São Paulo, encontra-se destacada das demais.É importante destacar que, em 2006, nos 4191 municípios avaliados foram gastos 6.309bilhões de reais em programas assistenciais, sendo que pouco mais de 130 milhões dereais gastos no município de São Paulo.

4.3. Número de votos válidos do presidente Lula em 2006. Na terceira avaliação, uti-lizamos o modelo de regressão linear. Aqui, a variável de interesse, y , é o número devotos válidos que o presidente Lula recebeu no segundo turno da eleição de 2006 pormunicípio. As covariáveis selecionadas pelo critério de seleção AIC foram G AST O,G I N I , RE ND A, U RB , AN ALF , LOGPOP2005, PE NT e NBR ANCO.

O modelo selecionado para descrever a relação entre a variável dependente e os re-gressores é da forma

E(yt ) =β0 +β1G AST Ot +β2G I N It +β3RE ND At +β4U RBt

+β5 AN ALFt +β6log POP2005t +β7PE NTt +β8NBR ANCOt ,

t = 1, . . . ,4191. Os parâmetros lineares do modelo acima foram estimados através dométodo de mínimos quadrados ordinários. De acordo com o teste de Koenker, aosníveis usuais de significância, rejeitou-se a hipótese de que a variância dos erros domodelo acima são iguais, ou seja, o modelo selecionado é heteroscedástico. Sendoassim, o estimador usual da matriz de covariâncias não é mais consistente nem não-viesado para a matriz de covariâncias de β, portanto, é importante considerar esti-madores consistentes mais confiáveis. Um estimador consistente da matriz de cova-riâncias de β foi proposto por Davidson & MacKinnon (1993), denotado por HC3. Oestimador HC3 é dado por

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 22

0 1000 2000 3000 4000

−4

−2

02

4

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

++++++++++++++++++++++++++++++++++++++++++

+++++++++++++++++++

++++++

++

0 1 2 3

01

23

45

6

FIGURA 5. Gráfico do resíduos ordinários padronizados 2 versus índicedas observações e gráfico da probabilidade normal com envelopes si-mulados.

HC3= (X T X )−1 X TΨ3X (X T X )−1, (4.1)

em que Ψ3 = diag{

e21

(1−h1)2 , . . . ,e2

n(1−hn )2

}, sendo et = yt − yt o t-ésimo resíduo e ht o t-

ésimo elemento diagonal da matriz X (X T X )−1 X .Na Tabela 8 apresentamos as estimativas pontuais dos β’s e os respectivos p-valores

calculados a partir da estatística de teste baseada no estimador HC3. Temos que umaumento de um milhão de reais na covariável G AST O conduz a um aumento médiode aproximadamente 15,816 votos. As covariáveis G I N I , U RB e log POP2005 apre-sentam relação inversa com a variável resposta, ou seja, estas covariáveis contribuemnegativamente para o incremento do número de votos de Lula em 2006. Por exemplo,um aumento de um ponto percentual na população que vive em áreas urbanas conduza um decréscimo médio de mais de sete mil votos. Em contrapartida, um aumento deum ponto percentual no montante de analfabetos entre pessoas acima de 15 anos deidade conduz a um aumento médio de mais de 27 mil votos. Podemos ainda destacar

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 23

0.3 0.4 0.5 0.6 0.7 0.8 0.9

01

23

45

µ

3652

0.3 0.4 0.5 0.6 0.7 0.8 0.9

0.00

0.05

0.10

0.15

0.20

0.25

0.30

µ

3652

FIGURA 6. Gráficos de distância de Cook e alavancagem generalizada.

que, de acordo com o modelo estimado, há indícios de que existe intensa populari-dade do presidente entre pessoas que declaram ser não-brancas e também pessoasde orientação pentecostal, pois as covariáveis relacionadas a essas duas característi-cas citadas contribuíram de forma positiva. Diferentemente das modelagens anterio-res, a covariável RE ND A contribuiu de forma positiva para a votação do presidenteem 2006. Para cada real de aumento, em média, da renda per capita, há um incre-mento médio de aproximadamente 158 votos a favor do presidente Lula. Ao nível designificância 10%, todas as covariáveis selecionadas para explicar o número de votosválidos do presidente Lula em 2006 são significativas.

Aqui o coeficiente de determinação, R2, mede a proporção da variabilidade do nú-mero de votos válidos do presidente Lula na eleição de 2006 (y) que pode ser explicadaao se levar em consideração o efeito das variáveis explicativas selecionadas. Esse coefi-ciente varia de 0 a 1, zero indicando ausência de correlação e um a correlação perfeita.Na nossa modelagem obtivemos R2

= 0.81.

5. CONCLUSÕES

Neste artigo consideramos três estratégias diferentes de modelagem para avaliar oefeito do aumento nos gastos com programas assistenciais sobre a reeleição do presi-dente Lula em 2006. Nos dois primeiros enfoques, utilizamos o modelo de regressãobeta, dado que a variável resposta é uma proporção. De início, modelamos a diferençaentre as proporções de votos do presidente Lula nos segundos turnos das eleições de

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 24

TABELA 8. Estimativas pontuais e p-valores. Votos válidos presidenteLula na eleição de 2006.

Covariável β p-valorINTERCEPTO 92359.24 0.027G AST O 15816.30 0.000G I N I −59434.38 0.000RE ND A 158.36 0.000U RB −7169.90 0.013AN ALF 27809.47 0.088log POP2005 −11286.80 0.024PE NT 31862.50 0.010NBR ANCO 7607.94 0.022

2006 e 2002. Durante o primeiro mandato houve uma queda de popularidade do presi-dente, mas no início de 2006 a popularidade voltou a subir e o presidente foi reeleito nosegundo turno da eleição de 2006. Contudo, estudos mostram que o perfil dos eleitoresdo presidente reeleito mudou. Na sua primeira vitória, Lula apresentou melhor de-sempenho nas regiões mais urbanizadas e mais desenvolvidas e em 2006 o voto mi-grou para lugares mais atrasados e menos urbanizados. No segundo turno da eleiçãode 2006, Lula disputou com Geraldo Alckmin, candidato do PSDB, que obteve maiorproporção de votos do que o candidato do PT em apenas sete estados. A partir desteresultado, vimos que quanto mais se gastou em 2006 em relação a 2002, ou seja, maiorfoi a diferença entre os gastos nos programas assistenciais de 2006 e 2002, maior foi adiferença entre a proporção de votos dos candidatos Lula e Alckmin. Vale ressaltar queem 2006 foram gastos pouco mais do que 6 bilhões de reais em programas assisten-ciais remanescentes e no Bolsa-Família enquanto que em 2002 gastou-se um poucomais de 451 milhões de reais. Além disso, em 2002 só existiam três programas assis-tenciais: Bolsa-Escola, Auxílio-Gás e Cartão-Alimentação. Assim sendo, calculamos oimpacto da diferença entre os gastos em programas assistenciais em 2006 e 2002 so-bre a resposta média, que neste caso foi a diferença entre as proporções de votos em2006 e 2002 do presidente Lula. Considerando o cenário em que nem o prefeito e nemgovernador eram do PT, concluímos que um aumento de um bilhão de reais conduz aum aumento médio de 1.213% na votação recebida pelo candidato Lula. Assim, o au-mento de 5.864 bilhões em gastos assistenciais acarretou aumento médio na votaçãodo presidente Lula de 7.11%.

Na segunda modelagem, a nossa variável de interesse foi a proporção de votos dopresidente Lula no segundo turno da eleição de 2006. Algumas covariáveis foram se-lecionadas para explicar seu comportamento, com destaque para a covariável que re-presenta o gasto nos programas assistenciais em 2006. Os nossos resultados revelaram

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 25

que um aumento de um bilhão de reais nos gastos com programas assistenciais con-duz a um aumento médio de votação de 4.62%. Podemos destacar ainda que a votaçãode Lula foi superior em municípios com maior participação de negros, pardos e índios.Além disso, os municípios que apresentam maiores proporções de analfabetos tendema contribuir mais expressivamente para a votação do presidente Lula.

Por fim, no último enfoque, a variável resposta foi a quantidade de votos válidosdo presidente no segundo turno da eleição de 2006. Diferentemente dos outros casosapresentados, aqui utilizamos o modelo de regressão linear, dado que a variável res-posta não é uma proporção. Dentre as covariáveis selecionadas para explicar a quanti-dade de votos, destacamos o gasto com programas assistenciais e concluímos que umaumento de um bilhão de reais nos gastos com programas assistenciais conduz a umaumento médio de quase 15 milhões de votos a favor do presidente Lula.

AGRADECIMENTOS

Os autores agradecem a César Zucco pelo compartilhamento da base de dados uti-lizada neste artigo. Os autores agradecem ainda o apoio financeiro da FAPESB e doCNPq.

REFERÊNCIAS

[1] Akaike, H. (1974). A new look at the statistical model identification. IEEE Transactions on AutomaticControl, 19, 716–723.

[2] Canêdo–Pinheiro, M. (2010). Bolsa família ou desempenho da economia? Determinantes dareeleição de Lula em 2006. Texto para discussão, ?.

[3] Carraro, A.; Araujo–Junior, A. F.; Shikida, C. D; Monasterio, L. M.; Damé, O. M. (2009). "It is theeconomy, companheiro!": an empirical analysis of re-election based on municipal data. EconomicsBulletin, 29, 977–992.

[4] Cook, R.D. (1977). Detection of influential observations in linear regression. Technometrics, 19,15–18.

[5] Cook, R.D. (1986). Assessment of local influence (with discussion). Journal of the Royal StatisticalSociety B, 48, 133–169.

[6] Davidson, R.; MacKinnon, J.G. (1993). Estimation and Inference in Econometrics. New York: OxfordUniversity Press.

[7] Espinheira, P. L. (2007). Regressão Beta. Tese de doutorado, Departamento de Estatística, Universi-dade de São Paulo.

[8] Espinheira, P.L.; Ferrari, S.L.P.; Cribari-Neto, F. (2008a). On beta regression residuals. Journal of Ap-plied Statistics, 35, 407–419.

[9] Espinheira, P.L.; Ferrari, S.L.P.; Cribari-Neto, F. (2008b). Influence diagnostics in beta regression.Computational Statistics and Data Analysis, 52, 4417–4431.

[10] Ferrari, S. L. P.; Cribari-Neto, F. (2004). Beta regression for modeling rates and proportions. Journalof Applied Statistics, 31, 799–815.

[11] Hunter, W.; Power, T. J. (2007). Rewarding Lula: Executive Power, Social Policy, and the BrasilianElections of 2006. Latin American Politics and Society, 49, 1–30.

[12] Kieschnick, R.; McCullough, B. D. (2003). Regression analysis of variates observed on (0,1): percent-ages, proportions and fractions. Statistical Modelling, 3, 193–213.

ELEIÇÃO PRESIDENCIAL DE 2006 NO BRASIL 26

[13] Koenker, R. (1981). A note on studentizing a test for heteroscedasticity. Journal of Econometrics, 17,107–112.

[14] Marques, R. M.; Leite, M. G.; Mendes, A.; Ribeiro, J. (2009). Discutindo o papel do Programa BolsaFamília na decisão das eleições presidenciais brasileiras de 2006. Revista de Economia Política, 29,114–132.

[15] McCullagh, P.; Nelder, J. A. (1989). Generalized Linear Models, 2nd ed. London: Chapman and Hall.[16] Ospina, R.; Cribari–Neto, F.; Vasconcellos, K. L. P. (2006). Improved point and interval estimation

for a beta regression model. Computational Statistics and Data Analysis, 51, 960–981.[17] Paolino, P. (2001). Maximum likelihood estimation of models with beta-distributed dependent vari-

ables. Political Analysis, 9, 325–346.[18] Simas, A. B.; Barreto-Souza, W.; Rocha, A. V. (2009). Improved estimators for a general class of beta

regression models. Computational Statistics and Data Analysis, a aparecer.[19] Smithson, M.; Verkuilen, J. (2006). A better lemon-squeezer? Maximum likelihood regression with

beta–distribuited dependent variables. Psychological Methods, 11, 54–71.[20] Stasinopoulos, D. M.; Rigby, R. A.; Akantziliotou, C. (2006). Instructions on how to use

the GAMLSS package in R. Accompanying documentation in the current GAMLSS help files(http://www.gamlss.com).

[21] Zucco, C. (2008). The President’s ’New’ Constituency: Lula and the Pragmatic Vote In Brazil’s 2006Presidential Elections. Journal of Latin American Studies, 40, 29–39.

DEPARTAMENTO DE ESTATÍSTICA, UNIVERSIDADE FEDERAL DA BAHIA, CAMPUS ONDINA, SALVADOR/BA,50740–540, BRAZIL

E-mail address, T. C. Souza: [email protected]

DEPARTAMENTO DE ESTATÍSTICA, UNIVERSIDADE FEDERAL DE PERNAMBUCO, CIDADE UNIVERSITÁRIA,RECIFE/PE, 50740–540, BRAZIL

E-mail address, F. Cribari–Neto: [email protected], F. Cribari–Neto: http://www.de.ufpe.br/~cribari