185
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO PUC-SP Mamerto Granja Garcia O PROCESSO ELEITORAL: Eleitores e Candidatos Análise quantitativa nas Ciências Sociais: limites e possibilidades DOUTORADO EM CIÊNCIAS SOCIAIS São Paulo 2013

DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

PUC-SP

Mamerto Granja Garcia

O PROCESSO ELEITORAL: Eleitores e Candidatos

Análise quantitativa nas Ciências Sociais: limites e possibilidades

DOUTORADO EM CIÊNCIAS SOCIAIS

São Paulo

2013

Page 2: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

PUC-SP

Mamerto Granja Garcia

O PROCESSO ELEITORAL: Eleitores e Candidatos

Análise quantitativa nas Ciências Sociais: limites e possibilidades

DOUTORADO EM CIÊNCIAS SOCIAIS

Tese apresentada à Banca Examinadora da

Pontifícia Universidade Católica de São Paulo,

como exigência parcial para obtenção do título de

Doutor em Ciências Sociais, Área de

Concentração Política, sob a orientação do

Professor Doutor Miguel W. Chaia.

São Paulo

2013

Page 3: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

BANCA EXAMINADORA

Page 4: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

Dedicatória

A meus pais, Mamerto (in memoriam) e

Manolvina, por acreditarem.

À minha companheira, Lucilene, pelo apoio

incondicional.

Aos meus queridos filhos, Gustavo e

Guilherme, pelo constante estímulo.

Page 5: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

AGRADECIMENTOS

Na minha infância e parte da adolescência, estive inserido em um

círculo social repleto de figuras caricatas e inesquecíveis. Meu pai, um

imigrante espanhol, chegou ao Brasil em 1955, com a idade de 27 anos.

Deixou para trás (e nunca mais retornou) as Ilhas Canárias, região formada por

sete ilhas vulcânicas tendo o vulcão El Teide como o principal, com quase

4.000 metros acima do nível do mar. Região pertencente à Espanha, próxima

da costa africana do Oceano Atlântico, fica muito distante da Península Ibérica,

e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de

sobrevivência levou muitos “Canários”, assim chamados os seus habitantes, a

buscarem uma nova vida fora das ilhas. Meu pai abandonou sua terra natal na

esperança de encontrar uma vida melhor não no Brasil, mas na Venezuela,

considerada a terra das oportunidades, onde se poderia enriquecer com

facilidade. Infelizmente, para o meu pai, devido a uma política de cotas de

imigração, não foi possível imigrar para a Venezuela e decidiu vir ao Brasil com

a esperança de depois se mudar para a “vizinha” Venezuela. Não tinha noção

da imensidão das terras sul-americanas. Acabou ficando no Brasil até o fim da

vida.

Pobre e com pouca instrução, não teve outra opção a não ser trabalhar

duro na lavoura em terras arrendadas na periferia do Município de São Paulo,

próximo onde hoje fica o Parque Estadual do Pico do Jaraguá. Foi ai que

conheceu minha mãe, uma jovem brasileira que, como tantas outras da sua

época, enfrentava uma vida rude na lavoura. Sem nunca ter frequentado uma

sala de aula, trabalhava com uma enxada o dia todo, cumprindo as chamadas

“tarefas”, as quais correspondiam a uma área pré-determinada para capinar.

Minha mãe sempre possuiu uma energia e força impressionantes, nunca se

deixando abater pelos percalços que a vida produzia. Cheguei a participar

Page 6: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

desse meio rural, acompanhando a luta dos meus pais na lavoura. Lembro-me

perfeitamente das plantações de cenoura, cebola, tomates, milho e mandioca.

Apesar da vida simples, havia uma riqueza cultural extensa, composta

de uma mistura de Brasil e Espanha. Meu pai era um exímio cozinheiro e no

final de semana o cardápio do almoço quase sempre era composto das

comidas típicas da região que meu pai vivia na Espanha. Nunca me esqueço

da cazuela, uma espécie de sopa de peixes, e do gofio, farinha de trigo

extremamente fina e torrada para ser adicionada à sopa.

Esse convívio social era partilhado intensamente com vizinhos,

principalmente nas datas festivas tais como natal, ano novo e festas juninas.

Com o tempo e após muito trabalho árduo, meus pais deixaram a

lavoura para trás e iniciaram um pequeno comércio, uma mistura de bar e

mercearia. Nessa fase a família aumentou com o nascimento da minha querida

irmã, carinhosamente chamada de “Niña” (pequenina), apelido que persiste até

hoje. Nesse ambiente de bar conheci pessoas que influenciaram e moldaram

parte da minha concepção de vida. Essa convivência com pessoas de lugares

distantes e culturas variadas, um clima que somente o ambiente de bar poderia

proporcionar, permitiu que eu construísse uma visão mais realista da natureza

humana do que muitos da minha idade. Nesse ambiente as pessoas expõem

seus problemas, seus traumas, suas angústias e também suas alegrias, tudo

potencializado pelo efeito inebriante das bebidas alcóolicas.

Desde cedo senti a necessidade de compreender o desconhecido,

sentindo uma forte atração pelas ciências exatas, principalmente a física.

Encontrava nas leis matemáticas, que buscavam delinear modelos funcionais

da realidade, uma sensação de que tudo poderia ser explicado, ser

determinado, desde que pudéssemos encontrar a equação certa. Puro delírio

de uma mente inexperiente.

Foi na minha adolescência, por volta dos 15 anos, que tive meu primeiro

contato com uma realidade invisível aos olhos na vida cotidiana. Influenciado

Page 7: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

pelas discussões de bar, chegou a minhas mãos um livro que foi um verdadeiro

sucesso na época, “Eram os deuses astronautas?”, do escritor suíço Erich Von

Däniken. Nesse livro o autor faz varias considerações inusitadas (para não

dizer fantasiosas) a respeito de visitações de seres extraterrestres ao nosso

planeta no passado. Na verdade o que mais me chamou a atenção foram

alguns trechos do capítulo II, no qual se discutia a teoria da relatividade e

tentava explicar o que era a dilatação do tempo. Quando soube que a

relatividade era um fato e não mera fantasia do escritor, fiquei chocado.

Percebi, naquele momento, que a realidade apresentada à nossa frente não é

bem o que parece. Fiquei impressionado ao saber que o tempo, tal como o

concebemos no dia a dia é, na verdade, o produto da situação específica que

nos cerca, não tendo, necessariamente, o mesmo comportamento em outra

região do Universo. Vemos apenas uma casca, e que o conhecimento

completo da realidade provavelmente seja algo impossível.

Esse breve resumo autobibliográfico serve para evidenciar a minha

convicção de que somos moldados por pessoas singulares que, por pura sorte

ou destino, entram no momento exato da nossa vida.

Agradeço aos meus pais, sempre solícitos, amorosos e éticos. Sinto-me

compelido a agradecer àquelas pessoas especiais, as quais tive o privilégio de

conhecer nas várias fases da minha vida. Pessoas na grande maioria muito

simples, mas com uma riqueza de espírito imensurável.

Na vida acadêmica, como professor ou como aluno, conheci pessoas

extraordinárias, incentivadoras e amigas, que me apoiaram e trouxeram novas

oportunidades de desenvolvimento pessoal. A elas o meu sincero

agradecimento.

Agradeço à minha família, esposa e filhos pela busca permanente da

harmonia no lar. Pela paciência e compreensão nos momentos difíceis e pelo

apoio, abrindo mão de muitos momentos que poderíamos estar juntos para

permitir que eu chegasse aqui.

Page 8: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

RESUMO

Compreender o processo eleitoral e identificar as variáveis

explicitamente ou implicitamente envolvidas continua sendo um campo repleto

de mistérios tão obscuros quanto a mente humana. Os fatores psicossociais

despertados no período eleitoral remetem o pesquisador a um ambiente repleto

de simbologias, as mais inusitadas emoções e interesses diversos que

compreendem uma busca empreendida pelo eleitor, aparentemente racional,

no sentido de encontrar convergência entre seus anseios pessoais e as

características do potencial representante.

Este trabalho tem como objetivo delinear considerações sobre o tema

com base em uma análise do comportamento do eleitor a partir de três fatores

que se destacam durante o processo eleitoral: a indecisão, a continuidade e o

candidato. A indecisão será analisada a partir do levantamento dos eleitores

indecisos apontados em diversas pesquisas eleitorais. Demonstra-se que pelo

simples fato de se situar no estrato dos indecisos, o eleitor apresenta

tendências de voto para determinado candidato. No tópico continuidade e

candidato, avalia-se a questão dos parlamentares que se mantem no cargo

eletivo por longos períodos, através de sucessivas reeleições e como

complemento, é feita uma análise do perfil do candidato e seus efeitos na

decisão do eleitor.

Para todas essas questões, são utilizados modelos quantitativos

apropriados, os quais buscam criar uma ponte entre a pesquisa nas Ciências

Sociais e a análise das observações por meio de ferramentas estatísticas.

Palavras-chave: Comportamento do eleitor, métodos quantitativos, modelos estatísticos.

Page 9: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

ABSTRACT

Understand the electoral process and to identify the variables explicitly or

implicitly involved remains a field full of mysteries as dark as the human mind.

Psychosocial factors awakened in the election period refer the researcher to an

environment full of symbols , the most unusual emotions and diverse interests

that include a search undertaken by the voter , apparently rational , in order to

find convergence between their personal aspirations and potential

characteristics representative .

This paper aims to outline considerations on the subject based on an

analysis of voter behavior from three factors that stand out during the election

process: indecision, the continuity and the candidate. Indecision will be

analyzed from a survey of undecided voters indicated in several polls. It is

demonstrated that the simple fact of being located in the stratum of the

undecided voter presents trends vote for a particular candidate. On the topic

continuity and candidate assesses the issue of parliamentarians that keeps on

elective position for long periods, through successive re-elections, and in

addition, an analysis of the candidate's profile and its effect on the voter's

decision.

To all these questions, appropriate quantitative models are used, which

seek to create a bridge between research in the social sciences and the

analysis of observations by means of statistical.

Key words: Voter behavior, quantitative methods, statistical models.

Page 10: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

SUMÁRIO

LISTA DE FIGURAS ................................................................................................................ 12

LISTA DE TABELAS ................................................................................................................ 13

Introdução .................................................................................................................................... 1

Capítulo 1................................................................................................................................... 17

Métodos Empíricos nas Ciências Sociais. ............................................................................ 17

Capítulo 2................................................................................................................................... 43

Comportamento do Eleitor Paulistano na Eleição para Prefeito em 2008. Uma

abordagem usando os conceitos de Campo e Habitus de Pierre Bourdieu. .................. 43

2.1 As eleições de 2008 e o cenário político na Cidade de São Paulo. ...................... 43

2.2 O comportamento do eleitor paulistano, uma analogia aos conceitos de campo e

habitus de Pierre Bourdieu. ................................................................................................ 55

2.3 A dinâmica dos campos: uma proposta de modelagem. ......................................... 61

2.4 Avaliação dos campos pela análise de correspondência ........................................ 69

2.4.1 Campo Escolaridade .............................................................................................. 69

2.4.2 Campo Renda ......................................................................................................... 76

2.4.3 Campo Faixa Etária ................................................................................................ 78

2.4.4 Campo Religioso .................................................................................................... 80

Capítulo 3................................................................................................................................... 85

Eleições para Prefeito de São Paulo em 2008: A questão das declarações incompletas

dos eleitores nas pesquisas eleitorais e como estas podem ser “tratadas” a partir da

criação de modelos estatísticos adequados. ....................................................................... 85

3.1 Conceituação de Dados Incompletos ......................................................................... 85

3.2 Modelos Estatísticos para dados omissos ou incompletos ..................................... 87

3.3 Apresentação do Problema .......................................................................................... 91

3.4 Modelando o Problema ................................................................................................. 92

3.5 Estimação dos Parâmetros .......................................................................................... 96

3.6 Aplicação nos Problemas Propostos ........................................................................ 102

3.3.1 Variável Idade ....................................................................................................... 102

3.3.2 Variável Escolaridade .......................................................................................... 110

3.3.2 Variável Renda...................................................................................................... 113

Capítulo 4................................................................................................................................. 118

Page 11: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

Reeleição e Perfil do Candidato: Eleições proporcionais e modelos que possam

apontar a probabilidade do candidato ser reeleito em função das diversas variáveis

explicativas previamente estabelecidas. ............................................................................ 118

4.1 Introdução .................................................................................................. 118

4.2 O fenômeno da reeleição dentro do sistema eleitoral ................................. 121

4.3 Proposta de modelagem estatística .................................................................... 129

Capítulo 5................................................................................................................................. 136

O perfil do candidato e o comportamento do eleitor: eleições para vereador no Estado

de São Paulo em 2012. ......................................................................................................... 136

5.1 Partidos políticos e a participação da mulher .......................................................... 137

5.2 As profissões e os candidatos .................................................................................. 141

5.3 Candidatos: escolaridade, estado civil e faixa etária. ............................................ 143

5.4 Modelagem Estatística do Perfil do Candidato e a Escolha do Eleitor ........ 147

Considerações Finais ............................................................................................................ 155

Apêndices ................................................................................................................................ 165

A.1 Código R referente ao capítulo 3 .................................................................................. 165

Bibliografia ............................................................................................................................... 167

Page 12: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

LISTA DE FIGURAS

Figura 1: Exemplo de modelo funcional. Ajuste de uma reta. ........................................... 26

Figura 2: Exemplo de modelo funcional. Ajuste de uma função senoidal. ................................. 30

Figura 3: Proporção de avaliações negativas dos candidatos Gilberto Kassab e Marta

Suplicy. ....................................................................................................................................... 53

Figura 4: Proporção de avaliações positivas dos candidatos Gilberto Kassab e Marta

Suplicy. ....................................................................................................................................... 54

Figura 5: Número de citações positivas dos candidatos Gilberto Kassab e Marta

Suplicy. ....................................................................................................................................... 54

Figura 6: Número de citações negativas dos candidatos Gilberto Kassab e Marta

Suplicy. ....................................................................................................................................... 55

Figura 7: A dinâmica dos campos: renda, religião e escolaridade. .................................. 62

Figura 8: Diagrama simplificado para "estados" religiosos. ............................................... 65

Figura 9: Diagrama de uma situação hipotética para "estados" religiosos. .................... 67

Figura 10: Diagrama de uma situação hipotética para estados religiosos. ..................... 68

Figura 11: Mapa de percepção para o campo escolaridade. ............................................ 71

Figura 12: Mapa de percepção do debate na televisão quanto ao campo escolaridade.

..................................................................................................................................................... 75

Figura 13: Mapa de percepção para o campo renda.......................................................... 77

Figura 14: Mapa de percepção para o campo idade (faixa etária) ................................... 79

Figura 15: Mapa de percepção para o campo religião. ...................................................... 82

Figura 16: Esquema básico de mecanismos de censura. ................................................. 89

Figura 17: Comparativo dos percentuais de votos válidos o sob o modelo NMAR. .... 106

Figura 18: Comparativo do modelo NMAR e resultado do TSE (votos válidos). Eleição

para prefeitura de São Paulo, 2008 ..................................................................................... 112

Figura 19: Comparativo do modelo NMAR e resultado oficial do TSE. eleições para a

prefeitura de São Paulo, 2008 .............................................................................................. 115

Figura 20: Eleições para vereador no Município de São Paulo. Relação entre receita

para fins de campanha e número de votos obtidos. ......................................................... 133

Figura 21: Correlação entre o nível de lembrança ("Recall") e o número de votos. .... 135

Figura 22: Eficiência das candidaturas por partido e por gênero. .................................. 137

Figura 23: Mapa de percepção. Percentual de participação da mulher e eficiência. .. 138

Figura 24: Percentual de candidatos eleitor estratificado por profissão. ....................... 142

Figura 25: Percentual de candidatos eleitos estratificados por gênero e escolaridade.

................................................................................................................................................... 144

Figura 26: Desempenho dos candidatos estratificados por estado civil e gênero. ...... 145

Figura 27: Desempenho dos candidatos estratificados por faixa etária e gênero. ...... 147

Figura 28: Ciclo de estados da consciência ....................................................................... 157

Figura 29: Ação da flecha do tempo.................................................................................... 159

Page 13: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

LISTA DE TABELAS

Tabela 1: Variação da arrecadação tributária no Município de São Paulo de 2004 a

2006. ........................................................................................................................................... 45

Tabela 2: Imagem de Kassab à época da saída de Serra para concorrer ao governo do

Estado de São Paulo. NS - não sabe, Outra - apontou outro nome. ............................... 47

Tabela 3: Modelagem da evolução das proporções de eleitores em cada estado do

campo religião. .......................................................................................................................... 67

Tabela 4: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo

estratificada pelo nível de escolaridade. ............................................................................... 70

Tabela 5: Pesquisa eleitoral para prefeito de São Paulo, debate na TV, estratificada

pelo nível de escolaridade. ..................................................................................................... 72

Tabela 6: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo

estratificada por renda. ............................................................................................................ 76

Tabela 7: Pesquisa eleitoral para prefeito de São Paulo estratificada por faixa etária. 78

Tabela 8: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo

estratificada por religião. ......................................................................................................... 80

Tabela 9: Pesquisa Religiões do Brasil, confiança no Congresso Nacional. .................. 83

Tabela 10: Pesquisa Religiões do Brasil, confiança no Sistema Judiciário. ................... 83

Tabela 11: Pesquisa Religiões do Brasil, confiança no Sistema Educacional. .............. 84

Tabela 12: Notação das frequências observadas na tabela de contingência. ............... 93

Tabela 13: Frequências e "pseudo-frequências" observadas com a introdução da

variável indicadora R. .............................................................................................................. 94

Tabela 14: Distribuição da frequência de eleitores por período e faixa etária. SREP:

sem resposta. .......................................................................................................................... 103

Tabela 15: Percentuais de eleitores por período e faixa etária. ..................................... 104

Tabela 16: Intenção de votos, valores imputados nos modelos MAR e NMAR. .......... 104

Tabela 17: Intenção de votos imputados em percentuais. Modelo NMAR. .................. 105

Tabela 18: Número de eleitores por faixa etária. .............................................................. 107

Tabela 19: Posição do eleitor quanto à obrigatoriedade do voto. .................................. 108

Tabela 20: Apropriação estimada de abstenção por faixa etária. .................................. 109

Tabela 21: Percentuais na intenção de voto candidato Gilberto Kassab na eleição de

2008 no segundo turno do Município de São Paulo. ........................................................ 110

Tabela 22: Intenções de voto estratificadas por escolaridade ........................................ 110

Tabela 23: Intenção de voto segundo escolaridade. Valores imputados nos modelos

MAR e NMAR .......................................................................................................................... 111

Tabela 24: Intenção de voto segundo escolaridade. Valores imputados percentuais nos

modelos MAR e NMAR ......................................................................................................... 111

Tabela 25: Abstenção por grau de instrução. Eleições para a prefeitura de São Paulo,

2008 .......................................................................................................................................... 113

Page 14: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

Tabela 26: Intenção de voto para a prefeitura de São Paulo, 2008, estratificação por

renda......................................................................................................................................... 114

Tabela 27: Intenção de voto, valores percentuais. Prefeitura de São Paulo, 2008,

estratificação por renda ......................................................................................................... 114

Tabela 28: Imputação dos dados segundo modelo NMAR para a variável renda ....... 116

Tabela 29: Imputação dos dados, valores percentuais, segundo modelo NMAR para a

variável renda .......................................................................................................................... 116

Tabela 30: Resultado do modelo de regressão logística usando o método "Stepwise"

do pacote estatístico R. ......................................................................................................... 132

Tabela 31: Número de vereadoras eleitas no Brasil no período 1996 a 2012. ............ 139

Tabela 32: Perfil dos candidatos a vereador no Estado de São Paulo. Gênero, idade e

escolaridade. ........................................................................................................................... 148

Tabela 33: Esquema notacional para o modelo logístico-linear, com interação até

primeira ordem, transcrito em uma tabela de contingência. ............................................ 149

Tabela 34: Coeficientes estimados sob o modelo logístico-linear com interação de

primeira ordem. ....................................................................................................................... 151

Tabela 35: Chances de ser eleito estratificadas por gênero, idade e escolaridade. ... 152

Tabela 36: Probabilidade de o candidato ser eleito estratificado por gênero, idade e

escolaridade. ........................................................................................................................... 154

Page 15: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

Uma resposta aproximada da questão certa

é mais valiosa do que uma resposta certa de

um problema aproximado.

John Tukey (1915 - 2000)

Page 16: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

1

Introdução

Compreender o processo eleitoral e identificar as variáveis

explicitamente ou implicitamente envolvidas continua sendo um campo repleto

de mistérios tão obscuros quanto a mente humana. Os fatores psicossociais

despertados no período eleitoral remetem o pesquisador a um ambiente repleto

de simbologias, as mais inusitadas emoções e interesses diversos que

compreendem uma busca empreendida pelo eleitor, aparentemente racional,

no sentido de encontrar convergência entre seus anseios pessoais e as

características do potencial representante.

Pode-se afirmar que os anseios serão sempre pessoais, pois não há

como se falar em anseios coletivos se considerarmos que estes apenas

representam as vontades individuais se materializando em uma coletividade. O

voto é individual, não coletivo. Tentar descrever o processamento dos anseios

e conflitos nas mentes individuais é uma tarefa difícil. Na melhor situação,

podem-se ter fatores psicossociais estratificados, ou seja, uma estimativa ou

uma estatística de como o eleitor se comporta dentro das categorias

analisadas.

Este trabalho tem como objetivo delinear considerações sobre o tema

com base em uma análise do comportamento do eleitor a partir de três fatores

que se destacam durante o processo eleitoral: a indecisão, a continuidade e o

candidato. A indecisão será analisada a partir do levantamento dos eleitores

indecisos apontados em diversas pesquisas eleitorais. Demonstra-se que

apesar de se situar no estrato dos indecisos, o eleitor apresenta, tendo em

vista as suas características, tendências de voto para determinado candidato.

No tópico continuidade e candidato, avalia-se a questão dos parlamentares que

se mantem no cargo eletivo por longos períodos, através de sucessivas

reeleições e como complemento, é feita uma análise do perfil do candidato e

seus efeitos na decisão do eleitor.

Page 17: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

2

O trabalho comportará cinco capítulos e sexto para considerações. O

capítulo um busca esclarecer como métodos empírico-indutivos se tornaram as

ferramentas mais usadas na abordagem explicativa do comportamento eleitoral

empregando a visão de vários pesquisadores e seus trabalhos científicos.

Essas visões formam um conglomerado de conceitos, análises e conclusões de

diversos autores que permitem melhorar o foco desse tema delicado e

controvertido através de métodos estatísticos de análise do comportamento

eleitoral. A principal intenção do capítulo é criar uma ponte mais sólida entre a

pesquisa nas Ciências Sociais e a análise das observações por meio das

ferramentas estatísticas.

O fato social, na forma apresentada por Emile Durkheim (DURKHEIM,

2007), pode ser submetido a uma modelagem matemática dentro de limites

que são impostos pelo próprio fato social, ou seja, o modelo é válido para um

momento específico do fenômeno, tal qual uma fotografia, a qual representa

apenas um instante no tempo. Deve-se ser cuidadoso no uso de modelos

indutivos nas ciências sociais, pois nem sempre é possível prever o futuro a

partir do passado no comportamento social, existindo inúmeras situações que

endossam essa afirmação. Talvez o fenômeno social que mais evidencia a

fragilidade da indução seja a economia. Nada é mais instável do que um

cenário econômico projetado pelos economistas. Os períodos de prosperidade

e de crise se alternam de forma que nenhum modelo estatístico pode ser usado

para uma modelagem segura. É bem verdade, no contexto das ciências

econômicas, que os cenários se alternam dentro de um limite probabilístico,

mas tal condição torna-se extremamente fragilizada quando observamos crises

extremas, fora de qualquer intervalo probabilístico delineado pela estatística.

Os estatísticos, conscientes do problema das situações extremas, buscaram

teorias que modelassem as situações extremas, ou seja, a Teoria dos Valores

Extremos, ou no jargão dos estatísticos, a distribuição das caudas1, o que

11

Distribuição dos valores extremos de uma função de distribuição probabilística. Em uma curva de distribuição normal, por exemplo, tem-se as caudas direita e esquerda, as quais abrigam os

Page 18: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

3

implica uma distribuição de probabilidades dentro de outra distribuição de

probabilidades.

Valores extremos estão associados a baixas probabilidades.

A teoria dos valores extremos (TVE) trata das questões

probabilísticas e estatísticas relacionadas a valores muito

baixos ou muito altos em sequências da variáveis aleatórias

e em processos estocásticos. Assim, dados considerados

como eventos raros não podem ser tratados simplesmente

como “outliers", pois, podem ser inseridos em uma

modelagem de extremos.

Mais diretamente, o interesse pode ser modelar as caudas

de uma distribuição de alguma variável aleatória; esta pode

representar dados sobre climatologia ou hidrologia ou outra

área, como seguros ou finanças. Busca-se eventualmente

precaver-se contra algum evento extremo (evento raro)

cujas consequências podem ser indesejáveis ou

desastrosas. Modelando essa cauda, pode-se ter ciência

sobre as probabilidades de ocorrências de valores altos ou

baixos.

Entretanto, extremos não são usualmente bem modelados

via distribuições clássicas, como, por exemplo, a distribuição

normal (BERGER e BRASIL, 2012).

Parece que os valores extremos estão mais ligados com eventos

caóticos do que com probabilísticos, ou seja, a modelagem não seria

probabilística abrindo caminho para que a teoria do caos forneça melhor

explicação. Pela teoria do caos, uma pequena variação dentro de um sistema

dinâmico como a economia pode gerar situação extremas e catastróficas. É o

popularmente chamado “efeito borboleta”, situação na qual o bater das asas de

valores extremos da distribuição, ou seja, os menores valores (cauda esquerda) e os maiores valores (cauda direita).

Page 19: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

4

uma borboleta numa ilha remota do pacífico pode gerar uma amplificação de

efeitos que culminariam com um furacão no Caribe.

Assim, acreditar que os fenômenos sociais possam ser domados a ponto

de serem previsto dentro de um intervalo de confiança2 é, no mínimo, agir com

ingenuidade. Isso não significa que devemos descartar completamente a

modelagem probabilística, longe disso. Deve-se, entretanto, considerar suas

limitações quanto ao fenômeno estudado, pois a concepção exata do

comportamento do fenômeno no instante imediatamente posterior à

observação é impossível. Torna-se claro que o fluxo do tempo é a principal

variável que afeta as modelagens que dependem da indução. A seta do tempo

permite que sistemas aparentemente em equilíbrio entrem em colapso a partir

de interferências mínimas.

Independentemente da polemica envolvendo a explicação dos

fenômenos sociais através da análise quantitativa, não há como abrir mão

desse recurso para parte dos estudos acadêmicos na área das ciências

sociais. É importante, entretanto, tentar separar como a explicação ocorre no

campo das ciências sociais. Brage e Cañellas (2005) consideram que a

explicação apresenta comportamentos diferentes dentro dos variados campos

da ciência.

Definir o que é uma explicação não acarreta maior

dificuldade, pode-se dizer que significa falar de algo para dar

conhecimento a outros a fim de que o compreendam. Mas,

quando levamos a explicação ao campo da ciência o

problema se faz mais complexo, por exemplo, uma

explicação na física inclui, pelo menos, dois elementos

fundamentais; em primeiro lugar, algumas leis que formam

parte de una teoria mais ampla e, em segundo lugar, uma

linguagem matemática na qual as leis se expressam. As

2 Na estatística o intervalo de confiança é definido por um limite inferior e um superior onde a

probabilidade de tais limites serem superados é muito pequena (normalmente adota-se 2,5% para cada lado).

Page 20: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

5

ciências da vida (biologia) e as ciências sociais apresentam

outra maneira de considerar a explicação. Na história da

ciência pode-se observar como as diversas tradições

evoluíram em formas de explicação diferenciadas (BRAGE e

CAÑELLAS, 2005).

Explicar o comportamento da matéria, campo vinculado à física, exige o

reconhecimento incontestável do fenômeno, uma teoria e um conjunto de leis.

Na explicação física pode-se encontrar, portanto, três

aspectos fundamentais, a saber: o fenômeno que se trata de

explicar a lei em função da qual se explica e a teoria em que

se inserem essas leis. Entre outras considerações, o que se

pode aproveitar do modelo das explicações físicas é que os

fenômenos aparecem inseridos em marcos mais amplos que

lhes permitem entrar em relação com outros fenômenos, ou

seja, estão compreendidos entre si (BRAGE e CAÑELLAS,

2005).

Não é difícil compreender a referência aos limites ampliados da

explicação do comportamento da matéria quando se constata que as leis

explicativas são regidas por uma linguagem universal, a matemática.

Albert Einstein possuía intuição aguçada para a física, mas, segundo

suas próprias palavras, não dispunha de conhecimento matemático suficiente

para definir as leis que regem as suas teorias. Conseguia reconhecer o

fenômeno e até criar uma teoria para explica-lo, entretanto, as leis que regem o

fenômeno, quase sempre uma expressão matemática, não eram facilmente

obtidas por seu esforço próprio, sendo obrigado, em muitas ocasiões, recorrer

a amigos matemáticos.

A explicação das ciências da vida, geralmente representada pela

biologia, vincula-se mais intensamente a um processo de interação entre um

organismo vivo, delimitado pelo seu corpo ou estrutura, com o meio que o

cerca. Essa interação se dá por meio de ferramentas sensoriais físico-químicas

Page 21: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

6

desenvolvidas pelo organismo. A constante dinâmica do meio induz

adaptações constantes do organismo às mudanças. Essas adaptações

estariam fortemente ligadas a processos aleatórios de mudança na natureza do

organismo que, por vezes, podem coincidir com as novas exigências do

ambiente. Tais processos aleatórios de mudança orgânica são denominados

de mutações genéticas. Nesse contexto, a explicação para a variabilidade da

vida é a dinâmica do meio ambiente favorecendo mutações melhores

adaptadas a essa dinâmica. Assim, a teoria da evolução, usada para designar

as mudanças do organismo em função da melhor adaptação, não significa

necessariamente evoluir em complexidade. Assim, a explicação nas ciências

da vida assume um contorno muito semelhante ao da física, quando nos

damos conta que o processo biológico é nada mais do um processo físico-

químico. Um exemplo ilustrativo muito interessante sobre a pesquisa na ciência

biológica está relacionado com as formigas da espécie Catagyphis fortis. Essas

formigas, adaptadas ao clima extremo do deserto do Saara, são capazes de

saírem de seu ninho e caminhar por até mais de 100 metros em busca de

alimento e depois retornar rapidamente, em linha reta, até o ninho

(SRINIVASAN, 2001). Qual o segredo dessa perfeita orientação num ambiente

onde o sol escaldante não permite que se deixem rastros químicos para serem

seguidos até o ninho? Uma teoria aponta para um mapeamento de odores

químicos ao longo do caminho, ou seja, a formiga seria capaz de criar

mentalmente um mapa de odores até o ninho. Os odores seriam oriundos de

objetos ao longo do caminho e a posição desses objetos num contexto

específico indicaria à formiga a direção da entrada do formigueiro. Esse

exemplo é citado pelo fato de que as pesquisas científicas desenvolvidas para

explicar o comportamento da formiga não são, todavia, conclusivas. Apesar de

todos os controles efetuados nos procedimentos, pairam dúvidas quanto à

validade da explicação. Mais recentemente outros pesquisadores, por exemplo,

alegam que suas pesquisas apontam outra explicação, igualmente válida,

afirmando que na verdade as formigas possuem uma espécie de odômetro nas

patas, e que conseguiriam, de alguma forma, contar os passos até o ninho

Page 22: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

7

(WITTLINGER, WEHNER e WOLF, 2007). Embora seja uma explicação válida

e convincente, não é possível determinar, ainda, se é a única e definitiva

explicação ou uma combinação de várias explicações.

Se nas ciências da vida a explicação pode apresentar várias facetas, o

que dizer então das Ciências Sociais, onde a complexidade das inter-relações

assume um papel preponderante, tornando a explicação mais enigmática e

imprevisível em função do comportamento humano.

O contexto apresentado pelas ciências sociais mostra uma dinâmica

desconhecida pelas ciências da matéria e parcialmente reconhecida nas

ciências da vida. Tal dinâmica está atrelada ao consciente coletivo e como este

reage às ações individuais. A busca de explicações no campo das ciências

sociais revela que o fato social, objeto de estudo, apresenta características que

vão muito além da explicação funcionalista, ou seja, uma relação de causa e

efeito. O segmento específico deste trabalho, o qual está voltado para o

comportamento eleitoral, não apresenta melhor sorte quanto ao fato social

estudado, ou seja, o processo eleitoral. Encontrar relações de causa e efeito no

processo eleitoral sempre é possível quando delimitado dentro de um lapso de

tempo. Pode-se explicar, por exemplo, porque um candidato cresceu nas

pesquisas de intenção de voto, mas é impossível inferir com exatidão, a partir

do seu ritmo de crescimento até o presente, se essa intenção crescerá,

estabilizará ou decrescerá nas próximas pesquisas. Enquanto as leis da física

e boa parte das leis da vida apresentam boa possibilidade de previsão, as leis

sociais fogem com maior frequência do controle probabilístico, ficando a mercê

da regência do caos.

É inegável a dominação dos fenômenos sociais pelo caos quando

notamos que um caso particular e isolado pode assumir proporções

imprevisíveis, afetando toda uma sociedade ou até várias sociedades,

mudando para sempre o seu perfil.

Page 23: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

8

Nas ciências da vida o caos também tem o seu papel. Esse papel pode

ser de modo relevante, sendo capaz de alterar toda a estrutura da

biodiversidade em um único momento. A sessenta e cinco milhões de anos

atrás houve uma extinção em massa na Terra, eliminando por completo os

dinossauros, os quais imperavam no ambiente terreno por milhões de anos

consecutivos. A teoria mais aceita é que a extinção se deu em um único

momento, quando o nosso planeta foi atingido por um grande meteoro,

causando mudanças radicais no meio ambiente por um longo período, matando

boa parte dos seres vivos e extinguindo outros. Após a recuperação das

condições normais do ambiente sobreveio o domínio de novos biótipos,

sobreviventes da catástrofe, entre eles os mamíferos, árvore genealógica que

deu origem ao homo sapiens. Tal evento radical é fruto de movimentos

caóticos no universo, estrelas nascendo e morrendo, buracos negros,

supernovas, quasares, pulsares, cometas e asteroides circulando

aleatoriamente no espaço, etc. Um evento dessa magnitude certamente não

pertence ao campo das probabilidades, tão raro são as suas condições de

ocorrência, entretanto, são possíveis, como é possível um candidato azarão

ganhar uma eleição. Muitos poderiam contestar essa analogia afirmando que a

trajetória de um corpo celeste, tal como um asteroide, é determinista, sofrendo

apenas de pequenos erros de medição que poderiam se encaixar

perfeitamente na teoria das probabilidades. Mas aí está o problema: não há

qualquer garantia que esses erros ficariam sob o controle estatístico. Qualquer

intervenção não prevista na sua trajetória (impacto com outro corpo celeste, por

exemplo, mesmo que diminuto) poderia gerar um desvio mínimo, mas que

culminará com um grande desvio após longo tempo. Do mesmo modo agem os

fenômenos sociais, tais como as eleições. Um pequeno evento, aparentemente

inofensivo, pode mudar completamente os rumos de uma eleição.

O capítulo dois faz uma análise do comportamento do eleitor paulistano

na eleição para prefeito em 2008. Essa análise toma como base os conceitos

de campo e habitus de Pierre Bourdieu e uma proposta de modelagem da

dinâmica desses campos.

Page 24: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

9

O comportamento do eleitor paulistano é marcado pelas condições

sociais e culturais da população. Explicar o voto é uma tarefa árdua quando

imaginamos a variabilidade cultural do paulistano. Acrescenta-se ainda uma

variável de peso nessa explicação do voto: a escolaridade. O comportamento

do eleitor é avaliado a partir de diversas pesquisas efetuadas pelo instituto de

pesquisas Datafolha. Esses dados secundários possuem informações que

permitem uma avaliação dos diversos aspectos comportamentais do eleitor

paulistano no processo eleitoral.

É realizado um acompanhamento pormenorizado da eleição para

prefeito da Cidade de São Paulo em 2008 e como a mídia focou as ações dos

principais candidatos e sua correlação com as intenções de votos divulgados

pelas pesquisas.

Tomou-se esse caso especificamente em função da situação

desfavorável do candidato Gilberto Kassab no início do processo eleitoral e

como este conseguiu alcançar o segundo turno e obter a cadeira de Prefeito da

maior cidade do país.

Busca-se demonstrar que os fatos políticos e midiáticos que permearam

o processo eleitoral foram de extrema relevância para que o candidato

obtivesse uma projeção positiva perante o eleitorado suficiente para coloca-lo

entre os dois mais votados no primeiro turno. Fenômenos relacionados à

identidade partidária e à rejeição se abateram sobre a candidata Marta Suplicy,

permitindo que o candidato considerado “azarão” se impusesse de modo

surpreendente no segundo turno. Delimitar e quantificar os fatos políticos e

midiáticos que permitiram tamanha proeza é o objetivo desse capítulo, através

do levantamento bibliográfico do tema e a análise de dados obtidos nos

principais jornais que circulam na Cidade de São Paulo, das pesquisas

eleitorais e do comportamento do eleitor.

O papel da mídia tem como principal foco a veiculação dos fatos

ocorridos no período eleitoral, seja de forma imparcial ou não. O interesse é

Page 25: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

10

demonstrar que essa veiculação pode ter um papel decisivo na eleição do

candidato.

Outras questões levantadas nesse capítulo estão vinculadas ao perfil do

eleitor e como se encaixa na sua decisão de voto. A intenção é avaliar até que

ponto as teorias expostas sobre o comportamento do eleitor se aderem aos

dados colhidos nas diversas pesquisas de opinião colhidas pelos institutos.

Questões relacionadas à emoção, à utilidade, à racionalidade ou à

irracionalidade são abordadas nesse capítulo.

O fluxo de emoções que acompanham o processo eleitoral é um fator de

peso no momento da decisão do voto. Desde os primórdios da humanidade, na

formação dos primeiros conglomerados humanos, o poder da persuasão

através do carisma pessoal viabilizou o destaque daqueles que melhor

dominavam as emoções humanas. O carisma, ou seja, o poder de poder

influenciar pessoas é um atributo que a maioria dos políticos de sucesso

costuma apresentar. Além do carisma do candidato, as emoções dos eleitores

podem ser despertadas por propagandas partidárias realizadas com o objetivo

de influenciar emocionalmente o eleitor. Quem não se lembra das eleições para

presidente da república em 2002, na disputa entre José Serra e Lula. Nessa

ocasião a atriz Regina Duarte protagonizou uma das mensagens de maior

apelo emotivo no horário político, quando afirmava que “tinha medo” de como

ficaria a situação do país caso Lula fosse eleito.

Distintamente da emoção, o voto utilitário apresenta uma maior

racionalidade do voto, ou seja, o eleitor busca atender suas necessidades

pessoais no momento da votação. Assim uma função utilidade direcionaria a

escolha do candidato conforme a relação entre voto e potencial de retorno

aumentasse.

Já a racionalidade está mais ligada a um ideal do eleitor, geralmente

vinculado a um partido e nem tanto a um candidato. Talvez seja o cenário mais

raro no processo eleitoral, dada às circunstâncias que marcam as identidades

Page 26: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

11

partidárias na atualidade. A identidade partidária está muito enfraquecida no

contexto político atual.

O fator indecisão será abordado no capítulo três, o qual se resume na

análise do comportamento do eleitor indeciso traduzido no campo da estatística

como uma variável que apresenta informações incompletas ou omitidas. A

problemática envolvida nesse tema está diretamente relacionada com

tendências do eleitor ao longo de várias pesquisas eleitorais, ou seja, será

aventada a hipótese de que o eleitor, pelo simples fato de estar na condição de

indeciso, revela sua preferência por determinado candidato. Essa preferência

será traduzida via modelos estatísticos de estimação paramétrica. Tais

parâmetros viabilizam a distribuição dos eleitores indecisos, entre os

candidatos, quanto a sua preferência revelada pelo modelo estatístico a partir

de informações latentes extraídas de outras características observadas nesses

indecisos. Parte desse capítulo toma como base trabalho anterior sobre o tema

desenvolvido na dissertação de mestrado buscando-se as adaptações

necessárias do texto, proporcionando uma visão dentro dos moldes exigidos

pelas Ciências Sociais. Essas adaptações permitem vislumbrar a problemática

no contexto tanto da Sociologia quanto da estatística, ou seja, permite que o

leitor não habituado com o rigor formal da matemática relacionada aos modelos

estatísticos consiga compreender os resultados obtidos e, caso tenha

interesse, aprofundar os conhecimentos a respeito dos modelos utilizados

através da literatura recomendada.

A delimitação empírica se restringe aos resultados de pesquisas

eleitorais realizadas pelo Instituto Datafolha referente à eleição para Prefeito de

São Paulo, segundo turno, em 2008. Os dados secundários obtidos serão

ajustados em modelos estatísticos voltados para a análise de dados

categorizados incompletos3.

3Normalmente os dados categorizados são dispostos em tabelas apropriadas conhecidas como

tabelas de contingência. Nessas tabelas o encontro de uma linha com uma coluna identifica os atributos

Page 27: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

12

A questão da falta de informações em variáveis que compõe os dados

nas mais diversas áreas do conhecimento é lugar comum e constitui um

verdadeiro desafio para os pesquisadores. O grande problema envolvendo

dados incompletos está relacionado com a maneira pela qual serão tratados. A

abordagem mais comum é simplesmente ignorá-los, ou seja, são descartados

do banco de dados sem um critério prévio de análise com o intuito de identificar

os motivos de serem incompletos. Descartar dados sem um critério implica que

a estimação, de alguma forma, está prejudicada por algum tipo de viés. A área

das Ciências Sociais não foge a regra, pois a exclusão das observações com

informações incompletas resulta numa simplificação que permite a análise por

métodos convencionais mais parcimoniosos. Essa estratégia é conhecida nas

Ciências Sociais como exclusão listwise ou casewise (ALLISON, 2002).

O desenvolvimento de modelos estatísticos que abordassem as

observações incompletas ocorreu a partir de meados da década de 80,

entretanto, já havia alguns trabalhos pioneiros da década de 70. (GRAHAM,

2009) faz uma breve descrição desses primeiros trabalhos:

“Problemas gerados por falta de dados começaram a ser

tratados de uma forma importante a partir de 1987, embora

já houvesse alguns artigos influentes até então (por

exemplo, Dempster et al. 1977, Heckman 1979, Rubin

1976). O que aconteceu em 1987 foi nada menos que uma

revolução no pensamento sobre a análise de dados

incompletos. A revolução começou com dois grandes livros

que foram publicados naquele ano. Little e Rubin (1987)

publicaram o livro clássico Statistical Analysis with Missing

Data ( segunda edição publicada em 2002). Além disso,

Rubin (1987) publicou seu livro, Multiple Imputation for

Nonresponse in Surveys. Esses dois livros, juntamente com

o aumento da capacidade computacional e o uso dos

observados para um grupo de elementos. Quando para um determinado grupo de elementos há ausência ou omissão de algum atributo, dizemos que os dados são incompletos.

Page 28: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

13

computadores pessoais, lançaram as bases para os pacotes

computacionais voltados para a estatística e, mais

especificamente, nos vinte anos seguintes e além, para o

tratamento de dados incompletos. Também foram

publicados em 1987 dois artigos descrevendo o primeiro

método verdadeiramente acessível para lidar com dados

incompletos usando programas computacionais existentes

de modelagem de equações estruturais (Allison 1987,

Muthen et al. 1987). Por fim, Tanner e Wong (1987)

publicaram artigo sobre o aumento de dados, o qual se

tornaria a pedra angular do programa computacional de

imputação múltipla (MI) desenvolvido uma década depois.”

Assim, podemos ver que tais fenômenos, envolvendo dados

incompletos, se repetem nas pesquisas eleitorais quando uma fração dos

eleitores não declara o seu voto, seja por indecisão ou por convicção (em

branco ou nulo). Mesmo aqueles eleitores que declaram voto em branco ou

nulo, podem se decidir no momento do voto por algum candidato. O fluxo

dessa mudança pode ser quantificado através de modelos estatísticos para

dados incompletos.

A adaptação da realidade do processo eleitoral a partir dos modelos de

dados incompletos pode trazer novas interpretações para o comportamento do

eleitor, principalmente daquele que se mostra indeciso no momento que

responde uma pesquisa eleitoral. Na modelagem sugerida por este trabalho

são tomadas conjuntamente com seu estado de indecisão variáveis conhecidas

do eleitor indeciso tais como escolaridade, faixa etária, renda e outras que

podem auxiliar na imputação do seu voto a algum candidato.

A principal contribuição desse capítulo pode ser entendida quando

constatamos que há uma grande lacuna no Brasil quanto ao tratamento dos

dados incompletos nos estudos referentes a fenômenos sociais. A leitura desse

capítulo pode despertar um maior interesse no assunto por parte dos

pesquisadores da área das Ciências Sociais levando a uma maior produção

Page 29: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

14

acadêmica e resultados práticos para a realidade brasileira. Tais análises são

amplamente consideradas em trabalhos realizados fora do Brasil e podem-se

citar, como destaque, os trabalhos realizados por Paul D. Allison, professor de

Sociologia da Universidade de Pensilvânia.

A continuidade e o candidato será objeto do capítulo quatro. Considera-

se, neste trabalho, continuidade como o fenômeno das reeleições sucessivas

de um político, tornando-o praticamente o dono da sua cadeira de

representante seja no Senado, na Câmara dos Deputados Federais, na

Assembleia Legislativa como Deputado Estadual ou ainda como vereador na

Câmara Municipal. Quais condições externas e características do candidato

que lhe permitem permanecer num cargo eletivo por um tempo extremamente

longo?

Buscando compreender o fenômeno, são trabalhadas variáveis

consideradas relevantes para explicar a reeleição. Tais variáveis estarão

vinculadas às atividades do parlamentar no que se refere a sua produção

legislativa, sua capacidade administrativa, sua identidade com o governo

(situação ou oposição) e seu grau de exposição na mídia.

A sua exposição na mídia, seja de forma positiva ou negativa, será

obtida a partir do volume de informação que circula nos principais sites de

busca na internet ou nos principais jornais que circulam na sua cidade ou

estado. Eventualmente, são coletadas informações pontuais, mas de grande

impacto referente ao candidato, tais como escândalos políticos ou ações que,

perante o eleitorado, o rotulam como um verdadeiro paladino da justiça. Essas

informações adicionais são quantificadas e adicionadas ao modelo como mais

uma variável a ser considerada.

A produção legislativa, ou seja, os projetos de lei relevantes que se

converteram em lei, são levantados a partir das informações obtidas nas

páginas de Organizações Não Governamentais voltadas para o controle dos

políticos brasileiros, as quais apresentam informações abundantes sobre os

Page 30: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

15

parlamentares respeitando a imparcialidade. Sempre que houver desconfiança

quanto à imparcialidade da ONG, são buscadas alternativas que possam

confirmar as informações tais como páginas das Câmaras Municipais ou

assembleias estaduais. Em último caso, não havendo confiança nas

informações, estas serão descartadas.

A identidade do parlamentar com o governo é quantificado em termos do

seu grau de aproximação com a situação. A importância dessa variável está no

fato da sua proximidade com a máquina administrativa. Apesar da ilegalidade

do uso da máquina administrativa para fins eleitorais, é impossível separar as

eleições da máquina administrativa. Qualquer cidadão, com o mínimo de

percepção do seu meio, vislumbra atividades do poder público distintas no

período eleitoral como, por exemplo, maior investimento em obras públicas.

Tais atividades aparentemente estariam revestidas de legalidade, afinal o

investimento público não pode parar no período eleitoral. A suspeita recai na

distribuição desses investimentos, com uma concentração maior de gastos no

período eleitoral. Assim, não há dúvidas que a proximidade do candidato com a

situação pode gerar um viés nas intenções de votos a seu favor.

Já a capacidade administrativa do candidato ou “currículo” é avaliada a

partir do seu histórico de atividades políticas tais como luta sindical ou

trabalhos sociais de relevância. A busca desses atributos vinculados à

experiência do candidato é realizada a partir de informações contidas na sua

página pessoal, nas páginas da Justiça Eleitoral, mídia e ONGs.

A variável explicada será sua probabilidade de reeleição, definida

através de um modelo probabilístico adequado e dentro dos intervalos de

confiança estatísticos. Procura-se dessa maneira quantificar o fenômeno da

reeleição dentro de um contexto mais geral definido pelo processo eleitoral.

O perfil do candidato é tema do capítulo cinco. O candidato é avaliado

quanto ao potencial de sucesso no processo eleitoral. Quais condições

relacionadas ao candidato, tais como escolaridade, gênero, idade ou profissão

Page 31: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

16

permitem maior probabilidade de vitória nas urnas. Para avaliar o perfil do

candidato, é utilizado um banco de dados disponibilizado pelo Tribunal Superior

Eleitoral (TSE) que disponibiliza informações pessoais do candidato. Essas

informações são buscadas entre os candidatos a vereador nos Municípios do

Estado de São Paulo nas eleições de 2012. A relação dos atributos dos

candidatos e o seu potencial de voto é modelada de forma permitir encontrar

uma medida para a intensidade dessa relação, destacando e comparando

candidatos.

Assim, nota-se claramente que este trabalho busca destacar o quanto é

imprescindível em toda campanha eleitoral uma avaliação do desempenho do

candidato. Sem essa avaliação os riscos se elevam consideravelmente, pois o

candidato caminha praticamente às cegas.

A avaliação da campanha normalmente é realizada por meio das

pesquisas eleitorais, as quais trazem informações que auxiliarão o candidato

nas formulações de estratégias.

As pesquisas qualitativas, por exemplo, fornecem subsídios para as

decisões com base na análise de caso. A análise de caso pode ser útil para

definir parâmetros que deverão estimados numa pesquisa quantitativa.

Uma campanha bem sucedida certamente depende do grau de

conhecimento que o candidato tem do seu eleitorado e como este reage às

suas atitudes.

O trabalho desenvolvido nesta tese busca, por meio da

interdisciplinaridade, formular conceitos e modelos matemáticos que podem

auxiliar na compreensão do processo eleitoral, identificando os caminhos que a

sociedade brasileira trilha na escolha dos seus representantes, fundamental

para o regime democrático.

Page 32: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

17

Capítulo 1

Métodos Empíricos nas Ciências Sociais.

Em razão do uso intensivo de ferramentas estatísticas, procura-se, neste

primeiro capítulo, traçar um paralelo entre os métodos quantitativos utilizados

na tese e sua aplicabilidade no campo das Ciências Sociais. Não se trata de

resumos ou noções desses métodos, pois a bibliografia recomendada atende

plenamente a esse quesito. Busca-se discorrer sobre sua importância como

ferramenta para as ciências sociais e quais as limitações impostas à sua

aplicação nos fenômenos sociais.

A ciência estatística, principal ferramenta do positivismo, apresentou um

grande avanço, tanto na geração de novas teorias como na ampliação do seu

repertório de modelos probabilísticos para as mais diversas aplicações. Hoje é

possível encontrar no mercado uma variedade de pacotes computacionais

voltados exclusivamente para o tratamento estatístico de dados oriundos de

pesquisas efetuadas em áreas do conhecimento que vão desde o direito até a

medicina, sem deixar de passar pela área da sociologia. Não resta dúvida que,

com o advento da informática, viabilizando o tratamento em tempo curto de

uma grande massa de dados, foi uma das principais razões desse crescimento

acentuado da estatística.

O uso das pesquisas empíricas nas Ciências Sociais é, atualmente,

lugar comum nas publicações acadêmicas, fornecendo uma grande quantidade

de análises estatísticas apoiadas em pacotes estatísticos que são “pilotados”

de forma que, no mínimo, gera dúvidas se as conclusões obedecem a um

método científico isento de interferências que desqualificariam tais conclusões.

Deve-se, portanto, evitar o foco estritamente “quantitativista” em detrimento da

verdadeira realidade social.

O argumento central é que o quantitativismo tem seu lugar

na ciência por se tratar de um conjunto de técnicas de pesquisa

social e análise que, ao ser bem aplicado, permite relacionar

Page 33: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

18

descobertas sobre padrões de comportamento social com

implicações nas teorias sociais já existentes. Para isso, é

preciso evitar duas armadilhas principais. A primeira é o

excesso de quantitativismo, que não raras vezes transforma a

ferramenta estatística, que deveria servir como forma de

acesso à realidade social, em finalidade última da pesquisa

empírica (CERVI, 2008).

O pesquisador deve tomar o cuidado de abordar seu trabalho de

maneira que não gere desconfiança quanto aos procedimentos adotados,

principalmente no que se refere ao rigor no levantamento das observações que

servirão como base para o processo empírico indutivo. Não se trata de uma

crítica à automação disponibilizada pelos pacotes computacionais, mas a falta

de uso criterioso desses pacotes.

A base de um trabalho empírico está atrelada às observações, sejam

elas do todo (universo) ou de uma parcela (amostra). Florestan Fernandes

busca delinear o processo de observação em três espécies:

Portanto, nas ciências sociais o processo de observação

abrange três espécies distintas de operações intelectuais: a) as

operações através das quais são acumulados dados brutos, de

cuja análise dependerá o conhecimento objetivo dos

fenômenos estudados; b) as operações que permitem

identificar e selecionar, nessa massa de dados, os fatos que

possuem alguma significação determinável na produção

daqueles fenômenos; c) as operações mediante as quais são

determinadas, isoladas e coligidas – nesse grupo restrito de

fatos – as instâncias empíricas relevantes para a reconstrução

e a explanação dos fenômenos, nas condições em que foram

considerados (FERNANDES, 1959).

Traduzindo a compreensão das três espécies de Florestan Fernandes

na linguagem da estatística, temos: a) a amostragem (ou censo, caso se trate

de toda a população), onde se acumulam os dados brutos através do

Page 34: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

19

levantamento de dados primários ou secundários, ou seja, dados oriundos de

uma pesquisa de campo (primários) ou de um banco de dados existente

(secundários); b) a análise exploratória de dados implica organizar e resumir as

informações através dos recursos da estatística descritiva, identificando e

selecionando aquilo determinante para o estudo; c) a inferência, a qual só faz

sentido quando se devem estimar parâmetros a partir de uma parcela do

universo (população) tomando-se uma amostra. Temos ai, na amostra, o ponto

sensível da pesquisa voltada para as ciências sociais ou qualquer outra área

do conhecimento.

Podem-se compreender melhor as espécies descritas por Florestan

Fernandes quando se busca uma analogia nos conceitos da estatística

moderna. A acumulação dos dados brutos é realizada a partir da coleta de

dados primários ou secundários. Essa coleta pode abranger toda a população

(censo) ou uma parte dela (amostra). É importante separar as implicações do

censo na estatística. A própria palavra estatística se refere a uma denominação

matemática ligada à estimação de parâmetros populacionais. Assim, quando se

faz um censo, toda a população está presente nos dados e, portanto, somente

trabalhamos com a exploração, descrição e resumo dos dados, ou seja, a

Estatística Descritiva propriamente dita. Os dados são interpretados, no censo,

de forma aflorar características da população visualizadas através de recursos

gráficos, tabelas, diagramas, etc. Conjuntamente com esses recursos, são

obtidas medidas resumos daquela população, também conhecidos como

parâmetros populacionais. Um dos parâmetros populacionais mais conhecidos

é a média. Outros parâmetros populacionais também despertam interesse do

pesquisador, tais como a mediana e o desvio padrão. A mediana corresponde

ao valor que divide a população finita em duas partes com o mesmo número de

elementos, ou seja, cinquenta por cento de cada lado. Quanto ao desvio

padrão, trata-se de uma medida resumo que aponta o grau de dispersão dos

valores da população. Essa dispersão é avaliada a partir do distanciamento dos

valores da média populacional.

Page 35: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

20

A estatística, quando considerada como ferramenta essencial ao

processo de indução, somente faz sentido quando é analisada uma parte da

população, uma amostra. Não existe indução no censo, pois todo o universo

está presente.

A importância da indução deve ser reconhecida, entretanto o seu uso

obedece a critérios precisos com a finalidade de se evitar conclusões errôneas.

Essa preocupação foi externada por J. S. Mill em sua obra Sistema de Lógica

Dedutiva e Indutiva. A citação a seguir, apesar de longa, mostra claramente as

armadilhas presentes no uso da indução.

Este uso tem engendrado uma grave confusão na teoria

da indução, exemplificada nos mais recentes e bem elaborados

tratados sobre a filosofia indutiva que existem em nossa língua.

O erro em questão é o de confundir uma mera descrição, por

meio de termos gerais, de um grupo de fenômenos observados

como uma indução tirada desses fenômenos.

Suponhamos que um fenômeno se compõe de partes, e

que essas partes só podem ser observadas separadamente, e,

obviamente, uma a uma. Quando as observações tiverem sido

feitas, haverá a conveniência (atingindo, conforme os objetivos,

a uma necessidade) de obter uma representação do fenômeno

como um todo, combinando, ou, de algum modo, juntando

esses fragmentos separados. Um navegante percorrendo o

oceano descobre terra; não pode a princípio, ou por uma

simples observação, determinar se é um continente ou uma

ilha, mas a costeia e, depois de alguns dias, descobre ter feito

a volta completa ao seu redor; então, declara-se uma ilha. Ora,

não houve um momento ou lugar específico de observação em

que se pudesse perceber essa terra completamente cercada

de água; apurou o fato por meio de uma sucessão de

observações parciais e, então, escolheu uma expressão geral

que resume em duas ou três palavras o conjunto do que

observara. Mas há algo da natureza de uma indução nesse

Page 36: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

21

procedimento? Ele inferiu alguma coisa que não tinha sido

observada de uma outra que o tinha sido? Certamente não:

tinha observado tudo que a proposição afirma. Que a terra em

questão é uma ilha não é uma inferência dos fatos parciais que

o navegante viu no curso de sua circunavegação; ela é os

próprios fatos; é um resumo desses fatos, a descrição de um

fato completo em relação ao qual fatos mais simples são como

as partes de um todo (MILL, 1979).

Se um pesquisador pudesse perguntar a todos os eleitores de uma

cidade em quem irão votar para prefeito e encontrar a proporção de 60% então

pode-se afirmar que tal proporção não é fruto da indução e sim uma

constatação da verdadeira proporção de eleitores do candidato naquele

momento. Se a variável tempo for introduzida, então a indução ressurge, pois

se estima que no dia seguinte à pesquisa a proporção se manterá nos 60%.

Para contradizer ou confirmar essa estimativa, o pesquisador deverá realizar

uma nova pesquisa e introduzir o componente tempo. Uma sucessão de

valores no tempo proporcionará um novo modelo de previsão por meio da

indução, estimando, por exemplo, as tendências das proporções de voto no

tempo.

Quando se tem uma amostra, chama-se de estatística um arranjo

matemático dos valores observados da amostra. Esse arranjo composto de

variáveis aleatórias é chamado de Estimador. O Estimador produz, a partir da

amostra, uma estimativa de um parâmetro populacional de interesse. Para

exemplificar, se um pesquisador desejasse estimar o peso médio de uma

população a partir de uma amostra, a Estatística ou Estimador dessa média

populacional, no caso o parâmetro de interesse, seria a média da amostra. É

possível demonstrar através de recursos matemáticos que o melhor estimador

da média populacional (Parâmetro) é a média amostral (Estatística ou

Estimador). De qualquer modo, não é difícil usar a intuição para perceber que

tal afirmação é verdadeira.

Page 37: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

22

O grande problema a ser enfrentado nesse procedimento é que a média

amostral também é um valor aleatório e que está estreitamente ligada à forma

adotada para a coleta da amostra, ou seja, ao planejamento amostral.

Nas Ciências Sociais, na maioria das vezes impossibilitada de fazer uso

da observação experimental, a amostra é muito sensível a interferências,

exigindo um planejamento amostral robusto.

A construção do caso típico, que se obtém mediante a

observação experimental, e a formulação de sua explicação,

que constitui um processo lógico de abstração e de

generalização das instâncias empíricas, interpretativamente

relevantes, encontram uma expressão comum nas mesmas

operações intelectuais, que culminam na descrição sintética do

fenômeno.

Isso não ocorre, de forma regular, com as ciências sociais,

em que ainda são muito limitadas as possibilidades de praticar

a observação em condições experimentais. Os dois momentos

ou fases do processo de investigação se separam com nitidez:

primeiro se procede à eliminação do que é acidental,

circunstancial e fortuito, mediante a construção analítica de

casos típicos; só então é que se pode passar ao tratamento

interpretativo das instâncias empíricas selecionadas, com o

propósito de explicar os fenômenos observados. Em outras

palavras, as operações intelectuais de caráter “técnico”

precedem e condicionam as operações intelectuais de caráter

“logico” (FERNANDES, 1959).

A primeira das duas fases do processo de investigação descritas por

Fernandes expõe claramente a problemática envolvendo a coleta de dados. As

chamadas “operações intelectuais de caráter técnico” nada mais é que planejar

a amostragem de forma reduzir a um mínimo os erros que afetam a

representatividade da população. Não faz o menor sentido passar para a

Page 38: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

23

segunda fase sem ter o controle da primeira. Seria uma estrutura de aço sendo

construída numa base de areia.

Uma estimativa somente tem importância se a amostra que lhe deu

origem provém da população de interesse e a representa em todos os aspectos

que estão sendo estudados. Toma-se, por exemplo, uma pesquisa eleitoral em

que a amostra de eleitores foi coletada dentro de um reduto eleitoral de certo

candidato. Provavelmente essa pesquisa apresentará falta de

representatividade da população de eleitores, gerando um viés em favor desse

candidato.

As operações intelectuais de caráter “lógico” definem as ferramentas

necessárias para a reconstrução proposta por Fernandes, o que implica

interpretar o todo a partir da parte, ou seja, pela lógica da indução, do

conhecido para o desconhecido. Essa reconstrução faz uso de modelos

probabilísticos funcionais, mas sempre admitindo uma parcela aleatória

desconhecida, chamada de parcela residual. Essa parcela residual, ou ruído,

não pode ser explicada pelo modelo mas, teoricamente, está sob controle

probabilístico.

Normalmente esse resíduo é tratado como um erro intrínseco ao modelo

e adota-se, para esse erro, um tamanho apropriado. Nas pesquisas de

intenção de voto, por exemplo, é comum anunciar que um candidato possui

tantos por cento das intenções de voto com uma margem de erro de tantos por

cento, para mais ou para menos.

É importante compreender que essa margem de erro4 depende de duas

grandezas: do tamanho da amostra e da confiança probabilística5 desejada.

4 Trata-se do erro amostral, ou seja, a diferença esperada entre o valor estimado pela amostra

(estimativa) e o verdadeiro valor populacional (parâmetro). 5 A confiança probabilística, ou nível de confiança, é eleita pelo pesquisador e representa

quanto se deseja confiar no erro adotado confrontado com a amostra, ou seja, a probabilidade de que o erro amostral seja menor ou igual ao erro adotado. Se, por exemplo, o pesquisador desejar um erro de 3% com nível de confiança de 95%, deve um tamanho de amostra que permita afirmar que para 100

Page 39: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

24

Assim é possível ter-se um erro pequeno, mas com baixa confiança

probabilística.

Adota-se na maioria das pesquisas um nível de confiança de 95% para o

erro amostral. Uma vez fixada a confiança, o erro somente poderá ser reduzido

a partir do aumento do tamanho da amostra.

Assim, a explicação dos fatos sociais com base na observação amostral

não foge à regra, depende de um termo aleatório mas com uma diferença,

sofre perturbações cruciais ao longo do tempo. O mesmo não ocorre com as

ciências experimentais. Se um pesquisador da área da física estuda a

resistência que um determinado corpo geométrico oferece à passagem de um

fluido, pode, empiricamente, determinar um modelo explicativo funcional para

aquela forma geométrica. Os erros envolvidos estão sob tal controle

probabilístico, que é possível repetir a experiência e colher dados que levarão a

resultados similares em qualquer instante. Assim, a variável tempo,

aparentemente, não possui relevância nesse caso.

De qualquer forma, as ciências sociais não dispõem de

meios regulares para a constatação e a retificação dos erros,

através das próprias condições de observação e da

experiência. Essa é uma possibilidade característica das

ciências que podem praticar a observação em condições

experimentais. Como já sugeria Comte, elas também carecem

dos meios de controle das explicações, fornecidos pela

experimentação propriamente dita. Mesmo a psicologia social,

que dispõe de maiores recursos para a observação controlada

e a exploração dos modelos experimentais de pesquisa, não

conta com as facilidades das “ciências de laboratório”, nas

quais basta repetir artificialmente as condições de produção do

fenômeno para saber-se se a explicação é verdadeira ou falsa

(FERNANDES, 1959).

amostras com esse tamanho, espera-se que no máximo cinco apresentem um erro amostral superior a 3%.

Page 40: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

25

É importante esclarecer o significado do erro na análise de dados (erro

amostral), buscando não confundi-lo com os erros de amostragem. Os erros de

amostragem podem ocorrer de várias maneiras como, por exemplo, erros de

medidas, de objeto, de representatividade, omissões de respostas, informações

incompletas, entre outros. Assim o erro de amostragem é uma falha na coleta

dos dados, enquanto o erro amostral é probabilístico, intrínseco a análise de

dados e vinculado ao processo de modelagem, ou seja, em função do grau de

aderência do modelo aos dados. Um modelo com maior aderência apresenta

erro amostral menor.

Pode-se melhor esclarecer o uso da modelagem na pesquisa social

usando um exemplo simples. O pesquisador está interessado em verificar o

número de votos de um vereador em função dos gastos com a campanha.

Assim o pesquisador parte do princípio que existe uma correlação entre gasto

de campanha e número de votos. Pode-se perceber que essa hipótese é

intuitiva, advinda da experiência do pesquisador, mas que carece de

comprovação empírica. O estudo busca obter os gastos de todos os candidatos

a vereador e quantos votos cada um obteve. Apesar do levantamento dos

gastos e número de votos de todos os vereadores até aquela data, ainda se

trata de uma amostra, pois não sabemos como os futuros candidatos a

vereador irão se portar frente às variáveis gasto e número de votos. A

estimativa para os futuros vereadores é o interesse principal e será obtida

através do modelo proposto.

A grande vantagem neste exemplo é que o pesquisador não necessita

se preocupar com o planejamento amostral, pois está usando todas as

informações disponíveis. O maior problema está na veracidade dos gastos

declarados, ou seja, incorrerá num viés que muito provavelmente subestimará

os gastos. Um pesquisador meticuloso poderia buscar informações

complementares sobre os gastos dos candidatos e realizar um cruzamento,

entretanto exigiria um grande esforço de logística, de tempo e de recursos

financeiros, nem sempre disponíveis. A seguir o pesquisador passa a explorar

Page 41: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

26

os dados usando ferramentas que permitam vislumbrar a correlação entre as

variáveis gasto e número de votos. Uma ferramenta que permite a visualização

de uma possível correlação entre as variáveis é o chamado gráfico de

dispersão. A figura 1 mostra um conjunto de dados obtidos no site do Tribunal

Superior Eleitoral (TSE) envolvendo uma amostra de 11 vereadores

posicionados em um gráfico de dispersão. A simples observação desse gráfico

permite afirmar que a correlação existe, pois a medida que os gastos

aumentam o número de votos também aumenta. Uma possível modelagem

para o comportamento das duas variáveis seria uma reta, a qual está

desenhada na figura. Trata-se de um modelo funcional, no qual entramos com

o valor gasto na campanha e obtemos uma estimativa do número de votos que

esse candidato terá.

Figura 1: Exemplo de modelo funcional. Ajuste de uma reta.

Fonte: TSE. Elaborada pelo autor.

O princípio utilizado aqui se baseia nas variações concomitantes de

Stuart Mill, a qual é discutida mais adiante. Nesse caso pode-se observar uma

dependência aparente entre o número de votos e os gastos de campanha.

Page 42: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

27

Dizemos que aparenta existir uma dependência pelo simples fato de que

existem outros fatores que afetam o número de votos e que mesmo os gastos

devem ser considerados como causa com algumas reservas, pois por trás dos

gastos existem fatores que podem possuir maior correlação com o número de

votos do que o próprio gasto. O que se quer dizer é que os fatores

determinantes conspiram de tal forma que trazem como resultado o volume de

gastos, que na verdade apenas simboliza a conjunção desses fatores. Uma

analogia para a situação pode ser feita quando temos um quadro valioso. O

quadro é valioso não pelo material que é feito, mas pelas qualidades atribuídas

ao seu autor, as quais permitem que o quadro seja valioso. De mesma forma o

pesquisador deve ter em mente que muitas vezes o objeto não se revela por

completo. A visão dos verdadeiros fatores está ofuscada por um fenômeno que

na realidade apenas é o portador de tais fatores.

Pode-se notar uma observação (apontada por uma seta na figura 1) que

foge do comportamento do restante. Tal observação discrepante aponta um

vereador que obteve muitos votos com baixo gasto em campanha. O

pesquisador deve realizar uma melhor análise dessa observação, pois afeta o

modelo no sentido de reduzir a aderência das observações, ou seja, aumenta o

erro amostral. Independentemente se o gasto divulgado é verdadeiro ou não,

obriga o pesquisador tomar uma decisão: se retira ou não essa observação da

análise. Uma justificativa para essa atitude está vinculada ao fato de que tal

observação é muito rara e mantê-la para fins de modelagem poderia gerar um

viés desnecessário na previsão. Por outro lado, caso se tenha certeza de que o

gasto foi realmente baixo, justificaria manter essa observação, pois se trata de

uma observação verdadeira. Nota-se, portanto, que mesmo na racionalidade

envolvendo o processo de indução, há espaço para alguma subjetividade

inerente à experiência do pesquisador. Mas essa subjetividade é relativa, pois

o pesquisador deve tomar sua decisão com algum respaldo técnico.

Em resumo, cabe à análise converter os dados imediatos da

experiência (ou, o que seria mais preciso, os “dados primários”

Page 43: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

28

da investigação), em dados manipuláveis pelo raciocínio

científico. Em contraste com o conhecimento de senso comum,

o conhecimento científico exige matéria prima própria, que

permita representar objetivamente as ocorrências observadas.

De fato, seria impossível explicar positivamente a realidade, se

só a pudéssemos perceber e representar através de

aparências e de atributos superficiais. Por isso, a primeira

etapa da pesquisa científica [coleta de dados], nas disciplinas

indutivas, se funde com uma indagação sistemática sobre os

caracteres e as condições das ocorrências (FERNANDES,

1959).

A questão da modelagem probabilística para explicar a realidade

apresenta limitações não somente com o erro amostral, mas também com sua

estrutura. Teoricamente, sempre é possível ajustar um modelo de explanação

que torna o erro amostral menor que outro modelo, ou seja, existem modelos

probabilísticos concorrentes que apresentam melhor aderência aos dados do

que outros modelos. O principal problema enfrentado com esses modelos está

relacionado com a complexidade. Normalmente maior aderência implica

modelos com maior complexidade matemática e nem sempre o ganho obtido

com essa melhor aderência justifica a adoção desses modelos. Convém,

portanto, buscar modelos probabilísticos mais parcimoniosos, mesmo que

esses impliquem menor aderência aos dados. A busca descontrolada por uma

aderência perfeita torna-se inútil, pois além da complexidade maior do modelo,

sua explicação para o fenômeno seria artificial em demasia.

Voltando ao exemplo dos gastos de campanha e número de votos,

“parece razoável” modelar o comportamento relacional entre os dois

fenômenos por uma reta. O que leva a crer que seja “razoável” modelar o

comportamento por uma reta? Temos novamente subjetividade nessa crença

do pesquisador ou trata-se de um critério estritamente técnico? Na verdade o

pesquisador pode adotar modelos que se encaixam perfeitamente aos dados.

Se, por exemplo, ao invés de utilizar uma reta, utilizar uma função senoidal do

Page 44: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

29

tipo , provavelmente teria um ajuste muito melhor aos dados

do que uma equação de reta do tipo .

A figura 2 mostra o ajuste de um modelo senoidal aos dados. Pode-se

observar que a curva do modelo está mais aderente aos dados. Quando o

pesquisador encontra modelos que apresentam essa característica, deve

eleger aquele que melhor se adequa à realidade do fenômeno. Fica claro que o

uso de um modelo mais complexo como o senoidal no exemplo é inútil do

ponto de vista prático. É inútil porque a realidade não se comporta dessa

maneira, e tudo leva a crer que caso se adicione mais observações para fins de

modelagem, nada garante que esse modelo continue sendo tão aderente,

demonstrando a sua artificialidade. Também é inútil a adoção do novo modelo

quando se constata o aumento de complexidade, flagrantemente

desnecessária para o modelo, tendo em vista que um modelo mais

parcimonioso atende satisfatoriamente as previsões necessárias tanto quanto o

modelo simplificado. Alias, é possível que um modelo mais simples apresente

previsões melhores do que um modelo mais complexo.

Pode causar surpresa tal situação no uso de ferramentas estatísticas,

pois se tem a ideia que tais ferramentas são inteiramente originárias de regras

objetivas. Nota-se, portanto, que o cientista deve encarar situações que exigem

algum grau de subjetividade, entretanto, essa subjetividade é relativa quando

se tem em mente que a experiência do pesquisador permite considerar que a

subjetividade envolvida é desprezível.

A escolha entre um modelo simples e outro complexo deve ser avaliada

em função do ganho que um modelo mais complexo traria. Esse ganho deve

ser avaliado de duas formas: quantitativamente e qualitativamente. Um ganho

quantitativo nem sempre implica num ganho qualitativo. O ganho quantitativo

se apoia na frieza dos números, ou seja, o modelo mais complexo trouxe uma

quantidade maior de aderência aos dados. O ganho de qualidade está ligado à

resistência do modelo a novas informações. Se novas informações são

Page 45: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

30

introduzidas no modelo e este continua mantendo seu grau de aderência,

pode-se afirmar que apresenta uma boa qualidade.

Figura 2: Exemplo de modelo funcional. Ajuste de uma função senoidal.

Fonte: TSE. Elaborado pelo autor.

O comportamento social implica uma complexidade que transcende as

leis naturais, exigindo uma compreensão adicional do pesquisador, ou seja,

segundo Durkheim, “o sentimento da especificidade da realidade social”:

A sociologia, portanto, não é o anexo de nenhuma outra

ciência; ela própria é uma ciência distinta e autônoma, e o

sentimento da especificidade da realidade social é inclusive tão

necessário ao sociólogo, que somente uma cultura

especificamente sociológica é capaz de prepará-lo para a

compreensão dos fatos sociais (DURKHEIM, 2007).

A partir dessas aplicações, reforça-se a ideia de que a Sociologia, tal

como foi tão apropriadamente formulada por Durkheim, possui vida própria

como ramo das ciências, trazendo no seu bojo a aplicação do método

Page 46: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

31

empírico-indutivo exigindo, entretanto, que se deva levar em conta que o

dinamismo dos fatos sociais carece de atualização constante. Um

comportamento social pode mudar completamente num curto intervalo de

tempo.

Durkheim, na sua obra As Regras do Método Sociológico, afirma:

A sociologia não tem de tomar partido por uma das grandes

hipóteses que dividem os metafísicos. Ela não precisa afirmar a

liberdade nem o determinismo. Tudo o que ela pede que lhe

concedam é que o princípio de causalidade se aplique aos

fenômenos sociais. E, ainda assim, esse princípio é por ela

estabelecido não como uma necessidade racional, mas

somente como um postulado empírico, produto de uma indução

legítima. Visto que a lei da causalidade foi verificada nos outros

reinos da natureza e que progressivamente ela estendeu seu

domínio do mundo físico-químico ao mundo biológico, e deste

ao mundo psicológico, é lícito admitir que ela igualmente seja

verdadeira para o mundo social; e é possível afirmar hoje que

as pesquisas empreendidas sobre a base desse postulado

tendem a confirmá-lo. Mas a questão de saber se a natureza

do vínculo causal exclui toda contingência nem por isso está

resolvida (DURKHEIM, 2007).

Segundo Durkheim, a sociologia apenas pede o benefício do princípio da

causalidade estabelecido a partir de um postulado empírico, o qual emerge por

meio da indução, e não permite conclusão diversa. Causalidade transmite a

ideia de que um fenômeno, quando surge ou é alterado, causa, a princípio,

algum efeito em outro fenômeno de características distintas do primeiro. Essa

ideia de causa e efeito deve ser vista com muita reserva, pois as aparências

enganam. John Stuart Mill na sua obra “A System of Logic” de 1843,

resumidamente, apresenta cinco métodos de indução: Concordância,

Diferença, Junção entre Concordância e Diferença, Resíduos e Variações

Concomitantes, sempre destacando a relação de causa e efeito.

Page 47: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

32

A indução permite obter conclusões a respeito de um determinado

fenômeno, ou fato social, a partir da observação de uma parte desse fato, ou

seja, do particular para o geral, da parte para o todo. Como a indução, nesse

método, parte da observação empírica, o objeto de pesquisa deve ser definido

com clareza de modo delinear como a parte deve ser tomada.

Fica claro, portanto, que se deve isolar a população a ser pesquisada, a

qual deve apresentar características exteriores que lhes são comuns, as quais

escapam da vontade do observador, ou seja, completamente definidas pela

natureza do objeto. Assim, não é possível tomar como objeto aquele que não

representa a população (categoria) de interesse, ou seja, desejando-se verificar

a incidência de um fato social dentro de uma categoria, seria absurdo utilizar

categorias diversas6.

Ao proceder dessa maneira, o sociólogo, desde seu primeiro

passo, toma imediatamente contato com a realidade. Com

efeito, o modo como os fatos são assim classificados não

depende dele, da propensão particular de seu espírito, mas da

natureza das coisas. O sinal que possibilita serem colocados

nesta ou naquela categoria pode ser mostrado a todo o mundo,

reconhecido por todo o mundo, e as afirmações de um

observador podem ser controladas pelos outros (DURKHEIM,

2007).

Percebe-se a necessidade de se afirmar que o procedimento se

enquadra na realidade do objeto de tal forma que pode ser reconhecido,

compreendido e reproduzido por outros interessados, tal qual um

desencadeamento lógico de uma equação matemática, ou seja, despojado de

qualquer subjetividade. Essa necessidade não foge à regra adotada pelas

ciências naturais.

6 Se, por exemplo, deseja-se verificar a frequência de pessoas favoráveis ao aborto no estrato

(categoria) correspondente aos indivíduos que se declaram católicos (propriedade exterior), não faria sentido tomar indivíduos que se declaram não católicos, a menos que o pesquisador deseja comparar os dois estratos mas , de qualquer forma, é definida uma nova população, não fugindo, portanto, da orientação de Durkheim.

Page 48: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

33

Em outros casos, toma-se o cuidado de definir o objeto

sobre o qual incidirá a pesquisa; mas, em vez de abranger na

definição e de agrupar sob a mesma rubrica todos os

fenômenos que têm as mesmas propriedades exteriores, faz-se

uma triagem entre eles. Escolhem-se alguns, espécie de elite,

que são vistos como os únicos com o direito a ter esses

caracteres. Quanto aos demais, são considerados como tendo

usurpado esses sinais distintivos e não são em conta. Mas é

fácil prever que dessa maneira só se pode obter uma noção

subjetiva e truncada. Essa eliminação, com efeito, só pode ser

feita com base numa ideia preconcebida, uma vez que, no

começo da ciência, nenhuma pesquisa pôde ainda estabelecer

a realidade dessa usurpação, supondo-se que ela seja possível

(DURKHEIM, 2007).

Logo, para decidir se uma determinada observação merece ou não estar

na pesquisa, não se permite simplesmente tomar o caminho da subjetividade.

Pode-se afirmar que somente a realidade do objeto permitiria fazê-lo, nunca o

critério subjetivo do observador. Qualquer atitude fora do contexto da realidade

atentaria contra o princípio da imparcialidade, podendo desmoralizar a

pesquisa por falta de objetividade ou, em caso extremo, gerar desconfiança

quanto à ética do pesquisador.

Durkheim mostra sua convicção no poder da explicação, ou seja, uma

postura funcionalista:

Mostramos que um fato social só pode ser explicado por

outro fato social, e, ao mesmo tempo, indicamos de que

maneira esse tipo de explicação é possível ao assinalarmos

*no meio social interno o motor principal da evolução coletiva*.

(...)

*Uma ordem de causas dotadas de suficiente eficiência para

tornar inteligível a produção dos efeitos que lhes atribuímos, e

bastante próximas desses efeitos para poder explicá-los sem

Page 49: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

34

que seja necessário desnaturá-los por uma simplificação

artificial: trata-se das propriedades do meio social (DURKHEIM,

2007).

Como já mencionado anteriormente, Durkheim sofre influência de Mill,

entretanto, seu trabalho apresenta forte influência de Descartes. A explicação

científica seria fornecida, fundamentalmente, por um processo empírico-

indutivo, mas igualmente aberta às influências do empiricismo e do

racionalismo (FERNANDES, 1959).

Nas Regras, no início do capítulo referente à administração da prova,

Durkheim afirma:

Temos apenas um meio de demonstrar que um fenômeno é

causa de outro: comparar os casos em que eles estão

simultaneamente presentes ou ausentes e examinar se as

variações que apresentam nessas diferentes combinações de

circunstâncias testemunham que um depende do outro.

Quando eles podem ser artificialmente produzidos pelo

observador, o método é a experimentação propriamente dita.

Quando, ao contrário, a produção dos fatos não está à nossa

disposição e só podemos aproximá-los tais como se

produziram espontaneamente, o método empregado é o da

experimentação indireta ou método comparativo.

(...)

Vimos que a explicarão sociológica consiste exclusivamente

em estabelecer relações de causalidade, quer se trate de ligar

um fenômeno à sua causa, quer, ao contrário, uma causa a

seus efeitos úteis. Uma vez que, por outro lado, os fenômenos

sociais escapam evidentemente à ação do operador, o método

comparativo é o único que convém à sociologia (DURKHEIM,

2007).

Page 50: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

35

Na administração da prova vemos a sedução que o método das

variações concomitantes7 de Mill exercia sobre Durkheim e, segundo suas

próprias palavras:

Muito diferente é o que acontece com o método das

variações concomitantes. Com efeito, para que ele seja

demonstrativo, não é necessário que todas as variações

diferentes daquelas que se comparam tenham sido

rigorosamente excluídas. O simples paralelismo dos valores

pelos quais passam os dois fenômenos, contanto que tenha

sido estabelecido num número suficiente de casos

suficientemente variados, é a prova de que existe entre eles

uma relação. Esse método deve esse privilégio ao fato de

atingir a relação causal, não a partir de fora como os

precedentes, mas a partir de dentro (DURKHEIM, 2007).

Após discorrer sobre os métodos de Mill, descartando um a um como de

alguma utilidade à interpretação dos fenômenos sociais, detém-se no método

das variações concomitantes. Segundo Durkheim, a vantagem desse método

sobre os outros8 está no fato de não haver necessidade da exclusão de todas

as variações distintas das que se comparam exceto uma. Segundo ele, os

fenômenos sociais seriam por demais complexos, não permitindo isolar os

efeitos de todas as causas exceto uma.

O método das variações concomitantes descrita por Mill vai ao encontro

do funcionalismo, na medida em que determinada variável de um fenômeno

7 No método da variações concomitantes, Mill afirma que quando um fenômeno varia de uma

maneira específica sempre que um outro fenômeno varia, também de sua maneira específica, as variações são causa ou efeito uma da outra.

8 Durkheim se refere ao método da concordância, da diferença e dos resíduos (Mill, 1843). No

método da concordância “se duas ou mais instâncias de um fenômeno sob investigação tem somente uma circunstância em comum, a circunstância, a qual todas as instâncias concordam, é a causa (ou efeito) do dado fenômeno”. O método da diferença diz que “se um fenômeno ocorre em uma instância e não em outra, e as duas instâncias têm todas as circunstâncias em comum exceto uma, e a circunstância onde as duas instâncias diferem está presente na primeira e não na segunda, a tal circunstância é o efeito, a causa, ou, necessariamente, parte da causa do fenômeno.”. Já o método dos resíduos afirma que “reduzindo-se de um fenômeno as partes previamente conhecidas como sendo efeitos de certos antecedentes, os resíduos do fenômeno são efeitos dos antecedentes remanescentes.”

Page 51: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

36

varia quantitativamente quando uma outra variável relacionada ao fenômeno

também sofre uma variação quantitativa:

A concomitância constante é, portanto, por si mesma, uma

lei, seja qual for o estado dos fenômenos que permaneceram

fora da comparação (DURKHEIM, 2007).

Durkheim adotou o método das variações concomitantes consciente das

suas limitações pois, segundo ele, as leis que potencialmente estariam

estabelecidas pelo método não significam, necessariamente, relação de causa

e efeito, havendo necessidade de interpretação dos resultados.

É verdade que as leis estabelecidas por esse procedimento

nem sempre se apresentam de imediato sob a forma de

relações de causalidade. A concomitância pode ser devida, não

a um fenômeno ser a causa do outro, mas a serem ambos os

efeitos de uma mesma causa, ou então por existir entre eles

um terceiro fenômeno, intercalado, mas despercebido, que é o

efeito do primeiro e a causa do segundo. Os resultados a que

esse método conduz têm, portanto, necessidade de ser

interpretados (DURKHEIM, 2007).

Esse comentário de Durkheim mostra seu cuidado na interpretação dos

fenômenos sociais pois, sem dúvida, o uso incorreto do método das variações

concomitantes pode levar a conclusões totalmente erradas a partir de

resultados aparentemente coerentes. Não seria surpresa descobrir que o

próprio Durkheim teria sido vítima desse método no momento de inferir as

relações de causa e efeito.

Imaginemos que um pesquisador consegue verificar empiricamente que

toda vez que uma variável A de um fenômeno sofre uma variação quantitativa

outra variável B também varia. A princípio ele desconhece uma terceira variável

C, também vinculada ao fenômeno, porém passou despercebida. De imediato o

pesquisador seria levado, a partir dos resultados, a afirmar que A é causa do

efeito em B. O pesquisador, desconfiado do resultado, resolve criar dois

Page 52: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

37

estratos, um que contém somente objetos que apresentam a variável A e outro

que apresenta a variável C, anteriormente ignorada. No estrato que contém a

variável A, quanto esta sofre uma variação, nada ocorre com a variável B,

entretanto, no estrato que contém a variável C, quanto maior a quantidade de C

maior a quantidade de B, ou seja, existe uma razão direta entre as variáveis. O

erro inicial do pesquisador está no fato de não ter percebido que A está

relacionado com C e não com B. Na verdade uma quantidade maior de A

implica uma maior quantidade de C e consequentemente uma maior

quantidade de B. Caso C esteja ausente, A não causa qualquer efeito em B.

Caso C esteja presente, B sofre efeito de sua presença. Esse fenômeno é

muito conhecido pelos epidemiologistas nos seus estudos relacionados às

substância que causam malefícios ao organismo. Uma variável com as

característica da variável C descrita no exemplo anterior é conhecida como

“Variável de Confusão”. Consideremos uma pesquisa feita sobre o consumo de

café, que indique uma relação causal entre consumo de café (A) e incidência

de câncer de pulmão (B), ou seja, aparentemente quanto maior o consumo de

café, maior o risco de adquirir câncer de pulmão. Na verdade, ocorre um

grande equivoco, pois quando se cria dois estratos, um de fumantes e outro de

não fumantes, constata-se que no estrato de não fumantes o consumo de café

não mostrava relação causal com o câncer de pulmão, ou seja, a incidência

estava dentro dos índices normais da população em geral. Entretanto, quando

se observa o estrato de fumantes, notava-se uma relação causal entre o

consumo de café e o câncer de pulmão. Quando separam-se entre os

fumantes os que tomam café e os que não tomam, observa-se o mesmo nível

de incidência de câncer. Não é o café que causa o câncer e sim o hábito de

fumar (C). O que ocorre é que, em geral, pessoas que fumam muito também

gostam de tomar muito café, o conhecido “cafezinho” após um cigarro. Nesse

caso a variável consumo de café é um exemplo de “variável de confusão”.

O racionalismo de Durkheim se manifesta no cuidado empregado na

interpretação dos resultados. A interpretação exige, obrigatoriamente, o uso da

razão e de processos dedutivos. Na verdade, a dedução pode preceder a

Page 53: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

38

experiência estabelecendo hipóteses que devem ser confirmadas

empiricamente através da indução, ou seja, a indução deve coincidir com a

dedução. Talvez o exemplo mais conhecido do que se diz aqui é a teoria da

relatividade geral. Einstein afirmava que uma das consequências da teoria era

que a gravidade pode curvar a luz. Entretanto, tratava-se de um processo

dedutivo, fruto das equações matemáticas, ou seja, não havia uma

demonstração experimental. Por mais que a razão indicasse a validade da

teoria, sem uma comprovação experimental, não passaria de um exercício

mental. Einstein buscava desesperadamente uma comprovação experimental

dos efeitos da teoria da relatividade. Chegou a fazer um apelo aos astrônomos

para que buscassem uma comprovação empírica da sua teoria, descrevendo

como esse experimento deveria ser feito durante um eclipse solar e até

buscando financiar quem se dispusesse a realizar tal empreitada. Somente

quando os astrônomos, aproveitando um eclipse solar, constataram

empiricamente os efeitos da gravidade na luz, corroborando com a teoria da

relatividade, que se reconheceu a validade da teoria9.

Durkheim reconhece a importância da dedução:

Mas qual o método experimental que permite obter

mecanicamente uma relação de causalidade sem que os fatos

que ele estabelece precisem ser elaborados pelo espírito?

Tudo o que importa é que essa elaboração seja metodicamente

conduzida, e eis aqui de que maneira se poderá procedera

isso. Em primeiro lugar procuraremos saber, com o auxílio da

dedução, como um dos dois termos foi capaz de produzir o

outro; a seguir, nos esforçaremos por verificar o resultado

dessa dedução com o auxílio de experiências, isto é, de novas

comparações. Se a dedução é possível e a verificação bem-

sucedida, poderemos considerar a prova como feita. Se, ao

contrário, não percebemos entre esses fatos nenhum vínculo

9 O reconhecimento é provisório, tendo em vista que sempre existirá a possibilidade de uma

nova teoria que refutaria a anterior.

Page 54: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

39

direto, sobretudo se a hipótese de semelhante vínculo

contradiz leis já demonstradas, sairemos em busca de um

terceiro fenômeno dos quais os dois outros dependam

igualmente ou que tenha podido servir de intermediário entre

eles (DURKHEIM, 2007).

Propõe a dedução como ferramenta auxiliar no processo de indução, ou

seja, constatada a relação de causa e efeito através do experimento, deve-se,

segundo Durkheim, deduzir através do uso da razão uma lei que modele o

fenômeno. O modelo obtido, que corresponderia à hipótese adotada, seria

testado com o auxílio de novos experimentos e se a hipótese resistir à

verificação considera-se a prova feita10. Esse método é usual no teste de

hipóteses na estatística quando imaginamos a situação na qual se afirma que

determinado candidato teria mais de 60% das intenções de voto. Temos então

duas hipóteses em jogo, uma que afirma que o candidato possui 60% ou

menos das intenções de voto, considerada como a hipótese básica e outra que

afirma que o candidato possui mais do que 60% dos votos, a qual corresponde

à afirmação a ser testada, ou seja, determinar sua validade. Dessa forma,

busca-se empiricamente por meio da experimentação11 verificar se a afirmação

é verdadeira ou falsa. Constatar, empiricamente, a validade da afirmação

significa que a validade é relativa, ou seja, a afirmação seria verdadeira (se

assim os resultados indicassem) com certa probabilidade.

Parte significativa da metodologia de Durkheim está relacionada a um

alto grau de positivismo e objetividade. Durkheim acreditava que o método

empírico-indutivo, acrescido com tempero dedutivo em alguns estágios da

pesquisa, era suficiente para o estudo dos fenômenos sociais. O caminho

10

Karl Popper na sua obra A Lógica da Investigação Científica (POPPER, 2007), adota o método hipotético-dedutivo, no qual afirma que se deve buscar evidências empíricas que falseiam uma hipótese adotada. Nesse aspecto, Durkheim mostra alguma semelhança com Popper exceto pelo fato deste último rejeitar o método indutivo.

11 Nesse caso seria obtida uma amostra representativa de eleitores e seria observada a

característica de interesse, ou seja, a proporção de eleitores da amostra que votariam no candidato. Para facilitar o entendimento, considera-se uma população de eleitores muito grande e que a amostra sempre será uma pequena fração dessa população.

Page 55: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

40

adotado de obter a partir do particular uma explicação para o todo faz

transparecer o seu pensamento indutivista ingênuo.

De acordo com o indutivista ingênuo, o corpo do

conhecimento científico é construído pela indução a partir da

base segura fornecida pela observação.

Conforme cresce o número de dados estabelecidos pela

observação e pelo experimento, e conforme os fatos se tornam

mais refinados e esotéricos devido a aperfeiçoamentos em

nossas capacidades de observação e experimentação, cada

vez mais leis e teorias de maior generalidade e escopo são

construídas por raciocínio indutivo cuidadoso. O crescimento

da ciência é contínuo, para a frente e para o alto, conforme o

fundo de dados de observação aumenta (CHALMERS, 1993).

Karl Popper, na sua obra A Lógica da Pesquisa Científica, critica

severamente o método da indução:

Ora, está longe de ser óbvio, de um ponto de vista lógico,

haver justificativa no inferir enunciados universais de

enunciados singulares, independentemente de quão

numerosos sejam estes; com efeito, qualquer conclusão

colhida desse modo sempre pode revelar-se falsa:

independentemente de quantos casos de cisnes brancos

possamos observar, isso não justifica a conclusão de que todos

os cisnes são brancos (POPPER, 2007).

Desperta curiosidade o exemplo dos cisnes brancos de Popper e

descobre-se que no passado sempre se acreditou somente na existência de

cisnes brancos até a descoberta da Austrália, pois lá foi encontrada uma

espécie de cisne de coloração negra, ou seja, apesar de todas as evidências

Page 56: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

41

até aquele momento indicar que todos os cisnes eram brancos, foram

encontrados cisnes negros12.

A proposta de Popper é radical, considera o princípio da indução

supérfluo e podendo levar a incoerências lógicas, ou seja, trata a indução como

um equívoco da razão.

Alguns dos que acreditam na Lógica Indutiva apressam-se a

assinalar, acompanhando Reichenbach, que “o princípio de

indução é aceito sem reservas pela totalidade da Ciência e

homem algum pode colocar seriamente em dúvida a aplicação

desse princípio também na vida cotidiana”13. Contudo, ainda

admitindo que assim fosse – pois, afinal, “a totalidade da

ciência” poderia estar errada–, eu continuaria a sustentar que

um princípio de indução é supérfluo e deve conduzir a

incoerências lógicas (POPPER, 2007).

Popper propõe uma metodologia que primeiramente parte de conceitos

quase metafísicos, afastando o uso de métodos empíricos. A partir da criação

da hipótese ou conjectura esta passará às fases seguintes que tentarão validar

ou falsear a hipótese com a presença de novas hipóteses, melhores adaptadas

à explicação do fenômeno. Obviamente que seria quase impossível testar

essas hipóteses sem algum recurso empírico, entretanto, não é o único fator

determinante da validade de uma hipótese. Qualquer explicação estaria

sempre sujeita a ser substituída por outra, num processo infinito.

Popper não deixa de ter razão nos seus argumentos, entretanto, não

seria viável na prática das ciências sociais, a qual não pode abrir mão da

indução para estabelecer previsões dentro da realidade do cotidiano social.

Uma pesquisa de intenção de voto serve para estimar as proporções de voto

que cada candidato possui utilizando-se de um processo indutivo. Não seria

12

Uma obra interessante sobre o improvável é A Lógica do Cisne Negro de Nassim Nicholas Taleb.

13 Hans Reichenbach, filósofo alemão, no seu artigo de 1930, revista Erkenntnis, vol1, pag. 186.

Page 57: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

42

possível a partir de um processo dedutivo encontrar essas proporções. A

complexidade imposta pelo fenômeno social é extrema.

Enfim, a problemática envolvendo os fatos sociais vai muito além dos

métodos propostos por Durkheim ou Popper. Toda essa metodologia se baseia

nos valores estabelecidos pelo próprio investigado, ou seja, está vinculada

numa realidade criada pela sua mente a qual se encontra em constante

mutação.

Os atributos das mentes, assim como os dos corpos, são

fundados em sentimentos ou estados da consciência. Mas, no

caso de uma mente, temos que considerar seus próprios

estados tanto quanto aqueles que ela produz em outras

mentes. Todo atributo de uma mente consiste ou em ser ela

mesma afetada de uma certa maneira, ou em afetar outras

mentes de uma certa maneira. Considerada em si, só podemos

predicar dela a série de seus próprios sentimentos. Quando

dizemos que uma mente é devota, supersticiosa, meditativa ou

alegre, afirmamos que as ideias, volições ou emoções contidas

nessas palavras entram, frequentemente, na série de

sentimentos ou estados de consciência que preenchem a

existência sensível da mente (Mill, 1989, p.124)

Tanto a dedução como a indução são resultados da interpretação de um

estado consciente vivido pela mente humana no espaço e no tempo. Esse

estado de consciência, nas ciências sociais, é objeto de estudo.

Diferentemente das ciências naturais, identificar padrões e estabelecer

previsões tendo como objeto uma coleção de mentes não é tarefa fácil ou pior,

tais padrões e previsões podem estar fadados a um redundante fracasso

devido a uma mudança repentina dos valores e interpretações dessas mentes.

Page 58: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

43

Capítulo 2

Comportamento do Eleitor Paulistano na Eleição para Prefeito

em 2008. Uma abordagem usando os conceitos de Campo e

Habitus de Pierre Bourdieu.

2.1 As eleições de 2008 e o cenário político na Cidade de São Paulo.

Em novembro de 2004 José Serra vence as eleições para prefeito de

São Paulo na disputa no segundo turno com Marta Suplicy. Muitos creditaram

sua vitória às atitudes de Marta Suplicy após sua separação conjugal do

senador Eduardo Suplicy. A sua aparente indiferença quanto ao processo de

separação transpareceu na mídia, e o eleitor considerou que tal falta de

sensibilidade pudesse refletir no trato com a população da Cidade de São

Paulo. Tal suspeita pode ser transcrita a partir da leitura feita pelos próprios

colaboradores da campanha de marta Suplicy, tal como Valdemir Garreta,

influente na sua gestão, secretário de Abastecimento e Projetos Especiais.

Foi determinante a atitude do senador Eduardo Suplicy logo

após a separação. Ele se colocou o tempo todo na mídia

como vítima, transformando a Marta numa pessoa

insensível, arrogante, indiferente ao que ele sentia (Folha de

São Paulo, 03/11/2004).

O modo como a separação foi exposta na mídia, de um lado a insensível

e do outro a vítima, foi um dos fatores que provavelmente pesou na preferência

do eleitor.

Outro fator considerado determinante para a sua derrota, foi a criação de

diversas taxas durante sua gestão como prefeita de São Paulo. As mais

polêmicas foram as taxas de lixo, conhecidas como TRSD (Taxa sobre

Resíduos Sólidos Domiciliares) e TRSS (Taxa sobre Resíduos Sólidos de

Saúde), a primeira tinha como fato gerador do tributo a utilização potencial dos

serviços divisíveis de coleta, transporte, tratamento e destinação final de

Page 59: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

44

resíduos sólidos domiciliares, de fruição obrigatória, prestados em regime

público. Quanto a TRSS, seu fato gerador era utilização potencial do serviço

público de coleta, transporte, tratamento e destinação final de resíduos sólidos

de serviços de saúde, de fruição obrigatória, prestados em regime público e

devida, principalmente, por farmácias, clínicas, laboratórios, consultório

médicos e hospitais.

O desgaste político foi tanto, que lhe proporcionou um

apelido criado pelo PSDB em tom jocoso, “Martaxa” (Folha

de São Paulo, 06/02/2005).

Surge ainda o aspecto conservador do eleitorado paulistano.

Questionado se Kassab reuniria esses votos, atraindo

eleitores dos candidatos derrotados Geraldo Alckmin e

Paulo Maluf (PP), Tadeu César tem outra versão. "É um

eleitorado anti-Marta, mais que anti-PT", avaliou, lembrando

aspectos que a população considerou negativos como o

apelido "Martaxa" e a separação do senador Eduardo

Suplicy (O Estado de São Paulo, 13/10/2008).

José Serra e seu vice, Gilberto Kassab, assumiram a Prefeitura de São

Paulo em janeiro de 2005 com pesadas críticas à situação financeira da maior

cidade do país.

Quase que imediatamente, José Serra impôs um forte ritmo à gestão

financeira da Cidade de São Paulo cancelando e renovando empenhos,

revendo e criando contratos e focando a arrecadação de tributos sem aumento

da carga tributária. Essa política fiscal permitiu um crescimento nominal de

31% na arrecadação comparando-se o exercício 2006 com 2004. Em termos

reais, ou seja, descontado o efeito da inflação, a expansão foi de 17%,

conforme Site do Tesouro Nacional (STN, 2013).

A tabela 1 mostra a evolução da arrecadação tributária do Município de

São Paulo no período 2004 a 2006. Essa arrecadação engloba os repasses

referentes à cota parte do Imposto sobre a Circulação de Mercadorias e

Page 60: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

45

prestação de Serviços (ICMS) e do Imposto sobre a Propriedade de Veículos

Automotores (IPVA), ambos de competência arrecadatória do Estado de São

Paulo.

Tabela 1: Variação da arrecadação tributária no Município de São Paulo de 2004 a 2006.

Variação Nominal Real

2006 x 2005 14% 9%

2006 x 2004 31% 17%

Fonte: Site do Tesouro Nacional.

Em 2006, José Serra revoga parte da lei que criou as taxas do lixo,

numa tentativa de demonstrar coerência com uma política fiscal voltada para a

arrecadação sem aumento da carga tributária.

Um dia antes de apresentar o Orçamento 2006 à Câmara

Municipal de São Paulo, o prefeito José Serra entregou

ontem um pacote composto por três projetos, de autoria do

executivo, à Casa com o intuito de organizar o sistema

tributário da cidade.

Um dos projetos extingue a taxa do lixo - instituída na

administração passada - a partir de 2006. O mesmo projeto

concede isenção da Contribuição para Custeio do Serviço

de Iluminação Pública (Cosip), a taxa de luz, para

moradores de ruas que não têm iluminação pública. Essa

proposta inclui ainda a redução das alíquotas e o perdão

das dívidas do Imposto Sobre Serviço (ISS) para

prestadores de serviço de diversões públicas. O segundo

projeto cria o Conselho Municipal dos Tributos. (Diário do

Comércio e Indústria /DCI – 30/09/2005).

Já em 2006, José Serra deixa o cargo de prefeito de São Paulo para

concorrer às eleições para o governo do Estado de São Paulo, deixando seu

vice, Gilberto Kassab assumir a Prefeitura de São Paulo.

Page 61: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

46

A administração Kassab deu continuidade aos projetos criados pelo seu

antecessor, ou seja, na prática, parecia que José Serra continuava no cargo,

pois até o secretariado foi mantido, provavelmente no compasso de espera

quanto ao resultado das eleições para o governo do Estado de São Paulo.

O engenheiro civil e economista Gilberto Kassab (PFL), 45,

assumiu ontem a Prefeitura de São Paulo após 15 meses de

gestão José Serra (PSDB), que renunciou para disputar o

governo do Estado. Na primeira entrevista como mandatário

da maior cidade do país, Kassab afirmou que sua gestão

será marcada pela continuidade de todos os projetos do

tucano (Folha de São Paulo – 01/04/2006)

Gilberto Kassab era praticamente um desconhecido até o momento da

sua posse como prefeito, conforme constatado em pesquisa de opinião

realizada pelo Datafolha.

Há 11 dias no comando da maior cidade do Brasil, o prefeito

Gilberto Kassab (PFL-SP), 45, ainda é desconhecido da

maioria dos moradores de São Paulo. Pesquisa realizada

pelo Datafolha nos dias 6 e 7 de abril com 1.073 pessoas

acima de 16 anos mostra que 77% não sabem quem é o

prefeito. A margem de erro é de três pontos, para mais ou

menos (Folha de São Paulo – 10/04/2006).

A pesquisa fazia a seguinte pergunta: “O prefeito José Serra deixou a

prefeitura da cidade de São Paulo para concorrer ao governo do estado de São

Paulo. Quem é o prefeito da cidade de São Paulo?” Foram consultadas 1073

pessoas, cujas respostas estratificadas por sexo, idade, escolaridade, renda e

ocupação estão tabuladas na Tabela 2.

A partir da observação da tabela, encontramos uma maior incidência de

desconhecimento de Kassab entre as mulheres (83%). Para o estrato idade, o

grau de desconhecimento prevalece entre os mais jovens (entre 16 e 25 anos),

chegando a 83%. No que se refere ao quesito escolaridade, encontramos mais

Page 62: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

47

desconhecimento para estrato referente ao nível fundamental, 85%. Quando

observamos o estrato renda, o maior grau de desconhecimento ocorre com a

faixa até 5 salários mínimos, 84%.

Tabela 2: Imagem de Kassab à época da saída de Serra para concorrer ao governo do Estado de São Paulo. NS - não sabe, Outra - apontou outro nome.

SEXO IDADE ESCOLARIDADE RENDA

MASC FEM 16 a 15 26 a 40 41 ou mais FUND MED SUP Até 5

SM

Até 10

SM

Mais de

10 SM

Kassab 31% 17% 16% 23% 29% 15% 22% 45% 17% 33% 45%

Serra 3% 3% 2% 5% 2% 4% 3% 2% 4% 0% 3%

Outra 9% 8% 7% 8% 10% 8% 7% 12% 8% 7% 16%

NS 57% 72% 74% 65% 59% 73% 68% 41% 72% 60% 36%

Fonte: Datafolha (2008).

A importância dessa análise do momento em que Kassab assume a

prefeitura torna-se de extrema importância para avaliar o seu grau de

crescimento e de relacionamento junto ao eleitor paulistano, pois são

justamente essas faixas que viabilizarão a sua reeleição para o cargo de

prefeito de São Paulo.

A primeira administração Kassab, iniciada em abril de 2006 e terminada

em 2008, foi salpicada por diversos eventos que culminaram com uma

aprovação substancial do seu governo em 2008. A partir de janeiro de 2007, a

lei cidade limpa, proposta pelo próprio Kassab, gerou diversas polêmicas, haja

vista a grande quantidade de mandados de segurança por ela gerados, todos,

efetivamente, cassados. A sociedade aprovou a lei, e nem mesmo a perda de

compostura do prefeito contra um manifestante contra a lei da cidade limpa14

abalou esse apoio da população e dos mais diversos setores representantes da

sociedade civil. Pode-se até arriscar que tal fato tenha consolidado, junto à

população, um perfil de bom administrador, não se intimidando, inclusive, com

ameaças de alguns setores prejudicados pelo dispositivo legal.

14

Esse episódio, amplamente divulgado pela mídia, mostra um Gilberto Kassab colérico, expulsando aos berros um manifestante contra a lei cidade limpa durante uma visita a um posto de saúde.

Page 63: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

48

Outras polêmicas que renderam um amplo espaço na mídia foram os

casos dos empresários Oscar Maroni15 e Law Kin Chong16. A firmeza

demonstrada pelo prefeito nos dois casos impressionou o paulistano.

Pode-se ter uma visão da evolução da aceitação dos candidatos pelo

eleitorado a partir de uma análise da cobertura jornalística desses candidatos.

Segundo página do Laboratório de Pesquisa em Comunicação Política e

Opinião Pública (DOXA, 2008), para cada jornal são apresentados os dados

parciais em gráficos relativos à quantidade de vezes em que o nome de cada

candidato aparece no noticiário (aparições) e à valência atribuída a cada um

nas matérias (positiva, negativa ou neutra).

Periodicidade: O objetivo de divulgação dos primeiros

dados relativos à cobertura das eleições presidenciais de

2008 é disponibilizar quinzenalmente os registros de

visibilidade (quantas vezes cada candidato foi citado em

cada jornal, valores totais) e valência (proporção de

matérias positivas, negativas e neutras na cobertura dada

por cada jornal aos quatro principais candidatos).

Definição das valências: Optamos por classificar as

valências de acordo com seu efeito potencial para a

candidatura em questão, notando-se ou não intenção de

viés ou parcialidade jornalística. Desta forma, os principais

critérios para identificar a valência da matéria, em relação a

cada candidato, procuram esclarecer se ela beneficia ou

prejudica sua candidatura.

15

O empresário do setor de entretenimento para adultos, iniciou a construção de um hotel próximo à cabeceira da pista do aeroporto de Congonhas. A partir dai, teve inicio uma disputa judicial entre a prefeitura e o empresário. Essa disputa reverberou nas outras atividades do empresário, sendo acusado de apologia à prostituição.

16Law Kin Chong, empresário chinês residente no Brasil, recebeu destaque na mídia após

investigação da polícia federal, com participação ativa da Prefeitura de São Paulo, que o acusou de ser o chefe do contrabando em São Paulo.

Page 64: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

49

Positiva: matéria sobre ou com o candidato reproduzindo

programa de governo; promessas; declarações do candidato

ou do autor da matéria ou de terceiros (pessoas ou

entidades) favoráveis (contendo avaliação de ordem moral,

política ou pessoal) ao candidato; reprodução de ataques do

candidato a concorrentes, resultados de pesquisas ou

comentários favoráveis.

Negativa: matéria reproduzindo ressalvas, críticas ou

ataques (contendo avaliação de ordem moral, política ou

pessoal) do autor da matéria, de candidatos concorrentes ou

de terceiros a algum candidato, resultados de pesquisas ou

comentários desfavoráveis.

Neutra: agenda do candidato, matéria sobre ou citação de

candidato sem avaliação moral, política ou pessoal do

candidato. Do autor da matéria ou de terceiros, inclusive de

concorrentes.

Equilibrada: matérias sobre o candidato que apresentem

conteúdos positivos e negativos com pesos relativamente

iguais; matérias cujo conteúdo apresente “contra-

ponto” entre aspectos positivos e negativos; matérias que

apresentam aspectos positivos e negativos do mesmo

evento (DOXA, 2008).

Para os candidatos Marta Suplicy e Gilberto Kassab foram adaptados os

dados da página do DOXA utilizando apenas as citações dos dois principais

jornais que circulam no Município de São Paulo: Folha de São Paulo e o

Estado de São Paulo.

O gráfico da Figura 3 mostra a evolução do percentual de citações

negativas dos candidatos no período de 01/03/2008 a 26/10/2008. As medições

foram realizadas quinzenalmente nos jornais Folha de São Paulo e O Estado

de São Paulo. O ápice da avaliação negativa de Kassab ocorreu na segunda

quinzena de julho, a qual se deve, em parte, a uma suposta “ação” nos pontos

Page 65: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

50

de coleta da pesquisa Datafolha. Tal “ação” seria arquitetada conjuntamente

com as subprefeituras. Tal caso está bem explicitado em editorial da Folha de

São Paulo sob o titulo “A Mensagem de Kassab”, a qual vale a pena ser

reproduzida:

Em dificuldade para deslanchar sua campanha à reeleição,

o prefeito de São Paulo, Gilberto Kassab, patrocinou na

semana passada uma atitude infeliz, que sugere desespero.

Enviou mensagem eletrônica a 26 subprefeitos, chamando-os a

"identificar o ponto" onde entrevistadores do Datafolha

abordariam eleitores e realizar uma "ação", sem especificar

qual.

Kassab afirma que jamais tentou inflar seu desempenho na

pesquisa eleitoral. É difícil, entretanto, acreditar que tenha sido

outro o propósito da iniciativa. O e-mail foi repassado na

quarta-feira à noite, fim do primeiro dia do campo do Datafolha,

e o resultado, que mostrava o prefeito estagnado na terceira

colocação com 11% das preferências, foi divulgado na noite de

quinta-feira.

O candidato do DEM diz que o objetivo da "ação" era

impedir que "pessoas ligadas ao PT" promovessem distúrbios

em lugares próximos aos pontos onde seriam feitas as

entrevistas, a fim de prejudicar a percepção que o eleitorado

tem da gestão. De acordo com Kassab, a ideia era que os

funcionários da prefeitura ficassem atentos e, se fosse o caso,

chamassem a polícia para prender os baderneiros. Conspira

contra essa explicação o fato de ela ter sido fornecida apenas

após reportagem de Renata Lo Prete, desta Folha, ter revelado

o teor da mensagem enviada aos assessores. Se o prefeito

estava desconfiado de armação petista, deveria ter feito

denúncia antecipada. Além disso, o correto seria acionar seu

Page 66: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

51

comitê de campanha, nunca a máquina da administração, para

tanto.

É difícil influir em conclusões do Datafolha. O instituto

cumpre um protocolo rígido para evitar ações indevidas.

Mantém sigilo sobre os locais das entrevistas e descarta

pessoas que se apresentem como voluntárias para responder

ao questionário. Na hipótese de movimentações atípicas

próximas ao campo, todo o material recolhido é desprezado e

procede-se a nova coleta.

Quem tentar distorcer o resultado da pesquisa, portanto,

estará fadado ao fracasso e correrá o risco de ter descoberta a

maquinação pueril (Folha de São Paulo, 29/07/2008).

A partir desse episódio, a proporção de citações negativas de

Kassab começou a subir até, igualando-se a Marta Suplicy a partir do mês de

agosto de 2008 e caindo abaixo das avaliações de Marta Suplicy no mês de

outubro. No mês de outubro, as avaliações negativas de Marta Suplicy

aumentaram drasticamente, a qual está relacionada, principalmente, a uma

inserção no horário de propaganda política que atacava a vida pessoal do

candidato Gilberto Kassab.

O juiz Marco Antônio Martin Vargas, da 1ª Zona Eleitoral de

São Paulo, proibiu a candidata à Prefeitura Marta Suplicy (PT)

de transmitir, novamente, na publicidade eleitoral gratuita na

televisão e rádio, "expressões com questionamentos vagos,

fugindo do direito de crítica político-administrativa", e deu ao

prefeito Gilberto Kassab(DEM) um minuto de direito de

resposta no rádio.

A decisão refere-se à publicidade eleitoral petista que teve

início no domingo, em que o locutor perguntava, entre outras

coisas, se o democrata era casado e se tinha filhos.

Page 67: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

52

A proibição foi em resposta a uma representação da

Coligação São Paulo no Rumo Certo (DEM-PR-PMDB-PRP-

PV-PSC), de Kassab, contra a Coligação Uma Nova Atitude

para São Paulo (PT-PC do B-PDT-PTN-PRB-PSB), de Marta.

A resposta no rádio deve ser dada pelo prefeito de São

Paulo em até 36 horas. De acordo com a sentença, "os

questionamentos feitos na propaganda, de modo subliminar,

trazem no seu âmago a indagação proposital e depreciativa

que, indiscutivelmente, ofende a honra subjetiva do candidato

por levantar a suspeita quanto ao seu caráter e sua conduta,

seja na vida pública ou pessoal".

O juiz eleitoral entendeu que a publicidade pode causar

dúvidas no eleitor, dando a entender que Kassab possa ter

algo "escuso" no passado que o "descredenciaria" como

candidato.

Segundo Vargas, "na verdade, as abordagens negativas

subliminares aos candidatos em nada acrescentam para o

convencimento de o eleitor definir seu voto". O prefeito pode

recorrer ao Tribunal Superior Eleitoral (O Estado de São Paulo,

14/10/2008).

Tal atitude por parte do comitê de campanha da candidata Marta Suplicy

certamente causou grandes estragos no seu desempenho junto ao eleitorado

paulistano. No momento em que a campanha de ataque à vida pessoal de

Kassab, a candidata Marta chegou a 40% de avaliações negativas, situação

somente superada na segunda quinzena de junho de 2008, quando atingiu a

marca de 56% de avaliações negativas. Esse momento coincide com a sua

decisão de concorrer à prefeitura de São Paulo, deixando o cargo de ministra

do turismo e polêmica referente à propaganda política eleitoral antecipada,

sendo inclusive multada após decisão judicial do Tribunal Regional Eleitoral de

São Paulo.

Page 68: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

53

Figura 3: Proporção de avaliações negativas dos candidatos Gilberto Kassab e Marta Suplicy.

Fonte: Doxa, Laboratório de Pesquisa em Comunicação Política e Opinião Pública

(2010). Adaptado pelo autor.

Quando são levantadas as proporções de avaliações positivas dos

candidatos, mostradas na figura 4, nota-se que havia um equilíbrio entre eles

até o final de setembro/2008. A partir desse momento, o candidato Kassab

ultrapassou a proporção da candidata Marta e se manteve assim até o final do

processo eleitoral.

As citações em números absolutos podem ser visualizadas nos gráficos

das Figuras 5 e 6. Em números absolutos, o comportamento das citações

converge para o resultado obtido com os números relativos (proporções de

citações positivas e negativas) e as conclusões obtidas mantêm-se inalteradas.

No mês de outubro, já na reta final do processo eleitoral, o candidato

alcançou praticamente o dobro de citações positivas em comparação a sua

oponente Marta Suplicy.

Page 69: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

54

Figura 4: Proporção de avaliações positivas dos candidatos Gilberto Kassab e Marta Suplicy.

Fonte: Doxa, Laboratório de Pesquisa em Comunicação Política e Opinião Pública

(2010).

Figura 5: Número de citações positivas dos candidatos Gilberto Kassab e Marta Suplicy.

Fonte: Doxa, Laboratório de Pesquisa em Comunicação Política e Opinião Pública

(2010).

Page 70: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

55

Figura 6: Número de citações negativas dos candidatos Gilberto Kassab e Marta

Suplicy.

Fonte: Doxa, Laboratório de Pesquisa em Comunicação Política e Opinião Pública (2010).

2.2 O comportamento do eleitor paulistano, uma analogia aos conceitos

de campo e habitus de Pierre Bourdieu.

Apresentado o cenário político na Cidade de São Paulo, resta saber o

que o eleitor paulistano pensa a respeito dos candidatos e como funciona a

dinâmica desse pensamento ao longo do processo eleitoral. Desvendar o que

se passa na mente do eleitor não é tarefa simples, entretanto, pode-se buscar

uma aproximação através de uma pesquisa de opinião. O período eleitoral traz

a tona uma série de circunstâncias incomuns no dia a dia do brasileiro.

Segundo Moacyr Palmeira, é o chamado “tempo da política”.

Nas áreas que estudamos, ao contrário de outras atividades,

a política não é pensada como uma atividade permanente. Ela

se circunscreve a um período determinado, o período eleitoral,

que é designado sintomaticamente como o tempo da

Page 71: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

56

política. O tempo da política representa o momento em que as

facções (os partidos reais) são identificadas, e em que, por

assim dizer, existem plenamente, em conflito aberto, as

municipalidades divididas de uma maneira pouco habitual nas

grandes cidades. Como a facção, fora do tempo da política,

resume-se aos chefes políticos e a uns poucos seguidores, a

disputa eleitoral é exatamente uma disputa para incorporar o

maior número possível de pessoas, o maior numero de apoios

a cada facção. É o seu lado da sociedade que tem que ser

aumentado. Está, pois, em jogo uma disputa que é mais ampla

do que a disputa eleitoral stricto sensu. Está em questão tanto

a tentativa de acesso a certos cargos de mando quanto o peso

relativo de diferentes partes da sociedade, o que é decisivo

para a ordenação das relações sociais durante um certo

período de tempo (PALMEIRA, 1992).

Nesse contexto nascem as mais diversas teorias explicativas de como o

eleitor decide seu voto.

Vigoram na ciência política, inclusive na brasileira, várias

teorias que procuram explicar o comportamento eleitoral.

Dentre as principais, pode-se destacar a perspectiva

sociológica, a psicológica e a teoria da escolha racional

(RADMANN, 2001).

Pode-se afirmar que nenhuma delas explica isoladamente a decisão do

eleitor no momento do voto. O máximo que se pode afirmar é que as teorias

agem conjuntamente sendo apropriadas em maior ou menor grau conforme

são ditadas as regras impostas pelas circunstâncias do momento dentro do

processo eleitoral.

A teoria sociológica do comportamento eleitoral presume que indivíduos

que se encontram em situações sociais semelhantes tendem apresentar o

mesmo comportamento político e, consequentemente, eleitoral.

Page 72: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

57

Quanto à teoria psicológica, está vinculada às emoções que margeiam o

processo eleitoral, tal como ondas que atingem um barco, jogando-o para

frente, para trás ou para os lados. Dependendo do impacto emocional, os

rumos da eleição podem ser desastrosos para o candidato, ou seja, uma onda

pode acabar virando o barco.

A escolha racional é possivelmente aquela que apresenta maior

preponderância na escolha do voto, pois está diretamente ligada a um

processo de troca, de identidade, de comprometimento do candidato com os

anseios e razões do eleitor.

Pode-se imaginar que a escolha do voto segundo o critério sociológico,

tal como definido anteriormente, é o resultado da composição das escolhas

racional e psicológica, pois os estratos sociais apresentam reações emocionais

e racionais distintas, ou seja, a sua condição dentro do espaço social define a

sua reação perante os fatos políticos que o cercam. Pode-se afirmar que o

eleitor apresenta padrões de comportamento quando identificamos os estratos

sociais a qual pertence. Tais estratos correspondem, por exemplo, a sua

condição religiosa, financeira, de faixa etária, de educação, etc.

Considerando que cada grupo de pacientes reage de forma diferente a

um medicamento, o principal objetivo deste capítulo é buscar e isolar esse

comportamento no interior de cada estrato, os quais podem evidenciar parte

das reações emocionais e racionais do eleitor.

A situação social pode ser compreendida como o campo e habitus

definidos por Pierre Bourdieu.

O conceito de habitus está diretamente relacionado com a percepção

que o indivíduo possui do seu ambiente e como interage com esse meio,

deixando-o impregnado de marcas que o inserem como participante

incontestável de um determinado estrato ou estratos da sociedade. Nota-se,

prontamente, que o habitus está ligado a características peculiares que

conduzem o indivíduo socialmente numa linha do tempo em constante

Page 73: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

58

mudança, normalmente causada pelas pressões impostas pela composição

dos campos em que se insere. Assim, podemos concluir que o habitus é um

subproduto do campo e, nesse contexto, com raras exceções, ambos são

inseparáveis. Acresce, ainda, observar que o habitus tem sua origem a partir

de ações externas impostas, principalmente, pelo campo.

Segundo Bourdieu, existe um estreito relacionamento entre habitus e

campo, considerando que o primeiro se manifesta ou é estimulado dentro do

segundo.

Pensar a relação entre indivíduo e sociedade com base na

categoria habitus implica afirmar que o individual, o pessoal e o

subjetivo são simultaneamente sociais e coletivamente

orquestrados. O habitus é uma subjetividade socializada

(BOURDIEU, 1992).

Dessa forma, deve ser visto como um conjunto de

esquemas de percepção, apropriação e ação que é

experimentado e posto em prática, tendo em vista que as

conjunturas de um campo o estimulam (SETTON, 2002)

O campo, compreendido como uma categoria autônoma molda os

agentes que nele estão inseridos dotando-os de características peculiares que

permitem identificá-los como a ele pertencentes. Essa modelagem imposta

pelo campo cria um perfil construído paulatinamente dentro de um processo

histórico, gerando e extinguindo ações, e com intensidades distintas de

indivíduo para indivíduo, de modo a criar substratos condicionados pelas

interfaces com outros campos.

[...] a existência de um campo especializado e relativamente

autônomo é correlativa à existência de alvos que estão em jogo

e de interesses específicos: através dos investimentos

indissoluvelmente econômicos e psicológicos que eles

suscitam entre os agentes dotados de um determinado habitus,

Page 74: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

59

o campo e aquilo que está em jogo nele produzem

investimentos de tempo, de dinheiro, de trabalho etc. [...]

Todo campo, enquanto produto histórico, gera o interesse,

que é condição de seu funcionamento (BOURDIEU, 1990).

Os habitus individuais, produtos da socialização, são

constituídos em condições sociais específicas, por diferentes

sistemas de disposições produzidos em condicionamentos e

trajetórias diferentes, em espaços distintos como a família, a

escola, o trabalho, os grupos de amigos e/ou a cultura de

massa (SETTON, 2002).

Adaptando os conceitos de campo e habitus dentro do processo

eleitoral, votar transforma-se em sinônimo de habitus, o qual se encontra

enraizado nos campos respectivos.

No campo econômico, por exemplo, podemos delinear o capital renda e

de que forma influi na decisão do voto. Para cada nível de renda, o habitus

difere, ou seja, em termos de preponderância, a escolha do eleitor acompanha

o seu nível de renda.

Dessa maneira, é possível endossar o pensamento de Bourdieu, quando

se pretende descrever o campo social observado por meio de escalas

multidimensionais em um sistema de coordenadas:

[...] o campo social como um espaço multidimensional de

posições tal que qualquer posição atual pode ser definida em

um sistema multidimensional de coordenadas cujos valores

correspondem aos valores das diferentes variáveis pertinentes:

os Agentes distribuem-se assim nele, na primeira dimensão,

segundo o volume global do capital que possuem e na segunda

dimensão segundo a composição do seu capital – quer dizer,

segundo o peso relativo das diferentes espécies no conjunto

das suas posses. [...]

Page 75: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

60

O inquérito estatístico só pode apreender esta relação de

forças em forma de propriedades, por vezes juridicamente

garantidas por meio dos títulos de propriedade econômica,

cultural – títulos escolares – ou social – títulos de nobreza -; é

isto que explica o liame entre a pesquisa empírica entre as

classes e as teorias da estrutura social como estratificação

descrita em termos de distância em relação aos instrumentos

de apropriação (‘distância em relação ao núcleo dos valores

culturais’ de Halbwachs), como faz o próprio Marx quando fala

da ‘massa privada de propriedade’ (BOURDIEU, 1989).

Para atender os objetivos do capítulo é abordado o comportamento do

eleitor paulistano na eleição para prefeito da Cidade de São Paulo em 2008. As

principais variáveis estudadas estão vinculadas aos campos renda,

escolaridade, faixa etária e religião. Cada um desses campos é avaliado com

base em mapeamento estatístico utilizando a ferramenta Análise de

Correspondência (ANACOR) a qual busca encontrar associações entre os

campos estudados com os respectivos candidatos.

A análise de correspondência (ANACOR) e a análise de

homogeneidade (HOMALS) são técnicas de interdependência

que buscam estudar a relação entre variáveis qualitativas,

permitindo ao pesquisador a visualização de associações, por

meio de mapas perceptuais que oferecem uma noção de

proximidade, ou associação de frequências, das categorias das

variáveis não métricas (FAVERO, BELFIORI, et al., 2009).

Os dados foram obtidos da pesquisa Datafolha realizada entre 07 e 08

de outubro de 2008, a qual mostra as preferências dos eleitores considerando

sexo, faixa etária, escolaridade, renda e religião. Esses dados secundários são

tratados e organizados de forma apropriada permitindo adaptá-los ao pacote de

análise estatística R (R PROJECT, 2013).

Page 76: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

61

2.3 A dinâmica dos campos: uma proposta de modelagem.

Antes de se iniciar a análise de correspondência, faremos uma breve

explanação referente à dinâmica dos campos procurando explicitar algumas

limitações impostas pelas variações intrínsecas a esses campos no que se

refere às análises de comportamento social e, mais especificamente, do

comportamento eleitoral.

A teoria exposta neste item se justifica pelo fato de proporcionar

potenciais análises e modelagens dos campos no que se refere à sua

dinâmica. A teoria que envolve o assunto é complexa para ser detalhada neste

trabalho, entretanto, busca-se traçar as linhas básicas dessa teoria de forma

subsidiar os interessados que desejarem um maior aprofundamento no

assunto.

A medida que o parâmetro tempo flui, a dinâmica desses campos pode

ser avaliada a partir de uma modelagem que considere as posições dos

agentes no interior desses campos e como esses agentes interagem com

essas posições. Essa modelagem permitiria realizar previsões sobre as

posições dos agentes dentro do seu campo considerando o comportamento

histórico desses mesmos agentes.

O que se pretende é apresentar ferramentas probabilísticas básicas

voltadas para potenciais estudos da dinâmica dos campos. Provavelmente não

é a única forma de se lidar com o fenômeno da dinâmica dos campos,

entretanto, pode lançar luz em um assunto pouco trabalhado quantitativamente

e que poderá abrir novos procedimentos de visualização dos campos tais como

conceituados por Pierre Bourdieu.

Para ilustrar a dinâmica imposta aos campos, consideremos o diagrama

da Figura 7. Nele é possível distinguir três campos (renda, religião e

escolaridade) interagindo ao longo de uma variável tempo. Se considerarmos a

Page 77: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

62

ação simultânea dos três campos (ou seja, a intersecção dos três campos),

vemos que essa ação depende da sua localização no tempo.

Figura 7: A dinâmica dos campos: renda, religião e escolaridade.

Fonte: Elaborada pelo autor.

Assim, num instante t particular, a configuração dos campos pode

oferecer um comportamento eleitoral diferente do instante anterior, t-1, ou em

instante posterior, t+1, ou seja, ocorre uma variação do comportamento do

eleitor quando há um incremento no tempo.

Esse incremento no tempo pode ser, por exemplo, o intervalo entre

períodos eleitorais, ou seja, considerando o processo eleitoral brasileiro, a cada

dois anos ou até dentro de um processo eleitoral caso o incremento de tempo

seja o intervalo entre as pesquisas eleitorais.

Tal fenômeno, dependente do tempo e de ocorrências aleatórias, é

conhecido como processos estocásticos, ou seja, processos probabilísticos

dependentes da variável tempo.

O processo estocástico é uma coleção de variáveis aleatórias indexadas

por um parâmetro t entendido como tempo.

Page 78: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

63

A variável aleatória é definida em um espaço denominado de espaço de

estados. Um exemplo singelo de processo estocástico é a condição

meteorológica em um determinado dia. Nesse exemplo o espaço de estados

pode ser definido como “chuvoso”, “nublado” ou “ensolarado” e o parâmetro

tempo corresponde ao dia em que a condição meteorológica é observada.

Tanto o estado quanto o tempo podem assumir várias formas relacionadas à

continuidade e à extensão.

Os processos estocásticos podem ser classificados em relação ao

estado e em relação ao tempo.

Em relação ao estado, quanto ao quesito continuidade, o espaço pode

ser discreto, quando é possível iniciar uma enumeração ou contagem17 do

número de estados, ou contínuo, quando não é possível realizar uma

enumeração ou contagem. Quanto à extensão, o espaço de estados pode ser

finito ou infinito.

O número de usuários em uma fila no caixa do banco em um

determinado instante corresponde a um espaço de estados discretos (número

de usuários) e finito, pois existe um número limite de usuários.

A temperatura média da Terra em determinado instante apresenta um

espaço de estados (temperatura) contínuo, pois o valor observado da

temperatura depende do grau de precisão do instrumento de medição, ou seja,

sempre se observa uma aproximação do valor da temperatura. O espaço de

estados é finito, considerando-se a hipótese de que o Universo está em

constante expansão e tende a se resfriar até o chamado zero absoluto18 em um

futuro extremamente distante.

17

Um conjunto é dito discreto quando for enumerável ou contável. O conjunto do número de filhos de um casal é enumerável e contável. Caso o conjunto seja discreto, mas infinito, ele é apenas enumerável, mas não contável. Um conjunto contínuo não permite enumeração e contagem.

18 A temperatura zero absoluto corresponde a -273,15°C e é a temperatura mais baixa

alcançável no Universo. Segundo algumas teorias sobre o futuro remoto do Universo, haveria uma expansão sem fim com consequente resfriamento até o zero absoluto (teoria do Big Freeze). Mesmo o

Page 79: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

64

Em relação ao tempo, o processo estocástico pode ser contínuo ou

discreto (quesito continuidade) e finito ou infinito (quesito extensão).

No exemplo da temperatura média da Terra em determinado instante, o

tempo é contínuo e infinito, admitindo-se a hipótese de que o tempo fluirá para

sempre.

Todas as classes de processos estocásticos tem aplicação nas

modelagens dos fenômenos socioeconômicos, dependendo apenas do

comportamento do fenômeno analisado.

Neste capítulo, o interesse está voltado para um caso específico de

processo estocástico, aquele no qual o espaço de estados é discreto e finito e

o parâmetro tempo é discreto, seja finito ou não. Tais processos estocásticos

são conhecidos como Cadeias de Markov19 em tempo discreto. Um exemplo de

Cadeias de Markov é o fluxo dos agentes dentro dos estados no campo

religioso. Nesse caso o espaço de estados corresponde às religiões e o

parâmetro tempo é discreto quando as observações são realizadas em

intervalos discretos e constantes.

É inevitável, portanto, a ação do tempo nas condições do campo por

meio das atitudes individuais dos agentes, as quais, somadas, definem um

novo estado ou uma permanência no estado.

Se considerarmos que o processo de transição entre as posições

(estados) dentro de um campo ocorre de forma homogênea, então se pode

afirmar que, em algum momento futuro, haverá um equilíbrio perfeito entre as

transições e as posições convergem para uma situação estável. Entende-se

como transição de forma homogênea aquela na qual as probabilidades de

transição são constantes no tempo, ou seja, uma simplificação da realidade

que pode ser útil em condições controladas. Para melhor esclarecimento dos

limite zero absoluto pode vir a ser contestado, pois corresponde a uma condição teórica confirmada por algumas experiências instrumentais, mas sem garantias de que não possa ser ultrapassado.

19 A cadeia de Markov apresenta a propriedade Markoviana, denominada em homenagem ao

matemático Andrei Andreyevich Markov.

Page 80: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

65

conceitos apresentados até aqui, recorreremos ao diagrama da Figura 8. Essa

figura mostra três estados (posições) dentro do campo religião. A simplificação

do diagrama exige que somente esses três estados sejam possíveis no campo

religião. Os agentes estão inseridos nesse campo dentro das respectivas

posições em um instante inicial qualquer. Esses agentes podem no instante

seguinte (uma próxima eleição, por exemplo) mudar a sua condição de estado,

ou seja, migrar de um estado para outro ou permanecer no mesmo estado.

Figura 8: Diagrama simplificado para "estados" religiosos.

Fonte: Elaborada pelo autor.

Essas mudanças de estado ocorreriam segundo uma probabilidade

encontrada a partir de uma análise histórica de comportamento.

Acompanhando o diagrama da Figura 8, quando se toma o estado, por

exemplo, sem religião, a probabilidade de que no período seguinte o agente se

mantenha nessa condição é , a probabilidade de que ele passe ao estado

católico é e de passar ao estado evangélico é . Como se admite que

somente existem esses três estados, a soma dessas probabilidades deve

resultar em 100%.

Page 81: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

66

Levando-se em conta a definição de processo estocástico do tipo tempo

discreto20 e cadeias homogêneas e regulares21 nos modelos estatísticos

(ROSS, 1996), em algum momento no futuro haverá uma estabilidade e será

possível estimar, por exemplo, o número daqueles sem religião dentro de uma

população de eleitores.

Como exemplo de modelagem de um campo usando as Cadeias de

Markov toma-se o diagrama da Figura 9, o qual corresponde a uma situação

hipotética para o problema das posições (estados) do campo religião. Pode-se

observar, por exemplo, que para o estado 3 (sem religião) a probabilidade do

agente continuar nesse estado é de 99%. A probabilidade de realizar uma

transição para o estado 2 (evangélico) é de 0,3% e para o estado 1 (católico) a

probabilidade é de 0,7%. O mesmo entendimento é aplicado para os outros

estados considerando-se as respectivas probabilidades de transição.

Admite-se que essas probabilidades de transição são fruto de

levantamentos históricos efetuados a cada dois anos, ou seja, coincidindo com

o período eleitoral. Assim, a cada dois anos, o percentual de católicos que

fariam transição para o estado 2 (evangélico) é de 1,5%.

Ainda considerando-se uma situação hipotética, admite-se que

atualmente as condições de estado do eleitorado nesse campo é 70% de

católicos, 25% de evangélicos e 5% sem religião.

Caso as probabilidades de transição se mantenham constantes

(homogêneas) para os próximos seis anos (três períodos) como estará essa

distribuição dentro do campo em cada período?

20

Discreto no tempo e no espaço de estados. No tempo porque a observação do processo ocorre em um instante definido (a cada dois anos, por exemplo) e no espaço de estados porque existe um numero finito de estados mutuamente exclusivos e exaustivos.

21 A cadeia é regular quando atende condições definidas de estado. Para um maior

aprofundamento no tema, recomenda-se a leitura de Ross, 1996.

Page 82: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

67

Figura 9: Diagrama de uma situação hipotética para "estados" religiosos.

Fonte: Elaborada pelo autor.

A modelagem feita através da definição das Cadeias de Markov permite

estimar, para cada período subsequente, a proporção de eleitores em cada

posição (estado) do campo religião. Os valores obtidos a partir dessa

modelagem são fornecidos na Tabela 3.

Tabela 3: Modelagem da evolução das proporções de eleitores em cada estado

do campo religião.

Condição Católico Evangélico Sem religião

Inicial 70% 25% 5%

Após 2 anos 68,8% 25,8% 5,4%

Após 4 anos 67,7% 26,6% 5,7%

Após 6 anos 66,6% 27,4% 6%

Fonte: Elaborada pelo autor.

Assim, após três períodos eleitorais (6 anos) haveria 66,6% de católicos,

27,4% de evangélicos e 6% sem religião.

Caso as probabilidades de transição se mantivessem constantes, após

muitos períodos as proporções se estabilizariam (haveria um equilíbrio) em

Page 83: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

68

27,7% de católicos, 48,7% de evangélicos e 23,6% sem religião. O gráfico da

Figura 10 mostra a velocidade de convergência das proporções de cada estado

até a estabilidade. Essa estabilidade, nas condições adotadas, levaria

aproximadamente 600 anos (300 períodos) para ser alcançada. Entretanto,

para que isso pudesse ocorrer, as probabilidades de transição entre os estados

teriam que ser imutáveis ao longo desses 600 anos. Obviamente que essa

condição é impossível de ser respeitada.

Figura 10: Diagrama de uma situação hipotética para estados religiosos.

Fonte: Elaborada pelo autor.

O problema principal nessa modelagem está vinculado ao fato de que as

probabilidades de mudança de estado não são constantes no tempo, ou seja, a

cadeia não é regular, jogando por terra qualquer tentativa eficiente de previsão.

Mesmo o campo da religião, o qual pode admitir certa regularidade no tempo,

está sujeita a mudanças drásticas, mudando completamente as probabilidades

de transição de estados.

Page 84: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

69

Não podemos esquecer que os campos não são herméticos, e podem

interagir, ou seja, mudanças em um campo pode afetar outro campo ou outros

campos, levando a uma reação em cadeia que beira o caos, não existindo

qualquer modelo estatístico que possa prever os resultados.

Apesar dos problemas evidenciados, a aproximação fornecida pelos

modelos estocásticos é importante para uma visualização do comportamento

social presente e em curto prazo. Com base nessas informações o cientista

político pode definir estratégias eleitorais considerando a dinâmica dos campos

e das posições que o compõe.

Passamos a seguir para a análise de correspondência para cada um dos

campos escolhidos para estudo de comportamento eleitoral. Cada campo será

analisado de forma independente, entretanto, sempre que ocorrer, é feita uma

análise das correlações entre os campos.

2.4 Avaliação dos campos pela análise de correspondência

2.4.1 Campo Escolaridade

A Tabela 4 mostra a preferência dos eleitores considerando o campo

escolaridade.

A escolaridade é, sem a menor margem para dúvidas, um fator

determinante nas análises de intensão de voto. Eleitores com mais

escolaridade tende a formar uma visão mais ampla do processo eleitoral e

consequentemente um maior senso crítico. Além da formação de opinião, o

eleitor recebe forte influência em função da sua posição no campo

escolaridade.

.

Page 85: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

70

Tabela 4: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo

estratificada pelo nível de escolaridade.

Pesquisa: 7 e 8 de

outubro 2008

Escolaridade

Fundamental Médio Superior

Gilberto Kassab 48 54 67

Marta Suplicy 45 36 25

Branco/nulo/nenhum 3 7 7

Não sabe 4 3 2

Total (%) 4 3 2

Total n° absolutos 734 774 398

Fonte: Datafolha (2008).

A análise de correspondência foi realizada utilizando-se o pacote

estatístico R (R PROJECT, 2013), de código aberto e de uso gratuito. Para

testar a significância estatística dos dados da Tabela 4, usou-se o teste de qui-

quadrado com 6 graus de liberdade, o qual forneceu um valor de 11,55 e um p-

valor correspondente de 0,073 (7,3%). Considerando um nível de confiança de

90%, pode-se afirmar que os dados fornecem informações de significância

estatística quanto ao comportamento dos eleitores em correspondência com o

campo escolaridade. O passo seguinte foi elaborar através do pacote

estatístico R, o mapa perceptual dos eleitores. Esse mapa perceptual é

apresentado na Figura 11.

O mapeamento perceptual do campo escolaridade realizado por meio da

análise de correspondência mostra claramente maior proximidade do nível

fundamental com a candidata Marta Suplicy. Pode-se explicar essa

proximidade considerando-se que eleitores do nível fundamental apresentam

maior probabilidade de pertencer às camadas mais pobres da sociedade. A

candidata pertencente ao partido do governo federal (PT) tem sua imagem

vinculada às ações e programas sociais de auxílio aos mais necessitados, tal

como o programa Bolsa Família. Nota-se, portanto, a provável eficiência

dessas ações no quesito referente à atração de votos dessa camada social.

Page 86: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

71

Figura 11: Mapa de percepção para o campo escolaridade.

Fonte: Elaborada pelo autor.

Os eleitores do nível médio se posicionaram em um ponto ligeiramente

mais próximo do candidato Gilberto Kassab, mostrando uma pequena

vantagem do candidato nesse estrato.

Já os eleitores que afirmaram votar em branco ou anular o voto

apresentam maior correspondência com os eleitores de nível superior e médio,

os quais demonstram ceticismo quanto ao processo eleitoral, não acreditando

ESCOLARIDADE

-0.3 -0.2 -0.1 0.0 0.1 0.2

-0.3

-0.2

-0.1

0.0

0.1

Kassab

Marta

branconulo

nsabe

Fund

Medio

Sup

Page 87: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

72

na possibilidade de viabilizar uma real mudança nos rumos da administração

da cidade.

Outra constatação interessante diz respeito aos eleitores indecisos, os

quais apresentam correspondência com os eleitores do nível fundamental. Uma

possível explicação para esse fenômeno se deve ao fato de que eleitores com

menor grau de instrução têm menos acesso aos meios de comunicação e,

consequentemente, maior dificuldade na formação de opinião. Tal explicação

pode ser confirmada pela pesquisa Datafolha que indaga a respeito do debate

realizado em 24/10/2008 a qual está resumida na Tabela 5. A pesquisa

perguntou se o eleitor assistiu o debate (por inteiro ou parte do debate) ou se

não assistiu.

Tabela 5: Pesquisa eleitoral para prefeito de São Paulo, debate na TV, estratificada pelo nível de escolaridade.

Pesquisa: 25 de

outubro 2008

Escolaridade

Fundamental Médio Superior

Assistiu 41 45 54

Assistiu Inteiro 12 15 19

Assistiu parte 30 30 35

Não Assistiu 59 55 46

Fonte: Datafolha (2008).

A partir da Tabela 5 realizou-se a análise de correspondência entre

escolaridade dos eleitores e se assistiu o debate realizado pela TV Globo em

25/10/2008. O resultado vai ao encontro da explicação proposta para os

eleitores indecisos do nível fundamental, pois o mapa perceptual mostra a

ligação desses eleitores com aqueles que não assistiram o debate e são do

nível fundamental.

Deve-se reconhecer, entretanto, que a questão dos eleitores indecisos

vai muito além da explicação proposta aqui, ou seja, o fato do eleitor do nível

fundamental apresentar correspondência com os indecisos é parte da

Page 88: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

73

explicação. Existem, certamente, outros motivos que levam o eleitor à

indecisão. O capítulo 3 tratará com maior aprofundamento o fenômeno da

indecisão no voto, inclusive propondo modelos estatísticos que possam

explicar esse comportamento e prever o comportamento do eleitor indeciso no

momento de inserir o seu voto na urna.

O mapa perceptual da Figura 12 mostra a proximidade dos eleitores do

nível superior com aqueles que assistiram inteiramente o debate. Um candidato

que faz uma boa apresentação em um debate tende apresentar uma boa

aceitação no estrato do nível superior, pois é justamente essa categoria que

mais assiste o debate. Assim, um candidato que apresentar melhor

desempenho num debate televisionado, provavelmente gerará impacto nos

eleitores que assistiram tal debate. Já os eleitores do nível fundamental

apresentam maior proximidade com aqueles que não assistiram o debate e,

portanto, os efeitos de um debate nesse estrato de eleitores seriam mínimos.

É possível afirmar, entretanto, que os efeitos dos debates são

relativamente pequenos no que se refere à mudança de opinião do eleitor. Para

aqueles que assistem o debate e apresentam maior senso crítico, a opinião é

formada por outros meios de informação, sendo o debate apenas uma

informação adicional para confirmar suas convicções, ou seja, está mais

interessado no desempenho do seu candidato do que no debate. O mesmo não

ocorreria com aqueles menos preparados em termos de formação de opinião.

Nesse caso, estariam mais sujeitos às estratégias de persuasão dos

candidatos.

Em suma, os estudos da literatura internacional sustentam

que os efeitos mínimos dos debates sobre a preferência do

voto ao nível individual são esperados porque os eleitores que

assistem esses eventos já são suficientemente informados

sobre os candidatos e suas posições. Essa atitude teria

correlação com as características sociais como escolaridade,

renda, preferência partidária e idade. Para esses eleitores,

Page 89: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

74

possíveis inconsistências entre a atitude com relação ao

desempenho dos candidatos e a preferência do voto seriam

reduzidas a partir de uma estratégia de percepção seletiva.

Como são mais preparados do ponto de vista cognitivo para

lidar com temas da política, podem recorrer a outros meios de

informação política, especialmente aqueles que reforcem suas

predisposições. Essa estratégia ajudaria a reduzir o efeito de

enfraquecimento ou mudança de atitude. Para outro grupo de

eleitores, especialmente os menos informados, as atitudes

seriam menos consistentes porque eles apresentam menos

disposição para o consumo de outras fontes de informação

política. Essa afirmação implica em dizer que esses eleitores,

embora tenham menos incentivos para assistir aos debates,

estão mais sujeitos às estratégias persuasivas dos candidatos

(VASCONCELLOS, 2011).

Vasconcellos (2011) chega a uma conclusão similar ao encontrado no

mapa perceptual da Figura 12 quanto ao perfil do eleitor que assiste o debate

pela televisão.

[...] a escolaridade alta, seguida da renda, preferência por

algum candidato e preferência partidária aumentam e muito a

probabilidade de o eleitor assistir ao debate. A escolaridade é a

variável preditora mais forte para toda a série.

Pelos resultados desse estudo, os debates, embora sejam

eventos de campanha voltados para o grande público da

televisão, têm mais probabilidade de atrair um determinado tipo

de eleitor. Portanto, não é o meio que atrai a audiência, mas

sim uma associação entre posição social e o conteúdo

específico desses eventos, qual seja, as informações político-

eleitorais.

[...] embora a escolaridade, renda e preferência partidária

sejam preditores importantes para prever quem deverá assistir

aos debates, eleitores com alta renda, alta escolaridade e

Page 90: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

75

preferência partidária, ou seja, aqueles mais propensos a

acompanhar esses eventos, são menos representativos no

eleitorado brasileiro. Portanto, uma avaliação geral dos efeitos

dos debates deve levar em conta também a repercussão dos

debates nas outras fontes de informação que chegam aos

outros eleitores que não acompanham esses eventos de

campanha (VASCONCELLOS, 2011).

Figura 12: Mapa de percepção do debate na televisão quanto ao campo escolaridade.

Fonte: Elaborada pelo autor.

DEBATE

-0.15 -0.10 -0.05 0.00 0.05 0.10

-0.1

0-0

.05

0.0

00

.05

0.1

0

assistiu

assint

asspart

naoass

Fund

Medio

Sup

Page 91: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

76

2.4.2 Campo Renda

A análise de correspondência para o campo renda apresentou forte

significância estatística para as correspondências entre as posições do campo

(níveis de renda) e a intensão de voto. O teste de correspondência de Pearson

forneceu um qui-quadrado com valor 21,5, para 9 graus de liberdade o que

fornece um p-valor de 1,06%, ou seja, alta significância estatística. A tabela 6

mostra os dados referentes à preferência de voto considerando a renda dos

eleitores com base no salário mínimo (SM).

Tabela 6: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo estratificada por renda.

Pesquisa: 7 e 8 de

outubro 2008

Renda (em salário mínimo)

até 2 SM 2 a 5 SM 5 a 10 SM mais 10 SM Gilberto Kassab 40 55 60 73

Marta Suplicy 49 37 31 22 Branco/nulo/nenhum 5 6 5 5

Não sabe 5 3 3 0 Total (%) 100 100 100 100

Total n° absolutos 485 830 312 223 Fonte: Datafolha(2008)

O mapa perceptual para o campo renda é apresentado na Figura 13. O

mapa mostra que eleitores de renda mais baixa estão próximos da candidata

Marta Suplicy e os de renda mais alta estão próximos do candidato Gilberto

Kassab. O campo renda apresenta comportamento similar ao campo

escolaridade, ou seja, a discussão se repete se considerarmos a analogia entre

os estratos de instrução e os estratos de renda. Eleitores com renda inferior a

dois salários mínimos e entre dois salários mínimos e cinco salários mínimos

estão próximos da candidata Marta Suplicy, juntamente com os indecisos.

Eleitores com renda superior a cinco salários mínimos estão próximos ao

candidato Gilberto Kassab. Votos em branco e nulos apresentam maior

correspondência com eleitores de renda superior a cinco salários mínimos.

Page 92: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

77

Figura 13: Mapa de percepção para o campo renda.

Fonte: Elaborada pelo autor.

Analisando os campos escolaridade e renda é possível constatar uma

associação entre os níveis extremos de cada campo, ou seja, superior com

mais de dez salários mínimos e fundamental com menos de dois salários

mínimos. É possível delinear perfeitamente a oposição entre esses níveis no

exercício do voto.

A situação de insatisfação com o processo eleitoral e a descrença em

reais mudanças na administração pública pode ser avaliada com base nos

eleitores que declaram voto nulo ou em branco. Nota-se, através do mapa

RENDA

-0.3 -0.2 -0.1 0.0 0.1 0.2 0.3

-0.2

-0.1

0.0

0.1

0.2

0.3

KassabMarta

branconulo

nsabe<2sm

2a5sm

5a10sm

>10sm

Page 93: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

78

perceptual, que eleitores com renda acima de cinco salários mínimos

apresentam elevada correspondência com os que declaram voto nulo ou em

branco. Uma possível explicação para essa correspondência seria a formação

de um senso crítico dentro da sua posição no campo renda e escolaridade.

Uma melhor análise seria possível se dados referentes às suas atividades

sociais fossem mais detalhados a ponto de determinar o habitus do grupo ao

qual pertence e, consequentemente, como votam. Tal análise exigiria um

levantamento de campo extremamente complexo, entretanto, seria interessante

para um trabalho futuro voltado exclusivamente para essa questão.

2.4.3 Campo Faixa Etária

A análise de correspondência para o campo faixa etária (idade) não

apresentou significância estatística para as correspondências entre as posições

do campo (faixas etárias) e a intensão de voto. O teste de correspondência de

Pearson forneceu um qui-quadrado com valor 14,03, para 12 graus de

liberdade o que fornece um p-valor de 29,86%, ou seja, sem significância

estatística. A estratificação das intenções de voto por faixa etária é

apresentada na tabela 7.

Tabela 7: Pesquisa eleitoral para prefeito de São Paulo estratificada por faixa etária.

Pesquisa: 7 e 8 de

outubro 2008

Idade (anos)

16 a 24 25 a 34 35 a 44 45 a 59 Mais de 60

Gilberto Kassab 53 53 53 54 62

Marta Suplicy 34 41 37 39 30

Branco/nulo/nenhum 10 5 5 4 4

Não sabe 2 2 4 3 4

Fonte: Datafolha (2008).

O mapa perceptual para o campo renda é apresentado na Figura 14.

Apesar de não apresentar significância estatística, é possível visualizar

proximidades no mapa perceptual. Temos uma proximidade dos muitos jovens

(16 a 24 anos) com a candidata Marta Suplicy. Também estão muito próximos

Page 94: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

79

da candidata os eleitores da faixa etária 35 a 44 anos. Surpreendentemente a

faixa 25 a 34 anos está mais distante da candidata que a faixa imediatamente

acima (35 a 44 anos), ou seja, isso justifica o resultado encontrado da não

significância estatística, mostrando que a preferência dos mais jovens pela

candidata não se confirma inteiramente. Já os eleitores com mais de 60 anos

apresentaram grande proximidade com o candidato Gilberto Kassab. Talvez

um estudo envolvendo uma amostra maior traga significância estatística para a

correspondência entre faixa etária e intenção de voto

Figura 14: Mapa de percepção para o campo idade (faixa etária)

Fonte: Elaborada pelo autor.

.

IDADE

-0.3 -0.2 -0.1 0.0 0.1 0.2 0.3

-0.3

-0.2

-0.1

0.0

0.1

0.2

Kassab

Marta

branconulo

nsabe

16a24

25a34

35a44

45a59

>60

Page 95: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

80

2.4.4 Campo Religioso

O campo religião apresentou significância estatística moderada com

valor de qui-quadrado 19,18 para 12 graus de liberdade e consequente p-valor

de 8,42%, ou seja, abaixo de um nível descritivo de 10%.

Isso indica que é considerável a influência do campo religião na decisão

do voto. Evangélicos e Católicos se posicionam de forma praticamente

equidistantes dos candidatos Gilberto Kassab e Marta Suplicy, mostrando a

inexistência de uma tendência. O destaque foi para os Espíritas e aqueles que

se declararam sem religião. A tabela 8 mostra os dados da preferência de voto

estratificados por religião adotada (católica, evangélica pentecostal - Evan,

evangélica não pentecostal – Evan Npet, espírita e sem religião).

Tabela 8: Pesquisa eleitoral de preferência de voto para prefeito de São Paulo estratificada por religião.

Pesquisa: 7 e 8 de

outubro 2008

Religião

Católica Evan. Pet.

Evan. Npet. Espírita Sem Religião

Gilberto Kassab 55 52 57 68 44

Marta Suplicy 38 38 38 26 43

Branco/nulo/nenhum 4 6 4 4 11

Não sabe 3 4 1 3 1

Fonte: Datafolha (2008).

No mapa perceptual do campo religioso da Figura 15 os Espíritas

mostraram maior proximidade com o candidato Gilberto Kassab e os sem

religião, mostraram proximidade com os que declararam voto nulo ou em

branco. Desperta curiosidade o fato dos sem religião optarem por anular o voto

ou votarem em branco. Tal disposição de voto, mostra que transferem sua

condição religiosa para o campo político, ou seja, não crê nas instituições

religiosas e, consequentemente, não crê nas instituições políticas. Lembrando

que os eleitores declarantes de voto nulo ou em branco estão próximos do

nível superior no campo escolaridade, temos a possibilidade de levantar como

provável hipótese para esse comportamento a racionalidade. A razão leva o

Page 96: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

81

eleitor questionar as instituições e seu papel na sociedade e, na sua

interpretação, não vê a possibilidade de mudança na sua condição de vida

caso aderir a uma instituição religiosa ou votar em um político. Possivelmente

não se trata exclusivamente na espécie de razão que leva ao ateísmo, apesar

de fazer parte desse grupo. O agente na condição de sem religião pode estar

em busca de formas alternativas de manifestar sua crença ou sua convicção

política, pois não consegue se identificar com os modelos preponderantes na

sociedade.

Reforçando o entendimento adotado no parágrafo anterior, foi possível

constatar que esse comportamento já ocorreu em outros estudos relacionados

à religião envolvendo questões socioeconômicas. Estudo realizado pelo Projeto

Religiões no Brasil (GREELEY e SCALON, 2002) proporciona uma visão geral

sobre a religião através das opiniões dos entrevistados.

Segundo sumário do Consórcio de Informações Sociais, CIS, o estudo

entrevistou homens e mulheres, maiores de 18 anos, em 24 Estados e 195

municípios brasileiros.

Este banco de dados traz informações sobre os valores e a

religião no Brasil de homens e mulheres de 18 anos e mais

para 24 Estados e 195 municípios no ano de 2002. Inclui a

opinião dos entrevistados sobre questões polêmicas no campo

religioso (como aborto e sexo antes do casamento, por

exemplo) e sobre a Igreja, bem como crenças (acredita ou não

em alguns dogmas, videntes, curandeiros; acredita na

existência de um céu e um inferno, entre outras) e religiosidade

dos mesmos (frequência com que vai ao culto/missa, filiação

religiosa, religião dos pais), além de opiniões sobre questões

sociais, políticas e econômicas (GREELEY e SCALON, 2002).

A análise do banco de dados permite observar como o campo religioso

influencia na opinião do entrevistado quanto a confiança nas instituições.

Page 97: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

82

Para permitir essa visão singela, os dados foram adaptados e inseridos

em três tabelas que mostram opiniões quanto a confiança no congresso, na

justiça e no sistema educacional. Essas opiniões são estratificadas pela religião

do entrevistado seguindo, aproximadamente, a nomenclatura adotada neste

capítulo (outras: outras religiões, semrel: sem religião, evnpen: evangélico

não pentecostal, evpen: evangélico pentecostal e catol: católico romano)

Figura 15: Mapa de percepção para o campo religião.

Fonte: Elaborada pelo autor.

RELIGIÃO

-0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2

-0.4

-0.3

-0.2

-0.1

0.0

0.1

Kassab

Marta

branconulo

nsabe

Catol

evpen

evnpen

espirsemrel

Page 98: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

83

A Tabela 9 mostra a confiança no congresso estratificada por religião.

Indivíduos de outras religiões e sem religião apresentam o maior percentual de

falta de confiança, com 84% e 82,5%, respectivamente. Os católicos romanos

apresentam o menor percentual de falta de confiança, 66%.

Tabela 9: Pesquisa Religiões do Brasil, confiança no Congresso Nacional.

Religião atual

Confiança no congresso outras semrel evnpen evpen catol

Confia 8,0% 0,0% 3,5% 4,6% 5,4%

Não sabe 0,0% 3,8% 7,0% 6,2% 5,8%

Confia completamente 4,0% 3,1% 5,3% 2,9% 3,8%

Alguma confiança 4,0% 10,6% 14,0% 14,0% 18,9%

Pouca confiança ou não confia 84,0% 82,5% 70,2% 72,3% 66,0%

Fonte: Consórcio de Informações Sociais, CIS (2002).

Quando o assunto se refere à confiança nas Instituições do judiciário, o

percentual se reduz um pouco, mas em alguns casos é maior que 50%,

conforme Tabela 10. O maior percentual de falta de confiança fica com os sem

religião (58,8%).

Tabela 10: Pesquisa Religiões do Brasil, confiança no Sistema Judiciário.

Religião atual

Confiança no congresso outras semrel evnpen evpen catol

Confia 12% 81% 7,0% 10,7% 11,8%

Não sabe 4,0% 2,5% 5,3% 5,5% 5,2%

Confia completamente 8,0% 10,0% 7,0% 6,2% 8,5%

Alguma confiança 20,0% 20,6% 31,6% 23,1% 27,0%

Pouca confiança ou não confia 56,0% 58,8% 49,1% 54,4% 47,4%

Fonte: Consórcio de Informações Sociais, CIS (2002).

Page 99: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

84

Um menor nível de falta de confiança ocorre para o sistema educacional,

sendo que os sem religião também apresentam o maior percentual (24,4%)

conforme a Tabela 11. Adotando uma postura inversa à adotada para o

congresso e para a justiça, o maior nível de confiança é apresentado por outras

religiões, com 80% dos entrevistados depositando pelo menos alguma

confiança no sistema educacional.

Tabela 11: Pesquisa Religiões do Brasil, confiança no Sistema Educacional.

Religião atual

Confiança no sistema educacional outras semrel evnpen evpen catol

Confia 40,0% 27,5% 29,8% 28,3% 30,2%

Não sabe 4,0% 1,3% 3,5% 1,6% 2,0%

Confia completamente 16,0% 21,3% 26,3% 22,8% 25,3%

Alguma confiança 24,0% 25,6% 17,5% 25,4% 25,1%

Pouca confiança ou não confia 16,0% 24,4% 22,8% 21,8% 17,4%

Fonte: Consórcio de Informações Sociais, CIS (2002).

Essas análises mostram indícios de que o campo religioso,

definitivamente, tem papel fundamental na formação da opinião do agente e na

estruturação do habitus e, consequentemente, na escolha do seu voto.

Page 100: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

85

Capítulo 3

Eleições para Prefeito de São Paulo em 2008: A questão das

declarações incompletas dos eleitores nas pesquisas eleitorais

e como estas podem ser “tratadas” a partir da criação de

modelos estatísticos adequados.

3.1 Conceituação de Dados Incompletos

Durante o processo eleitoral as pesquisas de opinião mostram que a

quantidade de eleitores indecisos apresenta peso suficiente para alterar o

resultado do pleito no momento das urnas, considerando que as proporções

das intenções de voto para cada candidato estão muito próximas. Além dos

eleitores indecisos, têm-se ainda aqueles que manifestam a intenção de anular

o voto ou votar em branco.

A questão central deste capítulo está vinculada ao fato de que parte dos

eleitores que alegam votar nulo ou em branco na verdade não o fazem, e

acabam decidindo-se por algum candidato. Para atender o objetivo de se

analisar os eleitores que se enquadram nessas categorias, buscaram-se

recursos estatísticos que possibilitassem a modelagem desse comportamento,

permitindo alocar essa classe de eleitores para os respectivos candidatos em

uma proporção que não obedece, necessariamente, à mesma proporção

encontrada para aqueles que declaram o seu voto.

Nas eleições passadas, quando não havia urna eletrônica, o voto nulo se

manifestava nas formas mais inusitadas, sendo o espaço da cédula de votação

o limite da imaginação do eleitor. Com a cédula de papel, o voto era

manifestado quando o eleitor assinalava o campo correspondente ao seu

candidato, caso marcasse mais de uma opção de candidato, estava

Page 101: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

86

caracterizado o voto nulo. As eleições pelo sistema proporcional22, envolvendo

deputados e vereadores, acomodavam alguns exemplos pitorescos de voto

nulo, pois o eleitor deveria escrever de próprio punho o nome ou o número do

seu candidato. Nas eleições para prefeito e vereadores da cidade de São Paulo

em 1959 o eleitor elegeu, com quase cem mil votos, o rinoceronte cacareco,

personagem conhecido do Zoológico de São Paulo (The Rhino Vote, 1959).

Com a utilização da urna eletrônica, o voto nulo é caracterizado quando o

eleitor digita um número que não corresponde a qualquer candidato que esteja

oficialmente concorrendo ao cargo eletivo.

Uma polêmica envolvendo o voto nulo é a questão relacionada aos

princípios de cidadania quando o eleitor, intencionalmente, anula o seu voto

como forma de protesto. O voto em branco, também, se caracteriza como uma

forma de protesto permitindo, de um modo sutil, manifestar indignação com o

processo eleitoral e s candidatos. Para anular o voto é necessário digitar um

número que não corresponda a qualquer candidato do pleito, ou seja, o eleitor

que deseja protestar pode correr o risco de votar em algum candidato contra a

sua vontade. Tal situação não ocorre com o voto em branco, pois existe uma

tecla específica na urna eletrônica para esse fim. É possível que a maioria dos

votos nulos seja um erro do eleitor no momento de digitar ou não conheça a

função do voto em branco como forma de não manifestar o seu voto.

Provavelmente essa confusão advém da possibilidade de os votos em branco

22

Esse sistema se aplica na eleição dos cargos de Deputado Federal, Deputado Estadual e Vereador. No sistema proporcional o número de votos válidos é dividido pelo número de vagas concorridas obtendo-se o quociente eleitoral. Na sequência, é obtido o quociente partidário através da divisão do número de votos obtido pelo partido pelo quociente eleitoral. A partir de critérios matemáticos pré-estabelecidos (Código Eleitoral, artigos 105 a 113), o quociente partidário define o número de candidatos eleitos do partido.O sistema é polêmico e seu extremo ocorreu nas eleições de 1945, quando o candidato Hermelindo Castelo Branco foi eleito deputado federal pelo Acre com zero votos (não chegou a votar sequer em si mesmo). Em 2002, quando o presidente do antigo PRONA, Enéas Carneiro, candidatou-se a deputado federal por São Paulo, obteve a maior votação da história brasileira para aquele cargo, impressionantes 1.573.112 votos, suficientes para, através do sistema proporcional, eleger mais cinco deputados federais, alguns com votações inexpressivas. Este episódio ficou marcado pela polêmica de que alguns destes candidatos teriam mudado de colégio eleitoral de forma ilegal apenas para serem eleitos pelo princípio da proporcionalidade, com a certeza de que o candidato Enéas obteria uma votação expressiva.

Page 102: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

87

serem computados de alguma forma em benefício de algum candidato ou

legenda. Realmente, até 1997, o Código Eleitoral (lei nº 4.737, de 15 de julho

de 1965), no seu art. 106, parágrafo único, considerava os votos em branco

para efeito do cálculo do quociente eleitoral. Hoje os votos em branco não são

computados, ou seja, não mais é considerado no cálculo do quociente eleitoral

e, consequentemente, o receio do eleitor de ter sua vontade de anular seu voto

desrespeitada é improcedente, pelo menos nos dispositivos legais.

Este capítulo não tem a intenção de simplesmente quantificar votos

nulos e em branco após o processo eleitoral, não é o objetivo principal do

capítulo, mas sim prever, por meio de modelos estatísticos apropriados, seu

comportamento ao longo do processo eleitoral. São utilizadas pesquisas de

intenção de voto realizadas pelos principais institutos de pesquisa, ou seja, são

utilizados dados secundários que atendem plenamente os objetivos. Irar-se-á

mais além, buscando interpretar o comportamento do eleitor desse estrato

quanto suas reais intenções de anular seu voto ou votar em branco, ou seja, se

o pelo fato de se encontrar nesse estrato não revelaria, na verdade, que estaria

propenso a votar em determinado candidato.

Às declarações de voto nulo e em branco serão somadas àquelas nas

quais os eleitores se dizem indecisos, ou seja, todos esses eleitores serão

considerados num mesmo estrato e, portanto, com comportamento similar.

3.2 Modelos Estatísticos para dados omissos ou incompletos

Independentemente da área de interesse, dados incompletos ou

censurados são, com frequência, um problema no momento de se efetuar uma

análise de dados. Dados incompletos elevam consideravelmente o nível de

complexidade da análise e, como resultado, muitos analistas acabam dando

pouca importância ao problema, subavaliando seu impacto. Além disso, a

dificuldade para identificar corretamente sua influência pode causar viés

significativo, prejudicando ou invalidando completamente, os resultados.

Page 103: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

88

Dados incompletos podem ocorrer por uma série de razões. Nas

pesquisas sociais, por exemplo, indivíduos podem interpretar certas perguntas

como irrelevantes, deixando de respondê-las. Além disso, alguns indivíduos

podem simplesmente se recusar a responder certos tipos de perguntas.

Existem ainda armadilhas estritamente técnicas, associadas a bancos de

dados corrompidos, à fusão de dados de várias fontes e a erros de registro,

que podem levar à eliminação de alguns dados.

Uma situação de grande importância para o estudo está relacionada

com dados categorizados23 (AGRESTI, 2007). O objetivo é estimar os

parâmetros de interesse levando em conta os mecanismos de censura de

informações.

Estes mecanismos de censura podem ser classificados em três

categorias (LITTLE e RUBIN, 1987): perdas completamente ao acaso (missing

completely at random–MCAR); perdas ao acaso (missing at random–MAR) e

perdas não aleatórias (not missing at random–NMAR). Estes mecanismos

podem ser “Ignoráveis”, compreendidos pelos mecanismos MCAR e MAR e

“Não-Ignoráveis”, representados pelo mecanismo NMAR.

Um mecanismo de censura é considerado MCAR quando as perdas de

informação não estão relacionadas às variáveis especificadas. Esta é a mais

restritiva das três condições no sentido de impor que a probabilidade de não-

resposta seja a mesma para diversas situações.

O mecanismo de censura é considerado MAR, quando o padrão de

perda de informação é previsível a partir das variáveis no banco de dados

excluindo-se a(s) variável(is) específica(s) na(s) qual(is) os dados são perdidos.

O mecanismo de censura é considerado NMAR quando as perdas de

informação não ocorrem de forma aleatória. Em contraste com o mecanismo

MAR, situação esboçada anteriormente, onde a perda de dados é explicável

23

As observações são definidas em função dos seus atributos (categorias)..

Page 104: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

89

através de outras variáveis medidas em um estudo, os dados perdidos via

mecanismo NMAR surgem devido ao padrão de perda que é explicável, além

de outras variáveis do estudo, pela(s) mesma(s) variável(is) para a(s) qual(is)

existe (m) informação (ões) omissas. Pode-se tomar como exemplo um estudo

sobre a renda de indivíduos de diversos níveis sociais. Podemos argumentar

que a perda de informação sobre a variável renda depende da própria variável

renda, ou seja, seria esperado, por exemplo, que indivíduos com maior renda

tendessem a omitir mais informações.

Buscando uma melhor compreensão dos três mecanismos

apresentados, foi montado o esquema da figura 16. Nesse esquema podemos

observar três variáveis: Classe Social, Idade e Renda. A variável Classe Social

está estratificada em dois níveis (A e B), a variável Idade está estratificada

também em dois níveis (Até 25 anos e mais de 25 anos) e a variável renda

apresentando dois níveis (Até 4 salários mínimos e mais de 4 salários

mínimos).

Figura 16: Esquema básico de mecanismos de censura.

Fonte: Elaborado pelo autor

Page 105: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

90

Foram entrevistas 880 pessoas quanto às variáveis acima, das quais

760 responderam por completo em quais níveis se encontram de cada variável,

entretanto, 120 delas omitiram informações sobre uma ou mais variáveis.

Caso o mecanismo de censura for MCAR, então não existe qualquer

informação a respeito dos 120 entrevistados e a modelagem simplesmente

apropria os entrevistados proporcionalmente ao total observado (760), ou seja,

para definir, por exemplo, quantos se encontram no nível A da classe social,

idade até 25 anos e renda Mais 4 SM, toma-se 120x(30/760)+30=35. Dessa

maneira, são calculadas todas as quantidades sob o modelo MCAR

apresentadas no esquema da Figura 16.

No momento que outras variáveis são conhecidas exceto a que se quer

medir, ou seja, são conhecidas para os 120 entrevistados as variáveis classe

social e idade, mas se desconhece a renda, caracterizando o mecanismo de

censura MAR, então a modelagem apropria as quantidades considerando as

variáveis conhecidas. Considerando, por exemplo, que dos 120 entrevistados

que não se conhece a renda, 20 são da classe social B e com idade até 25

anos então se obtém a quantidade com renda até 4 salários mínimos fazendo-

se 20x(200/210)+200=219. Dessa maneira são calculadas todas as

quantidades restantes apresentadas no esquema.

O Mecanismo de censura NMAR considera, além das variáveis Classe

Social e Idade, a própria variável sem informação, ou seja, Renda. A

modelagem é bem mais complexa e é abordada em detalhes neste capítulo.

Considerando que dos 120 entrevistados sem renda declarada, 15 são da

classe A e idade até 25 anos, 50 da classe A e idade acima de 25 anos, 20 da

classe B e idade até 25 anos, 35 da classe B e idade acima de 25 anos,

encontra-se o resultado apresentado no esquema e pode-se notar, por

exemplo, que há indícios de omissão de renda em todas as categorias, ou seja,

a quantidade de indivíduos que se declararam com renda superior a 4 salários

mínimos seria maior do que o observado.

Page 106: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

91

Dempster, Laird e Rubin (1977) introduziram o algoritmo EM

(Expectation-Maximization) o qual fornece um método iterativo para a obtenção

da estimativa de máxima verossimilhança de parâmetros envolvendo

informações incompletas (MCLACHLAN e KRISHNAM, 1997), abrindo caminho

para uma série de publicações voltadas para a imputação de dados com

informações faltantes e, entre essas publicações, algumas direcionadas para a

imputação de dados categorizados. Tanner e Wong (1987) apresentaram um

algoritmo para dados aumentados (latentes) enquanto Baker e Laird (1988)

usaram modelos envolvendo análise de regressão24 para dados categorizados

com informação incompleta.

Como o interesse nesse capítulo é a modelagem dos eleitores indecisos,

a abordagem se resume ao mecanismo de censura não-ignorável, ou seja,

inferir a intenção de voto dos eleitores indecisos considerando o próprio fato de

estarem indecisos.

Este capítulo é desenvolvido da seguinte forma: na seção 3.3, é

apresentado um problema vinculado a dados incompletos, ilustrado por um

exemplo prático. A seção 3.4 aborda a modelagem do problema. A seção 3.5

apresenta métodos para estimação de parâmetros. A seção 3.6 mostra a

aplicação para o problema proposto.

3.3 Apresentação do Problema

Uma pesquisa de intenção de voto espontânea para prefeito do

Município de São Paulo no segundo turno das eleições 2008 foi realizada pelo

Datafolha, em dois períodos no mês de outubro posteriores ao primeiro turno.

Foram realizadas 1.979 entrevistas para o primeiro período e 5.086 para o

segundo período. Segundo informações do Instituto Datafolha a pesquisa é um

24

Pode-se citar como exemplo a regressão logística ou logit onde variável resposta é dada por uma probabilidade variando de 0 a 100% obtida a partir de variáveis explicativas categóricas ou contínuas.

Page 107: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

92

levantamento por amostragem estratificada por sexo, idade, escolaridade e

renda com sorteio aleatório dos entrevistados. O universo da pesquisa é

composto pelos eleitores com 16 anos ou mais da cidade de São Paulo.

3.4 Modelando o Problema

Antes de adotarmos um modelo probabilístico, seria importante destacar

algumas suposições adotadas: a) O esquema amostral não foi levado em

consideração25; b) Todos os eleitores indecisos irão votar em algum candidato,

ou seja, não existem votos nulos ou em branco; c) Aqueles indivíduos que não

opinaram foram considerados como indecisos; d) Não há qualquer

dependência entre os indivíduos amostrados, evitando-se viés de opinião; e) A

proporção oficial de votos válidos apurados e divulgados pelo Tribunal Superior

Eleitoral corresponderá, para todos os efeitos, aos verdadeiros parâmetros

populacionais.

Nessa seção, optou-se por um nível de detalhamento mais aprofundado

da modelagem estatística com o objetivo de permitir que o leitor, caso deseje

aplicar o modelo em algum estudo, possa utilizar os recursos matemáticos aqui

utilizados, pois se acredita que tal abordagem seja inédita na pesquisa eleitoral

dentro do Município de São Paulo ou até no território brasileiro. Considerando

essa possibilidade, todos os códigos de linhas de programação viabilizados

através do pacote estatístico utilizado são fornecidos na forma de apêndice.

Uma classe de modelos log-lineares26, proposta por Fay (1986) e Baker

e Laird (1988), pode assumir o mecanismo de censura aqui apresentados para

os dados categorizados. Nesta seção usaremos este tipo de modelo, que é

25

Por se tratar de dados secundários, não se tem informações a respeito do esquema amostral adotado.

26 Os modelos log-lineares para dados categorizados foram desenvolvidos durante a década de

1960 objetivando criar uma metodologia que abordasse situações nas quais as variáveis são observadas simultaneamente tal como ocorrem nas tabelas de contingência. São modelos com estrutura linear no logaritmo das relações cruzadas de probabilidades ou médias das celas de uma tabela de contingência (Paulino e Singer, 2006).

Page 108: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

93

ajustado a tabelas de dados aumentados nas quais uma variável dicotômica é

incluída, indicando se a observação de determinada variável ocorreu ou não.

Devido à complexidade na aplicação do modelo log-linear para uma

tabela de contingência de três entradas, quando mais do que uma variável

apresenta dados ausentes, optou-se, neste trabalho, pela ilustração baseada

em uma situação específica na qual apenas uma variável apresenta ausência

de informação, entretanto, a modelagem proposta pode ser estendida para

qualquer número de variáveis sendo a complexidade computacional envolvida

o fator limitante. Vamos considerar aqui uma tabela tridimensional (Tabela 12)

composta por uma variável resposta Y (k=1: Candidato A e k=2: Candidato B)

indexada por k, que poderá conter informações omissas e pelas variáveis

explicativas (i=1: Período 1 e i=2: Período 2), representando dois momentos

da pesquisa eleitoral, e (j = 1: Estrato 1 e j = 2: Estrato 2), definindo duas

categorias relacionadas uma variável de interesse na explicação dos votos. As

variáveis e sempre são observadas e indexadas por i e j,

respectivamente. Seja K o número de categorias de Y e I e J o número de

categorias de e , respectivamente. Uma variável indicadora dicotômica R,

indexada por l, será introduzida objetivando apontar se a variável Y está sendo

informada ou não. Quando R = 1, Y foi observado e quando R = 2, a

informação sobre Y foi omitida.

Tabela 12: Notação das frequências observadas na tabela de contingência.

Y

1 2 Sem Resp

1 1

2

2 1

2

Fonte: Elaborada pelo autor.

Os índices na notação utilizada na Tabela 12 indicam o seguinte: os

números subscritos indicam os níveis de , , Y e R, respectivamente. Por

Page 109: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

94

exemplo, é o número de observações no nível 1 de , nível 2 de , nível

2 de Y e nível 1 de R. Quando a informação sobre Y é desconhecida, o índice

correspondente a essa variável é substituído por “+” e temos o nível 2 de R.

Montando-se a tabela de contingência de maneira que todas as celas

apresentem informações de X, Y e R então, um modelo de não-resposta será

não-ignorável quando possuir um termo de interação27 entre as variáveis Y e R.

A Tabela 13 mostra essa situação, destacando-se o fato de serem adotadas as

“pseudo-frequências observadas” , desdobradas a partir das frequências

observadas .

Para uma tabela genérica o modelo log-linear pode assumir a forma

em que é o vetor de frequências médias em cada uma das celas

é uma matriz de especificação de dimensão onde é o

número de celas e o número de parâmetros do modelo de tal forma que

( ) é o vetor de parâmetros com . A notação indica o

vetor de dimensão em que cada componente é o logaritmo natural do

correspondente componente em .

Tabela 13: Frequências e "pseudo-frequências" observadas com a introdução da variável indicadora R.

R

Sim Não

1 1 1

2

2 1

2

2 1 1

2

2 1

2

Fonte: Elaborada pelo autor

27

Dizemos que existe interação entre variáveis quando o efeito isolado de qualquer uma delas difere quando outras variáveis estão presentes.

Page 110: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

95

Com a introdução da variável indicadora , o modelo log-linear apresentando

todos os parâmetros possíveis (modelo saturado) pode ser escrito com as

restrições usuais de identificabilidade28.

(1)

Esse modelo servirá como base para a imposição dos dois mecanismos

de censura aqui tratados.

Dentro do contexto de modelos hierárquicos29 e sob o mecanismo de

censura ignorável (representado pelos modelos MAR), o modelo log-linear

apropriado pode ser expresso como uma redução da equação (1):

(2)

Esse modelo pode ser escrito na notação log-linear como

com as restrições usuais de identificabilidade. Nessa situação tem-se Y e R

condicionalmente independentes, dados e . Há ausência da interação de

primeira ordem YR, das interações de segunda ordem e e da

interação de terceira ordem .

Um mecanismo de censura não-ignorável, também a partir de uma

redução da equação (1), é representado por:

(3)

28

Essas restrições obrigam que a somatória dos parâmetros em determinados níveis seja zero (Agresti, 1990).

29 A hierarquia tratada aqui se refere a ordenação de um modelo a partir da sua forma

complexa até a mais parcimoniosa, ou seja, a hierarquia define o número de parâmetros a serem estimados.

Page 111: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

96

escrito como , também com as restrições usuais. Aqui, e R

são condicionalmente independentes dado e Y. Nessa situação, ocorreria a

ausência da interação de primeira ordem , das interações de segunda

ordem e e da interação de terceira ordem . A

proposta desse modelo está voltada para a interação entre as variáveis

respostas Y e R, significando agora que a probabilidade de censura depende

dos dados ausentes.

3.5 Estimação dos Parâmetros

Os estimadores de máxima verossimilhança para as frequências nas

celas podem ser obtidos pela maximização da função de verossimilhança

correspondente ao modelo log-linear restrito, usando-se o algoritmo EM.

O núcleo da função de log-verossimilhança de uma densidade conjunta

de , e Y condicionada em R pode ser escrito como

∑ ∑ ∑ ( ) ∑ ∑ ( ) (4)

em que [ ] e ∑ [

]. As frequências são as observadas para os dados

completamente informados e são as frequências para os dados com

ausência de informação sobre Y.

Os elementos do vetor de probabilidades são parametrizados como

A função de verossimilhança é maximizada sob frequências pseudo-

observadas nas celas, representadas por , fazendo-se uso do algoritmo

EM. O passo E do algoritmo determina as frequências pseudo-observadas nas

celas e o passo M obtém os estimadores de máxima verossimilhança dessas

frequências. Dentro do enfoque do modelo de censura não-ignorável, a

Page 112: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

97

estimação de máxima verossimilhança pode levar a soluções que se

encontram nas bordas do espaço paramétrico, quando algumas estimativas de

são zeros. Quando essas soluções limites ocorrem, as estimativas dos

parâmetros não podem ser determinadas de forma única. Esta instabilidade é

causada pelo ajuste do modelo incluindo termos de interação YR. Com o

objetivo de contornar esses problemas, foi proposta uma abordagem bayesiana

por Park e Brown (1994).

Em uma abordagem bayesiana, simplificada para estimar os parâmetros

em um modelo de regressão logística, Clogg, Rubin, et al. (1991) propuseram

usar uma constante de ajuste, de maneira que o valor de maximização seja

único. A partir dessa abordagem, Park e Brown (1994) usaram uma priori com

uma distribuição de Dirichlet para na forma conjugada,

∏∏∏

em que são constantes de ajuste positivas a serem especificadas e temos

para a equação (4) a nova forma

∑∑∑ [ ( ) ]

∑∑{ [ ( ) ]

∑ [ ( )

]}

Embora a condição ∑ ∑ ∑ seja usada para obter a equação

(7), seria conveniente aplicar um fator de correção, em de maneira a

satisfazer . Esse procedimento leva em conta que é um

Page 113: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

98

valor imputado para a pseudo-frequência observada na cela cujo total,

, para um dado i, j, é uma frequência verdadeiramente observada.

Tomando-se

, pode-se garantir que

, o que

implica que, para cada i, j, a soma das frequências pseudo-observadas é igual

àquelas das frequências observadas nas celas, e a condição

está satisfeita. Para atender a essas imposições, as frequências pseudo-

observadas nas celas são redefinidas como:

[

]

Sob esse enfoque bayesiano, as estimativas de máxima posteriori (EMP)

das frequências esperadas nas celas são obtidas a partir das frequências

pseudo-observadas que maximizam o logaritmo da posteriori sob as

condições e .

Podemos definir o passo E como:

( )

( )

[

]

Como o EMV não tem forma fechada, para obtê-lo no passo M é

necessário o uso de algum algoritmo de maximização como por exemplo

Newton-Raphson ou o método do ajustamento proporcional iterativo (DEMING

e STEPHAN, 1940).

O método do ajustamento proporcional iterativo (do termo em inglês,

Iterative Proportional Fitting - IPF), originalmente apresentado por Deming e

Stephan na década de 1940, é um procedimento que permite obter a estimativa

de máxima verossimilhança de com base nas frequências marginais

observadas, as quais constituem estatísticas suficientes mínimas dentro do

Page 114: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

99

modelo log-linear reduzido enfocado. Para o modelo saturado, as estatísticas

suficientes mínimas são as frequências observadas em cada cela.

Em determinadas condições, comparado com o método de Newton-

Raphson, o algoritmo IPF tende a convergir mais lentamente; entretanto é

computacionalmente mais simples. Ao longo do processo iterativo, o método de

Newton-Raphson provê automaticamente a estimativa da matriz de covariância

assintótica referente às estimativas dos parâmetros e o algoritmo IPF não

fornece esta matriz. Como o objetivo do presente trabalho foca a estimação

dos parâmetros para imputação de dados, não se terá a preocupação de se

obter erros-padrões e, consequentemente, não será necessária a matriz de

covariância assintótica.

O algoritmo IPF consiste das seguintes etapas:

a) uso de um valor inicial que satisfaça o modelo log-linear a ajustar;

b) ajuste sucessivo dos elementos de a cada um dos subconjuntos

distintos de componentes da estatística suficiente mínima (frequências

marginais observadas), através de sua multiplicação por fatores de escala

apropriados, de modo que satisfaça a correspondente equação de

verossimilhança;

c) o processo continua até que a variação entre as estimativas seja

desprezível dentro de um critério de convergência estabelecido a priori, o que

acontece quando todas as equações de verossimilhança são satisfeitas dentro

da aproximação tolerada.

Numa tabela I × J × K × L, para o modelo log-linear de ausência de

interação de segunda ordem, o algoritmo IPF (adaptado às frequências

pseudo-observadas) é composto por três passos para cada iteração, pois

nessa tabela temos três componentes da estatística suficiente mínima:

As Expressões

Page 115: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

100

definem o algoritmo IPF para o passo M, que maximiza o modelo posterior de

não-resposta impondo as frequências pseudo-observadas, , como

sendo as frequências observadas nas celas. Dependendo do modelo a ser

ajustado, o passo M do algoritmo EM difere, ou seja, por exemplo, se o modelo

a ser ajustado é , são usadas as Expressões (11) e (13). O

algoritmo EM, usando-se o algoritmo IPF no passo M, sempre converge para

uma solução, mesmo quando a solução está próxima de um limite do espaço

paramétrico, quando se toma o valor 0 para na expressão (9) (Dempster,

Laird e Rubin, 1977).

Quando , a abordagem se reduz àquela proposta por Fay

(1986) e Baker e Laird (1988), ou seja, corresponde ao método de máxima

verossimilhança. Nessa abordagem, as frequências pseudo-observadas nas

celas são exclusivamente determinadas por . Uma vez que seja

estimada como zero, continuará como zero ao longo das iterações, o que

poderá acarretar estimativas instáveis para os parâmetros . A introdução de

uma constante de ajuste, , pode evitar esse resultado indesejado;

sempre permanecerá positivo, desde que seja positivo.

Ao contrário da abordagem de máxima verossimilhança, essa

abordagem pelo método bayesiano acarretará estimativas estáveis e únicas

dos parâmetros do modelo.

Page 116: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

101

Para especificar a distribuição a priori, é necessário determinar Δ e

reparti-lo dentro dos valores de , ou seja, distribuir a quantidade Δ de

forma a gerar as quantidades . Seguindo aabordagem de Clogget al.

(1991), Δ foi escolhido como sendo p, o número de parâmetros do modelo a

serem estimados, pois este valor já corresponderia a uma situação de

estabilidade nas estimativas das frequências esperadas.

Sob o mecanismo de censura ignorável, o EMV de pode ser obtido

como

(

)

e neste contexto, escolhe-se o que melhor aproxima o EMP de

dessas estimativas, ou seja, é escolhido de forma a ser proporcional aos

. Tomando-se Δ = p, temos

Dessa maneira, deve ser expresso como

[

]

Assim a distribuição a priori (5) é dependente dos dados, uma vez que

é estimado a partir das frequências observadas .

As estimações dos parâmetros dependem das variáveis

Quando está entre e , a estimação de máxima verossimilhanças

decompõe os totais marginais dos dados censurados nas duas categorias de

Y. No caso contrário, a tabela é completada pela alocação de todos os dados

Page 117: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

102

ausentes em somente uma das categorias. Nessa situação, as frequências

esperadas para as celas de uma das categorias de Y são estimadas como

zero, e os estimadores dos parâmetros não podem ser unicamente

determinados. Quando o procedimento bayesiano é aplicado e uma constante

de ajuste é introduzida, evita-se esse problema, ou seja, uma solução de

borda só ocorre quando está próximo de 0 ou 1.

3.6 Aplicação nos Problemas Propostos

3.3.1 Variável Idade

O primeiro problema a ser apresentado está relacionado com a variável

idade e como esta interfere na decisão dos eleitores que não manifestaram seu

voto. Para essa análise, foi utilizada pesquisa Datafolha em dois períodos do

mês de outubro, após o primeiro turno, ou seja, já estavam definidos os

candidatos que participariam do segundo turno e, no caso da Cidade de São

Paulo, foram Gilberto Kassab e Marta Suplicy.

O primeiro período corresponde às pesquisas realizadas nos dias16 e 17

de outubro de 2008 e o segundo nos dias 24 e 25 de outubro de 2008. A

Tabela 14 apresenta a distribuição dos eleitores nas respectivas categorias

representadas por dois períodos e cinco níveis de idade: 16 a 24 anos, 25 a 34

anos, 35 a 44 anos, 45 a 59 anos e mais de 60 anos. A variável intenção de

voto, Y, pode assumir três situações, voto no Kassab, voto na Marta ou não

definido (SResp). Por exemplo, no período 16 e 17/10/08, faixa etária 25 a 34

anos, têm-se 229 entrevistados que declararam voto em Kassab, 192 na Marta

e 47 não responderam.

A Tabela 15 mostra a distribuição dos eleitores da Tabela 14 na forma

de frequências relativas (proporções). As proporções apresentadas na Tabela

15 normalmente diferem do divulgado pela mídia, pois, via de regra, os votos

sem definição são abandonados, permanecendo apenas os votos válidos.

Page 118: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

103

Tabela 14: Distribuição da frequência de eleitores por período e faixa etária. SREP: sem resposta.

Intenção Voto (Y)

Período

(X1)

Idade

(X2) Kassab Marta SResp

16e17/10/08

16a24 153 156 31

25a34 229 192 47

35a44 206 153 44

45a59 270 161 43

60 mais 197 71 26

TOTAL 1055 733 191

24e25/10/08

16a24 400 366 85

25a34 630 448 133

35a44 507 424 103

45a59 682 414 122

60 mais 533 201 39

TOTAL 2752 1853 482

Fonte: Datafolha (2008)

Assim, as estimativas publicadas das proporções de votos válidos totais

para os candidatos Kassab e Marta foram respectivamente de

1055/(1055+733) = 59,00% e 733/(1055+733) = 41,00% para o período 1 e de

2752/(2752+1853) = 59,76% e 1853/(2752+1853) = 40,24% para o período 2.

A Tabela 15 mostra que a vantagem do candidato Kassab aumenta a

medida que a idade do eleitor aumenta. Resta saber, entretanto, se esse

comportamento se repete nos eleitores indecisos a partir da imputação dos

votos utilizando o modelo probabilístico proposto (NMAR).

As frequências esperadas obtidas a partir da estimação dos parâmetros,

sob os mecanismos de censura não-ignorável (NMAR) e ignorável (MAR),

estão apresentadas na Tabela 16. O Programa utilizado foi desenvolvido para o

aplicativo R. O algoritmo empregado no programa foi o IPF.

Page 119: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

104

Tabela 15: Percentuais de eleitores por período e faixa etária.

Intenção Voto (Y)

Período (X1) Idade (X2) Kassab Marta SResp

16e17/10/08

16a24 45% 46% 9%

25a34 49% 41% 10%

35a44 51% 38% 11%

45a59 57% 34% 9%

60 mais 67% 24% 9%

TOTAL 53% 37% 10%

24e25/10/08

16a24 47% 43% 10%

25a34 52% 37% 11%

35a44 49% 41% 10%

45a59 56% 34% 10%

60 mais 69% 26% 5%

TOTAL 54% 36% 10%

Fonte: Elaborada pelo autor.

Tabela 16: Intenção de votos, valores imputados nos modelos MAR e NMAR.

Intenção Voto (Y)

Com resposta (MAR)

Sem Resposta

(NMAR) Total (NMAR)

Período (X1) Idade (X2) Kassab Marta Kassab Marta Kassab Marta

16e17/10/08

16a24 153 156 18 14 170 170

25a34 229 193 28 18 258 210

35a44 206 153 25 18 232 171

45a59 270 161 24 20 294 180

60 mais 196 71 18 9 215 79

TOTAL 1055 733 113 78 1168 811

24e25/10/08

16a24 399 366 55 31 454 397

25a34 633 450 105 23 737 474

35a44 509 425 41 59 550 484

45a59 682 411 57 68 739 479

60 mais 531 199 27 16 558 215

TOTAL 2753 1852 285 197 3038 2049

Fonte: Elaborada pelo autor.

Page 120: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

105

A Tabela 16 mostra os valores estimados para os candidatos nas celas

onde houve respostas (com resposta), nas celas onde não houve respostas

(sem respostas) e a imputação das quantidades estimadas dos sem resposta

para os respectivos candidatos.

A Tabela 17 mostra as quantidades obtidas sob o modelos NMAR

(colunas 5 e 6) na forma de proporção. Nessa tabela é possível ver como o

modelo NMAR apropria percentualmente para cada candidato as observações

sem resposta. Para o período24 e 25/10/08, essa apropriação favorece o

candidato Gilberto Kassab nas duas primeiras faixas etárias (coluna 3) e nas

faixas restantes favoreceu a candidata Marta Suplicy (coluna 4).

Tabela 17: Intenção de votos imputados em percentuais. Modelo NMAR.

Intenção Voto (Y) - Modelo NMAR

Com resposta

(votos válidos) Sem Resposta Total

Período(X1) Idade(X2)

Kassab

(1)

Marta

(2)

Kassab

(3)

Marta

(4)

Kassab

(5)

Marta

(6)

16e17/10/08

16a24 49,51% 50,49% 56,25% 43,75% 50,00% 50,00%

25a34 54,27% 45,73% 60,87% 39,13% 55,13% 44,87%

35a44 57,38% 42,62% 58,14% 41,86% 57,57% 42,43%

45a59 62,65% 37,35% 54,55% 45,45% 62,03% 37,97%

60 mais 73,41% 26,59% 66,67% 33,33% 73,13% 26,87%

TOTAL 59,00% 41,00% 59,16% 40,84% 59,02% 40,98%

24e25/10/08

16a24 52,16% 47,84% 63,95% 36,05% 53,35% 46,65%

25a34 58,45% 41,55% 82,03% 17,97% 60,86% 39,14%

35a44 54,50% 45,50% 41,00% 59,00% 53,19% 46,81%

45a59 62,40% 37,60% 45,60% 54,40% 60,67% 39,33%

60 mais 72,74% 27,26% 62,79% 37,21% 72,19% 27,81%

TOTAL 59,78% 40,22% 59,13% 40,87% 59,72% 40,28%

Fonte: Elaborada pelo autor.

Page 121: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

106

O gráfico da Figura 17 mostra como o modelo NMAR apropriou para a

pesquisa do período 24 e 25/10/08, em termos percentuais, a intenção de voto

dos indecisos (coluna 3 da Tabela 17) para o candidato Gilberto Kassab

comparando com os votos válidos observados na pesquisa (coluna 1 da Tabela

17). A partir do gráfico é possível constatar que o modelo identificou uma maior

propensão dos indecisos das faixas de idade 16 a 24 anos e 25 a 34 anos em

votar no candidato Gilberto Kassab. Quanto se toma a faixa 25 a 34 anos, por

exemplo, o modelo aponta que 82% dos eleitores indecisos estariam dispostos

a votar no candidato Kassab enquanto os votos validos da pesquisa mostram

apenas 58%. Já os eleitores indecisos com 35 a 59 anos seriam, conforme o

modelo, mais propensos a votar na candidata Marta Suplicy.

Figura 17: Comparativo dos percentuais de votos válidos o sob o modelo NMAR.

Fonte: Elaborada pelo autor.

Observa-se que se considerarmos a distribuição dos votos dos indecisos

pelo modelo NMAR (colunas 3 e 4 da Tabela 17), o candidato Kassab levaria

ligeira vantagem, pois as faixas etárias (16 a 24), (25 a 34) e (60 mais)

suplantam em número de eleitores as faixas (35 a 44) e (45 a 59),

desfavorecendo, numericamente, a candidata Marta Suplicy, entretanto, nos

16a24 25a34 35a44 45a59 60 mais

Votos Válidos 52% 58% 54% 62% 73%

NMAR 64% 82% 41% 46% 63%

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

Pe

rce

ntu

al

Apropriação dos sem resposta (NMAR) x Votos Válidos -Gilberto Kassab

Page 122: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

107

votos válidos, Kassab leva vantagem em todas as faixas (coluna 1 da Tabela

17).

Tabela 18: Número de eleitores por faixa etária.

Idade Nr. Eleitores Percentual

16a24 25a34 35a44 45a59 60 mais

1.295.012 1.961.146 1.687.790 1.981.665 1.255.143

15,8% 24,0% 20,6% 24,2% 15,3%

Fonte: Tribunal Superior Eleitoral (2008)

Considerando a importância dessa constatação, buscou-se junto ao TSE

informações sobre o número de eleitores no Município de São Paulo por faixa

etária e no mês de outubro de 2008. A Tabela 18 mostra como ocorre a

distribuição do número de eleitores por faixa etária no Município de São Paulo

à época das eleições de 2008.

A ponderação do resultado obtido pelo modelo NMAR quanto à

apropriação dos indecisos e levando em conta as proporções de eleitores nas

faixas etárias da Tabela 18, eleva a estimativa da proporção de votos do

candidato Kassab para 59,80%. É um ganho pequeno, entretanto, existe outro

fator que pode elevar ainda mais essa proporção, o fenômeno da abstenção

eleitoral.

Existem alguns estudos avaliando os efeitos da alienação eleitoral, ou

seja, a soma da participação via votos nulos e em branco com a abstenção.

Esses estudos procuram mostrar como ocorre a alienação eleitoral dentro das

variáveis idade, escolaridade e renda, dentre outras. Podemos citar como

exemplo os trabalhos de Silva (2013) e de Borba (2008). Esses dois trabalhos

se baseiam em dados do Estudo Eleitoral Brasileiro - ESEB 2002. Ambos

abordam os dados apresentados pela ESEB avaliando o grau de correlação

entre abstenção e algumas variáveis tais como escolaridade, idade e renda,

entretanto, tais dados foram levantados após a eleição para presidente em

2002 e com abrangência nacional. A abstenção obtida pelo estudo é inferior ao

Page 123: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

108

apresentado pelo TSE, demonstrando que o eleitor não revela efetivamente o

fato de não ter votado.

Outra questão importante diz respeito à abstenção no Município de São

Paulo, a qual é bem maior que a Nacional. Nas eleições para prefeito em 2008,

a abstenção no Município de São Paulo, divulgada pelo TSE, foi de 17,54%, a

qual tem forte impacto na avaliação obtida pelo modelo NMAR.

Buscando uma forma de quantificar o impacto da abstenção no modelo

NMAR, obteve-se a Tabela 19, a qual mostra o resultado de pesquisa realizada

pelo Datafolha entre 20 e 21/05/2010. Essa tabela resume as respostas à

seguinte pergunta: No Brasil o voto é obrigatório por lei. Você é a favor ou

contra o voto obrigatório?

Tabela 19: Posição do eleitor quanto à obrigatoriedade do voto.

Fonte: Datafolha (2010)

Para estimar a distribuição da abstenção eleitoral no Município de São

Paulo, toma-se como base a pesquisa Datafolha. Pode-se considerar que a

distribuição dos eleitores que são contra o voto obrigatório reflete a distribuição

da abstenção, ou seja, do total divulgado da abstenção pelo TSE apropria-se

essa abstenção dentro das variáveis idade, escolaridade e renda seguindo a

proporção apresentada na pesquisa Datafolha da Tabela 19.

Para a variável idade, a distribuição percentual dos que são contra o

voto obrigatório permite criar a Tabela 20 na qual são apropriadas as

abstenções por faixa etária dos 17,54% de abstenção, ou seja, 1.434.905

A favor 56 49 44 43 47 52 45 38 52 43 45 40

Contra 41 48 54 52 44 42 52 59 43 54 54 59

Indiferente 3 3 1 4 5 3 3 2 4 3 0 1

Não sabe 0 1 1 2 4 2 0 1 2 0 1 1

Total em % 100 100 100 100 100 100 100 100 100 100 100 100

Base pondeada 488 645 523 601 403 1266 1068 326 1348 856 241 109

Total nº absolutos 489 646 523 599 403 1260 1070 330 1346 858 242 108

RENDA

mais 60

anosMedio Sup até 2 SM 2 a 5 SM 5 a 10 SM

mais 10

SM

16 a 24

anos

25 a 34

anos

35 a 44

anos

45 a 59

anos

IDADE

Fund

ESCOLARIDADE

Page 124: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

109

eleitores que não votaram no segundo turno na eleição de 2008 no Município

de São Paulo.

Tabela 20: Apropriação estimada de abstenção por faixa etária.

Faixa (anos) (%) Nº eleitores Abstenção Votos Válidos

16 a 24 17,2 1.295.013 246.155 1.048.858

25 a 34 20,1 1.961.146 288.182 1.672.964

35 a 44 22,6 1.687.790 324.204 1.363.586

45 a 59 21,8 1.981.665 312.197 1.669.468

60 ou mais 18,4 1.255.143 264.167 990.976

Total 100 8.180.757 1.434.905 6.745.852

Fonte: Adaptado pelo autor

Essa nova ponderação atribui ao candidato Gilberto Kassab 59,78% dos

votos, ou seja, praticamente não altera os valores inferidos pelo modelo NMAR,

confirmando a pouca influência da abstenção quando estratificada pela variável

idade.

O resultado final das eleições de 2008 para prefeito do Município de São

Paulo, oficialmente divulgado pela Justiça Eleitoral (TSE), dá ao candidato

Gilberto Kassab 60,72% dos votos válidos e 39,28% à candidata Marta Suplicy.

O resultado da pesquisa de boca de urna divulgado pelo Datafolha dá ao

candidato Gilberto Kassab 59,76% dos votos válidos e 40,24% à candidata

Marta Suplicy. Os resultados obtidos pelo modelo MAR são os mesmos

divulgados pelo Datafolha, que consideram somente os dados totalmente

observados. O modelo NMAR não difere substancialmente do resultado boca

de urna dano ao candidato Gilberto Kassab 59,72% dos votos, demonstrando

que a variável idade pouco contribui, no seu total, para explicar o

comportamento do eleitor indeciso, apesar da indicação de tendências mais

favoráveis ao candidato Gilberto Kassab nos estratos do eleitorado indeciso

mais jovem. A vantagem de Kassab nos estratos dos eleitores mais jovem é

Page 125: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

110

ligeiramente superior a sua desvantagem nos estratos do eleitorado mais velho

e, possivelmente, explique o resultado final das urnas, dando ao candidato

Kassab 60,72% dos votos válidos. A Tabela 21 resume o parágrafo anterior.

Tabela 21: Percentuais na intenção de voto candidato Gilberto Kassab na eleição de 2008 no segundo turno do Município de São Paulo.

Modelo (%)

MAR (votos válidos no per. 24 e 25/10/08) 59,76

NMAR 59,72

NMAR ponderado pela idade 59,80

NMAR ponderado pela idade + abstenção 59,78

Resultado TSE (votos válidos) 60,72

Fonte: TSE (2008)

3.3.2 Variável Escolaridade

O segundo problema a ser apresentado está relacionado com a variável

escolaridade. A Tabela 22 mostra o resultado da pesquisa Datafolha adaptado

para apenas dois níveis de escolaridade: Fundamental e Médio/Superior

(Med+Sup).

Tabela 22: Intenções de voto estratificadas por escolaridade

Intenção Voto (Y)

Período(X1) Escolaridade(X2) Kassab marta S Resp

16e17/10/08 Fundamental 324 309 86

Med+Sup 713 433 113

24e25/10/08 Fundamental 921 806 192

Med+Sup 1823 1027 317

Fonte: Datafolha (2008)

A Tabela 23 mostra o resultado sob o modelo NMAR para a variável

escolaridade quanto às intenções de voto para os dois períodos já

apresentados conjuntamente com dois níveis de escolaridade adotados:

Fundamental e acima (médio mais superior).

Page 126: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

111

Tabela 23: Intenção de voto segundo escolaridade. Valores imputados nos modelos MAR e NMAR

Intenção Voto (Y) - Modelo NMAR

Imp com resposta Imp Sem

Resposta Imp Total

Período(X1) Escol(X2) Kassab marta Kassab Marta Kassab Marta

16e17/10/08

Fundamental 340 311 30 38 370 349

Med+Sup 711 431 63 53 775 484

TOTAL 1051 742 93 91 1145 833

24e25/10/08

Fundamental 921 806 102 90 1023 896

Med+Sup 1823 1027 203 114 2026 1141

TOTAL 2744 1833 305 204 3049 2037

Fonte: Elaborada pelo autor

A Tabela 24 apresenta o resultado da Tabela 23 em percentuais. Nessa

tabela é possível notar que a variável escolaridade não afeta de forma

significativa o eleitor indeciso.

Tabela 24: Intenção de voto segundo escolaridade. Valores imputados percentuais nos modelos MAR e NMAR

Intenção Voto (Y) - Modelo NMAR

Imp com resposta Imp Sem

Resposta Imp Total

Período(X1) Escol(X2) Kassab marta Kassab Marta Kassab Marta

16e17/10/08

Fundamental 52,23% 47,77% 44,12% 55,88% 51,46% 48,54%

Med+Sup 62,26% 37,74% 54,31% 45,69% 61,56% 38,44%

TOTAL 58,62% 41,38% 50,54% 49,46% 61,56% 38,44%

24e25/10/08

Fundamental 53,33% 46,67% 53,13% 46,88% 53,31% 46,69%

Med+Sup 63,96% 36,04% 64,04% 35,96% 63,97% 36,03%

TOTAL 59,95% 40,05% 59,92% 40,08% 59,95% 40,05%

Fonte: Elaborado pelo autor

Page 127: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

112

O gráfico da Figura 18 mostra uma comparação entre o resultado

estimado do percentual de votos destinados ao candidato Kassab pelo modelo

NMAR e o resultado final das eleições para a prefeitura de São Paulo, 2008,

votos válidos. Esse resultado segue a estratificação de escolaridade adotada.

Os valores estimados pelo modelo NMAR praticamente coincidem com o valor

do resultado final divulgado pelo TSE.

Figura 18: Comparativo do modelo NMAR e resultado do TSE (votos válidos).

Eleição para prefeitura de São Paulo, 2008

Fonte: Elaborado pelo autor

Com o objetivo de analisar o efeito da escolaridade na abstenção, foram

obtidos dados de abstenção segundo o grau de instrução nas eleições para a

prefeitura de São Paulo, 2008.

O TSE fornece informações do eleitorado categorizado por nível de

escolaridade conforme Tabela 25.

Uma ponderação do modelo NMAR a partir do número de eleitores

estratificados por grau de instrução não afeta significativamente os resultados.

Page 128: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

113

Quando se busca adicionar o efeito da abstenção a partir dos dados da

Tabela 19 (pesquisa Datafolha do voto obrigatório), novamente não se

encontra mudança significativa.

Assim, a abstenção não fornece informações adicionais que possam

explicar a intenção de voto do eleitor indeciso.

Tabela 25: Abstenção por grau de instrução. Eleições para a prefeitura de São

Paulo, 2008

Grau de Instrução Total(T) %T/TT

ANALFABETO 203.313 2,48

LE E ESCREVE 664.891 8,11

PRIMEIRO GRAU COMPLETO 824.824 10,061

PRIMEIRO GRAU INCOMPLETO 2.251.749 27,466

SEGUNDO GRAU COMPLETO 1.440.068 17,565

SEGUNDO GRAU INCOMPLETO 1.824.398 22,253

SUPERIOR COMPLETO 575.940 7,025

SUPERIOR INCOMPLETO 413.099 5,039

TOTAL(TT) 8.198.282 100

Fonte: TSE (2008)

3.3.2 Variável Renda

A terceira variável explicativa do voto do indeciso é a renda. A Tabela 26

mostra, em termos de frequência absoluta, o comportamento do eleitor

considerando duas faixas de renda: até dois salários mínimos (ate 2SM) e

acima de dois salários mínimos (mais 2SM). A mesma informação, em termos

de frequências relativas, é apresentada na Tabela 27.

Page 129: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

114

Tabela 26: Intenção de voto para a prefeitura de São Paulo, 2008, estratificação por renda

Intenção Voto (Y)

Período(X1) Renda(X2) Kassab marta S Resp

16e17/10/08

ate 2SM 205 240 55

mais 2SM 815 488 131

TOTAL 1020 728 186

24e25/10/08

ate 2SM 545 557 109

mais 2SM 2092 1229 374

TOTAL 2637 1786 483

Fonte: Datafolha (2008)

Tabela 27: Intenção de voto, valores percentuais. Prefeitura de São Paulo, 2008, estratificação por renda

Intenção Voto (Y)

Período(X1) Renda(X2) Kassab marta S Resp

16e17/10/08

ate 2SM 41,0% 48,0% 11,0%

mais 2SM 56,8% 34,0% 9,1%

TOTAL 52,7% 37,6% 9,6%

24e25/10/08

ate 2SM 45,0% 46,0% 9,0%

mais 2SM 56,6% 33,3% 10,1%

TOTAL 53,8% 36,4% 9,8%

Fonte: Datafolha (2008)

Introduzindo os dados a partir da variável renda no modelo NMAR,

obtém-se a distribuição dos eleitores conforme a Tabela 28 (frequências

absolutas) e Tabela 29 (frequências relativas).

A variável renda foi a que causou maior impacto na votação dos

eleitores indecisos quando utilizado o modelo NMAR. A variável renda elevou o

percentual de intenção de voto para o candidato Kassab de 59,6%, quando

considerado somente os votos válidos (MAR),para 60,4%, quando são

imputados os resultados obtidos pelo modelo NMAR. Esse percentual

apontado pelo modelo NMAR se aproxima muito do número final divulgado

pelo TSE para o candidato, ou seja, 60,72% dos votos válidos.

Page 130: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

115

O gráfico da Figura 19 mostra o percentual de votos válidos por faixa de

renda para o candidato Kassab na pesquisa Datafolha do período 24 e

25/10/08. Para a faixa até dois salários mínimos (ate 2SM), o candidato obteve

49% dos votos válidos e para a faixa acima de dois salários mínimos (mais

2SM), obteve 63% dos votos válidos. O modelo NMAR apropriou os eleitores

indecisos em proporções maiores para o candidato. Pelo modelo, 58% dos

indecisos com faixa de renda até dois salários mínimos votaram no candidato

Kassab e 70% dos indecisos com renda superior a dois salários mínimos

votaram no candidato.

Assim, sob o modelo NMAR, o candidato apresentou melhor

desempenho para as duas faixas de renda, sendo que na faixa de menor renda

esse desempenho foi mais destacado, crescendo de 49% para 58%, ou seja,

um crescimento aproximado de 18,4%.

Figura 19: Comparativo do modelo NMAR e resultado oficial do TSE. eleições para a prefeitura de São Paulo, 2008

Fonte: Elaborado pelo autor

Não foi buscada para a variável renda uma ponderação pelo número de

eleitores em cada uma das faixas de renda, pois tal informação não foi

Page 131: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

116

divulgada pelo TSE. Consequentemente, pela falta da informação do número

de eleitores por faixa de renda, não foi possível ponderação considerando-se

também a abstenção por faixa de renda.

Tabela 28: Imputação dos dados segundo modelo NMAR para a variável renda

Intenção Voto (Y)

Com

resposta

Sem Resposta

(NMAR) TOTAL (NMAR)

Período(X1) Renda(X2) Kassab marta Kassab marta Kassab marta

16e17/10/08

ate 2SM 206 242 17 35 223 277

mais 2SM 814 486 66 69 879 555

TOTAL 1020 728 83 104 1102 832

24e25/10/08

ate 2SM 541 554 67 49 608 603

mais 2SM 2096 1232 259 109 2355 1340

TOTAL 2637 1786 326 158 2963 1943

Fonte: Elaborado pelo autor

Tabela 29: Imputação dos dados, valores percentuais, segundo modelo NMAR para a variável renda

Intenção Voto (Y)

Com

resposta

Sem Resposta

(NMAR) TOTAL (NMAR)

Período(X1) Renda(X2) Kassab marta Kassab marta Kassab marta

16e17/10/08

ate 2SM 46,0% 54,0% 32,7% 67,3% 44,6% 55,4%

mais 2SM 62,6% 37,4% 48,9% 51,1% 61,3% 38,7%

TOTAL 58,4% 41,6% 44,4% 55,6% 57,0% 43,0%

24e25/10/08

ate 2SM 49,4% 50,6% 57,8% 42,2% 50,2% 49,8%

mais 2SM 63,0% 37,0% 70,4% 29,6% 63,7% 36,3%

TOTAL 59,6% 40,4% 67,4% 32,6% 60,4% 39,6%

Fonte: Elaborado pelo autor

Page 132: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

117

Embora as estimativas das proporções de votos tenham sido aqui

apresentadas, intervalos de confiança não foram construídos, pois o objetivo

principal deste trabalho é a apresentação do método de imputação. A

comparação desse tipo de método geralmente é feita de maneira empírica,

mas aqui não fizemos comparação com outros métodos.

Page 133: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

118

Capítulo 4

Reeleição e Perfil do Candidato: Eleições proporcionais e

modelos que possam apontar a probabilidade do candidato ser

reeleito em função das diversas variáveis explicativas

previamente estabelecidas.

4.1 Introdução

Dentre as diversas variáveis a serem analisadas dentro do perfil do

candidato uma que merece destaque é aquela relacionada ao político de

carteirinha. Aquele cuja profissão é ser vereador tal como declarado no

Tribunal Superior Eleitoral. Nesses casos, temos o vereador se candidatando a

vereador, ou seja, a busca da reeleição. O perfil desse candidato destoa de

maneira relevante dos demais candidatos que não possuem esse atributo.

A partir das conclusões desse tipo de estudo, pode ser possível traçar,

ainda que de forma grosseira, o perfil do eleitor e do candidato e, de certa

forma, diagnosticar a situação da democracia em nosso país.

Análises referentes a reeleições são escassas na produção acadêmica

e, quando são feitas, normalmente se vinculam aos cargos com eleição

majoritária. Essas análises se resumem, em sua maioria, nas especificidades

inerentes ao cargo e no desempenho do candidato e de sua equipe frente à

propaganda eleitoral. Alguns desses trabalhos focam, por exemplo, a análise

dos discursos dos candidatos no Horário Gratuito de Propaganda Eleitoral

(HGPE), destacando como esses discursos influenciam na reeleição do

candidato.

As imagens de estadista de FHC e Lula nos respectivos programas

eleitorais reforçam a idealização de que quem está no poder deve ficar.

Assim, a estratégia da ameaça é acionada para apontar que quem

vislumbra o melhor mundo futuro é o candidato da situação. A ênfase

Page 134: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

119

nos temas de cunho administrativo e o foco para questões econômicas

também se revelam como estratégias que favorecem os candidatos da

situação, na medida em que alimentam no eleitorado a impressão de

que suas políticas públicas serão mais eficientes do que as dos

oponentes, que muitas vezes não têm elementos para sustentar uma

sensação retrospectiva no eleitorado (MACHADO, 2009).

Trabalhos que analisam o fenômeno da reeleição nas eleições

proporcionais são muito raros. Grande maioria desses trabalhos se apoia na

Teoria da Conexão Eleitoral, descrita pelo cientista político estadunidense

David Mayhew no seu livro Congress: The electoral connection (1974),

baseado, principalmente, na teoria da escolha racional do eleitor. Segundo

essa teoria, o objetivo principal de todo político é de se manter no poder

através da reeleição. Para alcançar esse objetivo, o político toma como base o

comportamento racional do eleitor e busca criar condições no seu reduto

eleitoral para que essa racionalidade aflore favoravelmente a sua candidatura,

cuja importância se sobrepõe às posturas ideológicas do parlamentar no

Congresso nacional.

Uma vez que os eleitores estão se tornando cada vez mais

pragmáticos em relação às suas demandas específicas, as políticas

locais (pork barrel) têm se tornado mais relevantes para o controle do

desempenho dos parlamentares por parte dos eleitores do que a

postura ideológica que eles assumem dentro do Congresso (PEREIRA

e RENNÓ, 2001).

Como reforço a essa estratégia do candidato há ainda o apoio dos

partidos a essa prática, inclusive controlando, através dos seus líderes, a

distribuição dos benefícios ao eleitorado.

Nosso argumento é que o sistema político brasileiro cria incentivos para

que os eleitores se preocupem mais com os benefícios locais do que

com a performance nacional dos seus representantes, o que faz com

que a participação dos parlamentares no âmbito nacional,

Page 135: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

120

principalmente na Câmara dos Deputados, seja orientada pela busca de

benefícios que possam ser utilizados no plano local, como forma de

alcançar maiores retornos eleitorais. O comportamento partidário

também segue essa lógica, pois são os líderes dos partidos e o

Executivo que controlam a distribuição desses benefícios (PEREIRA e

RENNÓ, 2001).

Esses trabalhos buscam estabelecer marcadores (variáveis

explicativas) que possam quantificar e correlacionar as ações do parlamentar

com o comportamento racional do eleitor no momento do voto. A conexão

eleitoral envolve relações com as arenas políticas, legislativas e eleitorais

(CERVI, 2009).

O objetivo é analisar as interações entre essas duas arenas [política e

eleitoral] em um sistema de representação política subnacional: o

legislativo estadual do Paraná. A partir da relação entre a produção

legislativa individual dos deputados estaduais na 14ª Legislatura da

Assembleia Legislativa do Estado do Paraná (ALEP) e o desempenho

eleitoral dos que concorreram à reeleição, busca-se identificar possíveis

interdependências entre atividade parlamentar individual e reeleição.

Para isso, além dos resultados eleitorais dos candidatos à reeleição,

que deram origem a uma tipologia de votação (se concentrada ou

desconcentrada regionalmente) como variável dependente, são

incluídos no modelo três conjuntos de variáveis explicativas. O primeiro

é formado por variáveis sobre a posição política institucionalizada

(bancada a que pertence; ideologia; partido político; ocupação de cargo

na mesa; número de mandatos na ALEP; e posição sobre tema

polêmico). O segundo aborda a visibilidade do mandato (número de

aparições dos parlamentares no principal jornal diário do Estado e tipo

de aparições). O terceiro grupo de variáveis explicativas diz respeito à

produção legislativa individual propriamente dita (tipo de projeto de lei

apresentado; abrangência geográfica do projeto de lei; abrangência

social do projeto de lei; número de projetos apresentados; e número de

projetos aprovados durante o mandato). A partir do cruzamento das

Page 136: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

121

variáveis que compõem o modelo em testes de independência de

médias ou de regressões, o modelo analítico demonstra a existência de

forte correlação entre votações concentradas regionalmente e maior

possibilidade de reeleição. As variáveis explicativas sobre posição

política e visibilidade do mandato mostraram-se fracas na explicação

para tipo de votação, enquanto algumas variáveis sobre produção

legislativa individual apresentaram alto índice de correlação com

votação regionalizada e, por consequência, com a maior possibilidade

de reeleição do parlamentar (CERVI, 2009).

O trabalho de Cervi (2009), aplicado aos deputados estaduais do

Paraná, utiliza variáveis que também serão abordadas neste capítulo, tais

como a visibilidade do candidato (nível de Recall) e sua produção legislativa.

4.2 O fenômeno da reeleição dentro do sistema eleitoral

A política sempre foi e continua sendo uma área de pouco interesse e,

por isso, de pouca familiaridade para o cidadão brasileiro médio. Somos um

povo pouco politizado, até mesmo quando comparados com nossos vizinhos

sul-americanos, como os argentinos, que demonstram ser politicamente mais

ativos (FAUSTO e DEVOTO, 2004).

A cada dois anos, no entanto, durante os curtos períodos das eleições,

essa apatia do brasileiro frente à política é amenizada. Talvez por um despertar

voluntário para o cumprimento do dever cívico, talvez pela pressão sofrida

graças ao bombardeio de informações das propagandas políticas, ou

simplesmente por uma euforia contagiante similar à experimentada durante as

Copas do Mundo de futebol. O que se verifica é que cada brasileiro parece

tornar-se um expert em política nos três meses de campanha eleitoral e acaba

Page 137: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

122

traçando (ou repetindo) algumas teorias para prever ou explicar o sucesso ou o

fracasso dos candidatos nas urnas.

Muitas dessas teorias são internalizadas também pelos coordenadores

de campanha dos candidatos, balizando-os na condução da estratégia eleitoral

e, invariavelmente, produzem bons resultados, colaborando para reafirmar a

validade de tais teses. Os resultados (cada vez mais frequentes) que

contrariam o senso comum são relegados à esfera do imponderável, aquela

reserva de possibilidades a que todos estamos sujeitos, pois tal qual o futebol,

as eleições também seriam “uma caixinha de surpresas”, mas na realidade,

isso não ocorre.

Se pararmos para analisar mais profundamente, veremos que o eleitor

tem uma lógica muito bem definida de escolha de candidatos. De acordo com

ALMEIDA (2008), são seis os fatores que formam a lógica do eleitor: a

avaliação do governo – quanto mais positiva, maiores as chances de uma

continuidade, seja pela reeleição, seja pela eleição de um sucessor; quanto

mais negativa, maiores as chances de sucesso de um candidato de oposição; a

identidade dos candidatos como do governo ou de oposição – os candidatos

com forte identificação de oposição ou de apoio ao governo têm maiores

chances de sucesso do que aqueles candidatos que ficam, no jargão popular,

“em cima do muro”; o nível de lembrança (recall) dos candidatos – quanto mais

conhecidos, maiores as chances de conquistarem votos; o currículo dos

candidatos e se eles utilizam-no para mostrar ao eleitor que podem resolver o

principal problema que aflige o eleitorado – o candidato deve concentrar sua

campanha nos problemas que mais afligem os eleitores e, principalmente, deve

ser identificado com alguém com experiência (ou potencial) para enfrentar

efetivamente esses problemas; o potencial de crescimento dos candidatos, que

combina a rejeição de cada um deles com seu respectivo recall – é frequente

um candidato desconhecido tornar-se conhecido e conquistar mais votos do

que um candidato bem conhecido, mas que apresenta altos níveis de rejeição;

e o fato de não ser possível contar com os apoios políticos – a influência de

Page 138: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

123

apoios políticos é muito pequena quando comparada à dos fatores acima

descritos.

Segundo ALMEIDA (2008), fatores tidos pelo senso comum como

fundamentais, tais como o número de minutos de que dispõe o candidato na

propaganda eleitoral gratuita no rádio e TV, a verba gasta na campanha

eleitoral, a transferência de votos pelo apoio político e a influência das próprias

pesquisas no resultado da eleição (segundo o efeito da profecia

autorrealizável30), não passam de grandes mitos (ou paradigmas) sem

comprovação.

Para chegar a essas conclusões, Almeida analisou mais de 150 eleições

– federais estaduais e municipais – todas elas para cargos de eleição

majoritária: presidente da República, governadores, prefeitos e senadores. Em

suas análises, entretanto, não foram contempladas disputas para cargos de

eleição proporcional: deputados federais e estaduais e vereadores.

Dessa forma, dadas as peculiaridades de cada um dos dois sistemas

eleitorais, é possível que haja fatores particulares às eleições proporcionais,

que, mesmo fazendo parte do processo de escolha dos candidatos, tenham

sido desconsiderados.

Dentre os fatores que podem ter sido negligenciados, o primeiro que

vem à mente é a produção legislativa realizada pelo deputado ou vereador

candidato à reeleição. É possível que o desempenho de um parlamentar

durante a legislatura seja acompanhado pelos eleitores e componha um

30

A profecia autorrealizável é um efeito conhecido desde tempos remotos pela humanidade, mas

que acabou por ser conceituado pela primeira vez no livro “Teoria e Estrutura Sociais”, de 1949, Robert King Merton. Em termos simples, uma afirmação declarada como verdadeira, quando na verdade é falsa, pode influenciar de tal maneira as pessoas que acaba por se realizar.

Na literatura, temos o exemplo de “Macbeth”, de William Shakespeare, no qual três bruxas profetizam que o general Macbeth poderá se tornar rei um dia. Macbeth, inspirado pela profecia, acaba por assassinar o rei Duncan e tornar-se rei. Em seguida, as três bruxas profetizam que Macbeth deve tomar cuidado com o nobre Macduff. Desconfiado, Macbeth acaba assassinando a família de Macduff. Por esse motivo, Macduff passa a liderar uma revoluçãocontra Macbeth, e acaba matando-o. Se nenhuma das profecias fosse anunciada, possivelmente não teriam se realizado.

Page 139: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

124

cenário de aprovação ou rejeição do candidato, refletindo-se no resultado das

urnas.

Outro fator que pode ter sido negligenciado é a verba gasta na

campanha pois, diferentemente das eleições majoritárias, existe um grande

número de candidatos concorrendo a uma vaga de vereador, pulverizados

pelas diversas regiões do município. Nesse caso, gastos com divulgação do

seu nome e da sua plataforma política são imprescindíveis para melhorar a

competitividade do candidato.

Destarte, o que se pretende é verificar, mediante testes estatísticos, a

aplicabilidade dos fatores definidos por ALMEIDA (2008) às eleições realizadas

mediante o sistema proporcional, realizando-se, quando necessário, as devidas

adaptações, com o intuito de adequá-los às peculiaridades do referido sistema.

Para tanto, serão analisados os dados referentes às eleições para as

Câmaras Municipais de São Paulo, Rio de Janeiro, Belo Horizonte, Porto

Alegre e Recife, realizadas em 2008.

São duas as razões para essa escolha.

A primeira, de ordem mais pragmática, é a facilidade de obtenção de

informações referentes à produção legislativa dos vereadores candidatos à

reeleição, bem como referentes aos candidatos aos cargos de vereador por

esses grandes centros. A opção por cidades de menor porte traria dificuldades

adicionais e uma possível imprecisão nos dados, o que poderia comprometer o

resultado da pesquisa.

A segunda, também de ordem prática, é a dimensão do colégio eleitoral

dos referidos municípios, o que torna a disputa eleitoral mais impessoal do que

em municípios de pequeno porte. É uma tentativa de isolar efeitos não

previstos no modelo, mas que poderiam comprometer o caráter democrático

das eleições, em especial o livre arbítrio do eleitor, como, por exemplo, o

domínio que certos grupos ou famílias exercem, mediante força política e/ou

Page 140: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

125

econômica, sobre a população de determinados municípios. Tal situação, se

ocorre em grandes centros, é numa escala que não chega a prejudicar o

panorama geral do pleito.

Ao final, esperamos, além de confirmar (ou rejeitar) nossas hipóteses

iniciais, elucidar a importância do trabalho de vereador e, com isso, contribuído,

por pouco que seja, para que o Brasil torne-se cada vez mais uma verdadeira

democracia.

Como exposto anteriormente, o propósito é determinar, com base em

métodos estatísticos, os fatores que influenciam o processo de escolha do

eleitor nas eleições legislativas municipais, numa adaptação do modelo de

ALMEIDA (2008), o qual é elaborado, fundamentalmente, com base em

eleições majoritárias, para eleições proporcionais.

Como um objetivo adicional, espera-se elaborar uma metodologia que

seja, embora precisa, suficientemente flexível para ser empregada aos

legislativos estadual e federal, possibilitando a geração de resultados que

confirmem (ou desmintam) as conclusões a que chegou o presente trabalho,

permitindo (ou impedindo) sua generalização.

Para alcançar tais objetivos, analisaremos as produções dos

parlamentares das câmaras municipais de São Paulo, Rio de Janeiro, Belo

Horizonte, Porto Alegre e Recife, num período correspondente a legislaturas

2005-2008. O último ano da legislatura coincide com o ano das eleições

municipais. Assim, podemos considerar que o resultado do pleito reflete a

percepção dos eleitores a respeito do desempenho do parlamentar (ou do

partido).

A hipótese subjacente a esse capítulo é a de que há uma ou mais

variáveis relativas à produção legislativa de um parlamentar que são

percebidas pela população e se refletem no resultado das eleições: se a

percepção é positiva, há uma chance maior de o parlamentar ser reeleito do

que se a percepção for negativa. Seria o equivalente do fator “avaliação do

Page 141: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

126

governo”, no modelo proposto por ALMEIDA (2008). Para analisar tal aspecto,

estudaremos tanto a relevância dos projetos de lei apresentados pelo

parlamentar, quanto sua eficiência, isto é, a relação entre a quantidade de

projetos apresentados e o número dos que foram efetivamente aprovados pela

Câmara.

Outro fator que analisaremos é o que ALMEIDA (2008) chama de recall,

isto é, o grau de lembrança que o candidato consegue suscitar no eleitor. Na

falta de indicadores específicos para medir tal efeito, o nível de recall de cada

parlamentar será analisado pelo número de resultados gerados pelo seu nome

numa busca efetuada na Internet por meio da ferramenta Google. Infelizmente,

por limitações da metodologia empregada, não há a possibilidade de se

levantar dados históricos de recall. Por esse motivo, o grau de recall será

confrontado somente com os resultados das últimas eleições municipais

(2008).

Por fim, o fator “currículo” será avaliado de forma simplificada, pois, dada

a grande heterogeneidade que se observa entre os ocupantes das Câmaras

Municipais, é difícil graduar a experiência (ou potencial) de cada candidato

eleito. Assim, preferiu-se atribuir aos candidatos eleitos apenas um marcador

do tipo binário, para separar os que possuem alguma experiência prévia na

política, no trabalho social ou na luta sindical dos que não a possuem.

O fator “potencial de crescimento” não será analisado. Ao contrário das

eleições majoritárias, nas quais a disputa acaba sendo de um candidato contra

o outro, e o nível de rejeição torna-se uma variável decisiva, em especial no

segundo turno, em eleições proporcionais, essa variável perde sua importância,

pois os candidatos que se tem à disposição para escolher são muitos, de forma

que ninguém precisa optar pelo voto em um candidato porque rejeita outro ou

outros.

Dessa forma, serão avaliadas as seguintes variáveis relativas aos

parlamentares: EFICIÊNCIA – cada projeto de lei apresentado pelo

Page 142: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

127

parlamentar durante o mandato é classificado em categorias em termos de

relevância. Tais informações são obtidas na página da Organização Não

Governamental TRANSPARÊNCIA BRASIL (http://www.transparencia.org.br/ ).

Em seguida é levantada a relação entre o número de projetos de lei relevantes

apresentados pelo parlamentar durante a legislatura e a quantidade total de

projetos apresentados por esse parlamentar; RECEITA – a receita que o

candidato obteve para fins de gastos com sua campanha. Essa é a receita

oficialmente divulgada pelo TSE; RECALL – como dito anteriormente, será

levantado o número de resultados gerados pelo nome do parlamentar numa

busca efetuada na Internet por meio da ferramenta Google e citações na mídia.

Para atingir esse objetivo, foram efetuas as buscas utilizando o nome divulgado

pelo TSE como aquele utilizado para divulgação na campanha os quais nem

sempre correspondem ao nome de batismo do candidato. A busca foi sempre

utilizando a palavra “vereador” antes do nome e a frase exata, ou seja, o nome

entre aspas duplas. Por exemplo, se o parlamentar procurado é o Zé das

Cabras então é buscado “vereador Zé das Cabras”. Dessa maneira foi buscada

uma uniformidade na condição de busca do número de citações. Uma limitação

que deve ser reconhecida no nível de recall está vinculada ao fato de que não

é possível filtrar as citações quanto a serem favorável ou não ao candidato. Um

candidato pode apresentar um alto nível de recall mas podem ser lembranças

ou citações negativas, ou seja, estão na mídia por motivos que irão prejudicar a

sua imagem e, consequentemente, sua eleição, tais como envolvimento em

escândalos pessoais ou políticos. Assim, seria necessário um aprimoramento

da ferramenta de busca de citações através de um trabalho de coleta

permanente de dados sendo classificados segundo categorias de interesse

para o pesquisador, tais como ser ou não favorável ao candidato ou, conforme

o caso, neutra. Tais dados teriam importância relevante se considerarmos os

subsídios que forneceriam fortes subsídios para o eleitor no momento de

escolher o seu voto; CURRÍCULO – serão identificados os candidatos que

possuem alguma experiência prévia na política, no trabalho social ou na luta

Page 143: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

128

sindical, de forma a separá-los dos que não a possuem. Essas informações

também foram obtidas na ONG TRANSPARÊNCIA BRASIL.

Todas as variáveis acima serão confrontadas com o resultado das

eleições municipais realizadas ao fim da legislatura, procurando-se verificar,

com base em testes estatísticos, se há alguma correlação entre cada uma

delas e o resultado do pleito, bem como identificar quais delas apresentam

maior efeito.

É de se esperar, num regime democrático representativo, que os

cidadãos fiscalizem o trabalho dos eleitos para representá-los. Uma forma de

medir em que nível essa fiscalização ocorre (se é que ocorre), é verificar o

efeito do desempenho de cada parlamentar durante o mandato no sucesso ou

fracasso de sua tentativa de reeleição, ou seus reflexos nas candidaturas de

seus colegas de partido.

Por outro lado, o Brasil vive num regime democrático apenas há pouco

mais de 20 anos, após um período de ditadura militar. Assim, pode-se dizer

que o país ainda não tem uma sólida tradição democrática.

O motivo acima, aliado à dificuldade de acesso pelos cidadãos a

informações sobre o andamento do processo legislativo na maioria das

câmaras municipais, afasta o espanto frente à possibilidade de os resultados

analisados apontarem na direção de que a qualidade do trabalho parlamentar

tenha pouco ou nenhum efeito sobre o resultado das eleições municipais.

Portanto, excetuando-se o fator “avaliação de governo” (em nosso caso,

“produção legislativa”), que pode trazer, como dito, resultados surpreendentes,

esperamos validar a influência dos demais fatores apontados por ALMEIDA

(2008) também no processo de escolha de candidatos em eleições

proporcionais.

Page 144: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

129

4.3 Proposta de modelagem estatística

O interesse é encontrar um modelo estatístico que possa estimar a

probabilidade do candidato ser reeleito em função das variáveis adotadas para

explicarem o voto. Nessa situação em particular o melhor modelo que se ajusta

é o modelo de regressão binária conhecido como Regressão Logística.

A regressão logística se originou em meados de 1960 para atender

demandas da área de medicina como método de previsão de fatores de risco

para a saúde cardíaca. Esse modelo tornou-se tão popular que se alastrou

para outras áreas do conhecimento e, principalmente, nas áreas

socioeconômicas.

No modelo de Regressão Logística a variável resposta ou variável

independente é uma probabilidade, ou seja, varia de 0 a 100%. Essa

probabilidade como resposta é estimada a partir de um conjunto amostral de

variáveis explicativas que podem ser métricas (quantitativas) ou não métricas

(qualitativas) e uma variável resposta binária ou dicotômica indicando do

parlamentar foi eleito ou não. Esse conjunto amostral compõe o histórico do

comportamento do eleitor frente às características do vereador.

. Assim, se o objetivo é estimar a probabilidade de um candidato a

vereador ser reeleito (variável resposta) a partir das suas características

específicas (variáveis explicativas) devemos estimar os parâmetros do modelo

a partir das informações obtidas do perfil dos candidatos reeleitos confrontados

com os que não foram reeleitos.

Pode-se equacionar o Modelo de Regressão Logística através da

expressão:

(

)

Nessa expressão, indica a probabilidade de ocorrência do evento de

interesse (reeleição), ( ) representa o conjunto de variáveis

Page 145: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

130

explicativas (perfil do candidato) e ( )o conjunto de parâmetros

(ou coeficientes) do modelo a serem estimados. O termo (

) corresponde

ao logaritmo natural da razão entre a probabilidade de ser eleito e de não ser

eleito. Quando essa razão é menor do que 1, indica que a probabilidade de ser

eleito é menor do que não ser eleito. Caso o valor for superior a 1, a

probabilidade de ser eleito é maior do que não ser. Na estatística essa razão é

chamada de chance, ou seja, se a probabilidade de ser eleito, , é 80%, temos

que

, o que indicaria que a chance de ser eleito é 4 vezes maior

do que não ser.

Uma das vantagens desse modelo está na possibilidade de se obter

essa razão a partir de uma transformação na expressão anterior assumindo a

forma a seguir:

( )

Além da vantagem de se obter a chance diretamente a partir do modelo,

existe a possibilidade de se comparar as chances obtidas para cada situação

através da razão entre elas. Essa razão é chamada de razão de chances, a

qual é de extrema importância para a análise dos resultados a partir dos

diversos estratos gerados pelas variáveis estudadas.

A estimativa dos parâmetros permite verificar quais atribuições do perfil

do candidato são estatisticamente significativas quanto a sua probabilidade de

reeleição.

Para uma melhor clareza, o modelo é reescrito a seguir considerando-se

as variáveis do estudo:

(

)

Page 146: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

131

Onde:

probabilidade do candidato ser reeleito;

parâmetro do termo constante;

parâmetros das variáveis explicativas;

RECEITA: variável explicativa relacionada com receita, em R$, obtida pelo

candidato e gasta na sua campanha;

CURRÍCULO: variável explicativa que aponta se o candidato possui

experiência prévia na política, no trabalho social ou sindical. Essa é do tipo

dicotômica, ou seja, somente pode assumir dois valores. No modelo essa

variável assume o valor 0 (zero), caso o parlamentar não possua experiência

prévia ou o valor 1 (um) caso possua alguma experiência.

EFICIÊNCIA: variável explicativa que quantifica a produção legislativa relevante

do candidato. Trata-se de uma variável contínua no intervalo entre zero e um.

Esse valor corresponde à razão entre o número de projetos relevantes e o

número total de projetos apresentados pelo candidato. Caso, por exemplo, o

candidato apresente o valor 0,3 então 30% dos seus projetos foram

considerados relevantes.

RECALL: Esta variável explicativa corresponde ao número de vezes em que o

nome do candidato foi citado na ferramenta de busca Google.

O próximo passo é determinar quais dessas variáveis explicativas eleitas

apresentam significância estatística, ou seja, apesar da intuição de que existe

uma correlação entre o volume de votos e a variável explicativa sob análise,

entretanto, não apresentam indícios estatísticos que corroboram a intuição.

Para seleção das variáveis explicativas com significância estatística, foi

utilizado, dentro do modelo de Regressão Logística, o método “Stepwise”, o

qual permite a avaliação de cada uma das variáveis quanto a sua significância

estatística, ou seja, a eliminação passo a passo daquelas variáveis não

Page 147: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

132

representativas no modelo. O resultado da modelagem foi obtido através do

pacote estatístico de uso livre R-Software, sendo apresentado na tabela xxx a

seguir.

A tabela mostra que o método apresenta como resultado final três

variáveis significativas no nível de 5% de significância: a variável RECEITA,

com um p-valor de 0,2%, a variável EFICIÊNCIA, com p-valor de 4,5%, e a

variável RECALL, com um p-valor de 0,8%.

Tabela 30: Resultado do modelo de regressão logística usando o método "Stepwise" do pacote estatístico R.

Passo Variável β e.p. Sig. Exp(β)

1 Receita 0,000 0,000 0,003 1,000

Currículo -0,029 0,414 0,945 0,972

Eficiência 1,952 0,975 0,045 7,040

Recall 0,000 0,000 0,008 1,000

Constante -1,982 0,813 0,015 0,138

2 Receita 0,000 0,000 0,002 1,000

Eficiência 1,945 0,969 0,045 6,992

Recall 0,000 0,000 0,008 1,000

Constante -2,002 0,760 0,008 0,135

Fonte: Elaborada pelo autor

Esse resultado mostra que a variável CURRÍCULO não apresentou

significância estatística para efeito da reeleição do candidato, entretanto, as

variáveis RECEITA, EFICIÊNCIA e RECALL apresentaram significância

estatística (medida pelo p-valor) considerando nível descritivo de 5%, ou seja,

são importantes para que o candidato seja reeleito.

Um resultado importante da análise está relacionado com o fato de que

a produção legislativa relevante do parlamentar é levada em consideração por

uma parcela do eleitorado. Isso mostra que parte do eleitorado dos grandes

centros urbanos não está totalmente alheia ao trabalho do parlamentar na

Câmara Municipal, considerando esse fator no momento do seu voto.

Quanto à variável RECEITA, já era de se esperar sua significância

estatística, pois está diretamente relacionada aos gastos do candidato com a

Page 148: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

133

propaganda da sua candidatura. Tal estudo comparativo entre número de votos

obtidos e gasto com propaganda eleitoral já foi realizado em outras ocasiões,

demonstrando cabalmente a correlação entre voto e gasto. Um estudo sobre as

eleições para deputado federal em 2002 enfatizando os gastos dos candidatos

declarados no Tribunal Superior Eleitoral foi realizado por FIGUEIREDO

(2005). Nesse estudo pode constatar a correlação positiva entre o gasto e o

número de votos.

É importante enfatizar que foi demonstrado que a

quantidade de recursos (variável receita) possui correlação

positiva e significante com o número de votos obtidos. Ou seja,

quanto mais recursos são investidos nas campanhas, maior é o

número de votos recebidos por um determinado candidato

(FIGUEIREDO, 2005).

O gráfico da

Figura 20 mostra a relação entre os gastos de campanha e o número de votos

obtido pelo parlamentar nas eleições para vereador no Município de São Paulo

em 2008.

Figura 20: Eleições para vereador no Município de São Paulo. Relação entre receita

para fins de campanha e número de votos obtidos.

Page 149: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

134

Fonte: TSE (2008).

Nesse gráfico foram destacados os candidatos eleitos, suplentes e não

eleitos dentro do universo de todos os candidatos. Nota-se claramente o

posicionamento dos eleitos na parte superior direita do gráfico, indicando que

quanto maior o gasto, maior o número de votos obtidos.

Outro resultado interessante é a acentuada significância estatística da

variável referente ao nível de lembrança “RECALL”, apresentando um p-valor

de 0,8%. Isso mostra que a exposição na mídia tem algum benefício para o

candidato, desde que não seja negativa.

A Figura 21 mostra a relação entre o nível de lembrança e o número de

votos com destaque para os candidatos reeleitos e não reeleitos. Observando o

gráfico pode-se constatar, visualmente, uma maior concentração de não

reeleitos entre aqueles com baixo nível de lembrança (abaixo de 50 mil). Para

um nível de lembrança acima de 100 mil, 90% dos candidatos foram reeleitos e

para um nível de lembrança abaixo de 50 mil a proporção cai para 53% de

reeleitos.

Na amostra encontra-se um candidato com alto nível de lembrança

(acima de 150 mil), entretanto, não foi reeleito. Provavelmente a lembrança não

Page 150: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

135

seja positiva, causando perda de votos pelo candidato. Isso mostra que seria

necessário um maior aprofundamento na pesquisa, pois se adotando outras

metodologias de busca de citações, estratificando citações positivas (favoráveis

ao candidato) daquelas negativas (desfavoráveis ao candidato), é possível

melhorar a qualidade do modelo e encontrar resultados mais significativos.

Figura 21: Correlação entre o nível de lembrança ("Recall") e o número de votos.

Fonte: Elaborado pelo autor.

Page 151: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

136

Capítulo 5

O perfil do candidato e o comportamento do eleitor: eleições para

vereador no Estado de São Paulo em 2012.

Os capítulos 2 e 3 analisam o comportamento do eleitor considerando

características específicas do seu perfil. No capítulo 4 é feita uma inversão,

considerando-se o perfil do candidato que concorre à reeleição. Esse perfil

considera variáveis mais complexas e construídas pelo candidato ao longo da

sua atividade parlamentar.

Neste capítulo também será feita uma análise do perfil do candidato,

entretanto, são características mais comuns, tais como condição social ou

natural. São características que colocam o candidato como um cidadão

comum, tornando mais fácil o julgamento da população de eleitores. Assim,

diferentemente dos capítulos anteriores, a análise proposta busca mostrar

como o eleitor identifica os candidatos com base em características que podem

ser encontradas nesse mesmo eleitor.

Faremos agora uma análise exploratória do perfil dos candidatos a

vereador dos municípios do Estado de São Paulo e como esse perfil impacta

na decisão do eleitor. Foram analisados 72.263 candidatos a vereador, quanto

suas chances de serem eleitos, a partir dos atributos Gênero, Idade, Profissão,

Partido, Estado Civil e Escolaridade. Essas informações foram obtidas a partir

dos arquivos disponibilizados do Tribunal Superior Eleitoral (TSE) referentes a

todos os candidatos a vereador nos municípios do Estado de São Paulo nas

eleições de 2012.

Sempre que possível, a análise exploratória dos dados quanto à

eficiência dos candidatos é feita a partir da estratificação do atributo focado por

Gênero.

Page 152: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

137

5.1 Partidos políticos e a participação da mulher

Inicialmente é analisada a eficiência dos Partidos, ou seja, de todos os

candidatos que concorrem à eleição, quantos efetivamente foram eleitos. O

gráfico da figura 19 mostra a eficiência dos Partidos estratificados por Gênero.

Partidos que não elegeram vereador não aparecem no gráfico.

Figura 22: Eficiência das candidaturas por partido e por gênero.

Fonte: TSE (2012)

A primeira a ser notada no gráfico é a baixa eficiência das mulheres no

processo eleitoral. Dentro dos Partidos de alta eficiência, tais como PSDB,

Page 153: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

138

PSD, DEM e PMDB, todos com taxa de eficiência acima de 16% para os

candidatos masculinos, as taxas de eficiência das mulheres se mantêm na

faixa de 5%, ou seja, menos que a terça parte da eficiência dos homens. Pode-

se imaginar que isso se deve a uma desproporção entre candidatos do sexo

masculino e feminino, entretanto isso não ocorre. Em média 47,8% dos

candidatos são do sexo feminino, tendo como extremos o PPS, com 44,3% de

mulheres candidatas e o PSOL, com 52,9% de candidatas. Uma análise

detalhada desses resultados permite concluir que boa parte do contingente de

candidatas apenas preenche o quociente exigido por lei, não lhe sendo

oferecidas condições reais para disputa do cargo.

Uma forma de apresentar a posição de cada partido quanto à

oportunidade de competição dada às mulheres pode ser visualizada na figura

20. A figura mostra os partidos posicionados em quatro quadrantes onde cada

quadrante representa a intensidade da participação das mulheres no partido

através da proporção de candidatas e a intensidade da eficiência.

Figura 23: Mapa de percepção. Percentual de participação da mulher e eficiência.

Eficiência

Participação

Page 154: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

139

Fonte: TSE (2008). Elaborado pelo autor.

Assim, partidos localizados no quadrante “Alta Participação/Alta

Eficiência” mostra que estes apresentam proporção de candidatas a vereador

acima da média e também eficiência acima da média. A pior situação é “Baixa

Participação/Baixa eficiência” e nesse caso os partidos oferecem participação

de candidatas abaixo da média e também apresentam baixo desempenho

dessas candidatas.

Apresentam melhor eficiência o PT do B e PRTB e, além disso, apenas

perdem para o PSOL em termos de proporção de candidatas.

A tabela 20 mostra a evolução do número de vereadoras eleitas no

Brasil no período 1992 a 2012. De 1992 para 1996 houve um crescimento

expressivo de 65% no número de mulheres eleitas. Grande parte desse

crescimento pode ser explicado pela mudança na legislação eleitoral, a qual

estabeleceu cotas de mulheres nas listas partidárias para as eleições.

Tabela 31: Número de vereadoras eleitas no Brasil no período 1996 a 2012.

Ano Número de Eleitas Variação

1992 3.952 -

1996 6.536 65,4%

2000 7.001 7,1%

2004 6.555 -6,4%

2008 6.504 -0,8%

2012 7.648 17,6%

Fonte: TSE (2012).

A primeira lei (9.100/95) estabelecia 20% de mulheres nas listas

partidárias para as eleições do ano de 1996. Em 1997 foi votada a lei

eleitoral no 9.504, que aumentou o percentual para 30% a partir do ano

2000, estabelecendo o percentual intermediário de 25% para as

eleições de 1998. A existência da lei não mudou substancialmente a

participação das mulheres, mas provocou movimentos no sentido de

Page 155: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

140

trazer as mulheres para dentro dos partidos e instrumentalizá-las para a

vida política: são muitos os diretórios partidários em todo o Brasil que

promovem cursos para mulheres candidatas a cargos eletivos (ALVES,

2012).

Nos anos eleitorais seguintes praticamente não ocorreu alteração,

com um percentual de mulheres eleitas oscilando entre 11% e 13%,

segundo dados do TSE. Um salto maior ocorreu de 2008 para 2012 e,

novamente, parte desse crescimento se deve a mudança na legislação

Um dos fatores que explicam o aumento do número de vereadoras

eleitas foi a mudança da política de cotas. A Lei 12.034, de 29/09/2009,

substituiu a palavra reservar por preencher [...] A alteração pode

parecer pequena, mas a mudança do verbo "reservar" para "preencher"

significou uma mudança no sentido de forçar os partidos a darem

maiores oportunidades para as mulheres. O ideal é que fosse garantida

a paridade de gênero (50% para cada sexo) nas listas de candidaturas.

Mas diante do baixo número de mulheres candidatas, a mudança da Lei

em vigor já representou um avanço, mesmo que limitado.

O novo cenário construído pela legislação eleitoral permite uma maior

participação da mulher no mundo político, mas isso não significa que a

participação efetiva por meio de cargos políticos ou mandatos foi

automaticamente garantida.

Uma relação interessante se inverte: se antes as mulheres eram

barradas nas listas partidárias, agora os partidos buscam mulheres para

compô-las. Isso, entretanto, não garantiu qualquer condição de disputa

real por cargos eletivos.

Se, por um lado, a presença de mulheres pode ter apenas o intuito de

tentar cumprir a lei eleitoral, por outro, a resistência das mulheres em

entrar na arena política também é responsável pelo seu pequeno

número (PINTO, 2001).

Page 156: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

141

A situação do Estado de São Paulo, quanto à proporção de mulheres,

pode ser considerada favorável às mulheres quando comparada ao resto do

País. Muitos partidos acabam por não cumprir a proporção mínima de 30% de

mulheres candidatas em várias regiões do Brasil. Mas é importante notar que o

fato da proporção ser respeitada não permite avaliar que se está fazendo

justiça quanto a participação política da mulher, pois o baixo nível de eficiência

obtido mostra que apenas fazem número, não sendo encaradas com seriedade

pelos partidos. A politização da mulher de forma independente é caso raro, pois

muitas que estão envolvidas na política entraram através da indicação dos pais

ou maridos que já são políticos. Para que essa situação de baixa eficiência se

reverta, será necessário que os partidos encarem com seriedade o papel da

mulher na política, respeitando o seu espaço sem preconceitos e a tratando

politicamente, como igual.

A baixa participação feminina na política não corresponde ao papel que

as mulheres desempenham em outros campos de atividade. Elas são

maioria da população, maioria do eleitorado, já ultrapassaram os

homens em todos os níveis de educação e possuem uma esperança de

vida mais elevada. As mulheres compõem a maior parte da População

Economicamente Ativa (PEA) com mais de 11 anos de estudo e são

maioria dos beneficiários da Previdência Social. Nas duas últimas

Olimpíadas (Pequim e Londres) as mulheres brasileiras conquistaram

duas das tres medalhas de Ouro. Portanto, a exclusão feminina da

política é a última fronteira a ser revertida, sendo que o déficit político de

gênero em nível municipal não faz justiça à contribuição que as

mulheres dão à sociedade brasileira (ALVES, 2012).

5.2 As profissões e os candidatos

A figura 22 mostra o percentual de candidatos eleitos, considerando

suas profissões, na eleição de 2012 para vereador no Estado de São Paulo. A

profissão declarada pelos candidatos nos dados do TSE e com melhor

desempenho é a de vereador. O motivo óbvio para esse desempenho, quase

Page 157: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

142

56% de eficiência, é a vasta experiência e poder político do candidato para

angariar votos. Esse cenário já foi analisado anteriormente e não retomaremos

o assunto. Algo que impressiona é a profissão de farmacêutico, que ocupa a

segunda posição com 28,2% de eficiência. Nas eleições para vereador de 2012

nos Municípios Paulistas, concorreram 156 farmacêuticos, sendo eleitos 44

candidatos. Parte desse sucesso pode ser atribuída ao apoio explícito dos

Conselhos Regionais de Farmácia (CRF) aos candidatos da categoria em

2012. Outra provável grande vantagem dessa profissão é a sua atividade nas

farmácias, atendendo os consumidores de medicamentos, orientando e

aconselhando o bom uso dos medicamentos receitados pelos médicos. Tal

relacionamento estreito com o consumidor permite criar um laço afetivo na

região em que atua, estabelecendo relações sociais estreitas com aqueles

carentes de atenção, principalmente os idosos. Não seria surpresa se uma

pesquisa de intenção de voto indicasse como principais eleitores desse tipo de

profissional as pessoas com idade mais avançada. A mesma explicação pode

ser estendida para o quarto colocado, praticamente empatado com o terceiro, a

profissão de médico, com 24,2% de eficiência. Quanto ao terceiro colocado, o

pecuarista, dos 188 candidatos, 44 foram eleitos, uma eficiência de 24,5%,

uma possível explicação para esse desempenho está no fato que a maioria dos

candidatos está nas cidades do interior, onde a atividade pecuarista apresenta

peso relevante na economia.

No quesito quantidade de candidaturas, a profissão vencedora é a de

Servidor Público Municipal, com 6.869 candidatos e 879 eleitos, uma eficiência

de 12,8%. A seguir têm-se os comerciantes, com 6.165 candidatos e 590

eleitos, eficiência de 9,6%.

Figura 24: Percentual de candidatos eleitor estratificado por profissão.

Page 158: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

143

Fonte: TSE (2012)

5.3 Candidatos: escolaridade, estado civil e faixa etária.

Escolaridade

No quesito escolaridade, a figura 22 mostra que entre os candidatos do

sexo feminino a escolaridade influência no seu desempenho de forma

crescente mais discreta até o nível de escolaridade superior incompleto,

apresentando um salto significativo quando a candidata possui nível superior,

saltando de 2,8% para 6,54%.

Page 159: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

144

Figura 25: Percentual de candidatos eleitos estratificados por gênero e escolaridade.

Fonte: TSE (2012)

Quanto ao candidato do sexo masculino, o desempenho também

aumenta de forma gradual e discreta até o nível de escolaridade ensino médio

completo. No nível superior incompleto dá um salto de 11,8% para 18,5% de

eficiência, entretanto, no nível superior volta a cair para os mesmos níveis do

ensino médio. É possível afirmar que a influência do nível superior no

desempenho é mais proeminente na candidata do que no candidato. Chama a

atenção o fato do candidato do sexo masculino apresentar melhor desempenho

no nível de escolaridade superior incompleto. Uma possível explicação para

esse fato seria resultado de candidatos reeleitos, os quais adotam a política

como profissão, optando por não concluir o nível superior enquanto investido

no cargo.

Page 160: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

145

Estado Civil

Candidatos casados do sexo masculino apresentam a maior eficiência

nas categorias de estado civil (casado, divorciado, separado judicialmente,

solteiro e viúvo), como pode ser observado na figura 23, com destaque de

13,5% de eficiência na categoria casado, apresentando o triplo das mulheres

casadas, as quais apresentam 4,4% de eficiência. O restante das categorias

apresentam eficiências similares na estratificação por sexo.

Figura 26: Desempenho dos candidatos estratificados por estado civil e gênero.

Fonte: TSE (2012)

O eleitor, aparentemente, vê com bons olhos o político casado,

imaginando-o como um indivíduo equilibrado, respeitoso dos valores morais e

da família.

Faixa Etária

A faixa etária compreendida entre 30 e 60 anos corresponde à aquela

que apresenta maior eficiência, próximo de 13% para os candidatos

masculinos e 3,7% para as candidatas. As gerações mais jovens

Page 161: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

146

apresentam menor eficiência, a qual pode estar vinculada a uma quantidade

menor de recursos políticos (capital político).

O capital político é, em grande medida, uma espécie de

capital simbólico: o reconhecimento da legitimidade daquele

indivíduo para agir na política. Ele baseia-se em porções de

capital cultural (treinamento cognitivo para a ação política),

capital social (redes de relações estabelecidas) e capital

econômico (que dispõe do ócio necessário à prática política).

Como toda forma de capital, o capital político está

desigualmente distribuído na sociedade (MIGUEL, 2003).

Situações como esta foram constatadas em pesquisas anteriores, como

a realizada no Estado do Paraná para o cargo de deputado estadual.

Em todos os modelos, a variável “Idade” tem uma

importância reduzida para a formação dos eixos (com exceção

de 1998). Entretanto, a distribuição das modalidades dessa

variável dá, ainda assim, uma informação interessante sobre as

diferenças etárias correspondentes a cada perfil. Em todos os

modelos, há uma oposição entre a modalidade de candidatos

com até 30 anos e outras faixas etárias (31-40, 41-50, 51-60 e

mais de 60).

Nos quatro modelos, a modalidade “até 30 anos” se localiza,

considerando o primeiro eixo, do lado que representa o perfil

de performance eleitoral sem sucesso. Assim, é possível notar

como o insucesso eleitoral nas candidaturas a deputado

estadual no sul estão associadas a essa faixa etária mais

jovem. [...] A eleição para deputado estadual já exigiria uma

quantidade mediana de recursos políticos que as geração mais

jovens ainda não tiveram tempo de conquistar. (RESENDE e

CANTU, 2009)

Page 162: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

147

Para a faixa etária acima dos 60 anos, a eficiência diminui, o que pode

indicar, como parte da explicação, uma ruptura do eleitorado com a velha

guarda de políticos objetivando uma renovação dos seus representantes.

Figura 27: Desempenho dos candidatos estratificados por faixa etária e gênero.

Fonte: TSE (2012)

5.4 Modelagem Estatística do Perfil do Candidato e a Escolha do Eleitor

As diversas características dos candidatos, estudadas uma a uma, trás

poucas informações, exigindo uma maneira de se observar conjuntamente

essas características e como interagem.

Page 163: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

148

Para atender essa necessidade, foram buscadas as informações dos

candidatos junto ao Tribunal Superior Eleitoral (TSE) relacionadas ao gênero,

faixa etária e escolaridade.

A partir dessas informações, foi construída a tabela 21, tratando-se de uma

tabela de contingência apresentando o número de candidatos em cada

conjunto de atribuições, ou seja, para o conjunto Gênero, Idade, Escolaridade e

se Eleito ou não.

Tabela 32: Perfil dos candidatos a vereador no Estado de São Paulo. Gênero, idade e escolaridade.

Escolaridade

Fundamental (1) Médio (2) Superior (3)

Gênero Idade

(anos)

Eleito Total Eleito Total Eleito Total

Feminino <30 (1) 3 341 22 1420 26 670

30-44 (2) 28 2061 105 3984 188 2635

45-59 (3) 60 3104 125 3747 177 3046

>60 (4) 18 1007 13 626 29 706

masculino <30 (1) 33 534 174 2098 203 1166

30-44 (2) 501 5106 1087 8660 1001 5021

45-59 (3) 853 8153 933 7788 817 5033

>60 (4) 212 2629 121 1361 175 1367

Fonte: TSE (2012). Elaborado pelo autor.

Os dados referentes à distribuição dos candidatos a vereador nos

Municípios do Estado de São Paulo, eleições 2012, apresentados na tabela 21,

estão na seguinte ordem: número de candidatos eleitos, número total de

candidatos (eleitos e não eleitos), Escolaridade (1: Fundamental, 2: Médio, 3:

Superior), Idade em anos (1: menor do que 30, 2: 30 a 44, 3: 45 a 59, 4: mais

de 60) e o Gênero (1: Feminino, 2: masculino). Supõe-se que a distribuição do

número de candidatos eleitos tenha distribuição binomial. Essa suposição é

imprescindível para a validade do modelo estatístico adotado. O modelo

estatístico proposto para explicar a proporção de eleitos é o Logístico-Linear, o

Page 164: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

149

qual se passa a descrever. A descrição utilizada busca utilizar uma notação

que ajuda compreender o código de programação utilizado, o qual é

apresentado nos anexos.

Seja o número total de candidatos que concorrem ao cargo de

vereador no nível de A (Gênero), de B (Idade) e de C (Escolaridade).

Considere o número de candidatos eleitos no nível de A, de B e

de C então, conforme suposto, onde é a probabilidade

dos candidatos no nível de A, de B e de C serem eleitos onde: Gênero

(A), 1: Feminino, 2: masculino; Idade (B), 1: <30, 2: 30 a 44, 3: 45 a 59; 4:

>60; Escolaridade (C), 1: Fundamental, 2: Médio, 3: Superior.

Assim o modelo Logístico-Linear com interação até 1ª ordem é dado por:

{

} onde temos: efeito

comum, efeito da variável Gênero, efeito da variável Idade e efeito da

variável Escolaridade.

As estimativas dos parâmetros serão obtidas utilizando-se o modelo de

caselas de referência onde , e .

Dessa forma pode-se construir o esquema da tabela 22 para os efeitos

assumidos no modelo.

Tabela 33: Esquema notacional para o modelo logístico-linear, com interação até primeira ordem, transcrito em uma tabela de contingência.

Fonte: Elaborada pelo autor

Gênero Idade

<30 (1)

30-44 (2)

45-59 (3)

>60 (4)

<30 (1)

30-44 (2)

45-59 (3)

>60 (4)

Escolaridade

FEM(1)

Fundamental (1) Médio (2) Superior (3)

MAS(2)

+

+

+ + +

+ + +

+

+

+

+ + +

+ +

+ + +

Page 165: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

150

A casela de referência é a célula com o efeito comum representada

pelo nível 1 de Gênero (Feminino), nível 1 de Idade (<30 anos), nível 1 de

Escolaridade (Fundamental). A partir dessa casela os efeitos são somados à

medida que se caminha pelas células. É importante comentar que o valor dos

parâmetros pode ser positivo ou negativo, ou seja, o efeito tanto pode contribuir

para aumentar a probabilidade de o candidato ser eleito como para diminuir

essa probabilidade.

O processo de obtenção das estimativas de máxima verossimilhança

dos parâmetros exige iteração (algoritmo de convergência), já que não é

possível chegar-se numa forma fechada para as estimativas, tal como ocorre

no modelo normal linear tradicional.

Dessa forma, utiliza-se o pacote R-Software para o ajuste do modelo.

Todos os códigos utilizados para a obtenção dos resultados estão nos anexos.

O resultado do ajuste é mostrado na tabela 23 onde é possível visualizar

os parâmetros estimados e as respectivas significâncias estatísticas.

Os ajustes dos efeitos principais (sem interação) foram significativos.

Quanto às interações de primeira ordem, alguns efeitos foram significativos,

demonstrando a necessidade do ajuste do modelo considerando essas

interações. A interação entre Escolaridade e Idade apresentou significância

para os efeitos conjugados do nível 3 de Escolaridade (Superior) e Idade 3 (45

a 59 anos), para o nível 3 de Escolaridade (Superior) e Idade 4 (> 60 anos). A

interação entre Idade e Gênero apresentou significância estatística para os

efeitos conjugados de Idade 3 (45 a 59 anos) e Gênero 2 (Masculino), para

Idade 4 (> 60 anos) e Gênero 2 (Masculino). Os efeitos conjugados de

Escolaridade e Gênero apresentaram significância para Escolaridade 2 (Médio)

e Gênero 2 (Masculino), para Escolaridade 3 (Superior) e Gênero 2

(Masculino).

A existência de interação indica que a ação simultânea de dois efeitos

não é simplesmente a soma deles. Na interação ocorre uma potencializarão

Page 166: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

151

dos efeitos, quando o resultado é maior que a soma dos efeitos, ou uma

redução, quando o resultado é menor que a soma desses efeitos.

Tabela 34: Coeficientes estimados sob o modelo logístico-linear com interação de primeira ordem.

Fonte: Elaborado pelo autor

Em todos os casos de interação o resultado foi inferior à soma dos

efeitos. Tem-se como exemplo a interação do nível Superior com a Idade 45 a

59 anos e nível Superior com a Idade > 60 anos. Nesses dois casos de

interação o efeito do candidato possuir nível superior não se soma ao efeito da

Idade, resultando num valor inferior. Assim, caso não houvesse a interação, a

probabilidade estimada de eleição seria ainda maior. A mesma explicação pode

ser estendida às outras interações significativas encontradas.

Por outro lado, algumas mostraram não ser significativas, tais como a

interação entre o nível 2 de escolaridade (Médio) e o nível 2 de Idade ( 30 a 44

anos).

Page 167: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

152

Para uma melhor interpretação dos dados, é construída a tabela 24 com

os valores calculados para

em cada casela, ou seja, a chance de ser

eleito.

Tabela 35: Chances de ser eleito estratificadas por gênero, idade e escolaridade.

Fonte: Elaborado pelo autor

[ ] para ; ; e

.

A grande vantagem dessa tabela está relacionada ao fato de ser

possível comparar os diversos estratos quanto às chances de eleições através

do cálculo das razões de chances.

Inicialmente é analisada a situação das candidatas na faixa etária abaixo

dos 30 anos. A chance de uma candidata (i=1) com menos de 30 anos (j=1) e

do nível fundamental (k=1) é de 0,00734, ou seja, o resultado da razão entre a

probabilidade de ser eleita e a probabilidade de não ser eleita. Em termos de

chances, uma candidata com idade abaixo de 30 anos e com nível superior

apresenta uma chance de ser eleita de 0,04471. Fazendo-se uma comparação

com a candidata de nível fundamental, com chance de 0,00734, mostra que a

de nível superior tem 6,09 mais chances de ser eleita do que a de nível

Gênero Idade FUND (1) MÉDIO (2) SUP (3)

<30 (1) 0,00734 0,01417 0,04471

30-44 (2) 0,01562 0,02908 0,07189

45-59 (3) 0,01978 0,03274 0,06393

>60 (4) 0,01473 0,02255 0,04683

<30 (1) 0,06696 0,09166 0,20745

30-44 (2) 0,10790 0,14239 0,25252

45-59 (3) 0,11682 0,13713 0,19208

>60 (4) 0,08924 0,09687 0,14433

Escolaridade

FEM (1)

MAS (2)

Page 168: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

153

fundamental. Para obter esse resultado, basta encontrar a razão de chances

entre as candidatas, ou seja, calcular 0,04471/0,00734 = 6,09. O grande

abismo, entretanto, pode ser encontrado quando se compara as chances de

um candidato masculino, idade entre 30 e 44 anos e do nível superior com uma

candidata de idade inferior a 30 anos e do nível fundamental. A razão de

chances para esse caso é de 0,25252/0,00734 = 34,4, ou seja, as chances do

candidato ser eleito é aproximadamente 34 vezes maior do que a candidata.

Para ilustrar o distanciamento existente entre os gêneros, o perfil mais

favorável para uma candidata é aquele na qual sua idade está entre 30 e 44

anos com nível superior, apresentando uma chance de 0,07189. Esse

resultado é muito próximo do pior perfil do candidato masculino, com idade

abaixo dos 30 anos e nível fundamental, apresentando uma chance de

0,06696. Assim, a melhor situação de uma candidata corresponde ao pior

desempenho de um candidato.

Tomando-se uma candidata e um candidato com idade inferior a 30 anos

e nível fundamental, o candidato tem 9,12 vezes mais chance de ser eleito do

que a candidata.

As candidatas nas faixas etárias acima dos 30 anos apresentam um

melhor desempenho. De modo geral, candidatas com nível médio têm 50%

mais chance de ser eleita do que as de nível fundamental e as de nível

superior, 3 vezes mais chance do que a de nível fundamental. A vantagem da

candidata de nível superior quando comparada com a de nível médio é de

aproximadamente 2 vezes mais chance.

Pode-se converter a chance numa probabilidade isolando-se, no caso de

uma candidata (i=1) abaixo dos 30 anos (j=1) e nível fundamental (k=1),

(probabilidade de ser eleita) na expressão

fornecendo

. Assim, uma candidata com idade inferior a 30 anos e do

nível fundamental tem uma probabilidade de 0,7% de ser eleita. Fazendo-se o

mesmo procedimento para uma candidata com as mesmas características

Page 169: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

154

exceto por ter nível superior, a sua probabilidade de ser eleita sobe para 4,3%.

Repetindo-se o procedimento para todas as células, obtém-se a tabela 25, a

qual apresenta as probabilidades de ser eleito para as combinações de

características.

Essa tabela apresenta um forte apelo ilustrativo, pois destaca

visualmente as probabilidades de um candidato ser eleito a partir da

combinação de suas características. Quanto menor a probabilidade de ser

eleito, mais clara é a célula e quanto maior a probabilidade, mais escura a

célula. Nota-se, portanto, que candidatos do sexo masculino, idade entre 30 e

44 anos e nível superior são os que mais se destacam nas eleições, com

20,2% de probabilidade de ser eleito.

Tabela 36: Probabilidade de o candidato ser eleito estratificado por gênero, idade e escolaridade.

Fonte: Elaborado pelo autor

Gênero Idade FUND (1) MÉDIO (2) SUP (3)

<30 (1) 0,7% 1,4% 4,3%

30-44 (2) 1,5% 2,8% 6,7%

45-59 (3) 1,9% 3,2% 6,0%

>60 (4) 1,5% 2,2% 4,5%

<30 (1) 6,3% 8,4% 17,2%

30-44 (2) 9,7% 12,5% 20,2%

45-59 (3) 10,5% 12,1% 16,1%

>60 (4) 8,2% 8,8% 12,6%

Escolaridade

FEM (1)

MAS (2)

Page 170: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

155

Considerações Finais

O uso dos métodos quantitativos nas ciências sociais esbarra em um

ponto de difícil controle, a ação da flecha do tempo. Segundo a teoria mais

aceita atualmente, o universo teve início a partir de uma diminuta região

conhecida como singularidade. Por motivos ainda desconhecidos, ou seja,

fogem da explicação científica, essa singularidade, surgida a partir do nada

onde não existiam tempo e espaço, sofreu uma grande explosão, conhecida

como “big-bang”, e a partir dessa explosão a singularidade passou a se

expandir de modo inflacionário, criando o universo. Segundo essa mesma

teoria, o universo continua em expansão e de forma acelerada, ou seja, cada

vez mais rápido.

Essa expansão ocorre segundo um princípio que parte da organização

para a desorganização ou, a rigor, aumento constante da desorganização

conhecida como entropia nas leis de termodinâmica.

O crescimento da entropia designa, pois, a direção do

futuro, quer no nível de um sistema local, quer no nível do

universo como um todo (PRIGOGINE, 1996).

Assim, a flecha do tempo está associada à irreversibilidade.

A entropia é o elemento essencial introduzido na

termodinâmica, a ciência dos processos irreversíveis, ou seja,

orientados no tempo (PRIGOGINE, 1996).

O tempo, nessa interpretação de Prigogine, não é nada mais do que a

ação constante de um processo irreversível dado pela constante expansão do

universo, criando a sensação de há uma ordem cronológica na natureza,

quando na verdade tudo não passa de uma mera ilusão.

O pensamento é sequencial, sucessivo e unidimensional, ao

mesmo tempo em que o mundo real se apresenta como um

padrão multidimensional, não sucessivo e simultâneo, de

riqueza e variedade infinitas; e tentar que um compreenda o

Page 171: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

156

outro é o mesmo que tentar apreciar uma bonita paisagem

olhando através de uma estreita fenda numa cerca ou tentar

contemplar um quadro de Renoir por um microscópio (WILBER,

2007).

Existem tantas variáveis determinantes do tempo que este se torna

único e exclusivo para cada consciência que o interpreta.

Em verdade, toda a noção da sucessão, de uma “coisa” que

sucede a outra “coisa” no tempo, depende diretamente dos

nossos processos de memória, pois é óbvio que, sem memória,

não teríamos nenhuma ideia do tempo, quer do passado quer

do futuro. Trata-se, portanto, de saber se a memória nos

informa a respeito de um fenômeno real, a que damos o nome

de “tempo”, ou se a memória cria uma ilusão de tempo

(WILBER, 2007).

É este o divisor das águas. A consciência de alguma forma se destaca

do processo de irreversibilidade, a qual a natureza está submetida, devido ao

seu poder de criação dos momentos virtuais por meio da memória. Esse

mesmo tempo coaduna-se com a memória, agindo no sentido de causar

mudanças, mas com uma grande diferença, pelo menos em termos de

comportamento e expressão do pensamento, é possível a reversibilidade.

A sondagem dessas consciências por meio de análises quantitativas

implica em sérias restrições nas informações e respectivas interpretações. Uma

taça de cristal cai sobre o piso e se estilhaça em inúmeros pedaços. É um

processo irreversível, pois jamais será possível recompor a taça original, átomo

por átomo; o máximo que se poderia obter é uma taça muito parecida com a

original. Isso não ocorre na manifestação da consciência.

Nesse contexto pode surgir uma pergunta: se a entropia somente

aumenta no universo então por que a natureza permitiu o surgimento de

organismos tão organizados como os seres vivos? A resposta está na segunda

lei da termodinâmica, a qual afirma que a entropia aumenta o fica constante em

Page 172: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

157

um sistema isolado, ou seja, não ocorre troca de energia com o meio. Esse não

é o caso dos organismos vivos, os quais interagem com o meio, buscando

energia para se organizar e manterem essa organização até os limites

permitidos pela sua natureza, afinal a morte é considerada, por enquanto, a

realidade final de qualquer organismo vivo, a menos que possibilidades

metafísicas sejam consideradas. Entretanto, possibilidades metafísicas não são

passíveis de medições, coleta controlada de dados e comprovação por meios

empíricos, afastando-a da pesquisa científica clássica.

A consciência pode escapar da irreversibilidade quando se leva em

conta que os processos mentais estão à margem da segunda lei da

termodinâmica, ou seja, pode mudar de estado e depois retornar a esse

mesmo estado (processo reversível), perfazendo um caminho cíclico (Figura

28). Isso torna ainda mais difícil fazer previsões do estado dessa consciência

no tempo.

Figura 28: Ciclo de estados da consciência

Fonte: Elaborado pelo autor.

A principal utilidade dos métodos quantitativos nas ciências sociais está

relacionada à identificação de estados sociais tais como cultural, econômico,

religioso, etc. e como esses estados se relacionam entre si. Estados

Estado 1

Estado 2

Estado 3

Estado 4

Estado n

CONSCIÊNCIA

Page 173: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

158

comportamentais, reflexos de uma consciência coletiva, apresentam uma maior

dificuldade de modelagem.

A exploração e a análise de informações de estados sociais estão

vinculados, principalmente, a dados demográficos e a indicadores sociais.

Estatísticas nessa área tendem a ser mais comportadas no tempo, sendo

possível realizar previsões e projeções mais confiáveis. De qualquer maneira

também não estão imunes a fraturas bruscas, que alteram repentinamente

esses estados. Tais fraturas ocorrem a partir de eventos sociais drásticos e

imprevisíveis, tais como crises econômicas, políticas e conflitos armados. É

patente a relação dessas fraturas com o estado de consciência coletiva.

Quando o objeto de análise é o comportamento social, ou seja,

quantificar o estado da consciência coletiva, as dificuldades aumentam,

tornando a modelagem instável devido a sua sensibilidade à ação da flecha do

tempo. A manifestação da consciência coletiva é guiada por acontecimentos

temporais que modificam, por exemplo, opiniões, as quais, diferentemente dos

processos irreversíveis, podem até retornar a um estado anterior.

Se a sondagem diz respeito às opiniões ao longo de um processo

eleitoral, os modelos quantitativos precisam ser continuamente revistos, pois o

impacto de novos acontecimentos muda drasticamente a consciência coletiva.

Importante destacar que os impactos dos acontecimentos não ocorrem

de maneira homogênea nos estratos sociais aos quais os eleitores pertencem.

Esses estratos, quando corretamente delineados dentro dos campos

respectivos, podem, utilizando-se modelagem adequada, mostrar de que forma

o impacto dos acontecimentos é absorvido por cada um deles.

A ação da flecha do tempo pode ser incorporada em modelo estatístico

e, como a portadora da constante evolução da entropia do universo, pode

apontar tendências ou servir como contraste na identificação de variáveis

latentes, as quais passariam despercebidas em uma sondagem estática. Uma

única foto de um objeto não permite dizer se está parado ou em movimento.

Page 174: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

159

Quando são obtidas várias fotos (o tempo agindo) e desde que haja

informações nas fotos que permitam criar um modelo posicional para o objeto,

pode-se inferir se está em movimento e até dizer com que velocidade. Nesse

exemplo a velocidade é uma variável latente que não pode ser observada

diretamente, mas é possível determina-la a partir de outras informações

conhecidas e informadas pelos efeitos carregados pela flecha do tempo.

Figura 29: Ação da flecha do tempo

Fonte: Elaborado pelo autor.

A Figura 29 mostra um exemplo da ação do tempo no processo eleitoral.

Nela é possível observar que a proporção de eleitores para os candidatos

mudou entre duas datas pesquisadas, indicando uma ligeira vantagem para o

• 80% Religião A

• 20% Religião B

Candidato A

45%

• 60% Religião A

• 40% Religião B

Candidato B

45%

• 60% Religião A

• 40% Religião B

Não Sabe

10%

• 85% Religião A

• 15% Religião B

Candidato A

48%

• 55% Religião A

• 45% Religião B

Candidato B

42%

• 70% Religião A

• 30% Religião B

Não Sabe

10%

DATA 1

DATA 2

FLECH

A D

O TEM

PO

Page 175: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

160

candidato A. Provavelmente há uma tendência e o candidato A poderá, numa

próxima sondagem, ter maior proporção de votos. Entretanto, a proporção de

indecisos não mudou, mas a proporção dos estratos religiosos sofreu alteração

entre os indecisos e candidatos. A modelagem estatística se faz

particularmente importante nessas situações, pois muitos desses indecisos

terminarão decidindo seu voto e é possível modelar como esses votos migrarão

para cada candidato.

Esse tipo de abordagem específica foi utilizado no capítulo 3, entretanto,

ele se repete, usando-se outras formas de modelagem adaptadas aos

interesses apresentados nos capítulos 2, 4 e 5.

No capítulo 2 buscou-se delinear o comportamento do eleitor

paulistano na eleição para prefeito da cidade em 2008. Para atingir esse

delineamento, foram utilizadas técnicas de análise estatística nos principais

campos da sociedade, proporcionando uma visualização de como esses

campos se relacionam, através dos eleitores neles inseridos, com o processo

eleitoral na figura dos candidatos e as preferências dos eleitores.

A análise estatística mostrou que os campos apresentam relação com o

processo eleitoral, permitindo avaliar sua influência no resultado do processo

eleitoral.

A análise e modelagem dos campos, tais como conceituados por Pierre

Bourdieu, é possível quando se leva em consideração a dinâmica desses

campos. Tais modelagens, entretanto, são limitadas pelo fluxo temporal, o qual

permite a ação de fatores imprevisíveis, não probabilísticos, os quais podem

alterar totalmente as previsões traçadas pelo modelo adotado.

A maior contribuição que se pode atribuir a esse capítulo é a

possibilidade de se vislumbrar o estudo dos campos de forma qualitativa

através da modelagem dos estados e de forma quantitativa no momento em

que se avalia o montante do fluxo dos agentes entre os estados na seta do

Page 176: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

161

tempo. Esses modelos trariam previsões que podem funcionar razoavelmente

para avaliar a dinâmica dos campos em períodos curtos.

A abordagem feita no capítulo 3 permite modelar o comportamento do

eleitor indeciso nas eleições para prefeito da Cidade de São Paulo em 2008. A

modelagem mostra que é possível identificar padrões de comportamento de

eleitores que não revelaram o seu voto, entretanto foi possível colher algumas

informações do perfil desses eleitores indecisos. A partir desse perfil, foram

criados modelos estatísticos que incorporam as informações conhecidas e a

partir dessas informações inferir qual seria o candidato mais provável do eleitor

indeciso. Assim, o perfil do eleitor poderia revelar em qual candidato estaria

mais propenso a votar.

Esses modelos estatísticos consideram diversos níveis de conhecimento

de informação dos eleitores e, para atender os objetivos propostos no capítulo,

optou-se pela utilização do modelo de censura, ou seja, de falta de

informações, que considera um padrão de perda de informações que pode ser

explicado não só pelas variáveis conhecidas, mas também pela variável

desconhecida. Tal modelo considera um mecanismo de censura não-ignorável

(NMAR).

A abordagem para o mecanismo de censura não-ignorável

mostrou claramente a importância da escolha do mecanismo de censura que

inclua as observações incompletas. A adoção de um modelo NMAR para as

eleições apresentou resultados mais próximos do valor final (votos válidos

divulgados pela Justiça Eleitoral) se comparado com o resultado das pesquisas

descartando-se os votos indefinidos ou adotando-se o modelo de censura

ignorável.

Uma pergunta importante seria como eleger o modelo de censura

adequado. Os modelos ignorável e não-ignorável não são encaixados; cada um

deles se apresenta de forma independente para explicar os dados, ou seja,

representam, individualmente, o modelo saturado não implicando, portanto, da

Page 177: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

162

simplificação de um o qual gera outro. Provavelmente existem outros fatores

que podem levar a uma escolha adequada do modelo de censura. Alguns

desses fatores podem ser oferecidos pelo pesquisador, maior conhecedor do

provável comportamento do fenômeno, outros por algum método de análise de

sensibilidade. O desenvolvimento dessa análise de sensibilidade será tema de

um trabalho futuro.

O perfil do candidato à reeleição é o tema do capítulo 4. A partir do

resultado das eleições para vereador nas cidades de São Paulo, Rio de

Janeiro, Belo Horizonte, Porto Alegre e Recife em 2008 e o levantamento de

informações dos vereadores candidatos à reeleição, foi possível modelar quais

dessas informações, adotadas como perfil do candidato, são relevantes para a

sua reeleição. Foram consideradas como variáveis explicadas da reeleição a

receita declarada pelo candidato para fins de campanha, o seu currículo

relacionado a sua experiência prévia na política, no trabalho social ou sindical,

a sua eficiência como parlamentar, medida a partir da sua produção de projetos

relevantes apresentados e o nível de lembrança que o eleitor possui do

candidato.

A modelagem estatística proposta, modelo de regressão logística,

aponta com principal fator de reeleição o capital disponível para campanha,

medido a partir da receita declarada ao Tribunal Superior Eleitoral. Tal

relevância era esperada e modelo apenas confirmou tal expectativa. Outro fator

que revelou grande importância é o nível de lembrança que o eleitor possui do

candidato, indicando que a exposição na mídia trás benefícios à candidatura e

é relevante para o sucesso da sua reeleição.

Outro fator que apresentou relevância estatística foi a produção

parlamentar do candidato. Tal constatação foi surpreendente, considerando

que o eleitor brasileiro pouco acompanha as atividades dos parlamentares na

produção legislativa. Isso mostra que, nas cidades analisadas, o trabalho do

parlamentar é levado em consideração por uma parcela do eleitorado,

Page 178: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

163

ressaltando sua participação, como munícipe, no processo legislativo da

Câmara Municipal, característica fundamental da democracia.

O capítulo 5 complementa o capítulo 4, ou seja, também analisa o perfil

do candidato e determina as probabilidades de ser eleito, entretanto, apresenta

uma diferença básica, não se limita à análise de um grupo específico de

candidatos (vereadores) e as características ligadas à sua atividade como

parlamentar. O capítulo 5 leva em conta a generalização dos candidatos. Os

candidatos são analisados segundo uma série de características e como estas

influem na sua probabilidade de ser eleito. Informações referentes ao gênero,

profissão, escolaridade, estado civil e faixa etária, são analisadas focando o

sucesso do candidato no processo eleitoral.

A partir de uma modelagem estatística adequada (modelo logístico-

linear) foi possível mapear as chances de o candidato ser eleito a partir do seu

perfil considerando as suas características e como estas se inter-relacionam,

reduzindo ou aumentando as chances de ser eleito. O estudo realizado nesse

capítulo permite posicionar um candidato entre os demais no que diz respeito

às chances de ser eleito. Um resultado importante dessa análise é um

mapeamento da visão do voto dos eleitores vinculado às características dos

candidatos. Esse mapeamento pode indicar tabus e preconceitos que afloram

na sociedade brasileira e revelados por meio da expressão do voto.

A partir do que foi apresentado nos capítulos, nota-se que a abordagem

quantitativa das ciências sociais é plenamente válida e justificável desde que

alguns limites sejam respeitados. Esses limites se referem aos cuidados no

momento de se fazer o planejamento amostral, tratamento dos dados e

modelagem adequada para cada caso.

Informações importantes podem ser extraídas e aplicadas no

entendimento do comportamento social, ou seja, lançar uma luz sobre a

consciência coletiva.

Page 179: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

164

Este trabalho contribui com a divulgação do potencial do uso dos

métodos quantitativos nas ciências sociais, trazendo no seu bojo algumas

aplicações de modelagens que são úteis na compreensão do processo

eleitoral.

Page 180: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

165

Apêndices

A.1 Código R referente ao capítulo 3

O programa em R referente ao modelo NMAR, representado pela

equação 3, é apresentado a seguir:

m0<-matrix(1:16, nrow=1)-0:15;

m<-matrix(ncol=16,nrow=1);

m1<-matrix(ncol=16,nrow=1);

N<-matrix(ncol=16,nrow=1);

K<-16;

NAm<-19006;

FO<-matrix(c(2961,1436,3386,1890,2815,1406,3198,1914),nrow=1);

M<-matrix(c(236,488,394,650),nrow=1);

d<-(K/NAm)*FO;

for(I in seq(1,8,1)){

N[2*I-1]<-FO[I];}

N

for(J in 1:10000){

r<-0;

for(I in seq(1,(K-9),2)){

r<-r+1;

N[I*2]<-(M[r]/(M[r]+d[I]+d[I+1]))*(M[r]*m0[I*2]/(m0[I*2]+m0[(I+1)*2])+d[I]);

N[(I+1)*2]<-

(M[r]/(M[r]+d[I]+d[I+1]))*(M[r]*m0[(I+1)*2]/(m0[I*2]+m0[(I+1)*2])+d[I+1]);}

for(R in 1:3){

for(I in seq(1,(K-1),2)){

m[I]<-m0[I]*((N[I]+N[I+1])/(m0[I]+m0[I+1]));

m[I+1]<-m0[I+1]*((N[I]+N[I+1])/(m0[I]+m0[I+1]));}

m1<-m;

for(I in seq(1,(K-7),8)){

m[I]<-m1[I]*((N[I]+N[I+4])/(m1[I]+m1[I+4]));

Page 181: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

166

m[I+1]<-m1[I+1]*((N[I+1]+N[I+5])/(m1[I+1]+m1[I+5]));

m[I+2]<-m1[I+2]*((N[I+2]+N[I+6])/(m1[I+2]+m1[I+6]));

m[I+3]<-m1[I+3]*((N[I+3]+N[I+7])/(m1[I+3]+m1[I+7]));

m[I+4]<-m1[I+4]*((N[I]+N[I+4])/(m1[I]+m1[I+4]));

m[I+5]<-m1[I+5]*((N[I+1]+N[I+5])/(m1[I+1]+m1[I+5]));

m[I+6]<-m1[I+6]*((N[I+2]+N[I+6])/(m1[I+2]+m1[I+6]));

m[I+7]<-m1[I+7]*((N[I+3]+N[I+7])/(m1[I+3]+m1[I+7]));}

m0<-m;}}

m0

N

Page 182: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

167

Bibliografia

AGRESTI, A. An Introduction to Categorical Data Analysis. 2 ed. ed. New Jersey: John Wiley &

Sons, 2007.

ALLISON, P. D. Missing Data. Series: Quantitative Applications in the Social Sciences, vol. 136.

New York: SAGE Publications, Inc., 2002.

ALVES, E. D. O avanço das mulheres nas eleições de 2012 e o déficit democrático de gênero.

EcoDebate, 2012. Disponivel em: <http://www.ecodebate.com.br/2012/10/17/o-avanco-das-

mulheres-nas-eleicoes-de-2012-e-o-deficit-democratico-de-genero-artigo-de-jose-eustaquio-

diniz-alves/>. Acesso em: 2013.

BAKER, S. G.; LAIRD, N. M. Regression Analysis for Categorical Variables With Outcom Subject

to Nonignorable Nonresponse. Journal of the American Statistical Association, v. 83, p. 62-69,

1988.

BERGER, P. P.; BRASIL, H. Valores Extremos: Conceitos, Abordagem Clássica e Métodos de

Modelagem. Rio de Janeiro: [s.n.], 2012.

BORBA, J. As bases sociais e atitudinais da alienação eleitoral no Brasil. Revista Debates, Porto

Alegre, v. II, p. 134-157, 2008.

BOURDIEU, P. O Poder Simbólico. Lisboa: Bertrand, 1989. 135 p.

BOURDIEU, P. Coisas Ditas. São Paulo: Brasiliense, 1990.

BOURDIEU, P. Pierre Bourdieu avec Löic Wacquant; réponses. Paris: Seuil, 1992.

BRAGE, L. B.; CAÑELLAS, A. J. C. El concepto de explicación en las ciencias sociales. Revistes

Catalanes amb Accés Obert, Barcelona, v. 77, p. 181-204, 2005.

CERVI, E. U. Métodos quantitativos nas ciências sociais: uma abordagem alternativa ao

fetichismo dos números e ao debate com qualitativistas. blog em Público, 2008. Disponivel

em: <http://www.blogempublico.com/wp-

content/uploads/2011/04/2008_PesquisaSocialMetQuant_CapEmerson.pdf>. Acesso em:

julho 2013.

CERVI, E. U. Produção legislativa e conexão eleitoral na Assembléia Legislativa do Paraná.

Revista de Sociologia Política, fevereiro 2009. 159-177.

CHALMERS, A. O queé ciência afinal? 2a. ed. São Paulo: Brasiliense, 1993.

Page 183: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

168

CLOGG, C. C. et al. Multiple imputation of industry and occupation codes in census public-use

samples using bayesian logistic regression. Journal of American Statistical Association, v. 86,

p. 68-78, 1991.

DEMING, W. E.; STEPHAN, F. F. On a least squares adjustment of a sample frequency table

when the expected marginals totals are know. Annals of Mathematical Statistics, v. 11, p. 427-

444, 1940.

DEMPSTER, A. P.; LAIRD, N. M.; RUBIN, D. B. Maximum Likelihood from Incomplete Data via

the EM Algorithm. Journal of the Royal Statistical Society, v. B, p. 1-38, 1977.

DOXA. Laboratório de Pesquisa em Comunicação Política e Opinião Pública, 2008. Disponivel

em: <http://doxa.iesp.uerj.br/eleicoes2008.html>. Acesso em: 2013.

DURKHEIM, È. As Regras do Método Sociológico. 3a. ed. São Paulo: Livraria Martins Fontes,

2007.

DURKHEIM, È. As Regras do Método Sociológico. São Paulo: Livraria Martins Fontes, 2007.

FAUSTO, B.; DEVOTO, F. J. Brasil e Argentina: um ensaio de história comparada (1850 - 2002).

1a. ed. São Paulo: 34, 2004.

FAVERO, L. P. et al. Análise de dados - modelagem multivariada para tomada de decisões.

São Paulo: Elsevier, 2009.

FAY, R. E. Causal Models for Patterns of Nonresponse. Journal of the American Statistical

Association, v. 77, p. 270-278, 1986.

FERNANDES, F. Fundamentos Empíricos da Explicação Sociológica. São paulo: Companhia

Editora Nacional, 1959.

FERNANDES, F. Fundamentos empíricos da explicação sociológica. São Paulo: Companhia

Editora Nacional, 1959.

FIGUEIREDO, D. B. Gastos eleitorais: os determinantes das eleições? Estimando a influência

dos gastos de campanha nas eleioções de 2002. Urutágua, Maringá, v. 8, p. 1-10, 2005.

GRAHAM. Missing Data Analysis: Making It Work in the Real World. Annual Review of

Psychology, Pennsylvania, v. 60, p. 549–576, 2009.

GREELEY, A.; SCALON, C. Consórcio de Informações Sociais. Projeto Religião (Banco de Dados).

Rio de Janeiro: Instituto Universitário de Pesquisa do Rio de Janeiro - IUPERJ., 2002. Disponivel

em: <http://www.cis.org.br>. Acesso em: 15 janeiro 2013.

LITTLE, R. J. A.; RUBIN, D. B. Statistical Analysis with Missing Data. 2 ed. ed. New York: John

Wiley & Sons, 1987.

Page 184: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

169

MACHADO, M. A retórica da reeleição: mapeando os discursos dos Programas Eleitorais

(HGPE) em 1998 e 2006. Opinião Pública, Junho 2009. 159-189.

MAYHEW, D. R. Congress: the electoral connection. 1a. ed. [S.l.]: Yale University Press, 1974.

MCLACHLAN, G. J.; KRISHNAM, T. The EM Algorithm and Extensions. 1a. ed. New York: John

Wiley & Sons, 1997.

MIGUEL, L. F. Capital Político e Carreira Eleitoral: algumas variáveis na eleição para o congresso

brasileiro. Revista de Sociologia e Política, Curitiba, n. 20, p. 119-134, junho 2003. ISSN ISSN

0104-4478.

MILL, J. S. Sistema de Lógica Dedutiva e Indutiva. Tradução de J. M. Coelho. 2a. ed. São Paulo:

Abril Cultural, 1979. 169 p. Série Os Pensadores.

PALMEIRA, M. Voto: racionalidade ou significado? Revista Brasileira de Ciências Sociais,

volume 20, 1992. 26-30.

PARK, T.; BROWN, M. B. Models for categorical data with nonignorable nonresponse. Journal

of the Americal Statatiscal Association, v. 89, p. 44-52, 1994.

PEREIRA, C.; RENNÓ, L. O que É que o Reeleito Tem? Dinâmicas Político-Institucionais Locais e

Nacionais nas Eleições de 1998 para a Câmara dos Deputados. Dados, Vol. 44, nr. 2, 2001.

PINTO, C. R. J. Paradoxos da participação política da mulher no Brasil. REVISTA USP, São Paulo,

v. 49, p. 98-112, maio 2001.

POPPER, K. R. A Lógica da Pesquisa Científica. 13a. ed. São paulo: Cultrix, 2007.

R PROJECT. The R Project for Statistical Computing. R Project, 2013. Disponivel em:

<http://www.r-project.org/>. Acesso em: 2013.

RADMANN, E. R. H. O Eleitor Brasileiro: Uma Análise do Comportamento Eleitoral. Porto

Alegre: Dissertação de Mestrado, 2001.

RESENDE, R. C.; CANTU, R. Performance eleitoral e perfis: análise da Assembléia Legislativa

do Paraná (1998-2006). Observatório de Elites Políticas e Sociais do Brasil. Caxambú. 2009.

ROSS, S. Stochastic Processes, Second Edition. New York: John Wiley & Sons, Inc, 1996.

SETTON, M. D. G. J. A teoria do habitus em Pierre Bourdieu: uma leitura contemporânea.

Revista Brasileira de Educação, nr. 20, 2002. 60-70.

SETTON, M. D. G. J. Família escola e mídia: um campo com novas configurações. Educação e

Pesquisa, v. 28, nr. 1, 2002. 107-116.

Page 185: DOUTORADO EM CIÊNCIAS SOCIAIS - PUC-SP...e, naqueles anos de pós-guerra, esse isolamento e as dificuldades de sobrevivência levou muitos “Canários”, assim chamados os seus

170

SILVA, R. Alienação eleitoral: um estudo comparado das bases sociais e atitudinais. Revista

Andina de Estudios Políticos, Lima - Peru, v. III, p. 109-133, 2013.

SRINIVASAN, M. V. Animal behaviour: Homing in on ant navigation. Nature, Londres, v. 411, p.

752-753, junho 2001. ISSN doi:10.1038/35081224.

STN. Sistema de Coleta de Dados Contábeis. Sistema de Coleta de Dados Contábeis dos Entes

da Federação - SISTN, 2013. Disponivel em:

<https://www.tesouro.fazenda.gov.br/pt/prefeituras-governos-estaduais/sistema-coleta-

dados-contabeis>. Acesso em: 2013.

TANNER, M. A.; WONG, W. H. The Calculation of Posterior Distributions by Data Augmentation.

Journal of the American Statistical Association, v. 82, n. 398, p. 528-540, 1987.

THE Rhino Vote. Time Magazine, outubro 1959. Disponivel em:

<http://content.time.com/time/magazine/article/0,9171,869297,00.html>. Acesso em: 10

fevereiro 2013.

VASCONCELLOS, F. Quem se importa com os debates eleitorais na TV?, Rio de Janeiro, 2011.

WITTLINGER, M.; WEHNER, R.; WOLF, H. W. The desert ant odometer: a stride integrator that

accounts for stride length and walking speed. The Journal of Experimental Biology, Zürich, v.

210, p. 198-207, 2007. ISSN doi:10.1242/jeb.02657.