Uma Investigação Sobre a Ocorrência de Viés de Seleção Amostral Em Concursos Públicos No Brasl

Embed Size (px)

DESCRIPTION

Avaliação sobre ocorrência de viés de seleção amostral em um concurso público no Brasil - Dissertação de Mestrado Acadêmico

Citation preview

  • UNIVERSIDADE FEDERAL DO CEAR

    FACULDADE DE ECONOMIA, ADMINISTRAO, ATURIA,

    CONTABILIDADE E SECRETARIADO EXECUTIVO - FEAAC

    CENTRO DE APERFEIOAMENTO DE ECONOMISTAS DO NORDESTE CAEN

    UMA INVESTIGAO SOBRE A OCORRNCIA DE VIS DE SELEO

    AMOSTRAL EM CONCURSOS PBLICOS NO BRASL

    ANDERSON PASSOS BEZERRA

    FORTALEZA CEAR

    2012

  • ANDERSON PASSOS BEZERRA

    UMA INVESTIGAO SOBRE A OCORRNCIA DE VIS DE SELEO

    AMOSTRAL EM CONCURSOS PBLICOS NO BRASL

    Dissertao de Mestrado apresentada ao Curso de

    Ps Graduao em Economia da Universidade

    Federal do Cear, CAEN / UFC, como requisito

    parcial para obteno do ttulo de Mestre.

    rea de Concentrao: Teoria Econmica

    Orientador: Prof Dr. Luiz Ivan de Melo Castelar

    FORTALEZA CEAR

    2012

  • FICHA CATALOGRFICA

  • UMA INVESTIGAO SOBRE A OCORRNCIA DE VIS DE SELEO

    AMOSTRAL EM CONCURSOS PBLICOS NO BRASL

    Esta dissertao foi submetida, como parte dos requisitos necessrios obteno

    do ttulo de Mestre em Economia, outorgado pela Universidade Federal do Cear

    UFC e encontra-se disposio dos interessados na Biblioteca do Curso de

    Mestrado em Economia da referida Universidade .

    A citao de qualquer trecho desta dissertao permitida, desde que feita de

    acordo com as normas de tica cientfica.

    _______________________________________

    Anderson Passos Bezerra

    Data da aprovao _____/_____/_____

    BANCA EXAMINADORA

    ________________________________________

    Prof Dr. Luiz Ivan de Melo Castelar

    Orientador

    ________________________________________

    Prof Dr. Ricardo Brito Soares

    Membro da Banca Examinadora

    ________________________________________

    Prof Dr. Roberto Tatiwa Ferreira

    Membro da Banca Examinadora

  • AGRADECIMENTOS

    Aos meus pais Bolivard e Elizabeth pelo estmulo e amparo necessrios e

    fundamentais que me proporcionaram para obteno deste ttulo.

    minha esposa Jamille, com quem sou muito feliz.

    Ao professor Ivan Castelar por me orientar neste trabalho, durante o mestrado e

    por ser verdadeiro mestre docente.

    Aos professores Ricardo Brito Soares e Roberto Tatiwa Ferreira por terem

    aceitado participar da banca examinadora deste trabalho.

    As amizades construdas no mestrado em especial, Jos Wellington Coronel,

    Cristiano dos Santos, Guilherme Padilha, Pedro de Oliveira, Rodolfo Herald e aos

    companheiros do doutorado, Etevaldo Almeida e Rodolfo Costa, amigos estes com

    quem compartilhei agonias e alegrias que valeram cada momento.

    Aos amigos Fabricio Machado, Joo Paulo Martins e Thibrio Mota, que h

    muito so grandes amigos.

    Aos companheiros do Conselho Regional de Economia do Cear, Mirian

    Pinheiro, Elaine Cristina, Ricardo Macedo, Natlia Pinho, Erick Gabriel, Thiago Costa

    e Janara Silveira que alm de leais, foram bastante compreensivos quando da redao

    deste trabalho.

    A Capes pelo apoio financeiro que me proporcionou para a realizao deste

    curso

  • "Ento voc acha que o dinheiro a raiz de todo o mal. Mas

    voc j se perguntou qual a raiz de todo o dinheiro?"

    Ayn Rand em A Revoluo de Atlas

  • 1

    SUMRIO

    Sumrio 1

    Lista de Tabelas 2

    Lista de Grficos 3

    Resumo 4

    Abstract 5

    Introduo 6

    Reviso de Literatura 8

    Metodologia 10

    Descrio dos Dados 16

    Resultados Alcanados 21

    Interpretao dos Resultados 29

    Efeitos Marginais Mdios 29

    Determinantes Ligados a Educao 29

    Determinantes Ligados a Renda 30

    Determinantes ligados situao empregatcia 32

    Determinantes ligados faixa etria e a regio de moradia 32

    Significncia e ocorrncia de vis de seleo amostral 33

    Concluso 35

    Referncias 37

  • 2

    LISTA DE TABELAS

    Tabela 1 - Variveis utilizadas......................................................................................18

    Tabela 2: Resultados da Estimao por MV.................................................................21

    Tabela 3: Resultados da Estimao por 2 estgios........................................................24

    Tabela 4: Resultados da Estimao do Probit (assumindo que no h vis).................26

    Tabela 5: Resultados dos trs mtodos de estimao (2S, MV e probit simples)..........31

    Tabela 6: Efeitos Marginais Mdios (2S, MV e probit simples)....................................32

  • 3

    LISTA DE GRFICOS

    Grfico 1: Evoluo do emprego pblico 2002-2009....................................................6

  • 4

    RESUMO

    O objetivo do presente trabalho volta-se para a avaliao de fatores que possam

    influenciar as chances de aprovao em um concurso pblico para o provimento de

    cargos pblicos. Com a utilizao de uma base de dados obtida a partir de um concurso

    realizado pelo Banco do Nordeste do Brasil, ocorrido em 2003 para cargos de nvel

    mdio e da Pesquisa Nacional por Amostra de Domiclio (PNAD) tambm de 2003,

    buscou-se traar um mapa dos fatores que influenciam a aprovao no concurso,

    contudo levantou-se a hiptese da ocorrncia de vis de seleo amostral, posto que o

    simples processo de inscrio no concurso estaria atrelado a certas caractersticas scio

    econmicas devendo portanto ser levado em considerao quando da anlise dos fatores

    para aprovao, pois de outra forma obteramos resultados enviesados caso tal problema

    (vis de seleo) ocorra. Para lograr xito em nossa demanda utilizamos uma adaptao

    da metodologia proposta por Heckman, com a diferena que empregamos modelos de

    escolha binria, pois nossas variveis dependentes tratavam-se de variveis dummies,

    sendo para o processo de inscrio se o indivduo inscreveu-se ou no e para o processo

    de seleo se o candidato foi aprovado ou no. Foram realizadas trs estimaes sendo

    duas que levam em considerao a problemtica do vis de seletividade e uma terceira

    em que ignora-se tal possibilidade. Os resultados encontrados apontam para a

    inexistncia do vis corroborando estudos realizados anteriormente relativos ao mesmo

    tema.

    Palavras-chave: Concurso pblico; Seleo amostral; Desempenho educacional;

    Heckman.

  • 5

    ABSTRACT

    The objective of this paper turns to evaluation of the factors that may influence the

    chances of approval in an aptitude test for admission in public jobs. Using a database

    obtained from a aptitude test realized by the Banco do Nordeste do Brasil, occurred in

    2003 to mid-level positions, and from Pesquisa Nacional por Amostra de Domiclio

    (PNAD) database, also 2003, sought to draw a map of the determinants to approval in

    the aptitude test, however the hypothesis of sample selection occurrence was raised,

    since the enrollment process in the aptitude test was coupled with certain

    socioeconomic characteristics needing so, be considered in the analysis of the approval

    factors, or in other way, we could obtain biased results, if the problem (sample

    selection) occurs. To obtain success in our demand, we use an adaptation of the

    methodology proposed by Heckman, with an addition that was employed in a discrete

    choice model, because ours dependent variables are dummies, being to the enrollment

    process, if he enrolls or not and for the aptitude process, if he has succeeded or not. We

    estimated three models, being two models, considering the sample selection problem,

    and another without the selectivity. The results found pointed to nonexistence of the

    selectivity problem, confirming other papers on the same theme.

    Keywords: Aptitude test; Sample selection; Educational performance; Heckman

  • 6

    1. Introduo

    O emprego pblico no Brasil vem se tornando o objetivo profissional de boa

    parte da populao em idade ativa, a preparao para um concurso pblico algo

    custoso exigindo do participante grande disciplina e aplicao. Entretanto se a

    aprovao no gerar benefcios, percebidos pelo indivduo, como superiores queles

    custos relacionados preparao, ou mesmo se o indivduo acreditar que possui chances

    nfimas de ser aprovado haver grande possibilidade da pessoa no efetivar a inscrio

    no concurso. Portanto o problema de escolha do indivduo pela participao no

    concurso pode ser visto como uma avaliao de custo/benefcio.

    Existem certos benefcios queles que ingressam no setor pblico, um deles a

    estabilidade no emprego outra a remunerao que superior praticada no setor

    privado para categorias semelhantes, alm de benefcios como plano de sade e

    aposentadoria com benefcio equivalente ao salrio da categoria ativa.

    Contudo a dificuldade relacionada ao ingresso na carreira pblica tambm uma

    grande barreira a ser considerada por aquele que almeja tais vantagens, segundo dados

    do IBGE, para cinco grandes Regies Metropolitanas do Brasil entre 2002 e 2009, o

    nmero de pessoas empregadas no setor privado foi de aproximadamente 11.135.000

    pessoas contra 2.107.000 no setor pblico, alm disso, a taxa de crescimento da

    populao ocupada no setor privado para o perodo foi de 0,275%, j para o setor

    pblico, em contraste, foi de apenas 0,237%. O grfico abaixo mostra a evoluo do

    emprego pblico no Brasil.

    Grfico 1: Evoluo do emprego pblico 2002-2009

    Fonte: IBGE

    0

    5.000

    10.000

    15.000

    2002 2003 2004 2005 2006 2007 2008 2009

    PES

    SOA

    S

    (M

    IL)

    Populao Ocupada por Setor

    Cinco Grandes Regies Metropolitanas Brasil (2002-2009)

    Setor Privado Setor Pblico

  • 7

    A grande dificuldade em ingressar no servio pblico relaciona-se as matrias

    abordadas no concurso, que em geral no foram contempladas no processo educacional

    do candidato, bem como com a menor oferta de vagas. Seguindo este raciocnio emerge

    a possibilidade da ocorrncia de vis de seleo, ou seja, o processo que determina a

    inscrio do candidato influencia a chance de ingresso no setor pblico, pois candidatos

    aptos a passar se inscreveriam normalmente, porm existiriam indivduos, na populao,

    com caractersticas semelhantes que no se inscrevem no concurso, influenciados por

    fatores no observveis e que certamente tambm teriam boas chances de aprovao

    (por exemplo, a tal medida intangvel de custo/benefcio, percebido pelo mesmo),

    gerando, portanto, impreciso dos efeitos estimados pelo pesquisador que deseje

    investigar os mesmos. Trataremos com mais detalhes deste fenmeno, visto que

    objetivo deste estudo verificar se ocorre ou no o vis de seletividade amostral.

    Poderamos modelar, portanto, que a avaliao da magnitude da relao de

    custo/benefcio est condicionada a um conjunto de caractersticas socioeconmicas

    relacionadas ao prprio indivduo, resultando na inscrio ou no no concurso pblico

    para o provimento de cargo pblico. Uma vez determinados os indivduos na populao

    que se inscreveram, podemos modelar, novamente, o processo que leva ao sucesso em

    um concurso pblico, como estando condicionado a um grupo de fatores

    socioeconmicos relacionados ao candidato que pleiteia a vaga no servio pblico.

    Desta maneira se encontrarmos uma correlao vlida entre os dois processos h forte

    indcio da existncia do vis, do contrrio, pode-se dizer que o processo de inscrio

    ocorre aleatoriamente.

    O problema de seleo amostral um problema comum em cincias sociais, e

    ocorre quando o pesquisador toma um estrato da populao que no selecionado de

    maneira aleatria provocando assim estimativas enviesadas baseadas nesta amostra.

    Algum mais desavisado poderia se perguntar se h alguma justificativa para

    desconfiar do vis de seleo amostral neste caso, a resposta (talvez no to clara

    quanto parece) sim, primeiramente por ser o vis resultante naturalmente do

    comportamento humano (WINSHIP & MARE, 1992), que certamente o que estamos

    avaliando e encontrando em ampla variedade de estudos tais como insero feminina

    no mercado de trabalho, criminologia, sociologia familiar, sociologia educacional, etc.

    Segundo (que decorre da primeira), mesmo que no exista o vis e como no est

  • 8

    explicito a sua inexistncia, ento no devemos descartar a hiptese a priori. No

    ocorrendo seletividade, haveremos ao menos mostrado que no, caso ocorra, teremos

    insumos fundamentados para efetuar o ajuste de nossas concluses.

    O trabalho est dividido da seguinte maneira, na seo dois apresentamos uma

    breve reviso de literatura sobre desempenho acadmico/estudantil, na seo trs

    desenvolvemos a metodologia com qual se buscar a possvel existncia do vis

    amostral, na seo quatro faremos algumas consideraes sobre as bases de dados que

    sero utilizadas e variveis escolhidas destas, nas sees cinco e seis, mostraremos os

    resultados alcanados, bem como a interpretao dos mesmos e por fim na seo sete

    ser exposta a concluso.

    2. Reviso de literatura

    Muitos so os trabalhos versando sobre o tema de desempenho

    acadmico/estudantil, e muitas so as abordagens empregadas, porm boa parte segue o

    emprego de modelos de escolha qualitativa, onde a varivel dependente o

    conceito/nota/ndice de desempenho (compreendido entre certas categorias), e as

    variveis explicativas so caractersticas socioeconmicas e/ou caractersticas

    individuais, por exemplo, a personalidade do avaliado (Borg & Stranahan, 2002), a

    seguir apresentamos alguns destes trabalhos.

    Park e Keer (1990) estimaram um modelo logit multinomial para avaliar os

    determinantes da performance acadmica de estudantes, com uma amostra de 97

    estudantes, onde a varivel dependente correspondia ao resultado final em um curso de

    conhecimento bancrio e monetrio (uma escala de valores inteiros de 0 at 4) e as

    variveis explicativas representavam inteligncia, preparo, esforo, atitude e

    caractersticas demogrficas. Os pesquisadores concluem que as variveis relacionadas

    inteligncia, (como o resultado no American College Test (ACT) um teste que serve

    como critrio para ingresso em universidade nos Estados Unidos) e as relacionadas a

    esforo so preponderantes para o bom desempenho. As demais variveis no se

    mostraram significantes. Interessante notar que variveis de contra-esforo, como

    possuir um emprego, ou horas gastas no estudo de matrias no relacionadas no se

    mostraram significantes.

  • 9

    Yang e Raehsler (2005) utilizando um probit ordenado para avaliar o

    desempenho de alunos de um curso intermedirio em microeconomia chegam a

    concluses parecidas, tomando uma amostra de 169 estudantes de duas turmas, uma em

    2003 e a outra em 2004, ambas com professores diferentes, da Clarion University na

    Pensilvnia, tambm utilizando como varivel dependente o conceito final no curso

    (novamente uma escala de valores inteiros de 0 at 4) e as variveis explicativas sendo o

    nmeros de crditos cursados anteriormente na graduao, a mdia global das

    disciplinas cursadas1, o Major

    2 do curso e uma dummy para a metodologia empregada

    pelo professor3. Chegaram concluso que a varivel de maior impacto positivo para o

    desempenho foi mdia global das disciplinas anteriormente cursadas.

    Mare e Winship (1984) investigaram tendncias de emprego da dcada de 60

    dcada de 80 para homens jovens, brancos e negros que esto fora da escola, alm dos

    muitos fatores que influenciam estas tendncias a seletividade influencia a populao

    que no est na escola. Pessoas que ficam mais tempo na escola tm, em mdia,

    melhores perspectivas de trabalho do que aqueles que saem da escola, mostraram,

    contudo, que estimativas de tendncias de emprego eram enviesadas pois a

    probabilidade de se empregar e deixar a escola eram dependentes. Verificaram que

    quando aumentam as matrculas, as taxas de emprego para pessoas jovens fora da escola

    caem.

    Manski e Wise (1983) pesquisaram os determinantes para graduao na

    faculdade, entre vrios, um foi o SAT (Scholastic Aptitude Test, algo como o ENEM no

    Brasil), e verificaram que a pontuao no mesmo um fraco preditor da probabilidade

    de graduao. Whinship e Mare (1992) apontam que certos problemas relacionados a

    seletividade entre fazer o teste e a graduao influenciam este resultado pois, alguns

    estudantes que fazem o SAT, no tentam ir para a faculdade, alguns tentam mas no so

    admitidos, alguns so admitidos mas no se matriculam e aquele que se matriculam so

    selecionados para a amostra entre as instituies em que foram admitidos. Portanto cada

    estgio no aleatrio do processo, afeta a avaliao sobre a probabilidade do estudante

    se graduar na faculdade.

    1 Mais especificamente o GPA (Grade Points Average) acumulado

    2 O Major a rea acadmica de principal interesse na graduao.

    3 Refere-se ao livro empregado pelo professor na disciplina

  • 10

    Um trabalho tambm interessante o de Emilio et al. (2004), que faz uma

    avaliao dos determinantes do acesso a educao superior e utiliza a correo para o

    problema de vis de seleo amostral. Neste trabalho os autores avaliam o desempenho

    de candidatos ao vestibular da FUVEST para o ingresso em 2000, constataram que a

    educao dos pais (sobretudo a da me) o tipo de escola frequentada pelos candidatos e

    ter cursado um curso pr-vestibular, foram os fatores de maior importncia para garantir

    o sucesso no vestibular, alm disso, a correo do vis mostrou-se robusta, pois a

    mudana ocorrida no erro-padro dos parmetros estimados foi pequena, e houve uma

    sensvel diminuio da magnitude desses valores.

    Dois trabalhos que versam sobre o mesmo assunto (RAMOS, 2007 e VELOSO,

    2004), chegam s mesmas concluses a respeito dos determinantes para o sucesso em

    um concurso pblico, ambos comungam da mesma base de dados (de um concurso do

    BNB ocorrido em 2003, baseado no questionrio socioeconmico aplicado aos

    candidatos) esta mesma base uma das que ser utilizada neste trabalho. Ambos

    concluem que tais caractersticas socioeconmicas influenciam sim, a aprovao em um

    concurso pblico, precisamente ser de baixa idade, possuir renda familiar elevada,

    dispor de tempo livre e ter elevada formao so os fatores que contribuem para o

    sucesso no certame. interessante, tambm notar, que as metodologias por estes

    utilizadas foram baseadas em variveis dependentes dicotmicas, apesar de cada um

    usar metodologia distinta.

    3. Metodologia

    Como mencionado anteriormente o objetivo deste trabalho avaliar os

    determinantes (scio-econmicos) para o sucesso em um concurso pblico para

    provimento de cargos, considerando um possvel vis de seleo, causado pelo processo

    de inscrio no concurso pblico, ou seja, dentre a populao, os indivduos que

    participam do concurso comungam de certas caractersticas que determinam sua

    inscrio no certame (ou seja, as observaes retiradas da populao que entram na

    amostra no so retiradas de maneira aleatria). Devemos, portanto avaliar tanto o

    processo de inscrio no concurso, como o que leva a aprovao do candidato.

    Tratemos do primeiro.

  • 11

    Assumiremos a hiptese de que o indivduo na populao em condies de

    ingressar no servio pblico, aquele que satisfaz as condies previstas em edital

    regulatrio do concurso opta por inscrever-se ou no, e condicionaremos esta escolha a

    um conjunto de caractersticas deste mesmo indivduo, a varivel que representa a

    inscrio binria (o candidato est ou no inscrito), e esta depender de caractersticas

    da pessoa, portanto, teremos;

    = + (1)

    A varivel I* representa a condio do candidato em relao a sua inscrio no

    concurso. O vetor Z apresenta o conjunto de caractersticas do candidato que considera-

    se relevante para sua inscrio, o vetor de parmetros associados ao vetor Z e um

    componente estocstico representando fatores no refletidos em Z, sua distribuio

    ~ N(0 , A participao no certame ento ocorrer do seguinte modo;

    = {

    (2)

    Onde I a varivel que representa se ocorreu ou no a inscrio, sendo 1 em

    caso afirmativo e 0 em caso negativo, a varivel c caracteriza-se por um ndice

    individual que levado em considerao pela pessoa, sendo a partir de ci o valor crtico

    para que ocorra a inscrio, deve-se notar que os valores da mesma no so observveis.

    Uma vez que o candidato esteja inscrito, h ainda a dura tarefa de passar nas

    provas do mesmo, modelaremos, novamente, utilizando variveis binrias. Por hiptese

    tomemos a equao abaixo.

    = + (3)

    A varivel Y* relaciona-se linearmente com um conjunto de caractersticas dos

    candidatos, representado aqui por X, a letra grega um vetor de parmetros

    associados a tais caractersticas, h tambm o componente aleatrio anlogo ao da

    equao (1), cuja distribuio dada por ~ N(0 , ). A aprovao no concurso se

    dar ento da seguinte forma;

    = {

    (4)

  • 12

    Onde a varivel que representa se o candidato foi ou no aprovado,

    analogamente ao processo de inscrio, sendo 1 quando o candidato aprovado e 0

    quando no, a varivel a representa a dificuldade associada a prova do concurso, note

    que esta tambm no observvel.

    Aqui devemos esclarecer alguns pontos, primeiramente s existem dados

    relativos posio atingida no concurso, para os candidatos que efetivamente

    inscreveram-se no concurso, portanto existe aqui um problema de dados censurados,

    segundo acredita-se que o processo de aprovao est relacionado ao processo de

    inscrio, se este ltimo no for aleatrio, algumas correes podem ser implementadas,

    no caso devemos aplicar a correo de Heckman (1979) que trata do problema de

    seletividade amostral (quando os elementos selecionados da populao para compor a

    amostra no so selecionados de maneira aleatria), a aplicao direta desta correo,

    entretanto para este caso especfico no deve ser implementada s cegas, ou seja, tal

    qual a proposta por Heckman, visto que a varivel dependente de nossa equao

    principal (1), no quantitativa, entretanto a adaptao bem simples, j foi inclusive

    empregada por Van de Ven e Van Praag (1981), e tambm por Emilio et. al. (2004), no

    entanto, como se trata de uma adaptao simples da proposta de Heckman, convm

    expor a sua metodologia, para facilidade de compreenso.

    Tomemos a equao (3), aplicando mnimos quadrados diretamente

    (considerando a regra de seleo amostral - r.s.a.), obteramos o seguinte resultado

    [|, . . . ] = + [|, . . . ] (5)

    Aqui emerge o motivo pelo qual nos preocuparmos com o vis de seletividade,

    se o erro da equao principal (3), for ortogonal a regra de seleo amostral, ento no

    haveria problema na estimativa direta da mesma, pois o segundo termo do lado direito

    da equao seria [ | , . . . ] = 0, contudo, se no o for, claramente termos

    estimativas viesadas (da o nome vis de seleo amostral). Consideremos a existncia

    do problema, a regra de seletividade est na equao (2), teramos, portanto (por

    convenincia faremos c = 0)

    [|, ] = + [|, ] (6)

  • 13

    Teremos ento uma correlao entre o erro da equao principal (3) e da

    equao de seleo (1), onde e distribuem-se conjuntamente como uma normal

    padro bivariada (HECKMAN, 1979), ou seja;

    [|, ] = (/)() = () (7)

    Onde o coeficiente de correlao entre os erros das equaes principal (3) e

    de seleo (1), o erro padro do componente estocstico da equao principal (3),

    o erro padro do componente estocstico da equao de seleo (1) veja que

    podemos escrever a equao (7) desta maneira, pois multiplicamos e dividimos por

    poise o termo () a chamada razo de Mills invertida (GREENE, 2002). A

    razo de Mills invertida dada por,

    =()

    ()=

    ()

    () (8)

    Os termos e representam respectivamente o funo densidade e acumulada

    de uma distribuio normal, e o termo = ()/. Note que devido simetria da

    distribuio normal podemos fazer () = (). Portanto se existe a

    correlao entre os erros das duas equaes a aplicao de mnimos quadrados

    diretamente, no deve ser realizada, na verdade o modelo correto a ser estimado seria;

    = + () + (9)

    Onde = (), como dissemos anteriormente e distribuem-se

    conjuntamente como uma normal padro bivariada, costuma-se nesses casos normalizar

    = = 1 (EMILIO ET AL, 2004), aqui tambm o faremos, apenas a ttulo de

    simplificao, portanto teremos;

    = + () + (10)

    Desta maneira temos segundo a equao acima, dois vetores de parmetros a

    serem estimados, e , este ltimo indicativo de vis de seleo amostral, portanto

    um teste timo para detect-la testar o prprio parmetro atreves de um teste t comum,

    se este se mostrar no significante, no h indcios de vis de seleo amostral, do

    contrrio h forte indcio da existncia de seletividade.

  • 14

    Feito isto h ainda um problema na estimao da equao (10), o vetor X

    formado de elementos conhecidos, contudo a razo de Mills invertida no, pois depende

    do componente i que depende do parmetro populacional que desconhecido,

    devemos, todavia, estimar o parmetro pertencente equao de seleo, tambm o

    que tambm, por se tratar de um parmetro populacional, deve ser estimado. Deste

    modo utilizaremos;

    =()

    ()=

    (/)

    (/) (11)

    E a equao que realmente ser estimada, assumir a seguinte forma;

    = + () + (12)

    Podemos de fato ver que o erro da equao acima no tendencioso, veja que a

    equao (10), pode ser escrita como,

    = [|, ] + (13)

    Aplicando [. |, , ] e passando o primeiro termo do lado direito da

    equao acima, para a esquerda, termos ento que

    [|, , ] = [|, , ] - [[|, ]|, , ]

    [|, , ] = 0 (14)

    Entretanto esta correo, apesar de anular a tendenciosidade, gera um novo

    problema, cria heteroscedasticidade no modelo, pois,

    [|, , ] = + ( ) = (15)

    Utilizaremos a equao acima para corrigir a heteroscedasticidade do novo

    modelo. Uma vez realizada a correo na equao (12), estima-se o modelo atravs de

    uma regresso linear simples.

    A estimao do modelo, pode ser realizada de duas maneiras, por mxima

    verossimilhana (MV) ou por 2 estgios (2S), o caso por 2 estgios foi mostrado acima,

    para a situao em que a varivel dependente quantitativa. No caso da estimao por

  • 15

    MV, trata-se apenas de maximizar a funo de log-verossimilhana mdia (VELLA,

    1998), essencial lembrar que supomos que erros se distribuam normalmente, portanto

    maximizamos

    =

    {. [ (

    , )

    ( )

    ] + ( =

    ) [ (, )

    ( )

    ]} (16)

    Pode-se ver que se o coeficiente de correlao entre os erros for nulo ( = 0), a

    expresso acima ser bastante simplificada, pois a segunda integral tornar-se- o

    logaritmo do produto de duas integrais, entretanto se isto ocorre, no h motivo pelo

    qual se preocupar com vis de seleo amostral, posto que os erros da equao principal

    (3) e da equao de seleo (1) sero independentes. Neste trabalho utilizaremos tanto o

    mecanismo de estimao por mxima verossimilhana, como a estimao por 2 estgios

    (2S), cabe ressaltar que a estimao por MV gera estimativas mais eficientes do ponto

    de vista estatstico.

    Para o caso da estimao por 2S, h pouca alterao na metodologia original

    proposta por Heckman, Van de Ven e Van Praag (1981) e Emilio et al. (2004),

    descrevem um pequeno roteiro para o caso com varivel dependente dicotmica, abaixo

    reproduzido

    1) Estimar um probit comum para a equao de seleo (1), obtendo assim

    estimativas para , com este resultado, obter estimativas para .

    2) Estimar um modelo de probabilidade linear (MPL), onde a equao a ser

    regredida = + + , obtendo assim estimativa para ,

    3) Tendo agora e , substituir em (15) e obter uma estimativa para e

    corrigir o problema da heteroscedasticidade em (12)

    4) Por fim, estimar e , utilizando um probit no modelo corrigido (equao

    12 aps correo do passo 3).

    Por esse roteiro obteremos boas aproximaes dos valores dos parmetros

    (EMLIO ET AL., 2004), apesar de que a estimao por MV obtm as melhores

    estimativas, o processo por 2S uma boa alternativa que resulta em aproximaes

    muito boas das obtidas por MV.

  • 16

    4. Descrio dos dados

    Devido natureza do problema estudado neste trabalho, utilizamos duas bases

    de dados, a saber, uma oriunda do concurso realizado em 2003 para o provimento de

    cargos do Banco do Nordeste do Brasil (BNB) e a outra a prpria Pesquisa Nacional por

    Amostra de Domiclios (PNAD) tambm de 2003. A primeira contava com 232.308

    observaes, enquanto que a segunda possua 384.834 observaes. A razo de se

    utilizar duas bases de dados est exatamente na suspeita da ocorrncia do vis amostral,

    o ideal seria que existisse uma base de dados nica que englobasse todos os candidatos

    e no inscritos no concurso, como essa base no existe a alternativa tomada foi o uso da

    PNAD 2003, tal escolha tambm no se deu de maneira leviana, existem pelo menos 2

    bons motivos para a utilizao desta, primeiramente nos dados do BNB, no h

    informaes sobre o estado de origem do candidato, apesar do emprego ser para um

    instituio que est no nordeste do pas, possvel que muitos candidatos tenham

    residncia fixa em estados que no compe tal regio, segundo como a PNAD rene um

    grande nmero de informaes e realizada em todo o pais, tais candidatos tem grande

    probabilidade de estarem representados na amostra, isso fundamental para que

    realizemos um cruzamento entre as duas bases de dados.

    Os dados da PNAD de 2003 contemplam indivduos das mais variadas

    caractersticas, entretanto para participao no concurso era necessrio que o candidato

    estivesse enquadrado em um grupo especfico destas, a saber, ter no mnimo 18 anos e

    no mximo 69, pois no Brasil 70 anos a idade para aposentadoria compulsria e

    possuir escolaridade mdia (antigo segundo grau), aplicado estes filtros a base da

    PNAD 2003, reduziu-se de 384.834 observaes para 76.011 indivduos representados

    aptos a pleitear vaga no referido concurso pblico. Alm disso, precisvamos encontrar

    aqueles candidatos que efetivamente se inscreveram e estavam representados nas duas

    amostras, ou seja, realizar um cruzamento entre observaes comuns as duas bases de

    dados, para tanto se tomou com referncias as informaes dos dados contidos na

    amostra oriunda do BNB, que eram renda individual, renda familiar, grau de estudo,

    regio de moradia (metropolitana ou rural), estado civil, situao no mercado de

    trabalho, idade e tipo de ensino mdio do candidato (pblico ou privado). Entretanto em

    relao a ltimo quesito infelizmente tivemos que ignor-lo como critrio para

  • 17

    cruzamento de informaes, pois no h na PNAD de 2003 informaes que reflitam o

    tipo de escolaridade que a pessoa teve durante seu ensino mdio4. Feito este cruzamento

    sobraram 46.407 observaes das 232.308 originais. Feitas estas retificaes, ficamos

    com um conjunto de variveis para a equao de seleo que contm as informaes do

    conjunto de variveis da equao principal e mais algumas informaes adicionais, em

    nosso caso especfico, utilizamos uma medida de contra-esforo, a saber, se o candidato

    trabalha e a durao de sua jornada semanal, tal informao, dividimos em trs

    variveis, uma correspondendo a uma jornada curta, at 30 horas semanais, a segunda

    correspondente a uma jornada mdia, entre 40 e 44 horas semanais de trabalho e a

    terceira relativa a uma jornada longa, acima de 44 horas semanais de trabalho, todas

    representadas por dummies, onde a categoria base no estar empregado. Os motivo

    para utilizar variveis de contra-esforo, so pelo menos dois, o primeiro est na

    prpria natureza do problema, algum que deseje enfrentar um processo de seleo,

    deve tambm considerar o custo de oportunidade associado a sua escolha, de se

    esperar que aqueles candidatos com maior jornada enfrentem um maior custo para se

    prepararem para a prova, o segundo motivo est relacionado a outros estudos relativos a

    desempenho acadmico, como mencionado anteriormente, tais tipos de variveis

    geralmente so utilizadas. Tambm utilizamos uma dummy para o sexo dos

    concorrentes, onde a categoria base ser do sexo feminino, no temos expectativa a

    priori do efeito desta varivel, no por desconhecimento de efeitos relacionados ao sexo

    e mercado de trabalho no Brasil, mas sim por fatos que parecem se chocar, segundo

    dados do IBGE no ano de 2002 as mulheres engajadas no mercado de trabalho recebiam

    em mdia 70% dos rendimentos auferidos por homens, e em mdia possuam 1 (hum)

    ano a mais de estudo que os homens, se levarmos em considerao que em um emprego

    pblico cujos rendimentos so fixados para categorias trabalhistas e em geral com efeito

    legal e de acordo com os princpios que regem a administrao pblica, bem como

    existncia de planos de cargos e salrios, com regras objetivas definindo as promoes e

    ajustes salariais de se esperar ento que as mulheres estejam mais propensas a

    dedicarem-se ao ingresso na carreira pblica, por outro lado a mesma fonte que nos traz

    a luz desta verdade parcial, tambm aponta que a relao entre empregos e anos de

    estudo tende a diminuir a medida que crescem os anos de estudo, para se ter idia,

    4 Existe a varivel V6002 (Rede de ensino) que tem como possveis resultados 2 = Pblica, 4 = Particular

    e 9 = Sem declarao, entretanto esta informao s referente queles pesquisados que so estudantes ou freqentam creche na data de referncia, por isso optou-se por no utilizar tal varivel

  • 18

    segundo dados de 2002, para pessoas entre analfabetas e at 3 anos de estudo a taxa de

    desocupao era de 5,6%, para aqueles que estavam entre 4 e 7 anos de estudo

    apresentavam taxa de desocupao em 9,6% e aqueles com 8 anos ou mais de estudo a

    taxa de desocupao crescia para 10,6%, diante do exposto no se pode formular um

    efeito esperado para a varivel relacionada ao sexo, alm disso utilizamos mais duas

    variveis dummies para captar a possvel existncia de algum efeito oriundo da

    tonalidade da pele, sobre a deciso de se inscrever no certame. Dito isto ficamos com 13

    variveis para a equao de seleo e 8 (oito) variveis para a equao principal, na

    tabela a seguir apresentamos a variveis e os sinais esperados destas, na equao de

    seleo e na equao principal.

    Tabela 1: Variveis utilizadas

    VARIVEL NOTAO CATEGORIA BASE SINAL ESPER.

    1 0

    EQUAO DE SELEO

    Ens. Mdio ENSMED Possui apenas o

    ensino mdio

    Caso contrrio -

    Ens, Superior ENSSUP Possui ensino

    superior completo

    Caso contrrio +

    Estado Civil SOLT Casado Solteiro

    Renda Familiar Mensal RFMA Maior ou igual a 10

    salrios mnimos*

    Caso contrrio +

    Renda Pessoal Mensal RPMB Menor ou igual a 2

    salrios mnimos*

    Caso contrrio -

    Regio Metropolitana RMETR Mora em regio

    metropolitana

    Caso contrrio +

  • 19

    Jornada Curta JCURT Entre 15 e 39 horas

    semanais

    Caso contrrio +

    Jornada Mdia JMED Entre 40 e 44 horas

    semanais

    Caso contrrio

    Jornada Longa JLONG Mais de 44 horas

    semanais

    Caso contrrio -

    Sexo SEXO Masculino Feminino

    Idade Baixa IDADB Entre 18 e 22 anos Maior de 22

    anos

    +

    Cor da pele branca BRANCA Branco Caso contrrio +

    Cor da pele, negra, parda

    ou indgena

    NPIND Negro, Pardo ou

    Indgena

    Caso contrrio -

    EQUAO PRINCIPAL

    Ens. Mdio ENSMED Se possui apenas o

    ensino mdio

    Caso contrrio -

    Ens, Superior ENSSUP Se possui ensino

    superior completo

    Caso contrrio +

    Estado Civil SOLT Casado Solteiro

    Renda Familiar Mensal RFMA Maior ou igual a 10

    salrios mnimos*

    Caso contrrio +

    Renda Pessoal Mensal RPMB Menor ou igual a 2

    salrios mnimos*

    Caso contrrio -

    Sit. no Merc. de Trabalho DEST Desempregado ou

    estagirio

    Caso contrrio

  • 20

    Regio Metropolitana RMETR Se mora em regio

    metropolitana

    Caso contrrio +

    Idade Baixa IDADB Entre 18 e 22 anos Maior de 22

    anos

    +

    *O salrio mnimo no ano de 2003 era de R$ 200,00 at o dia 1 de Abril daquele ano, passando a ser a partir daquela data R$ 240,00 at 1 de Maio de 2004. Portanto tomaremos como salrio mnimo o valor de R$ 240,00.

    Cabe aqui alguns esclarecimentos a respeito dos efeitos esperados de tais

    variveis, j mencionamos acima o motivo daquelas relacionas a contra-esforo, sexo e

    cor da pele. No caso das variveis relativas ao ensino mdio e ao ensino superior

    completo (categoria base ensino superior incompleto), para a equao de seleo temos

    efeito esperado negativo, isto est relacionado ao nvel exigido para o concurso, o nvel

    daqueles que realmente se inscrevem no mesmo, que o prprio ensino mdio, visto

    que aps a censura de dados, a proporo de observaes relativas ao ensino mdio, se

    altera, pois antes da inscrio tnhamos uma proporo de 65,14% das observaes

    possuidoras de apenas ensino mdio contra 34,86% detentoras do ensino mdio, e aps

    a inscrio ficamos com 46,66% detentores do ensino mdio contra 53,34% possuidoras

    de ensino superior completo, temos aqui um indcio de que possuir apenas o ensino

    mdio contribui negativamente para participar do concurso, no caso desta varivel para

    a equao principal, existem conhecimentos requeridos para este concurso que no so

    contemplados no ensino mdio regular e que compe o concurso, enquanto que aqueles

    candidatos que j concluram o ensino superior j esto acostumados (acredita-se) a

    prtica autodidtica, bem como rotinas de estudo mais intensas.

    No que tange as variveis relacionadas renda, em ambas as equaes o efeito

    esperado o mesmo, no caso da renda familiar mensal alta positivo e para a renda

    pessoal mensal baixa negativo, pois rendas mais elevadas garantem acesso a certas

    condies de qualidade de estudo e, portanto, preparao adequada, de se esperar que

    o candidato nestas condies esteja mais propenso a se inscrever e passar na prova

    requerida para o ingresso no servio pblico.

    Quando acreditamos que residir em regio metropolitana e possuir idade baixa

    (entre 18 e 22), contribuem positivamente, tanto para inscrio no concurso como para

  • 21

    aprovao, estamos supondo que na primeira situao as dificuldades relativas a

    adquirir boas condies de ensino so minoradas, enquanto que na segunda situao, o

    indivduo est mais prximo de conhecimentos mais recentes, alm de estar tambm

    de sua poca estudantil, seno ainda nesta, o que o tornaria mais propenso a dedicao

    acadmica.

    Por fim no que diz respeito ao estado civil do candidato e situao empregatcia

    dos indivduos, no que tange a primeira varivel, no temos expectativas a priori, pois o

    candidato solteiro por no ter tantas obrigaes familiares, goza de mais tempo livre

    para debruar-se em seus estudos, o que o faria mais propenso inscrio e aprovao

    no processo seletivo, por outro lado o candidato casado tem mais incentivo melhoria

    de sua situao financeira, j que deve garantir recursos para atender necessidades

    prprias e da famlia, e, portanto visando os benefcios que o servio pblico brasileiro

    oferece, se dedicaria mais a conquista desta vaga. A situao empregatcia do agente,

    tambm apresenta a priori efeito ambguo, pois aqueles que no trabalham ou so

    apenas estagirios gozam de maior tempo livre, vantagem para quem deseja se preparar

    para um concurso pblico, entretanto aqueles que trabalham no intuito de conquistarem

    benefcios que no se apresentam no setor privado, estariam mais dispostos a realizarem

    sacrifcios (entenda-se reduzir tempo destinado a atividades de lazer) para

    conquistarem a sonhada vaga no setor pblico.

    5. Resultados Alcanados

    O software utilizado para estimarmos o modelo foi o STATA verso 11.0, pelo

    mtodo da mxima verossimilhana, anteriormente apresentado. Os resultados da

    estimao so apresentados abaixo

    Tabela 2: Resultados da Estimao por MV

    Probit com seleo amostral N de Observaes = 46407

    Observ. Censuradas = 14158

    Log Verossimilhana = - 20793,39 Observ. No Censuradas = 32249

    Prob > chi2 = 0,0000 Wald chi2(8) = 49,97

    Equao Principal

  • 22

    Varivel Coeficiente Erro Padro Z P > |Z|

    ENSMED -0.4732588 0.120425 -3.93 0.000

    ENSSUP 0.0928397 0.1037557 0.89 0.371

    SOLT -0.2099085 0.1084117 -1.94 0.053

    RFMA 0.1952131 0.09983 1.96 0.051

    RPMB 0.0062186 0.0862049 0.07 0.942

    DEST 0.2003213 0.0927374 2.16 0.031

    RMETR 0.2768601 0.0948476 2.92 0.004

    IDADB 0.1801416 0.1134317 1.59 0.112

    Constante -3.007952 0 .1389316 -21.65 0.000

    Equao de Seleo

    ENSMED 0.4706823 0.0216092 21.78 0.000

    ENSSUP -0.0865741 0.0241964 -3.58 0.000

    SOLT 0.1506231 0.0187824 8.02 0.000

    RFMA 0.1010285 0.017481 5.78 0.000

    RPMB 0.6185016 0.0179085 34.54 0.000

    RMETR 0.3964034 0.014671 27.02 0.000

    JCURT -2.194237 0.0367443 -59.72 0.000

    JMED -1.982935 0.0359596 -55.14 0.000

    JLONG -1.443836 0.03714 -38.88 0.000

    SEXO 0.182367 0.0169986 10.73 0.000

    IDADB 0.2523003 0.025155 10.03 0.000

    BRANCA -0.1252488 0.1169461 -1.07 0.284

    NPIND -0.0791051 0.1171555 -0.68 0.500

  • 23

    Constante 1.257976 0.1237322 10.17 0.000

    Teste da Razo de Verossim. para as equaes independentes ( = 0)

    Chi2(1) = 2.82 Prob > chi2 = 0.0929

    Fonte: Elaborao Prpria

    Mostraram serem significantes para a equao de seleo todas as variveis, com

    exceo daquelas relacionadas cor da pele (mesmo para nveis de significncia de

    10%), portanto o processo de inscrio parece ser influenciado sim por caractersticas

    scio-econmicas que atuam sobre o indivduo, sugerindo, portanto que tal processo

    no se d de maneira aleatria como se poderia imaginar. No que tange a equao

    principal o processo j foi mais penoso, ao nvel de significncia de 5%, apenas trs

    variveis mostraram-se robustas, a saber, aquela relacionada ao ensino mdio

    (ENSMED), a relacionada situao empregatcia do candidato (DEST) e a que se

    relaciona ao local de residncia (RMETR), se folgarmos um pouco mais este nvel de

    significncia (de 5% para 10%), mais duas variveis se mostram significativas, o estado

    civil do candidato (SOLT) e a renda familiar do mesmo (RFMA). O coeficiente de

    correlao entre a equao de seleo e a equao principal, mostrou-se significante e

    apresenta uma correlao negativa entre estas (-0.174), sugerindo existncia de vis de

    seleo amostral, cabe aqui uma ressalva, como o nvel de significncia est

    visivelmente elevado, estamos em um limiar entre a existncia do vis e a no

    ocorrncia do mesmo, se tomarmos o nvel de 5% certamente a existncia de vis

    descartada.

    O teste de Wald para rejeitar a significncia global dos coeficientes, para a

    equao principal (Wald chi2(8) = 49,97), apresentou uma estatstica bastante alta,

    levando assim a rejeio da hiptese nula, onde todos os coeficientes conjuntamente so

    no representativos, portanto acredita-se que esta situao (no significncia global dos

    coeficientes) no esteja ocorrendo. Por outro lado temos um ponto nada pacfico aqui, o

    teste realizado para verificar se as duas equaes so no correlacionadas, (Teste da

    razo de verossimilhana ao fim da tabela 2), apresenta um valor relativamente pequeno

    da estatstica de teste Chi2(1) = 2.82 (leia-se Chi2 = 2), para um nvel de significncia

    de 10% a hiptese nula quase no rejeitada (Prob > chi2 = 0.0929), o que j um nvel

    de significncia considerado elevado, nos levando a duvidar da suspeita que recai sobre

  • 24

    a existncia do vis de seleo amostral. Antes de prosseguirmos com a discusso sobre

    os efeitos encontrados apresentaremos mais duas estimativas, uma apreciando a

    possibilidade da existncia de vis de seletividade, porm pela metodologia de 2

    estgios e um probit onde no se considera a o vis.

    Tabela 3: Resultados da Estimao por 2 estgios

    Probit com seleo amostral 2 Estgios N de Observaes = 46407

    Log Verossimilhana = -496.21048 Pseudo R2 = 0.0710

    Prob > chi2 = 0.0000 LR chi2(9) = 75.83

    Equao Principal

    Varivel Coeficiente Erro Padro Z P > |Z|

    ENSMED -0.4405693 0.1086683 -4.05 0.000

    ENSSUP 0.1023619 0.0935426 1.09 0.274

    SOLT -0.2553279 0.0967773 -2.64 0.003

    RFMA 0.2621137 0.0892438 2.94 0.003

    RPMB -0.0138088 0.078696 -0.18 0.861

    DEST 0.1521766 0. 083577 1.82 0.069

    RMETR 0.2850672 0.0866989 3.29 0.001

    IDADB 0.1502435 0.1009812 1.49 0.137

    Constante -3.012311 0.1187829 -25.36 0.000

    RMI* -0.0039395 0.0050175 -0.79 0.432

    N de Observaes = 76011

    Log Verossimilhana = -28147.663 Pseudo R2 = 0.2297

    Prob > chi2 = 0.0000 LR chi2(13) = 16790.46

    Equao de Seleo

    ENSMED 0.3799397 0.0177886 21.36 0.000

  • 25

    ENSSUP -0.1656499 0.0195873 -8.46 0.000

    SOLT 0.1240214 0.0158344 7.83 0.000

    RFMA 0.1221708 0.0144323 8.47 0.000

    RPMB 0.4555022 0.0154502 29.48 0.000

    RMETR 0.3020626 0.0123256 24.51 0.000

    JCURT -1.304543 0.0367443 -59.72 0.000

    JMED -1.781007 0.0327255 -54.42 0.000

    JLONG -1.304543 0.0337182 -38.69 0.000

    SEXO 0.1995233 0.0143866 13.87 0.000

    IDADB 0.3453483 0.0213075 16.21 0.000

    BRANCA -0.4424091 0.0837448 -5.28 0.000

    NPIND -7.7355529 0.0841583 -8.74 0.000

    Constante 2.158794 0.0912957 23.65 0.000

    Fonte: Elaborao Prpria

    * RMI = Razo de Mills Invertida

    Quando comparamos os resultados obtidos com a estimao por MV e a

    estimao por 2 estgios (2S), a varivel referente a escolaridade de nvel mdio

    (ENSMED) do candidato mostrou ter efeito negativo sobre a probabilidade de obter

    sucesso no concurso e mostrou pequeno aumento (do modelo de MV para 2S, sempre

    que fizermos comparaes, o faremos nesse sentido), passando de -0.473 para -0,44, a

    que trata do estado civil (SOLT), tambm apresentou efeito negativo sobre as chances

    que candidato tem de aprovao, porm diferente do que ocorreu com o ensino mdio

    quando se muda o mtodo de estimao as chances do candidato diminuem (-0,209 para

    -0,255), das variveis que dizem respeito a renda, aquela referente a renda familiar

    mensal apresenta relativo crescimento quando o mudamos de MV para 2S (0,195 para

    0,262)

  • 26

    No que tange a significncia dos resultados encontrados pela estimao por 2S

    apresentam pequenas divergncias em relao aos encontrados por MV, por exemplo,

    que no modelo que se leva em considerao a estimativa por MV rejeita-se a varivel

    concernente ao estado civil do candidato (SOLT) ao nvel de significncia de 5%,

    enquanto que no processo por 2S mesmo ao nvel de significncia de 1% ela se torna

    significativa, acontece parecido para a renda familiar mensal do candidato (RFMA), no

    modelo por MV demonstra-se no significativa para a aprovao no concurso, ao passo

    que quando estamos trabalhando com o 2S esta se torna significativa ao nvel de 5%,

    por outro lado aquela referente situao dos candidatos no mercado de trabalho

    (DEST), ao nvel de 5%, rejeitada para a estimativa por MV, e no rejeitada para o

    caso da estimativa por 2S. Tambm no se verificou, como mostra o teste da raiz de

    verossimilhana, que o modelo globalmente significante (na equao principal temos

    LR chi2(9) = 75.83 e equao de seleo LR chi2(13) = 16790.46). Entretanto o

    coeficiente relacionado razo de Mills invertida, na estimativa por 2S, ou seja, o

    coeficiente de correlao entre os componentes estocsticos da equao de seleo e da

    equao principal, tal como na estimativa por MV, apresentou correlao negativa entre

    as equaes, porm mostrou-se insignificante, mesmo ao nvel de 10%, refutando a

    hiptese de ocorrncia de vis de seleo amostral.

    Para comparao com um modelo em que no se acredita na ocorrncia do vis

    de seleo amostral, lanaremos mo de um modelo probit simples, para tal, utilizamos

    a base original do concurso realizado pelo BNB, ou seja, com todas as observaes.

    Tabela 4: Resultados da Estimao do Probit (assumindo que no h vis)

    Probit simples N de Observaes = 232308

    Log Verossimilhana = -4059.7054 Pseudo R2 = 0.0518

    Prob > chi2 = 0.0000 LR chi2(8) = 443.60

    Equao Principal

    Varivel Coeficiente Erro Padro Z P > |Z|

    ENSMED -0.4324884 0.0355538 -12.16 0.000

  • 27

    ENSSUP 0.0976548 0.0344606 2.83

    0.005

    SOLT -0.0025269 0.0361154 -0.07 0.944

    RFMA 0.2108126 0.0338719 6.22 0.000

    RPMB -0.0648996 0.0276512 -2.35 0.019

    DEST 0.1093347 0.0287675 3.80 0.000

    RMETR 0.1789449 0.0284228 6.30 0.000

    IDADB 0.1224489 0.0356619 3.43 0.001

    Constante -2.902276 0.042619 -68.10 0.000

    Fonte: Elaborao Prpria

    Utilizando o probit simples encontramos mais algumas diferenas em relao

    aos modelos anteriores, com relao ao sentido do efeito das variveis sobre a chance de

    sucesso no concurso, apenas a varivel condizente com a renda pessoal mensal

    (RPMB), apresentou divergncias entre os trs modelos na estimao por MV tivemos

    efeito negativo, na estimao por 2S apresentou efeito positivo e novamente no probit

    simples voltou a apresentar efeito negativo, as demais mantiveram o mesmo sinal para o

    coeficiente em todos os modelos, em contrapartida houve muita mudana no que diz

    respeito significncia das variveis, por exemplo, a varivel relacionada educao

    superior do candidato (ENSSUP), nos modelos com hiptese de seleo amostral (MV e

    2S), no eram significativas mesmo ao nvel de 10%, contudo quando trabalhamos no

    modelo simples (probit) esta significativa mesmo ao nvel de 1%.

    Quanto a varivel condizente com o estado civil (SOLT), na estimao por MV

    se mostra significativa ao nvel de 1%, na estimativa por 2S apenas aos 10% e no

    modelo probit no significativo em nenhum nvel (10%, 5% ou 1%), quanto a renda

    familiar do candidato (RFMA) nos modelos MV e probit mostra-se significante ao nvel

    de 1%, ao passo que no modelo por 2S, s significante ao nvel de 10%, j a renda

    pessoal mensal do candidato (RPMB) s no rejeitada no probit simples (5%), as

    variveis relacionadas situao no mercado de trabalho (DEST) e local de residncia

    (RMETR) e possuir apenas ensino mdio (ENSMED) so significativas em todos os

  • 28

    trs modelos sendo as ltimas duas em qualquer nvel de significncia e a primeira,

    respectivamente, aos nveis 10 % no modelo por 2S, 5% no modelo por MV e 1% no

    modelo probit simples.

    A varivel relacionada idade baixa do candidato (IDADB), s mostrou-se

    significante no probit simples (1%). Verificamos significncia global no probit simples,

    utilizando o teste da razo de verossimilhana (LR chi2(8) = 443.60). Na tabela a seguir

    apresentamos um quadro que sumariza os resultados encontrados pelos trs mtodos de

    estimao. Deve-se ressaltar tambm que os valores calculados dos coeficientes no so

    verdadeiramente os efeitos marginais que as variveis exercem sobre a probabilidade de

    sucesso na varivel dependente, na verdade devido a natureza no-linear destes tipos de

    modelos, tal interpretao induz ao erro, apesar destes coeficientes retratarem a direo

    do efeito (o que se apresenta negativo, tem efeito negativo sobre a varivel dependente,

    interpretao anloga no caso de sinais positivos), na realidade os efeitos marginais

    variam conforme variar o vetor de variveis independentes pois o clculo deste efeito

    dado pelo produto da densidade de probabilidade (normal para um probit) pelos

    coeficientes estimados;

    () = Vetor de efeitos marginais (17)

    Facilmente se pode notar que os efeitos marginais mudam conforme se alteram

    os valores das variveis independentes, contudo para contornar este problema,

    utilizaremos os valores mdios (amostrais) dessas variveis de modo que trabalharemos

    com a seguinte expresso

    () = Vetor de efeitos marginais mdios (17)

    Os efeitos marginais encontrados nos trs mtodos utilizados so apresentados

    na tabela a seguir, mantivemos na tabela apenas as variveis que se mostraram

    estatisticamente significantes.

  • 29

    6. Interpretao dos resultados

    I) Efeitos Marginais Mdios

    a) Determinantes ligados educao

    Encontramos nos trs mtodos abordados, que possuir apenas o ensino mdio

    influencia negativamente as chances do candidato ser aprovado em um concurso

    pblico observamos pequenas mudanas nos coeficientes encontrados para esta

    varivel, contudo em ambos as verses em que considervamos a existncia de

    seletividade na inscrio a influncia negativa fora maior, em todos os modelos

    mostrou-se significante, tal resultado era esperado (conforme tabela 1), isto pode ser

    visto como decorrente da baixa preparao que o sistema educacional brasileiro, em

    nveis bsicos, proporciona aos seus alunos, pois para um concurso em que exigia-se

    apenas o ensino mdio surpreendente que possu-lo, apenas, diminui a probabilidade

    de aprovao no mesmo.

    Em contraste possuir nvel superior completo ou ps-graduao, apresentou

    efeito positivo, entretanto no se mostrou varivel significativa quando supomos

    existncia de seletividade, antes de comentarmos esse ocorrido (no significncia

    estatstica), examinemos as razes socioeconmicas que estariam por trs dos resultados

    encontrados (coeficientes estimados), decerto, isto, reflete uma melhor preparao de

    tais candidatos, visto que se ingressaram no ensino superior de se esperar que j

    tenham certo ritmo e mtodo de estudo bem mais desenvolvido, porm tal efeito foi um

    dos de menor magnitude, (vale lembrar que tais valores no so em si os efeitos

    marginais que a varivel exerce sobre a aprovao, pois em se tratando de modelos no-

    lineares, no representam o efeito marginal direto, porm expressam a direo do efeito)

    o que pode indicar tambm que apesar de estarem no nvel superior, sua educao

    efetiva no corresponde ao nvel em que se encontram, no se pode desprezar, contudo

    que a concorrncia destes (de nvel superior) com aqueles (de nvel mdio) pode ter

    dado certa contribuio ao efeito negativo sobre possuir apenas o ensino mdio.

  • 30

    b) Determinantes ligados renda

    Tratando da renda dos candidatos encontramos que a renda familiar mensal alta

    (acima de 10 salrios mnimos do ano de 2003) fator de grande influncia (positiva)

    no sucesso para obteno de emprego pblico, fato j previsvel. de se esperar que os

    de maior renda apresentem chance maior de aprovao, j que os mesmos podem

    adquirir melhores formas de preparao, bem como materiais especializados, aulas

    particulares e cursos preparatrios. Um indcio nefasto emerge, o da concentrao de

    renda inter-geracional, pois aqueles candidatos oriundos de lares mais abastados

    ingressam no servio pblico (que em relao ao setor privado, geralmente, apresenta

    maiores rendimentos) com maior chance do que os que possuem origem mais modesta.

    Isto pode ser visto pelo seu contraposto a renda pessoal mensal baixa (menos que 2

    salrios mnimos do ano de 2003), em todas as estimativas o efeito visto fora negativo,

    embora tenham sido rejeitadas (ao nvel de 10%), quando se sups seletividade, apesar

    disto refora-se a tese do efeito concentrador que aqui atua, onde aqueles que auferem

    menores rendimentos tem suas chances reduzidas de ingressarem no setor pblico,

    perpetuando o ciclo nocivo da pobreza e da concentrao de renda. Para uma regio

    como o nordeste brasileiro, que historicamente palco de extremos da desigualdade

    social isso ainda mais preocupante, e em parte explica o tal processo histrico

    concentrador, onde o filho de coronel estudava e tornava-se o doutorzinho, que em

    quase sempre vinha ser um funcionrio da administrao pblica, adensando cada vez

    mais essa espiral da desigualdade social.

  • 31

    Tabela 5: Resultados dos trs mtodos de estimao (2S, MV e probit simples)

    Equao Principal 2S Equao Principal MV Equao Principal Probit

    Varivel Coeficiente Erro Padro P > |Z| Coeficiente Erro Padro P > |Z| Coeficiente Erro Padro P > |Z|

    ENSMED -0,4406 0,1087 0,000 -0,4733 0,1204 0,000 -0,4325 0,0356 0,00

    ENSSUP 0,1024 0,0935 0,274 0,0928 0,1038 0,371 0,0977 0,0345 0,01

    SOLT -0,2553 0,0968 0,003 -0,2099 0,1084 0,053 -0,0025 0,0361 0,94

    RFMA 0,2621 0,0892 0,003 0,1952 0,0998 0,051 0,2108 0,0339 0,00

    RPMB -0,0138 0,0787 0,861 0,0062 0,0862 0,942 -0,0649 0,0277 0,02

    DEST 0,1522 0,0836 0,069 0,2003 0,0927 0,031 0,1093 0,0288 0,00

    RMETR 0,2851 0,0867 0,001 0,2769 0,0948 0,004 0,1789 0,0284 0,00

    IDADB 0,1502 0,1010 0,137 0,1801 0,1134 0,112 0,1224 0,0357 0,00

    Constante -3,012 0,1188 0,000 -3,008 0,1389 0,000 -2,902 0,0426 0,00

    RMI* -0,0039 0,0050 0,432

    Fonte: Elaborao Prpria

    * Razo de Mills invertida

  • 32

    Tabela 6: Efeitos Marginais Mdios (2S, MV e probit simples)

    2S MV Probit Simples

    Varivel Efeito Marginal Varivel Efeito Marginal Varivel Efeito Marginal

    ENSMED -0,0024127 ENSMED -0,0032389 ENSMED -0,0034162

    ENSSUP - ENSSUP - ENSSUP 0,0007714

    SOLT -0,0013982 SOLT -0,001436 SOLT -

    RFMA 0,0014354 RFMA 0,.0013377 RFMA 0,0016652

    RPMB - RPMB - RPMB -0,0005126

    DEST 0,0008334 DEST 0,0013717 DEST 0,0008636

    RMETR 0,0015611 RMETR 0,0018976 RMETR 0,0014135

    IDADB - IDADB - IDADB 0,0009672

    Fonte: Elaborao Prpria

    c) Determinantes ligados situao empregatcia

    Observamos um efeito positivo sobre no estar no mercado de trabalho ou ser

    estagirio, implicando que a disponibilidade de tempo que estes candidatos possuem

    para se dedicarem a estudar para o concurso reflete em melhor desempenho, alm de

    haver grande incentivo (sobretudo queles desempregados) em sair da situao em que

    se encontram. Tambm h aqueles que optam por ficar sem emprego durante

    determinado perodo que antecede o concurso para dedicao integral a sua jornada de

    estudo, em muitos casos so candidatos que juntaram dinheiro durante certo perodo

    para custearem sua preparao e suas despesas em suas demandas pelo servio pblico.

    d) Determinantes ligados a faixa etria e a regio de moradia

    Em todos os trs mtodos de estimao abordados nesse estudo, as estatsticas

    encontradas para a regio de moradia (RMETR), mostraram-se significantes, j as

    relacionadas faixa etria entre 18 e 22 anos (IDADB), no foram quando se supe

    seletividade amostral (nvel de 10%), ambos apresentaram influncia positiva para o

    sucesso no referido concurso. Os candidatos oriundos de regio metropolitana tm suas

  • 33

    chances aumentadas, possivelmente pela maior facilidade na aquisio de servios

    educacionais do que aqueles provenientes de regies rurais, como escolas bem

    estruturadas e professores capacitados, que em regies rurais costumam ser muito mais

    escassas, sobretudo nas regies norte e nordeste do pas. No que tange a faixa etria, os

    mais jovens tambm apresentam maiores chances, isto pode ser conseqncia de um

    ritmo de estudo ainda bastante presente, j que no se encontram to distantes

    (temporalmente) de sua vida escolar e de conhecimentos mais atualizados.

    At o momento parece que se desprezou o fato de algumas variveis se

    mostrarem significantes em certa modelagem, mas no ocorrer em outra, optou-se por

    tratar deste assunto a parte, pois merece certa ateno, trataremos disso na seo

    seguinte.

    II) Significncia e ocorrncia de vis de seleo amostral

    Como mencionado anteriormente, percebe-se que algumas variveis se mostram

    significantes e uma modelagem, mas no em outras caso da varivel relacionada a

    possuir nvel superior (ENSSUP) que significante apenas no probit simples, caso da

    varivel relacionada ao estado civil do candidato (SOLT), que contrariamente s no

    tem significncia no probit simples, o mesmo ocorre com a varivel renda familiar

    mensal alta (RPMA) e idade entre 18 e 22 anos (IDADB).

    No que tange a ocorrncia de vis de seleo amostral, no h ponto pacfico,

    pois na modelagem por dois estgios (2S), o coeficiente de correlao entre o

    componente estocstico da equao principal e aquele da equao principal, no

    estatisticamente significante, caracterizando a inexistncia de vis, por outro lado no

    modelo estimado por mxima verossimilhana (MV) o coeficiente referido por muito

    pouco tambm no se mostra insignificante, isso se considerarmos o nvel de

    significncia de 10%, pois o p-valor da estatstica de teste foi 0,092 o que muito

    prximo do ponto crtico de rejeio, ao nvel de 5% o vis j descartado. Certamente

    o nvel de 10% para significncia uma margem bastante generosa, quase que um apelo

    s foras etreas que governam a aleatoriedade das distribuies utilizadas para

    realizao dos testes, comumente se utiliza a margem de 5% o que bastante razovel,

    o que nos leva a rejeitar a hiptese de seletividade amostral.

  • 34

    Alm disso, temos bons motivos para acreditar que no ocorre o vis,

    primeiramente ao contrastarmos os resultados dos modelos com e sem vis, variveis

    que a priori acreditvamos importantes apresentam comportamentos estranhos, de se

    esperar que candidatos cuja renda da famlia seja alta tenham suas chances aumentadas

    em relao aos de famlia mais humilde, por motivos anteriormente expostos, contudo

    quando se passeia em um mundo com o vis amostral, no faz a menor diferena ser

    mais rico ou mais pobre, apesar de isso ser muito pouco provvel, caso anlogo de

    possuir ensino superior completo, mais uma vez, nas modelagens em que se considera o

    vis, tal varivel rejeitada, apesar de quando no consideramos a seleo amostral, o

    efeito, apesar de positivo, bem pequeno, mas ainda assim melhora as chances do

    candidato, se confrontarmos essa situao, com possuir ensino mdio apenas (onde o

    efeito reduzido sobre a probabilidade de aprovao), vemos que faz bastante sentido

    se imaginar que possuir o ensino superior um plus para a aprovao. Ainda mais, o

    mesmo ocorre com o fato de possuir idade entre 18 e 22 anos, novamente s tem

    significado quando rejeitamos a existncia de seletividade amostral, mas menos

    provvel que um candidato que h muito tenha deixado sua vida escolar, e que

    geralmente est empenhado em muito mais atividades do que aqueles mais jovens,

    tenham disposio e tempo para uma preparao mais adequada, o que certamente no

    exatamente um determinante rgido, porm uma dificuldade a ser levada em

    considerao. Por fim temos o estado civil do candidato que, quando ocorre o vis

    mostra-se vlido, apontando que os casados tm maiores chances de aprovao,

    confrontando isto com o que aponta a varivel de idade, um contra-senso, pois

    candidatos mais velhos tm suas chances reduzidas ao passo que aqueles mais velhos

    geralmente so casados, e por isso tem suas chances aumentadas, este efeito um tanto

    ambguo, aponta no suportar que estas duas no convivam pacificamente, e assim se v

    nas trs modelagens, sempre que uma significativa a outra no , e h poucos motivos

    para se imaginar que ser solteiro ou no tenha alguma influncia significativa.

    Diante do exposto acreditamos que o mais correto desconsiderar qualquer

    efeito proveniente de vis de seletividade amostral, bem com a sua prpria existncia,

    na situao de demanda por empregos pblicos no Brasil. Os resultados encontrados no

    modelo simples (sem vis de seleo) parecem bastante razoveis, condizem com o

    esperado e so estatisticamente slidos.

  • 35

    7. Concluso

    O foco deste estudo era levar a prova, se o fenmeno conhecido com vis de

    seleo amostral afetava a deciso e, em ltima instncia, a aprovao em um concurso

    para provimento de cargos pblicos. Atravs do uso de trs metodologias prximas,

    duas em que se sups a ocorrncia e outra em que se fez o contrrio. Encontramos que

    no h indcios fortes da ocorrncia do fenmeno.

    Corrobora esta sentena o fato de variveis que em outros estudos sobre o

    mesmo tema mostraram-se significativas, quando aplicamos a correo do vis j no

    eram, contudo em tais estudos (que utilizaram inclusive uma das bases de dados aqui

    utilizadas) os pesquisadores no levaram em conta o vis de seletividade, conjugando

    isto com o resultado encontrado nos modelos estimados com correo para o vis, que

    ao nvel de significncia de 5%, rejeita a hiptese de seleo amostral, viu-se que no

    existe correlao entre o processo de inscrio e o processo de aprovao do concurso.

    Portanto mais provvel que os resultados encontrados com a terceira

    modelagem (probit simples sem vis de seleo), sejam os mais condizentes com a

    natureza do problema, reforando estudos anteriores que mostram que a instituio do

    concurso pblico no Brasil contribui nocivamente para a manuteno do perverso ciclo

    da concentrao de renda, pois, muito pelo seu sistema educacional deficitrio, que

    diploma alunos do ensino mdio, mas quando em um concurso que exige apenas esse

    tipo de formao, possuir apenas o referido ensino mdio tem o maior impacto negativo

    (magnitude) sobre as chances do candidato ser aprovado. Em contrapartida o candidato

    com ensino superior, renda familiar alta, jovem e com tempo disponvel tem em muito a

    as suas chances acrescidas, caracteristicamente a varivel relativa renda familiar

    refora outro problema, o da pobreza intergeracional, ou seja, a riqueza alm de ser

    concentrada, castra o desenvolvimento de geraes futuras, e um problema leva a outro,

    pois aqueles com pouca formao e de famlias menos favorecidas, tem de ingressar

    mais cedo no mercado de trabalho, reduzindo ainda mais suas possibilidades de tornar-

    se empregado pblico ao passo que essa situao vai se perpetuando enquanto o

    indivduo envelhece e cada vez mais se intensifica o abismo entre este ente e o emprego

    pblico.

    Podemos visualizar dois cenrios extremos baseados nas estimativas obtidas

    com a modelagem que ignora o vis de seleo amostral. Imaginemos um indivduo que

  • 36

    apresenta todas as caractersticas que influenciam negativamente a aprovao no

    certame, ou seja, que possui apenas ensino mdio, a famlia no de situao abastada,

    sua renda pessoal baixa, trabalha, mora em localizao distante e no jovem, a

    probabilidade de aprovao deste candidato figura entre menos do que 0,1%

    (aproximadamente 0,033%) ao passo que o candidato em situao extremamente oposta,

    ou seja, com educao superior completa, oriundo de famlia rica, com ganhos mensais

    elevados, que no trabalha, morador de regio metropolitana e jovem, tem suas chances

    aumentadas para 1,45%, o que pode parecer muito pouco, se visto em absoluto,

    entretanto se tomarmos tais probabilidades e compar-las veremos que (atravs de uma

    simples razo), o candidato que apresenta caractersticas favorveis tem 43,03 vezes

    mais chances de ser aprovado do que aquele outro, o que os separa no nem um

    abismo praticamente uma galxia.

  • 37

    8. Referncias

    BORG, M.; STRANAHAN, H. (2002), Personality type and student performance in

    upper-level economics courses: the importance of race and gender, Journal of

    Economic Education pp. 314.

    CASTELAR, I.; VELOSO, A.; FERREIRA, R.; SOARES, I. (2010), Uma Anlise dos

    Determinantes de Desempenho em Concurso Pblico. Brazilian Journal of Applied

    Economics, v. 14, n. 1, p. 81-98, jan-mar.

    CHEVALIER, A.; LINDLEY, J.; Overeducation and the Skills of UK Graduates,

    Centre for the Economics Education, London School of Economics, London. 2007

    DUARTE, G.B., SILVEIRA, R.M., (2009), Avaliando o impacto do programa bolsa

    famlia sobre a frequncia escolar: o caso da agricultura familiar no nordeste do Brasil,

    in: ANPEC, ed., Anais do XIII Encontro Regional de Economia, Fortaleza. CE.

    EMILIO, D. R., BELUZZO, W. , ALVES, D.C.(2004), Uma Anlise Economtrica dos

    Determinantes do Acesso Universidade de So Paulo, Economia Aplicada 34(2), 275-

    305.

    GOLDBERGER, A.S. (1991), A course in econometrics, Harvard University Press,

    Cambridge, Massachusetts.

    GREENE, W. H. (2012), Econometric Analysis, Pearson, Saddle River, New Jersey

    GUJARATI, D. N. (2000), Econometria Bsica. 3ed. So Paulo: MAKRON Books,

    2000

    HECKMAN, J. J.; (1979), Sample Selection Bias as Specification Error.

    Econometrica, v. 47, n. 1

    MATOS, V.D.; FREITAS, S.H.A.(2005), Uma Estimativa Dos Fatores

    Condicionantes Do Nvel Tecnolgico Dos Apicultores De Limoeiro Do Norte: Uma

    Aplicao Do Modelo Probit In: CONGRESSO DA SOCIEDADE BRASILEIRA DE

    ECONOMIA, ADMINISTRAO E SOCIOLOGIA RURAL, XLIII, Ribeiro Preto.

    So Paulo

  • 38

    MANSKI, C. F.; WISE, D. A.;(1983). College Choice in America. Cambridge, Mass:

    Harvard University Press

    OLIVEIRA, M. de M. (2004), Modelos de Regresso com Varivel Dependente

    Truncada ou Censurada, Excertos de notas Pessoais.

    MARE, R. D.; WINSHIP, C.;(1984) The Paradox of Lessening Racial Inequality and

    Joblessness Among Black Youth: Enrollment, Enlistment, and Employment, 1964-

    1981, American Sociological Review, v. 49, pp.39-55

    MENDONA, T. G. de; LIMA, J. R.; LRIO V. S.; Determinantes da Insero de

    Mulheres Jovens no Mercado de Trabalho Nordestino, Universidade Federal de

    Viosa. Disponvel em < http://www.sober.org.br/palestra/13/656.pdf> Acesso em: 05 mar 2012

    PARK, K.H.; KERR, P.M. (1990), Determinants of Academic Performance: A

    Multinomial Logit Approach The Journal for Economic Education, v. 21, n. 2

    VELLA, F.(1996), Estimating Models with Sample Selection Bias: A Survey. The

    Journal of Human Resources, v. 33 n. 1

    PARK, KANG H.; KERR, PETER M.;(1990) Determinants of Academic Performance:

    A Multinomial Logit Approach. Journal of Economic Education, v.21 n. 2 pp.101-

    111

    RAMOS, A. C. P.; Influncia dos Fatores Socioeconmicos no Desempenho dos

    Candidatos de um Concurso Pblico: Uma Anlise Utilizando Modelos de Escolha

    Ordenada, 2007. 115fls. Dissertao (Mestrado em Economia) CAEN, Universidade Federal do Cear, Fortaleza 2007

    WINSHIP, C.; MARE, R. D.;(1992) Models for Sample Selection Bias. Annual

    Review of Sociology, v. 18, pp.327-350

    WOOLDRIDGE, J.M. (2006), Introduo Econometria: Uma Abordagem

    Moderna. So Paulo: Thomson Learning LTDA,

  • 39

    YANG, C.; RAEHSLER, R.D. (2005), An Economic Analysis On Intermediate

    Microeconomics: An Ordered Probit Model. JOURNAL FOR ECONOMIC

    EDUCATORS, v. 5, n. 3