Upload
jeancassio
View
214
Download
0
Embed Size (px)
DESCRIPTION
ciência dos materiais
Citation preview
1AULAS 22, 23 E 24
A lgica da amostragem
do survey
Ernesto F. L. Amaral
03, 09 e 10 de junho de 2011
Metodologia (DCP 033)
Fonte:
Babbie, Earl. 1999. Mtodos de Pesquisas de Survey. Belo Horizonte: Editora UFMG. pp.113-158.
Triola, Mario F. 2008. Introduo estatstica. 10 ed. Rio de Janeiro: LTC. pp.2-31.
2CONCEITOS BSICOS
Estatstica (como cincia) um conjunto de mtodos para:
Planejamento de estudos e experimentos.
Obteno de dados.
Organizao, resumo, apresentao, anlise, interpretao e elaborao de concluses baseadas nos
dados.
Censo um conjunto de dados obtidos de todos os membros da populao.
Amostra um subconjunto de membros selecionados de uma populao.
3POR QUE FAZER AMOSTRAGEM?
H duas razes para selecionar uma parcela (amostra) da
populao e fazer estimativas sobre toda a populao:
tempo e custo.
Muitas vezes surveys por amostragem so mais precisos do
que entrevistar todos componentes da populao, devido
logstica do survey.
Um grande nmero de entrevistas requer muitos
pesquisadores, os quais podem no ter boa qualidade.
A qualidade dos dados coletados se reduz com a menor
qualidade dos entrevistadores.
Uma pesquisa em menor escala permite procedimentos de
acompanhamento mais severos.
4POR QUE FAZER AMOSTRAGEM? (cont.)
Se forem realizadas vrias entrevistas, o tempo aumenta,
dificultando especificar a data de referncia.
O ponto mdio da entrevista pode ser utilizado como data de
referncia.
Tambm possvel pedir aos entrevistados para responder
sobre uma data especfica no passado, mas isso introduz
problema de recordao imprecisa.
Geralmente recomendado que pesquisas de survey
tenham perodo de coleta de dados de no mximo 3 meses.
A superviso, relatrios e treinamento so muito mais
difceis em um grande survey, e a qualidade dos dados pode
ser menor do que aquela obtida com menos entrevistas.
5DADOS POR AMOSTRAGEM SO REALMENTE EXATOS?
Se forem tomados procedimentos de amostragem bem
estabelecidos, surveys por amostragem podem permitir
estimativas muito precisas sobre as populaes.
Raramente possvel determinar com exatido o grau de
preciso dos achados de uma amostra.
Pesquisadores de opinio poltica e eleitoral representam
um grupo de analistas a quem dada a oportunidade de
verificar a preciso de seus dados (resultados reais da
eleio).
6PROBLEMAS EM AMOSTRAGEM
Em grande parte, o objeto da estatstica o uso de dados amostrais para se fazer generalizaes sobre uma
populao.
Os dados amostrais devem ser coletados de modo apropriado, seno a amostra no ser representativa para a
populao da qual foi obtida.
Amostra de resposta voluntria (ou amostra auto-selecionada) aquela em que os respondentes decidem,
eles mesmos, se sero ou no includos.
uma amostra tendenciosa e no deve ser usada para fazer afirmaes de uma populao maior.
Censo americano tenta corrigir esse problema com visita de recenseadores aps envio dos questionrios.
Pequenas amostras podem gerar resultados no confiveis.
7HOMOGENEIDADE E HETEROGENEIDADE
Homogeneidade: se todos os membros de uma populao fossem idnticos uns aos outros em todos os sentidos,
qualquer tamanho de amostra seria suficiente. Na realidade,
bastaria um caso para estudar as caractersticas de toda
populao.
Heterogeneidade: se h variao na populao estudada, o pesquisador deve usar procedimentos de amostragem mais
controlados.
Uma amostra de indivduos de uma populao deve conter a mesma variao existente na populao, para
permitir descries teis dela.
A amostragem probabilstica um mtodo eficiente para extrair uma amostra que reflita corretamente a
variao existente na populao como um todo.
8VIS CONSCIENTE E INCONSCIENTE NA AMOSTRAGEM
preciso entrevistar pessoas com perfis diferenciados para representarem a populao total.
Porm, sem mtodo de amostragem robusto, no saberemos as propores adequadas dos tipos diversos de
indivduos que devem ser entrevistados.
H ento o perigo dos vieses pessoais do pesquisador afetarem a amostra selecionada.
Esse vis pode acontecer de maneira consciente ou inconsciente na coleta de dados.
9REPRESENTATIVIDADE E PROBABILIDADE DE SELEO
Como vimos, as amostras de surveys devem representar as populaes das quais so retiradas.
Alm disso, amostras necessitam ser representativas para os interesses substantivos da pesquisa.
A representatividade vai depender se queremos fazer anlises especficas por:
reas geogrficas.
Nvel de escolaridade.
Nvel scio-econmico.
Faixa etria.
Sexo...
10
CONCEITOS E TERMINOLOGIA DE AMOSTRAGEM
Elemento (unidade de anlise) a unidade sobre a qual a informao coletada e que serve de base para a anlise
(pessoas, famlias, corporaes, pases...).
Universo a agregao terica e hipottica de todos elementos definidos num survey. O universo no
especificado quanto a tempo e lugar.
Populao a agregao teoricamente especificada de elementos do survey. a coleo completa de todos os
elementos a serem estudados. preciso definir o elemento e
o referencial de tempo da pesquisa. a especificao terica
do universo.
Populao do survey a agregao de elementos da qual a amostra do survey de fato selecionada. Nem todos
elementos da populao tero chance de ser selecionados
para a amostra.
11
CONCEITOS E TERMINOLOGIA DE AMOSTRAGEM (cont.)
Unidade de amostra o elemento ou conjunto de elementos considerados para seleo em alguma etapa da
amostragem.
Numa amostra simples, as unidades de amostra so o mesmo que os elementos.
Em outros casos, uma amostra pode ter diferentes unidades de amostra (setores censitrios, domiclios,
pessoas), mas s as pessoas so elementos.
Moldura de amostragem a lista de unidades de amostra da qual a amostra selecionada.
Na amostra de etapa nica, a moldura de amostragem a lista dos elementos compondo a populao de survey.
Muitas vezes, so as molduras que definem as populaes de survey, e no o contrrio.
12
CONCEITOS E TERMINOLOGIA DE AMOSTRAGEM (cont.)
Unidade de observao (unidade de coleta de dados) um elemento (ou agregao de elementos) do qual se coleta
dados.
Unidade de anlise (elemento) e unidade de observao podem ser a mesma coisa (indivduo, por exemplo).
Mas em uma pesquisa podemos entrevistar chefes de domiclio (unidades de observao) para coletar
informao sobre todos membros (unidades de anlise).
Varivel um conjunto de caractersticas mutuamente excludentes, como sexo, idade, emprego...
Podemos descrever os elementos de uma populao com base nas caractersticas individuais das variveis.
13
CONCEITOS E TERMINOLOGIA DE AMOSTRAGEM (cont.)
Parmetro uma medida numrica que descreve alguma caracterstica de uma populao.
Estatstica uma medida numrica que descreve alguma caracterstica de uma amostra.
Erro amostral: pesquisa de survey busca estimar parmetros com base em amostras, o que gera erros.
Teoria da probabilidade permite estimar o grau de erro.
Nveis de confiana indicam o percentual de confiana de que sua estatstica (amostral) est dentro de um intervalo
de confiana do parmetro (populacional).
Nvel e intervalo so estimados usando o erro amostral.
14
TIPOS DE DADOS
Dados so observaes coletadas de um determinado grupo de interesse.
Dados quantitativos so nmeros que representam contagens ou medidas (renda, anos de escolaridade...).
Dados discretos so aqueles em que o nmero de valores possveis so finitos ou enumerveis (nmero de cmodos em um domiclio...).
Dados contnuos resultam de infinitos valores possveis em uma escala contnua (renda per capita...).
Dados qualitativos (ou categricos ou de atributos) podem ser separados em diferentes categorias que se distinguem
por alguma caracterstica no-numrica (sexo, ideologia
poltica).
15
NVEIS DE MENSURAO DE DADOS
Nvel nominal de mensurao possui dados que informam nomes, rtulos ou categorias:
Os dados no so ordenados e no devem ser usados para clculos de mdias.
Raa e cdigo postal, por exemplo.
Nvel ordinal de mensurao engloba dados que podem ser organizados em alguma ordem:
Sabemos que h diferenas relativas entre os valores dos dados, mas no sabemos as magnitudes das diferenas.
Na escala de frequncia (pouco/mdio/muito), possvel ordenar os dados, mas no sabemos se a diferena entre
pouco e mdio o mesmo que mdio e muito.
16
NVEIS DE MENSURAO DE DADOS (cont.)
Nvel intervalar de mensurao similar ao ordinal, mas sabemos as magnitudes das diferenas entre dois valores:
Os dados no possuem um ponto inicial zero natural.
Sabemos as magnitudes das diferenas entre os anos censitrios (1970, 1980, 1991 e 2000), mas o tempo no
comeou em zero.
Nvel de mensurao de razo similar ao intervalar, mas h um ponto inicial zero natural:
Como h um zero que indica nenhuma quantidade, possvel dizer que uma quantidade maior que outra em
X vezes (razes significativas).
30 anos de idade 6 vezes maior do que 5 anos de idade, por exemplo.
17
RESUMO DOS NVEIS DE MENSURAO DE DADOS
Nvel Resumo Exemplo
Nominal Apenas categorias. Os dados no
podem ser arranjados em um
esquema de ordem. H categorias ou
nomes apenas.
Municpio de
residncia.
Ordinal As categorias so ordenadas, mas as
diferenas no podem ser encontradas
ou no tm significado.
Frequncia
igreja: pouco,
mdio, muito.
Intervalar As diferenas so significativas, mas
no existe ponto inicial zero natural e
as razes no tm sentido.
Ano
censitrio
(no h
tempo zero).
Razo H um ponto inicial zero natural e as
razes so significativas.
Taxa de
desemprego.
18
TEORIA DA AMOSTRAGEM PROBABILSTICA
A finalidade do survey selecionar um conjunto de elementos de uma populao de modo que as estatsticas
descrevam com preciso os parmetros populacionais.
A amostragem probabilstica fornece mtodos para ampliar a possibilidade de alcanar esta meta, bem como
mtodos para estimar o grau de sucesso provvel.
Em uma amostra com seleo aleatria, todos membros da populao tm oportunidade igual de serem selecionados
para a amostra.
Os mtodos de seleo aleatria:
Diminuem os vieses conscientes ou inconscientes do pesquisador.
Permitem utilizar a teoria da probabilidade para estimar parmetros populacionais e erros amostrais.
19
DISTRIBUIO BINOMIAL DA AMOSTRAGEM
Queremos avaliar uma varivel binomial em nossa populao, em que os valores possveis so zero e um.
A distribuio amostral a distribuio das estatsticas das diferentes amostras selecionadas.
Se muitas amostras aleatrias independentes so extradas de uma populao, as estatsticas amostrais
fornecidas por estas amostras estaro distribudas em torno
do parmetro populacional.
A teoria da probabilidade possui uma frmula para estimar o quo prximo as estatsticas da amostragem esto
aglomeradas em torno do valor real.
O erro da amostragem ou erro padro (S) medido com base nos parmetros (P, Q) e tamanho da amostra (n):
20
ERRO DA AMOSTRAGEM (ERRO PADRO)
O erro padro (S) indica em que medida as estimativas amostrais esto distribudas em torno do parmetro
populacional.
Aproximadamente 34% das estimativas amostrais esto at um erro padro (desvio padro) acima do parmetro da
populao, e outros 34% at um desvio padro abaixo do
parmetro.
Ou seja, 68% das amostras resultaro em estimativas dentro de (mais ou menos) um erro padro.
Cerca de 95% das amostras estaro dentro de (mais ou menos) dois erros padro do valor verdadeiro.
99,9% das amostras estaro dentro de (mais ou menos) trs desvios padro.
A proporo de amostras dentro de 1, 2 ou 3 erros padro do parmetro constante em amostragens aleatrias.
21
TEORIA DA PROBABILIDADE NA PRTICA
A teoria da probabilidade depende que se selecione grandes nmeros de amostras aleatrias.
Se parmetro for conhecido e muitas amostras aleatrias forem selecionadas, podemos predizer quantas amostras
cairo dentro de intervalos especficos a partir do parmetro.
No entanto, geralmente desconhecemos o parmetro e selecionamos somente uma amostra.
Sabemos que uma amostra aleatria tem probabilidade de 68% de estar dentro da faixa de um erro padro.
Ou seja, temos 68% de confiana que a estimativa da amostra est dentro de um erro padro do parmetro.
Como no temos parmetro, usamos a estimativa da amostragem na frmula do erro padro.
Estamos x% confiante (nvel de confiana) de que o parmetro est entre dois valores (intervalo de confiana).
22
POPULAES E MOLDURAS DE AMOSTRAGEM
preciso discutir as relaes entre as condies de campo e os pressupostos tericos.
A moldura de amostragem a lista de elementos dos quais selecionada uma amostra probabilstica.
O survey amostral representativo dos membros desta lista.
importante saber at que ponto h semelhana ou diferena entre populaes e molduras de amostragem.
Se as molduras de amostragem so realmente representativas da populao estudada, amostras
corretamente selecionadas fornecem informaes
apropriadas para descrever a populao.
23
SOBRE QUAL POPULAO ESTAMOS FALANDO?
Os resultados dos surveys por amostragem s podem ser considerados representativos do conjunto de elementos que
compem a moldura de amostragem.
As listagens no incluem de fato todos os elementos da populao, por isso preciso avaliar a extenso destas
omisses e corrigi-las, se possvel.
No caso de existir omisses, necessrio informar nos relatrios de pesquisa, com o objetivo de expor corretamente
qual populao est sendo estudada.
Para poder generalizar a populao que compe a moldura de amostragem, necessrio que todos elementos tenham
representao igual (apaream s uma vez).
24
MTODOS DE AMOSTRAGEM
Amostragem probabilstica: indivduos do universo tm probabilidade conhecida e diferente de zero de serem
selecionados para amostra (mas no necessariamente a
mesma probabilidade).
Amostras probabilsticas so mais representativas do que outros tipos, porque so evitados os vieses de seleo.
Alm disso, a teoria da probabilidade permite estimar a preciso ou representatividade da amostra.
Amostragem no-probabilstica: no so estimadas as probabilidades de seleo dos elementos da amostra.
25
AMOSTRAGEM ALEATRIA SIMPLES (AAS)
O desenho da pesquisa realizado com AAS quando toda amostra possvel de ser obtida de tamanho n tem a mesma
chance de ser escolhida.
De posse da moldura de amostragem, voc enumera cada elemento da lista, atribuindo s um nmero a cada um, sem
saltos.
Em seguida, usada uma tabela de nmeros aleatrios ou um programa computacional para selecionar os elementos
da amostra.
AAS raramente realizada na prtica, pois necessrio dispor de uma lista de elementos (moldura de amostragem)
bem definida a priori.
Mesmo de posse desta lista, geralmente os pesquisadores usam o mtodo de amostragem sistemtica.
26
AMOSTRAGEM SISTEMTICA
Na amostragem sistemtica, h a escolha de algum ponto inicial e a seguir selecionado cada k-simo elemento da
populao.
Por exemplo, se a lista tem 10.000 elementos e se deseja uma amostra de 1.000, selecionado cada 10 elemento.
Amostra sistemtica de incio aleatrio: primeiro elemento selecionado aleatoriamente.
Intervalo de amostragem a distncia padro entre os elementos selecionados na amostra (10 no exemplo acima).
Razo amostral a proporo de elementos selecionados da populao: diviso de 1 pelo intervalo de amostragem.
H perigo da periodicidade, se lista de elementos estiver organizada com base em alguma informao da populao.
Resultados da AAS e da AS so idnticos, mas a AS mais fcil e conveniente de ser realizada na prtica.
27AMOSTRAGEM ESTRATIFICADA
AAS e AS so importantes para garantir grau de representatividade e permitir estimativa de erro.
Na amostragem estratificada, intuito de garantir representao das variveis de estratificao para aumentar
representao de outras variveis.
AE tem possibilidade de ser mais representativa em certas variveis do que AAS, reduzindo erro amostral.
Como erro menor com populao homognea, idia de selecionar amostra dentro de subconjuntos homogneos
(com heterogeneidade entre subconjuntos).
Populao dividida em subgrupos (estratos) diferentes entre si. Sujeitos de um subgrupo possuem mesmas
caractersticas. Variveis de estratificao dependem do
interesse de estudo e disponibilidade de informao.
Com base na proporo relativa de cada subgrupo na populao, elementos dos subgrupos so selecionados
na mesma proporo do tamanho da amostra.
28
ESTRATIFICAO NA AMOSTRAGEM SISTEMTICA
Se uma lista de elementos estiver agrupada por caractersticas da populao, a amostragem sistemtica
realizar uma estratificao implcita.
Por exemplo, se alunos so organizados por turma, sexo e notas em uma lista, uma amostra sistemtica selecionaria
nmeros adequados de cada subgrupo.
Uma lista ordenada de elementos pode ser mais til do que uma lista no ordenada (aleatria).
Nestas condies, a amostragem sistemtica mais precisa na representatividade dos subgrupos do que a amostragem
aleatria simples.
A lista s deve ser reordenada se o arranjo apresenta algum problema de periodicidade.
29
AMOSTRAGEM POR CONGLOMERADOS
Muitas pesquisas no possuem listagens para fins de amostragem, tais como populao de um municpio.
possvel realizar uma amostragem inicial de grupos de elementos (conglomerados) e em seguida selecionar os
elementos de cada conglomerado.
Passos: (1) populao dividida em conglomerados (sees); (2) so selecionados alguns dos conglomerados; e
(3) seus membros so listados e amostrados.
Um exemplo de amostragem por conglomerados em mltiplas etapas :
Ao pesquisar um municpio, pode ser feita lista de bairros (conglomerados) para amostragem AAS ou AS.
Aps selecionar bairros, pode ser feita lista de quarteires (conglomerados) para amostragem AAS ou AS.
Aps selecionar quarteires, realizada listagem de domiclios para nova amostragem AAS ou AS.
30
PRECISO NA AMOSTRAGEM POR CONGLOMERADOS
A amostragem por conglomerados recomendada pela eficincia, embora no tenha muita preciso.
Como a amostragem por conglomerados geralmente realizada em mltiplas etapas, ela ter um erro amostral
para cada etapa.
A amostra inicial dos conglomerados representa a populao de conglomerados em uma faixa de erro amostral.
A amostra de elementos extrada de um conglomerado representa todos elementos, com um erro amostral.
H o risco de selecionar uma amostra de quarteires desproporcionalmente ricos, assim como amostra de
residncias ricas dentro dos quarteires.
Soluo pensar: (1) na quantidade de conglomerados selecionados no incio; e (2) no nmero de elementos
selecionados em cada conglomerado.
31
AMOSTRA E HOMOGENEIDADE NOS CONGLOMERADOS
Sabemos que erro amostral menor com o aumento do tamanho da amostra e com maior homogeneidade dos
elementos a serem amostrados.
Uma amostra por conglomerados representar melhor todos conglomerados se um grande nmero for selecionado
e se todos eles forem bastante semelhantes entre si.
Uma amostra de elementos representar melhor todos elementos de um conglomerado se um grande nmero de
elementos for selecionado do conglomerado, e se todos os
elementos forem bastante semelhantes entre si.
Dado um tamanho mximo de amostra, se o nmero de conglomerados aumentar, o nmero de elementos num
conglomerado deve diminuir.
Ou seja, a representatividade dos conglomerados aumenta custa da menor representao dos elementos de cada um,
e vice-versa.
32
DIRETRIZ GERAL DE AMOSTRA DE CONGLOMERADOS
Os elementos de um conglomerado natural dentro de uma populao so tipicamente mais homogneos do que todos
os elementos da populao total.
Por exemplo, os moradores de um bairro so mais semelhantes entre si do que todos os moradores do
municpio.
Podem ser necessrios poucos elementos para representar adequadamente um conglomerado natural,
enquanto um nmero maior de conglomerados pode ser
necessrio para representar adequadamente a diversidade
dos conglomerados.
A diretriz geral (cientfica) no desenho de conglomerados maximizar o nmero de conglomerados selecionados,
diminuindo o nmero de elementos de cada um.
Porm, um nmero menor de conglomerados pode ser listado com mais agilidade e economia.
33
REGRA SIMPLES DE AMOSTRA DE CONGLOMERADOS
Pesquisadores populacionais convencionalmenteselecionam cinco residncias por zona ou quarteiro de
recenseamento.
Por exemplo, querendo entrevistar um total de 2.000 residncias, selecionamos 400 quarteires com cinco
entrevistas de residncias em cada um.
De todo modo, amostragem por conglomerados envolve perda de preciso.
Desenho amostral em etapas mltiplas est sujeito a erros amostrais em cada uma das etapas:
O erro amostral em cada etapa ser maior do que no caso de uma amostra aleatria em etapa nica, porque o
tamanho da amostra menor em cada etapa.
Isso est relacionado com a frmula de clculo do erro amostral:
34
AAS, AS E ESTRATIFICAO NOS CONGLOMERADOS
Discutimos a amostragem por conglomerados como se fosse selecionada uma amostra aleatria simples a cada
etapa do desenho.
Informaes podem ser usadas para estratificar os conglomerados:
Censo pode ser usado para estratificar quarteires de recenseamento em termos de composio tnica, classe
social, valores das propriedades, qualidade de estruturas,
natureza da propriedade das construes e tamanho.
Aps estratificao das unidades primrias de amostragem de acordo com as variveis disponveis, pode-se usar tanto
tcnicas de amostragem aleatria simples ou amostragem
sistemtica para extrair a amostra.
Conglomerados e estratificao: erro amostral ser mais reduzido, quanto mais os conglomerados estiverem
combinados em estratos homogneos.
35
AMOSTRAGEM SIMPLES POR CONGLOMERADO
Para garantir a seleo de uma amostra representativa de elementos, preciso dar a cada elemento da populao total
uma oportunidade igual de ser selecionada.
A forma mais simples de fazer isso numa amostra por conglomerados dar a cada um a mesma chance de
seleo e selecionar uma determinada proporo de
elementos de cada conglomerado selecionado:
Temos 100.000 elementos agrupados em 1.000 conglomerados e queremos amostra de 1.000 elementos.
Selecionamos 1/10 dos conglomerados (100) com igual probabilidade.
Depois selecionamos 1/10 dos elementos de cada conglomerado escolhido.
Ou seja, cerca de 1.000 elementos foram selecionados e tiveram a mesma probabilidade de seleo.
36
AMOSTRAGEM ANTERIOR SIMPLES E INEFICIENTE
A tcnica anterior simples, mas no a mais eficiente.
A maioria das amostragens por conglomerados envolve conglomerados de tamanhos muito diversos.
Ao selecionar conglomerados com igual probabilidade, retirando uma proporo fixa de elementos dos
conglomerados selecionados:
Seleciona-se um nmero relativamente pequeno de conglomerados grandes na primeira etapa da
amostragem.
Os elementos selecionados para representar todos os elementos dos grandes conglomerados so retirados de
poucos desses conglomerados.
No limite, toda populao da cidade residindo em dez grandes quarteires poderia ser representada pelas
pessoas vivendo em apenas um deles.
37
AMOSTRAGEM PPT
Como vimos, a amostragem por conglomerados ter maior eficincia se houver a seleo de muitos conglomerados,
com poucos elementos retirados de cada um.
Esse princpio utilizado pelo mtodo de amostragem de probabilidade proporcional ao tamanho (PPT):
H seleo de maior nmero de conglomerados.
H garantia de representao dos elementos de conglomerados grandes.
Cada elemento na populao recebe igual chance de seleo.
38
PROCEDIMENTOS DA AMOSTRAGEM PPT
Na primeira etapa, dada a cada conglomerado uma oportunidade de seleo proporcional ao seu tamanho.
Na segunda etapa, o mesmo nmero de elementos escolhido de cada conglomerado selecionado.
Esses procedimentos igualam as probabilidades ltimas de seleo de todos os elementos, j que:
Conglomerados com mais elementos tm maior probabilidade de serem selecionados.
Elementos em conglomerados maiores tm menor chance de seleo do que elementos em conglomerados
menores.
39
FRMULA E EXEMPLO DE PPT
A probabilidade de seleo de um elemento num desenho de amostragem PPT :
Se 100 conglomerados so selecionados e 10 elementos escolhidos de cada um, a partir de uma populao total de
100.000, a probabilidade geral de seleo de cada elemento
ser de 1.000/100.000 ou 1/100.
Exemplo 1: um conglomerado com 100 elementos:
Prob1 = 100 X (100/100.000) X (10/100) = 1/100
Exemplo 2: um conglomerado com 10 elementos:
Prob2 = 100 X (10/100.000) X (10/10) = 1/100
Independente do nmero de elementos num conglomerado, cada elemento tem a mesma probabilidade de seleo.
40
SIMPLIFICANDO A FRMULA DE PPT
O tamanho do conglomerado cancelado:
Isso o tamanho da amostra dividido pelo tamanho da populao:
41
MODIFICAES NO DESENHO PPT
Costuma-se fazer duas modificaes no desenho de amostra PPT.
Primeiro, podemos achar necessrio representar conglomerados muito grandes na amostra.
Selecionamos todos esses conglomerados (probabilidade igual a 1) e seus elementos com a probabilidade geral.
Segundo, se um nmero padro de elementos for selecionado de cada conglomerado escolhido,
conglomerados com menos elementos do que o nmero
padro representam um problema.
Soluo combinar pequenos conglomerados, de forma que cada combinao tenha pelo menos o nmero padro
a ser selecionado.
Amostragem por conglomerados difcil, mas adequada quando for impossvel obter uma lista de todos elementos da
populao.
42
AMOSTRAGEM PROBABILSTICA E PONDERAO
Sabemos que uma amostra probabilstica aquela em que cada elemento da populao tem uma probabilidade
diferente de zero e conhecida de seleo, mesmo que
elementos diferentes tenham probabilidades diferentes.
A amostra ser representativa da populao se cada elemento da amostra receber um peso igual ao inverso da
sua probabilidade de seleo.
No caso de todos os elementos da amostra terem a mesma chance de seleo (amostra autoponderada), cada um
recebe o mesmo peso (1).
43
AMOSTRAGEM E PONDERAO DESPROPORCIONAIS
ainda possvel fazer amostragem e ponderao desproporcionais:
Ou seja, amostramos subpopulaes desproporcionalmente para garantir nmero suficiente de
casos de cada subpopulao para anlise.
Podemos sobre-amostrar uma primeira rea para analis-la detalhadamente, ao mesmo tempo em que a segunda rea
ter uma amostra proporcionalmente menor:
Devemos analisar as duas amostras separadamente ou comparativamente.
Se quisermos combinar as duas amostras para criar um quadro composto de toda regio, devemos realizar um
procedimento de ponderao da amostra.
44
GRAUS DE PRECISO NA PONDERAO
Em um desenho complexo de amostra, podemos computar pesos para cada elemento at vrias casas decimais, ou
atribuir pesos aproximados para corrigir uma eventual
amostragem desproporcional.
A preciso que buscamos na ponderao deve ser comensurvel com a preciso que queremos nos nossos
resultados.
Se nossos objetivos de pesquisa permitem tolerar erros de alguns pontos percentuais, no nos preocuparemos com
clculo de ponderaes exatas.
O grau de preciso da ponderao ter relao direta com o grau de erro amostral e no amostral de nossa pesquisa.
No h uma frmula precisa para determinar qual a melhor ponderao.
No entanto, devemos informar nos resultados se nossa ponderao foi aproximada ou precisa.
45
MTODOS DE PONDERAO
Para a ponderao aproximada:
Primeiro criamos tabelas sem pesos de cada uma das amostras das subpopulaes.
Depois multiplicamos as clulas da subpopulao que foi subamostrada (segundo grau de subamostragem), antes
de adicion-la subpopulao que foi sobreamostrada.
Para uma ponderao mais extensa e rpida:
Dados para certos casos podem ser copiados. Inteno de aumentar nmero de casos, como se tivssemos
aplicado uma maior quantidade de questionrios.
Para ponderaes previamente calculadas:
Podemos utilizar um banco de dados que j possui os pesos de cada elemento. Neste caso, somente
informamos ao programa computacional qual varivel
contm a informao de peso.
46
PONDERAO E INFERNCIA ESTATSTICA
Os procedimentos de ponderao tm efeitos srios na maioria dos clculos de inferncia estatstica.
Se finalidade da pesquisa exige inferncias estatsticas precisas, feitas com base em dados cuidadosamente
ponderados, preciso consultar um estatstico de
amostragem antes da amostra ser desenhada.
47
PANORAMA DA AMOSTRAGEM PROBABILSTICA
O mtodo chave de amostragem usado na pesquisa de survey a amostragem probabilstica.
Os elementos so escolhidos de uma populao, com base na seleo aleatria e com probabilidades diferentes de zero
e conhecidas.
A amostragem probabilstica pode ser simples ou complexa, dependendo da situao de campo.
o mtodo mais eficiente para seleo de elementos:
Evita o vis consciente ou inconsciente na seleo de elementos por parte do pesquisador.
Utiliza mtodos controlados de seleo que permitem estimar o grau de erro esperado (erro amostral).
48
DESENHOS DE AMOSTRAGEM NO-PROBABILSTICA
Apesar dos mtodos de amostragem probabilsticos serem adequados generalizao, podemos decidir por utilizar
amostragem no-probabilstica:
Porque mais barata.
Porque talvez no seja necessrio ter representatividade exata.
H alguns mtodos de amostragem no-probabilstica:
Amostragem intencional ou por julgamento.
Amostragem por cotas.
Amostragem por confiana em sujeitos disponveis.
49
AMOSTRAGEM INTENCIONAL OU POR JULGAMENTO
Na amostragem intencional ou por julgamento, pode-se selecionar a amostra baseado no prprio conhecimento: (1)
da populao; (2) dos seus elementos; e (3) da natureza das
metas de pesquisa.
Pode-se realizar um pr-teste do questionrio com a seleo de maior variedade de entrevistados para testar a
aplicabilidade geral das perguntas.
Este um pr-teste do instrumento e no um surveypropriamente dito.
Ou seja, h a seleo de indivduos-chave importantes para os interesses da pesquisa.
50
AMOSTRAGEM POR COTAS
Na amostragem por cotas, sabemos qual a proporo da populao que possui determinadas caractersticas (sexo,
idade, raa, local de residncia, ocupao):
So colhidos dados de pessoas com todas as combinaes de caractersticas.
Todas pessoas recebem peso apropriado sua poro na populao total.
Quando todos elementos da amostra estiverem ponderados, os dados como um todo devem resultar
numa representao razovel da populao total.
H problemas na amostragem por cotas:
A moldura das cotas deve ser precisa.
Pode haver vieses na seleo de elementos com determinadas caractersticas.
51
CONFIANA EM SUJEITOS DISPONVEIS
Na amostragem por confiana em sujeitos disponveis, h a seleo de indivduos que so fceis de acessar.
Tambm chamada de amostragem de convenincia ou amostragem a esmo.
Embora sirva finalidade de pr-testar um questionrio, este mtodo de amostragem no deve ser usado para um
estudo que pretende descrever uma populao.
52
USOS NO-SURVEY DOS MTODOS DE AMOSTRAGEM
Na discusso sobre a lgica e os mtodos de amostragem, foi dada maior ateno pesquisa de survey, em que h a
seleo de elementos de uma populao para entrevista ou
questionrios auto-administrados.
Mtodos de amostragem podem ter aplicao no-survey:
Anlise de contedo: volume de documentos para analisar pode ser muito grande, o que exige uso de
tcnicas de amostragem de seleo de tais documentos.
Experimentos de laboratrios: sujeitos para experimentos so geralmente voluntrios. Pode-se usar
mtodos de estratificao para satisfazer cotas.
Observao participante: ao utilizar mtodos de amostragem de survey, um pesquisador pode obter um
conjunto mais representativo de observaes.
53
PENSAMENTO CRTICO
O sucesso em um curso introdutrio de estatstica normalmente requer mais senso comum do que habilidade
matemtica. (Triola 2008, p.9)
importante interpretar os dados e resultados com mtodos cientficos, e saber usar o senso comum.
H trs tipos de mentiras: mentiras, mentiras horrveis e estatstica. (Benjamin Disraeli)
Nmeros no mentem, mas mentirosos manipulam nmeros. (Autor desconhecido)
Algumas pessoas usam a estatstica como os bbados usam os postes - para apoio mais do que para iluminao. (Andrew Lang)
Estatstico um especialista que coleta nmeros e depois os desvirtua. (Esars Comic Dictionary)