Aula 7 Amostragem

Preview:

Citation preview

Técnicas de Amostragem

ESTATÍSTICA APLICADA CAP PM UBIRATAN

A COLETA DE DADOS

Elaboração de Instrumentos

Objetivos

Critérios

A coleta de dados

A coleta de dados é a pesquisa propriamente dita; consiste no processo de levantamento dos dados necessários à resolução do(s) problema(s) apontado(s) no “briefing” e na indicação de meios de atingir os objetivos propostos, bem como na validação das hipóteses.

Instrumentos de coleta de dadosInstrumentos de coleta de dados são as ferramentas que permitirão a coleta, o levantamento de dados, a produção de informações.

Não existe um instrumento definido como o melhor. O instrumento depende do tipo de pesquisa e de dados que se pretende.

Fatores de definição do instrumento

ClienteProblemasObjetivos (“foco”)

Público-alvoFacilidade de contatoDisponibilidade do respondente

PesquisaTempo previsto para a duração da

pesquisaRecursos disponíveis para a pesquisa

Instrumentos

Em geral, os instrumentos de coletas de dados podem ser divididos em:

Estruturados Semi-estruturados Não-estruturados

EstruturadosSão aqueles instrumentos de coleta cujas partes

estão planejadas em uma seqüência rigorosa e previamente determinada.

Semi-estruturadosSão aqueles instrumentos de coleta que

possuem algumas partes já sistematizadas previamente, mas que possuem outras “abertas”, que podem ser adaptadas/modificadas ao longo da entrevista (trabalho de campo).

Não-estruturadosSão aqueles instrumentos focados estritamente

no depoente, sem um direcionamento prévio, além da manifestação espontânea do sujeito.

Tipos de instrumentos

Em geral, os instrumentos de coleta de dados podem ser de Quatro tipos:

Questionários Entrevista (roteiro de entrevista) Observação Análise de conteúdo (documental)

I – Questionário

Elaborado pelo entrevistador para ser respondido pelo informante, o que determina a estrutura do questionário é, justamente, o perfil do público-alvo, a partir do problema, objetivos e hipóteses da pesquisa.

Partes de um questionário

Um questionário, para ser eficaz e efetivo, deve conter, minimamente:Questões de identificação do respondente,

delimitadas ao essencialmente necessário para enquadramento no perfil e plano amostral.

Questões relativas ao objeto de pesquisa.

Tipos de questões Fechadas: as que já vem com as respostas

indicadas, cabendo ao respondente optar a partir do repertório indicado.

Abertas: as que deixam espaço à livre expressão do respondente; não oferecem alternativas pré-determinadas.

Semi-abertas (mistas): São aquelas que apresentam uma estrutura a partir da qual o respondente pode desenvolver (completar, relacionar...) sua opinião.

As questões fechadas podem ser: Dicotômicas: quando o respondente

deve escolher, necessariamente, entre duas alternativas.

De múltipla escolha: quando o respondente deve escolher uma (ou mais) de entre uma lista de alternativas apresentadas. Quando deve escolher apenas UMA, é unívoca.

Escalar (Likert): quando o respondente deve enumerar as respostas pré-determinadas em ordem de preferência.

As questões abertas são aquelas onde apenas se enuncia a pergunta, sem qualquer direcionamento de resposta.

As questões semi-abertas ou mistas são aquelas que, geralmente, parte de uma questão fechada e solicitam um complemento por parte do informante.

Exemplos Questão fechada dicotômica:

Trabalha? ( ) Sim ( ) Não

Questão fechada de múltipla escolha:A renda média mensal de sua família?

( ) Até 2 salários mínimos ( ) Entre 2 e 5 salários mínimos ( ) Entre 5 e 10 salários mínimos ( ) Entre 10 e 15 salários mínimos ( ) Acima de 15 salários mínimos

Questão fechada escalarVocê considera seu ambiente de trabalho:

( ) Muito agradável ( ) Agradável ( ) Desagradável ( ) Muito desagradável

Questão abertaQual sua opinião a respeito de seu

ambiente de trabalho?

________________________________________

Questão semi-aberta ou mistaQual seu passatempo predileto, nas horas

vagas? ( ) Leitura ( ) Assistir TV ( ) Conversar com amigos ( ) Praticar esportes ( ) Outro. Qual?

____________________________

Recomendações O questionário deve ser gradativo, introduzir o

respondente no foco do problema aos poucos O questionário deve deixar as perguntas mais

pessoais para a metade ou parte final As questões não devem se reportar a fato

longínquo (no tempo), nem obrigar o respondente a fazer cálculos

A linguagem deve se adaptar ao respondente As questões não devem ser longas ou apresentar

dupla interpretação A estrutura do questionário não deve induzir a

resposta do entrevistado

II – Entrevista

Por implicar no diálogo aberto entre pesquisador e respondente, os cuidados com a entrevista devem ser redobrados.

Em geral, recorre-se a um “roteiro” onde se indicam as idéias principais que devem ser buscadas pelo entrevistador.

Planejamento da entrevista

Para o sucesso de uma entrevista, devem-se observar alguns pontos:Seleção do entrevistado:

significado/relevânciaPlano de entrevista e questões a serem feitasPré-teste

Recomendações - Atitudes Relação amistosa, sem debate de idéias Não demonstrar insegurança ou admiração

excessiva Buscar um clima natural, deixar que as

questões fluam “naturalmente” Objetividade Encorajamento do entrevistado Capacidade de síntese – anotações Pedidos de permissão (gravador, fotos...)

III – Observação

A observação consiste no posicionamento do investigador no meio a ser conhecido, evitando, o máximo possível, a influência recíproca (entrevistador X meio e/ou meio X entrevistador).

Método vantajoso para aferir condutas.

Não tem uma metodologia específica, um tipo determinado de instrumento a ser usado.

Recomendações

Conhecimento prévio do que observar Planejamento de um método de registro Atenção aos fenômenos inesperados Registro fotográfico ou vídeo (preparação) Elaboração de relatório posterior

IV – Análise de conteúdo

É a utilização de documentos ou produções bibliográficas como base de coleta de dados.

As fontes podem ser primárias ou secundárias.

Determinar:Local (is) de coletaRegistro de documentosOrganização dos dados, informações...

Critério de Classificação Socioeconômica “Brasil”

ObservaçõesAlgumas pesquisas de campo podem incluir

outras técnicas que auxiliam na coleta de dados, como a degustação (saborear) de um alimento ou bebida, a experimentação (utilização) de um objeto ou produto, a simulação de uma situação etc.

Em geral, à aplicação dessas técnicas (que são alvo de observação), segue-se a aplicação de questionários ou a entrevista.

População e Amostras

Ao conjunto de entes portadores de pelo menos uma característica comum denominamos População Estatística ou Universo Estatístico. Ou seja, não se refere apenas a uma coleção de indivíduos, mas também pode ser ao alvo sobre o qual reside nosso interesse.

Em Estatística, a palavra população tem um significado muito mais amplo do que no vocabulário comum. Exemplos: A população de interesse pode ser todas as lâmpadas produzidas por uma fábrica, todo o sangue que corre no corpo de uma pessoa ou todos os habitantes de uma cidade, estado ou país.

AMOSTRAGEM X CENSO Uma amostra envolve o estudo de uma parcela dos itens de uma população, enquanto que um censo requer o exame de todos os itens. A amostragem pode ser melhor em várias situações a) A população pode ser considerada infinita. b) Uma amostra pode estar mais atualizada que

um censo, pois é mais rápido de se obter informações.

c) Os testes podem ter caráter destrutivo, ou seja, os itens examinados são destruídos no ato do experimento.

d) O custo de um censo pode ser proibitivo, tanto em termos de recurso como de tempo.

e) A amostragem envolve menor número de coletores de dados, o que pode diminuir os erros.

Censo

No censo coletamos informação sobre todos osindivíduos da população.

Em algumas situações é mais vantajoso fazercenso:

a) A população pode ser tão pequena que ocusto, de tempo e dinheiro, sejam poucomaiores que o de uma amostra.

b) Se o tamanho da amostra é grande emrelação à população, o esforço adicionalrequerido por um censo pode ser pequeno;

c) O censo elimina a variabilidade amostral.Então, se a informação tem que ser precisa, aúnica alternativa é o censo.

Amostras Tendenciosas

1) As inferências, quando possíveis, só devem serfeitas para a população onde a amostra foirecolhida.

2) É preciso verificar se a amostra foi retirada dapopulação utilizando um processo delineadosegundo critérios estatísticos.

3) Na prática, o tamanho da amostra costuma serdeterminado por considerações de ordemprática, como o orçamento disponível.

4) Amostras pequenas podem até ser excelentesestudos de casos, mas não permitem fazerInferência Estatística.

Mas desconfie de amostras muito grandes, osdados podem ser falsos!

AMOSTRAGEM PROBABILÍSTICA

Uma amostragem será probabilística se todos os elementos da população tiverem uma probabilidade conhecida, diferente de zero, de pertencer à amostra. Desta forma, a amostragem probabilística implica um sorteio com regras bem determinadas. Como toda a Estatística Inferencial é baseada em Amostragem Probabilística, as amostras coletadas de outra forma não têm tratamento Estatístico adequado desenvolvido para elas.

AMOSTRAGEM NÃO PROBABILÍSTICA

Quando não é possível designar uma probabilidade a cada elemento, dizemos que a amostragem é não probabilística.

Este processo de amostragem é subjetivo e depende do conhecimento que o pesquisador tem a respeito da população que está estudando.

Principais tipos de Amostragem NãoProbabilísticas:

1) A Esmo ( Tenta imitar o aleatório, mas semsorteio)

2) Por cotas ( Cada coletor deve amostrar umnúmero fixo de elementos a seu critério);

Perguntas que devem ser feitas ao se ler umtrabalho envolvendo amostragem:

1) Será que o pesquisador tinha tempo e dinheiropara fazer um bom levantamento dos dados?

2) Como foi feito o questionário? As perguntaseram claras? Podem induzir o informante amentir por alguma razão?

3) Qual é a população?

4) Como a amostra foi selecionada e qual é otamanho da amostra?

Fique sempre atento para o seguinte:

A pessoa pode mentir ao responder perguntas sobre suaidade ou renda;

A pessoa pode não lembrar e dar uma resposta erradaquando perguntada sobre questões do tipo: “quantos cigarroso senhor fumou esta semana?” ou “ Quanto o senhor gastapor mês com alimentação?”;

Quando o informante não entende a pergunta pode dar umaresposta qualquer apenas para não passar por ignorante;

Perguntas mal colocadas podem induzir a resposta: Porexemplo: “ Você acha que justo pessoas de idade ficarempasseando de ônibus de graça enquanto estudantes etrabalhadores têm que pagar?”.

Fontes externas de erro Erros de anotação por parte da pessoa que coleta os dados; Erros de digitação por parte de quem digita os dados; Fraudes (a pessoa que coleta os dados preenche os formulários sozinha) Perda de informações. Todas estas fontes de erro são difíceis de detectar! O treinamento rigoroso para as pessoas que vão coletar os dados é essencial, mas encarece o processo da coleta e, por isto, às vezes é deixado de lado...

Fique de olho!!!!

Quando o tamanho da amostra aumenta, independente da distribuição da população

original, a distribuição da Média X aproxima-se cada vez mais da distribuição Normal. Este resultado é conseqüência de um dos teoremas mais importantes da teoria Estatística, chamado Teorema Central do Limite. Teorema: se ),...,,(

21 XXX n é uma amostra aleatória

simples de uma população X com média e

variância 2 e n

XXX n

...1

, então:

)1,0(~/

Nn

XZ

Tamanho da amostra

Qual o tamanho da amostra que devemos considerar se queremos estimar

A proporção de eleitores que votam em um candidato? A contaminação da água da praia de Ipanema? A taxa de açúcar no sangue de uma pessoa? A temperatura do corpo de uma pessoa? A renda média dos alunos da sua escola? (como estimar

renda?) A renda média dos brasileiros?

Tamanho de Amostra

• Parâmetro: característica da população.• Estatística: característica descritiva de elementos de uma

amostra.

• Estimativa: valor acusado por uma estatística que estima ovalor de um parâmetro populacional.

• ERRO AMOSTRAL: diferença entre o valor que aestatística pode acusar e o verdadeiro valor do parâmetroque se deseja estimar.

• ERRO AMOSTRAL TOLERÁVEL: quanto um pesquisadoradmite errar na avaliação dos parâmetros de interessenuma população.

- Exemplo, o resultado de uma pesquisa eleitoral:Candidato A = 20%, com 2% de erro amostral (18% - 22%)

Fórmula para cálculo do tamanho daamostra

• N = Tamanho da população

• E0 = erro amostral tolerável

• n0 = primeira aproximação do1

n =0 2Etamanho da amostra

N• n = tamanho da amostra n=

0

n0

N+n 0

Exemplo cálculo do tamanho da amostra

N = 200 famílias

E0 = erro amostral tolerável = 4% (E0 = 0,04)

n0 = 1/(0,04)2 = 625 famílias

n (tamanho da amostra corrigido) =

n = 200x625/200+625 = 125000/825 = 152 famílias

E se a população fosse de 200.000 famílias?

n = (200.000)x625/(200.000 +625) = 623 famílias

Observe=se que se N é muitogrande, não é necessárioconsiderar o tamanho exato N da 1

n=n =população. Nesse caso, o cálculo 0

da primeira aproximação já ésuficiente para o cálculo.

E20

Tamanho da amostra ...Observe que: N = 200 famílias, E0 = 4%

n = 152 famílias Î 76% da população

Observe que: N = 200.000 famílias, E0 = 4%

n = 623 famílias Î 0,3% da população

Logo, é errôneo pensarque o tamanho daamostra deve sertomado como umpercentual do tamanhoda população para serrepresentativa

n

N

Exercício Tamanho da amostra ...4. Numa pesquisa para uma eleição presidencial, qual deve ser o

tamanho de uma amostra aleatória simples, se se deseja garantirum erro amostral não superior a 2% ?

5. Numa empresa com 1000 funcionários, deseja-se estimar apercentagem dos favoráveis a certo treinamento. Qual deve ser otamanho da amostra aleatória simples que garanta um erroamostral não superior a 5%?

Exercício Tamanho da amostra ...4. Numa pesquisa para uma eleição presidencial, qual deve ser o

tamanho de uma amostra aleatória simples, se se deseja garantirum erro amostral não superior a 2% ?

n = n0 = 1/(0,02)2 = 1/0,0004 = 2500 eleitores

5. Numa empresa com 1000 funcionários, deseja-se estimar apercentagem dos favoráveis a certo treinamento. Qual deve ser otamanho da amostra aleatória simples que garanta um erroamostral não superior a 5%?

N = 1000 empregados

E0 = erro amostral tolerável = 5% (E0 = 0,05)

n0 = 1/(0,05)2 = 400 empregados

n = 1000x400/(1000+400) = 286 empregados

Valor de z

(Distribuição Normal)

Probabilidade

(confiança)

1,645 90%

1,960 95%

2,329 99%

No caso, por exemplo, de pesquisa de intenção de votos, temos que a média amostral é a própria proporção de votos para um determinado candidato. Assim o TCL afirma que:

Ou seja:

Com média p ( proporção verdadeira) e variância pq/n.

E um intervalo de Confiança para a proporção verdadeira “p” pode ser construído assim:

Desta forma temos que:

De tal forma que

1)])(;)((Pr[^^

n

pqkzp

n

pqkzpp

1 - é a “confiança” do intervalo

Escolhemos z(k) de modo que a probabilidade de p pertencer ao IC seja 1 -

Usamos o fato de que pq<1/4 para chegar a

IC =

Este IC é chamado conservativo, pois estamos usando a maior variância possível, o que gera um intervalo maior do que o necessário em geral.

Valor de z

(Distribuição Normal)

Probabilidade

(confiança)

1,645 90%

1,960 95%

2,329 99%

Desta forma, se estamos interessados em determinar o tamanho da amostra necessária para estimar a proporção de eleitores que votam em um certo candidato, com nível de confiança de 95% e uma margem de erro de 2%, fazemos

240102,04

)96,1(2

2

n

Cálculo do tamanho da amostra para

populações finitasSe a população é finita, o desvio padrão não é mais

n

pq

Mas sim,

n

pq

N

nN

1

Onde n0 é dado por

Nn

nn

/)1(10

0

Desta forma, o cálculo do tamanho da amostra é dado por

2

2

0

)(

d

pqkzn

Se não conhecemos p, usamos o valor máximo aqui também:

2

2

0 4

)(

d

kzn

Exemplo: Um colégio de Ensino médio tem 240 alunos entre as 3 séries. Os alunos devem escolher entre 2 candidatos quem será o presidente do grêmio estudantil. Qual o tamanho da amostra necessária para estimar as intenções devoto, com 95% de confiança e uma margem de erro máxima de 2%?

Este é um problema proposto em um livro de segunda série do Ensino Médio. Lá, a resposta é 24. Vejam qual é a resposta correta:

24010016,0

8416,3

)02,0(4

96,12

2

0n

218240/)12401(1

2401

n

Se 1- é 95%, então z(k) é 1,96, como a margem de erro é 0,02, temos que:

Portanto, o tamanho da amostra é:

Recommended