Amostragem - estatistica

Preview:

Citation preview

Noções de Amostragem

Denise DuarteDepto de EstatísticaICEx- UFMG

População e Amostras

Ao conjunto de entes portadores de pelo menos uma característica comum denominamos População Estatística ou Universo Estatístico. Ou seja, não se refere apenas a uma coleção de indivíduos, mas também pode ser ao alvo sobre o qual reside nosso interesse.

Em Estatística, a palavra população tem um significado muito mais amplo do que no vocabulário comum. Exemplos: A população de interesse pode ser todas as lâmpadas produzidas por uma fábrica, todo o sangue que corre no corpo de uma pessoa ou todos os habitantes de uma cidade, estado ou país.

AMOSTRAGEM X CENSO Uma amostra envolve o estudo de uma parcela dos itens de uma população, enquanto que um censo requer o exame de todos os itens. A amostragem pode ser melhor em várias situações a) A população pode ser considerada infinita. b) Uma amostra pode estar mais atualizada que

um censo, pois é mais rápido de se obter informações.

c) Os testes podem ter caráter destrutivo, ou seja, os itens examinados são destruídos no ato do experimento.

d) O custo de um censo pode ser proibitivo, tanto em termos de recurso como de tempo.

e) A amostragem envolve menor número de coletores de dados, o que pode diminuir os erros.

Censo

No censo coletamos informação sobre todos osindivíduos da população.

Em algumas situações é mais vantajoso fazercenso:

a) A população pode ser tão pequena que ocusto, de tempo e dinheiro, sejam poucomaiores que o de uma amostra.

b) Se o tamanho da amostra é grande emrelação à população, o esforço adicionalrequerido por um censo pode ser pequeno;

c) O censo elimina a variabilidade amostral.Então, se a informação tem que ser precisa, aúnica alternativa é o censo.

Amostras Tendenciosas

1) As inferências, quando possíveis, só devem serfeitas para a população onde a amostra foirecolhida.

2) É preciso verificar se a amostra foi retirada dapopulação utilizando um processo delineadosegundo critérios estatísticos.

3) Na prática, o tamanho da amostra costuma serdeterminado por considerações de ordemprática, como o orçamento disponível.

4) Amostras pequenas podem até ser excelentesestudos de casos, mas não permitem fazerInferência Estatística.

Mas desconfie de amostras muito grandes, osdados podem ser falsos!

AMOSTRAGEM PROBABILÍSTICA

Uma amostragem será probabilística se todos os elementos da população tiverem uma probabilidade conhecida, diferente de zero, de pertencer à amostra. Desta forma, a amostragem probabilística implica um sorteio com regras bem determinadas. Como toda a Estatística Inferencial é baseada em Amostragem Probabilística, as amostras coletadas de outra forma não têm tratamento Estatístico adequado desenvolvido para elas.

AMOSTRAGEM NÃO PROBABILÍSTICA

Quando não é possível designar uma probabilidade a cada elemento, dizemos que a amostragem é não probabilística.

Este processo de amostragem é subjetivo e depende do conhecimento que o pesquisador tem a respeito da população que está estudando.

Principais tipos de Amostragem NãoProbabilísticas:

1) A Esmo ( Tenta imitar o aleatório, mas semsorteio)

2) Por cotas ( Cada coletor deve amostrar umnúmero fixo de elementos a seu critério);

Perguntas que devem ser feitas ao se ler umtrabalho envolvendo amostragem:

1) Será que o pesquisador tinha tempo e dinheiropara fazer um bom levantamento dos dados?

2) Como foi feito o questionário? As perguntaseram claras? Podem induzir o informante amentir por alguma razão?

3) Qual é a população?

4) Como a amostra foi selecionada e qual é otamanho da amostra?

Fique sempre atento para o seguinte:

A pessoa pode mentir ao responder perguntas sobre suaidade ou renda;

A pessoa pode não lembrar e dar uma resposta erradaquando perguntada sobre questões do tipo: “quantos cigarroso senhor fumou esta semana?” ou “ Quanto o senhor gastapor mês com alimentação?”;

Quando o informante não entende a pergunta pode dar umaresposta qualquer apenas para não passar por ignorante;

Perguntas mal colocadas podem induzir a resposta: Porexemplo: “ Você acha que justo pessoas de idade ficarempasseando de ônibus de graça enquanto estudantes etrabalhadores têm que pagar?”.

Fontes externas de erro Erros de anotação por parte da pessoa que coleta os dados; Erros de digitação por parte de quem digita os dados; Fraudes (a pessoa que coleta os dados preenche os formulários sozinha) Perda de informações. Todas estas fontes de erro são difíceis de detectar! O treinamento rigoroso para as pessoas que vão coletar os dados é essencial, mas encarece o processo da coleta e, por isto, às vezes é deixado de lado...

Fique de olho!!!!

Quando o tamanho da amostra aumenta, independente da distribuição da população

original, a distribuição da Média X aproxima-se cada vez mais da distribuição Normal. Este resultado é conseqüência de um dos teoremas mais importantes da teoria Estatística, chamado Teorema Central do Limite. Teorema: se ),...,,(

21 XXX n é uma amostra aleatória

simples de uma população X com média e

variância 2 e n

XXX n

...1

, então:

)1,0(~/

Nn

XZ

Tamanho da amostra

Qual o tamanho da amostra que devemos considerar se queremos estimar

A proporção de eleitores que votam em um candidato? A contaminação da água da praia de Ipanema? A taxa de açúcar no sangue de uma pessoa? A temperatura do corpo de uma pessoa? A renda média dos alunos da sua escola? (como estimar

renda?) A renda média dos brasileiros?

Valor

de z

(Distribuição

Normal)

Probabilidade

(confiança)

1,645 90%

1,960 95%

2,329 99%

No caso, por exemplo, de pesquisa de intenção de votos, temos que a média amostral é a própria proporção de votos para um determinado candidato. Assim o TCL afirma que:

Ou seja:

Com média p ( proporção verdadeira) e variância pq/n.

E um intervalo de Confiança para a proporção verdadeira “p” pode ser construído assim:

Desta forma temos que:

De tal forma que

1)])(;)((Pr[^^

n

pqkzp

n

pqkzpp

1 - é a “confiança” do intervalo

Escolhemos z(k) de modo que a probabilidade de p pertencer ao IC seja 1 -

Usamos o fato de que pq<1/4 para chegar a

IC =

Este IC é chamado conservativo, pois estamos usando a maior variância possível, o que gera um intervalo maior do que o necessário em geral.

Desta forma, se estamos interessados em determinar o tamanho da amostra necessária para estimar a proporção de eleitores que votam em um certo candidato, com nível de confiança de 95% e uma margem de erro de 2%, fazemos

240102,04

)96,1(2

2

n

Cálculo do tamanho da amostra para populações finitas

Se a população é finita, o desvio padrão não é mais

n

pq

Mas sim,

n

pq

N

nN

1

Onde n0 é dado por

Nn

nn

/)1(10

0

Desta forma, o cálculo do tamanho da amostra é dado por

2

2

0

)(

d

pqkzn

Se não conhecemos p, usamos o valor máximo aqui também:

2

2

0 4

)(

d

kzn

Exemplo: Um colégio de Ensino médio tem 240 alunos entre as 3 séries. Os alunos devem escolher entre 2 candidatos quem será o presidente do grêmio estudantil. Qual o tamanho da amostra necessária para estimar as intenções devoto, com 95% de confiança e uma margem de erro máxima de 2%?

Este é um problema proposto em um livro de segunda série do Ensino Médio. Lá, a resposta é 24. Vejam qual é a resposta correta:

24010016,0

8416,3

)02,0(4

96,12

2

0n

218240/)12401(1

2401

n

Se 1- é 95%, então z(k) é 1,96, como a margem de erro é 0,02, temos que:

Portanto, o tamanho da amostra é:

Exercício

Elabore uma atividade para trabalhar com seus alunos que envolva uma pesquisa por amostragem ou censo.

Justifique a sua escolha pela metodologia. Defina a variável de interesse e a

população alvo (é finita ou infinita?). Como calcular o tamanho da amostra?