Upload
truongkien
View
215
Download
0
Embed Size (px)
Citation preview
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -1
Capítulo 9
Amostragem
Desenvolvimento
9.1 – Introdução
9.2 – Censo versus Amostra
9.3 – Processo de planejamento de uma amostragem
9.4 – Técnicas Amostrais
9.5 – Amostragem Não-probabilística
9.6 – Amostragem Probabilística
9.7 – Determinação do Tamanho da Amostra
9.8 – Cálculo Amostral
9.9 – Notações utilizadas no cálculo do tamanho da amostra
9.1 – Introdução
Vamos iniciar nossa aula de hoje com algumas definições já conhecidas dos
senhores:
População: É a soma de todos elementos que compartilham algum conjunto
comum de característica, conforme o universo propósito do problema. Resumiríamos
assim: População é o “todo”.
Censo: Enumeração completa dos elementos de uma população.
Amostra: É um sub-conjunto da população.
È com isso que vamos tratar daqui por diante: “A Amostra”, e em conseqüência
temos que o processo de colher amostras de uma população chama-se “Amostragem”, e
podemos afirmar que todo esse capítulo nada mais é que um estudo estatístico.
Em realidade, a idéia básica da amostragem é coletar dados de uma amostra,
cientificamente calculada, e sua análise fornecer informações precisas a cerca da
população. Isto se chama “Inferência Estatística”.
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -2
Quando nos deparamos com um projeto de pesquisa, pensamos: que caminho
seguir, trabalhar com toda a população (isto se chama censo) ou trabalhar com uma
amostra (amostragem). O que é melhor Censo ou Amostra?
9.2 – Censo x Amostra
Há vantagens de se amostrar, como também há vantagens de se realizar o
censo, por exemplo: quando a população for muito pequena é mais seguro e confiável
realizar o censo. Numa sala de 40 alunos, desejo saber quem fuma e quem não fuma, é
mais fácil e seguro realizar o censo.
Por outro lado numa fábrica de fósforo obrigatoriamente temos que testar e medir
a qualidade do produto por amostragem. Chega até ser engraçado você pensar em
realizar um censo nesta mesma fábrica, pois simplesmente não sobraria nenhum fósforo
para comercializar.
Outro exemplo: quando você prepara aquela bebida tipicamente brasileira, a
caipirinha, feita em grande quantidade para servir num dia de feijoada para todos os seus
amigos e colegas, pergunto você bebe toda a caipirinha ou apenas prova. Logo você está
amostrando.
Realizamos o censo também se houver imposição legal.
A tabela abaixo resume as condições que favorecem a utilização da amostra em
relação ao censo:
Amostra ou Censo
Condições que favorecem o uso de
Amostra Censo
1. Orçamento Pequena Grande
2. Tempo disponível Curto Longo
3. Tamanho da população Grande Pequeno
4. Variância da característica Pequena Grande
5. Custo de erro de amostragem Baixo Alto
6. Custo de erros não amostrais Alto Baixo
7. Natureza da medição Destrutiva Não-destrutiva
8. Atenção a casos individuais. sim Não
Fonte: MALHOTRA, Naresh. Pesquisa de Marketing.
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -3
9.3 – Processo de Planejamento de uma Amostragem
O processo de planejamento de uma amostragem, segundo Naresh, inclui 5
estágios. Eles estão inter-relacionados, desde a problematização até a apresentação dos
resultados.
Definir a população
Determinação da estrutura Amostral
Escolha da Técnica Amostral
Determinar o tamanho da Amostra
Executar o Processo
Definir a População
Consiste em estabelecer um uma população-alvo. Este é o primeiro passo, e tem
que ser feito com precisão. A escolha errada de uma população-alvo resulta sempre em
uma pesquisa desorientadora, o que é uma catástrofe.
Determinação da estrutura Amostral
Consiste em representar os elementos que compõe a população-alvo. Um
exemplo disto é a lista telefônica.
Escolha da Técnica Amostral
O pesquisador deverá decidir qual a técnica que utilizará: amostragem
probabilística ou não-probabilística. Veremos a frente com detalhes.
Determinação do Tamanho da amostra
O pesquisador deverá calcular qual o tamanho da amostra; qual o número de
elementos retirados do público-alvo que fornecerá a fidedignidade necessária para inferir
sobre a população.
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -4
9.4 – Técnicas Amostrais
As técnicas amostrais ou técnicas de amostragem podem ser classificadas como
“Amostragem Não-probabilística e Amostragem Probabilística”. Vejamos o organograma a
seguir:
9.5 – Amostragem Não-probabilística
Esta técnica consiste em não utilizar uma seleção aleatória da população-alvo e
sim na confiança pessoal do pesquisador. Segundo Naresh, as amostras não-
probabilísticas podem oferecer boas estimativas das características da população, mas
não permitem uma avaliação objetiva da precisão dos resultados amostrais. As técnicas
Técnicas de
Amostragem
Não-probabilística Probabilística
Por
Cotas
Por Julgamento
Por Conveniência
Aleatória Simples
Sistemática Estratificada Conglomerado
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -5
de amostragem não-probabilística comumente usadas se dividem em amostragem por
julgamento, amostragem por quotas e amostragem por conveniência.
Amostragem não-probabilística por Conveniência:
Obtém-se uma amostra de elementos convenientes, ou seja, que estão a seu
dispor. Os elementos estão no lugar exato e no memento certo.
Exemplos:
Questionários aplicados (destacados) em sites da Internet
Questionários aplicados em Shopping Center
Questionários aplicados à lista de clientes de determinada loja, etc...
Amostragem não-probabilística por Julgamento:
Não deixa de ser uma variável da amostra não-probabilística por conveniência,
só que neste caso a escolha dos selecionados é feita com base no julgamento do
pesquisador.
Exemplo:
A rede Mac Donald lançará um novo tipo de Mc Lanche. Foi selecionado o
estabelecimento da Av. Bartolomeu de Gusmão, em Santos-SP, com base em critérios de
julgamento do pesquisador contratado.
Amostragem não-probabilística por Cotas:
Segundo a Professora Beatriz, o pesquisador procura uma amostra que se
identifique em alguns aspectos com o universo. Esta identificação pode estar ligada ao
sexo, idade, etc...
Exemplo:
Um determinado pesquisador fará uma pesquisa de opinião sobre o carro “Honda
Accord”, para pessoas da classe A, de faixas etárias variáveis de 35 a 60 anos.
9.6 – Amostragem Probabilística
Aquela em que cada elemento da população tem uma chance conhecida e
diferente de zero de ser selecionado para compor a amostra. As amostragens
probabilísticas geram amostras probabilísticas. Podem ser: Aleatórias Simples,
Estratificada, Sistemáticas e por Conglomerado.
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -6
Amostra Probabilística Aleatória Simples:
É feita uma escolha aleatória dos elementos que farão parte da amostra
aplicando a Tabela de Números Aleatórios. Utiliza-se comumente o sorteio aleatório
disponível em planilhas eletrônicas como o Excel. É impraticável quando a população for
muito grande, entretanto é a técnica mais indicada para se obter uma amostra
representativa da população.
Amostra Probabilística Estratificada:
Para a Professora Beatriz a amostra probabilística estratificada é aplicada
quando há a necessidade de subdividir a população em estratos homogêneos, como, por
exemplo, por classe social, idade, sexo etc. Determinados os estratos, os elementos da
amostra são selecionados pela técnica probabilística simples. Segundo o professor
Mattar, nessa categoria de amostragem ainda podemos ter uma variância de
estratificação, ou seja, torná-la proporcional ou não.
Amostra Probabilística Sistemática
Segundo Naresh Malhotra, escolhe-se uma amostra e selecionando um ponto de
partida aleatório e, em seguida, extraindo cada i-ésimo elemento sucessivamente da
minha estrutura amostral. O intervalo amostral i é determinado dividindo o tamanho N da
população pelo tamanho n da minha amostra. Por exemplo:
População : 10.000 Amostra: 1000 logo N/n = 10
Cada traço vertical abaixo representa um domicílio:
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Começa-se aleatoriamente com a terceira unidade da amostra que pode ser uma
pessoa, um domicílio etc., em seguida passa-se para a 13ª e assim sucessivamente,
somando-se o valor do intervalo calculado.
Segundo a Professora Beatriz e Professor José Carlos, esse tipo de amostra
probabilística é muito utilizado em pesquisas domiciliares, pois se acredita que os vizinhos
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -7
se influenciam e que, utilizando-se um intervalo para aplicação dos questionários,
diminuem as possíveis distorções provenientes dessa influência.
Amostra Probabilística por conglomerado:
“A técnica probabilística por conglomerado requer a utilização de mapas de
regiões, estados, municípios e cidades, pois, para a seleção da amostra, há subdivisão da
área a ser pesquisada por bairros, quarteirões e domicílios, que serão sorteados para
composição dos elementos da amostra, e a pesquisa será realizada de forma sistemática
para que não haja interferência nas informações”.(SAMARA & BARROS,2002)
Por exemplo, se desejamos fazer uma pesquisa em um bairro de sua cidade, em
primeiro lugar dividimos o bairro por quarteirões, em seguida identificamos a população
do quarteirão e então estabelecemos o intervalo por meio da fórmula da técnica
probabilística sistemática já conhecida.
9.7 – Determinação do Tamanho da Amostra
Chegamos ao passo mais importante da nossa aula: o cálculo amostral.
Logicamente vamos nos ater a apenas às fórmulas estatísticas mais usadas para o
referido cálculo amostral.
Para o cálculo do tamanho da amostra partimos do princípio que a população e a
amostra tem uma distribuição normal de freqüência (curva normal ou curva simétrica), e
ainda há a presença do desvio-padrão e das principais medidas de tendência central, que
são a média aritmética, a mediana e a moda.
Desta maneira temos que recordar 2 pontos principais: O desvio-padrão
(medidas de posição) e distribuição normal de probabilidade. Estão lembrados?
9.8 – Cálculo Amostral
Vimos e recordamos o que é um desvio-padrão, a distribuição normal de
probabilidade, e esteja certo que estão prontos para determinarmos o tamanho da
amostra.
Vejamos o que diz a Professora Beatriz Sâmara e o Professor José Carlos: “Em
pesquisa, o número de desvios utilizados representará a margem de segurança dada ao
cálculo da amostra, influindo diretamente na sua amplitude, pois, quanto maior a margem
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -8
de segurança, ou intervalo de confiança, maior será a amostra. Em pesquisa, é usual a
utilização das seguintes margens de segurança e respectivos desvios padrões:”.
68% - Z = 1
95% - Z = 1,96
95,5% - Z = 2
99,7 % - Z = 3
Vejamos o gráfico:
Também utilizamos, além dos conceitos de desvio-padrão e de normalidade, o
conceito de erro amostral, que indica uma proporção da minha amostra que estará fora
dos valores previstos. Por exemplo: Se realizarmos uma pesquisa com um erro amostral
de 3%, isto quer dizer que em nossos resultados devemos considerar que há uma
variação de ± 3%. Isto lembra eleições.
9.9 – Notações utilizadas no cálculo do tamanho das amostras
N = Universo. Todas as pessoas que detém a informação procurada
n = Amostra. Parte representativa do universo.
Z = Número do desvio padrão
68.26 %
99.73 %
µ µ +σ µ+3σµ +2σ
µ-σ µ -2σ
µ -3σ
95.46 %
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -9
p = Proporção ou porcentagem dos elementos da amostra favorável ao atributo
pesquisado.
q = Proporção ou porcentagem dos elementos da amostra desfavorável ao atributo
pesquisado.
σp = erro amostral
Onde p + q = 100%
Resta sabermos se a população é infinita ou finita. Para alguns autores uma
população infinita é acima de 100.000, já para SAMARA & BARROS, nosso livro texto,
população infinita é acima de 10.000.
Portanto vamos adotar a linha do nosso livro texto.
População FINITA
Quando o universo é igual e/ou menor que 10 mil
População INFINITA
Quando o universo é desconhecido ou maior que 10 mil
Exemplo 1:
Deseja-se fazer uma pesquisa para saber a aceitação de um novo produto no
mercado. Determine o número de pessoas que devem ser entrevistados com 5% de erro
e 94% de segurança. ?
n= ?
σpp q
nZ
� n
�=
−
−
.. .
1
σpp q
nZ=
..
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -10
N = desconhecido (infinito)
p = 50%
q = 50%
Como não sabemos quem será favorável ou desfavorável, então estimamos 50%
para os atributos.
σp = 5%
94% de segurança = consultando a tabela para uma área de 94/2 = 47% ou 0,47000 vai
encontrar um Z: 1,88
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327 1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062 1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670 2,0 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169 2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574 2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899 3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976 3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983 3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989 3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992 3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995 3,9 > etc ...
Logo, introduzindo esses dados na fórmula teremos:
8815050
5 ,××
=n
25 n = 2500 x 3,534
25 n = 8836
n = 353,44
n = 354
Exemplo 2:
Seja agora o exemplo de uma pesquisa que tenha por objetivo verificar quantos
dos 10.000 empregados de uma fábrica são sindicalizados. Presume-se que esse número
Faculdade do Guarujá__________________________________________________Estatística Prof. Joel Oliveira Gomes
C9 -11
não seja superior a 30% do total, deseja-se um nível de confiança de 95,5% e tolera-se
um erro de até 3%.
n= ?
N = 10.000 (finito)
p = 30%
q = 70%
σp = 3%
95,5% de segurança = consultando a tabela para uma área de 95,5/2 = 47,75% ou
0,47750 vai encontrar um Z: 2,00
110000
1000070303
−
−××
×=
nZ
n
98391n = 84000000
n = 854
Bibliografia:
1) SAMARA, Beatriz Santos. Pesquisa de Marketing. Editora Prentice Hall. 2003.
2) MALHOTRA, Naresh. Pesquisa de Marketing. Editora Bookman. 2001
3) MATTAR, Fauze. Pesquisa de Marketing. Editora Atlas. 1998
4) TOLEDO & OVALLE. Estatística Básica. Editora Atlas
5) OSVALDO TANAKA. Estatística Conceitos Básicos. Editora Makron Books
6) ARNOT CRESPO. Estatística Fácil. Editora Saraiva
7) ALMEIDA, Elizabeth Gomes. Estatística para Concursos. São Paulo: Pró-concurso. 2002
σpp q
nZ
� n
�=
−
−
.. .
1