Download pdf - Questao 2-3_controle

Transcript

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Teoria da Amostragem Contedo da unidade: principais conceitos; tipos de amostragem; determinao do erro; intervalo de confiana e; tamanho da amostra para populaes finitas e infinitas relacionado mdia e proporo. Objetivos da unidade: oferecer condies de trabalhar com amostragem para casos de mdias e propores. Esta Unidade estar dividida em duas partes, a saber: Amostragem; Estimativas.

1) AmostragemConsideraes iniciais O conhecimento de fatos que afetam a convivncia socio-econmica numa comunidade influi sempre na tomada de deciso de um indivduo em todos os aspectos de sua vida e de sua famlia. Um cidado comum, geralmente decide sobre os seus problemas dirios bem como a respeito dos rumos de seu negcio com base no bom senso e nas indicaes de sua experincia acumulada ao longo do tempo. Quando uma pessoa escolhe uma marca de carro para comprar, um mecnico para fazer reviso do seu carro, um oftalmologista para fazer uma consulta, um restaurante para jantar, alguma informao ele utiliza para nortear sua escolha. Esta informao baseada em seus conhecimentos ou nos de seus familiares ou amigos. Percebe-se que as pessoas se utilizam no dia a dia de resultados de amostragens, mesmo que imperceptivelmente. Quando a indstria e o comrcio se baseiam em levantamentos por amostragens para decidir sobre os investimentos a serem feitos, geralmente obtm sucesso. A pesquisa de mercado nesse caso fundamental para que se conhea a reao do consumidor a novos produtos e embalagens, identificando-se crticas e razes pela preferncia por um artigo. Os resultados de pesquisa so sempre utilizados pela indstria no sentido de se fabricar produtos que atendam s exigncias do mercado consumidor. Para se fazer um diagnstico sobre aspectos ligados a economia, um pesquisador utiliza sempre levantamentos por amostragem. Os dados coletados em planilhas de custo de acordo com o planejamento estabelecido, permitem o clculo do ndice de inflao e de outros ndices econmicos relevantes para a populao. Em campanhas eleitorais, as pesquisas feitas por rgos especializados, apontam para a preferncia do eleitorado a um determinado candidato, apontando o possvel vencedor no pleito. Vrios so os tipos de dados de interesse que so obtidos por amostragem. Como exemplo, podem ser citados entre outros: a) fora de trabalho, nvel de emprego e desemprego;

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

b) c) d) e) f) g) h) i)

produo agrcola e nvel de abastecimento; produo industrial; condies sanitrias da populao; inadimplncia no comrcio; nvel educacional da populao; nvel de informatizao das empresas; oramentos familiares e custo de vida; audincia de programas de rdio e emissoras de TV. Para que um levantamento por amostragem tenha sucesso, importante que se conhea profundamente a populao.

Alguns conceitos Populao: o conjunto de todos os elementos de interesse em um estudo (N). Amostra: um subconjunto da populao. Tamanho n. Parmetro: uma caracterstica numrica da populao, como uma mdia da populao, um desvio padro da populao, uma proporo da populao e assim por diante. Amostragem: estudo das relaes existentes entre a amostra e a populao de onde esta foi extrada. A amostragem usualmente realizada com o objetivo de estimar parmetros da populao, como por exemplo a mdia (), a varincia () ou a proporo (p) de uma determinada caracterstica. Estimador: funo que estima o valor de um parmetro baseandose nas observaes de uma amostra. Ele representa uma dada frmula de clculo que fornecer valores que sero diferentes, conforme a amostra selecionada. Exemplos: i) o estimador da mdia populacional ou X que uma mdia amostral. Estimativa: valor obtido pelo estimador numa amostra. Inferncia estatstica: mtodos que tornam possvel a estimativa de uma caracterstica de uma populao ou a tomada de uma deciso referente populao com base somente em resultados de amostras. Dados: se referem informao numrica necessria para nos ajudar a tomar decises mais bem fundamentadas em determinada situao. Lembramos que no passado muitas decises eram difceis de serem tomadas por existncia de poucos dados. Hoje o nmero de dados normalmente disponvel grande e se faz necessrio em alguns casos o uso de amostragem, em outros casos a minerao de dados. Fonte primria e fonte secundria, biblioteca virtual, so termos comuns a quem trabalha com dados. Quando nos referimos a fonte secundria e biblioteca virtual, estamos dizendo que algum trabalhou por ns, no sendo necessrio fazer-se uma pesquisa de campo j que os dados esto disponveis. Dados secundrios importantes so liberados por fontes do governo federal. Resumimos ento trs mtodos para se dispor de dados: 1) fonte primria; 2) fonte secundria; 3) pesquisa. Das trs formas de obteno

2

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

de dados, apenas na pesquisa aplicamos o chamado questionrio. Os dados de fonte secundria, j representados em grficos e tabelas e figuras so mais comuns que os dados primrios. Lembramos que existem essencialmente quatro motivos para se coletar dados: 1) oferecer insumos a um estudo de pesquisa; 2) medir desempenho; 3) elevar o nvel da tomada de deciso; 4) satisfazer nossa curiosidade. Para se enfatizar a importncia de se obterem dados de qualidade, pesquisadores adotaram o termo GIGO (garbage in, garbage out) que significa lixo dentro, lixo fora, em portugus podendo ser expresso por LDLF. Os dados so um produto observado das variveis aleatrias. Estas, conforme relatamos no captulo 2, so qualitativas e quantitativas (discretas e contnuas). A amostragem e o censo O censo o estudo envolvendo todos os elementos da populao. Por meio do censo se determina o valor exato de cada parmetro da populao. Exemplos disso so o censo demogrfico e o agropecurio realizados pelo governo Federal. No entanto, a realizao do censo nem sempre possvel e lana-se mo do uso de amostragens, pelas seguintes razes: a) Custo reduzido Em funo dos dados serem tomados de uma frao da populao. b) Maior rapidez Em decorrncia do menor volume de dados. c) Maior amplitude Em certas pesquisas h necessidade de utilizao de uma equipe bem treinada e equipamento bem sofisticado para obteno dos dados, o que limita a realizao do censo. Assim, dado sua flexibilidade, a amostragem pode ser utilizada em situaes onde o censo invivel. d) Maior exatido Em decorrncia da possibilidade de trabalhar com uma equipe de melhor nvel, mais bem treinada e ainda se poder acompanhar melhor a coleta e a tabulao dos dados, em virtude da reduo do volume de trabalho. e) Testes destrutivos Nesses casos, como no teste de lmpadas, no interessa testar toda populao e ter resultados sobre uma populao que no mais existir. Por outro lado, o censo deve ser realizado: - quando o tamanho da populao for bastante pequeno; - quando os requisitos do problema em estudo impem a obteno de dados especficos de cada elemento da populao; - por imposio legal; - quando j se dispe de informao completa.3

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Planejamento de um levantamento por amostragem No planejamento de qualquer levantamento, devem-se considerar os seguintes tpicos: a) Objetivos A definio das finalidades do levantamento a diretriz para a sua perfeita execuo. Baseado nos objetivos que se obtm as concluses finais do trabalho. b) Populao Em certos casos a populao bem definida, em outros casos no. Populao dos estudantes de uma universidade ou faculdade por exemplo bem definido, onde entraro os alunos de graduao, ps-graduao e os alunos especiais. No entanto, quando se fala em populao de hospedarias de uma cidade: um quarto alugado numa casa de famlia seria considerado uma hospedaria e participaria do estudo? c) Dados a serem coletados Deve-se ter o cuidado de observar se todos os dados levantados so essenciais para a pesquisa em questo. Perguntas suprfluas so dispensadas como, qual o ms do nascimento do consumidor numa pesquisa sobre consumo de macarro. Lembramos tambm que um questionrio muito extenso, prejudica a qualidade das respostas. O nmero de perguntas num questionrio nunca deve exceder a 30. d) Grau de preciso Quando se procede a um levantamento por amostragem, os resultados esto sujeitos a um certo grau de incerteza, devido ao fato de que foi considerada apenas uma parte da populao. Segundo Levine et al. (2000) existem quatro erros de pesquisa: 1) erro de cobertura o caso mais conhecido foi o erro da revista americana Literary Digest em 1936 com relao previso das eleies presidenciais nos Estados Unidos. O erro foi to gritante e a revista perdeu a credibilidade vindo falncia. A revista previu que Alf Landon (governador do Kansas) ganharia as elees para presidente com 57% dos votos. Quando a contagem dos votos terminou, Alf Landon teve apenas 38% dos votos e o ento presidente Franklin Delano Roosevelt foi reeleito. Surge a pergunta. O que houve de errado? Foi um caso de erro de cobertura. A revista entrevistou 2,4 milhes de indivduos (grande nmero), no entanto selecionando os mesmos com base em fontes como catlogo telefnico, lista de scios de clubes, assinantes de revistas e licenas de veculos. Desse modo, selecionou os ricos e excluiu da sua lista a maioria da populao votante, que ainda vivia sofrendo devido grande depresso, no possuindo recursos para4

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

manter assinatura de revistas, telefones, etc. Certamente a revista no errou a previso para a populao alvo mas errou a previso para a populao real. 2) erro por falta de resposta em pesquisas socio-econmicas normalmente indivduos de classes baixa e alta respondem com menos freqncia que os da classe mdia. Com esses deveria se insistir para que os mesmos respondam para no mascarar o verdadeiro resultado. Insistir por correio ou por telefone. 3) Erro de amostragem mesmo usando a aleatoriedade pelo uso de tabelas aleatrias, a depender de que parte da tabela eu inicio a seleo, os componentes da amostra sero diferentes do que se eu comeasse a seleo em outra parte da tabela, podendo produzir um erro de amostragem. Esse erro, particularmente, reduzido tomandose tamanhos da amostra maiores. Exemplo de situao com margem de erro: espera-se que os resultados dessa votao estejam entre 4 pontos percentuais do valor real . 4) Erro de medio ocorre devido falta de exatido das respostas registradas: por deficincia na formulao da pergunta; por um efeito causado pelo entrevistador sobre o informante; por causa do esforo realizado pelo informante. e) Mtodos de medida Antes de coletar os dados, necessrio e importante que esteja bem definida toda a metodologia de obteno dos mesmos. Essas metodologias podem ser, dentre outras: e1) declarao de entrevistas; e2) consultas de fichas; e3) por telefone; e4) por resposta a um questionrio. Caso os dados sejam coletados por mais de uma pessoa, necessrio o bom treinamento e padronizao de linguagem, a fim de existir um critrio nico de registro de dados. No caso de se trabalhar com questionrio deve-se padronizar os diferentes tipos de respostas a serem obtidas e, se possvel, codific-las para cada item respondido, a fim de evitar controvrsias na tabulao dos dados. Exemplo: Qual forma de pagamento aceita: ( ) dinheiro em moeda nacional ( ) dinheiro em moeda de outro pas ( ) cheque ( ) cheque pr-datado ( ) carto de crdito ( ) outra interessante na confeco dos questionrios, que haja algumas perguntas que sirvam para verificao da consistncia das respostas,

5

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

como por exemplo: qual a renda da famlia? E depois: quais os aparelhos eletrodomsticos que possui? f) Unidade de amostra Qual a unidade amostral? Num levantamento socio-econmico a unidade de medida a famlia com todos os residentes numa mesma casa. Caso haja sublocao, tambm estes indivduos estariam includos? necessrio que haja uma definio prvia. Aqui portanto, observamos mais uma vez que quem trabalha para fazer o levantamento deve ser conhecedor do assunto. g) Escolha do tipo de amostra De conformidade com o tipo de levantamento definido o tipo de amostra que ser adotado no estudo, de tal forma a obter o grau de preciso desejado. No se pode perder de vista o custo operacional do trabalho e sua execuo prtica. h) Pr-verificao Na prtica isso se chama de pr-amostragem. Aqui podemos detectar possveis faltas de entendimento no questionrio e corrigir eventuais falhas na estrutura adotada. i) Organizao do trabalho Deve-se traar toda a sistemtica operacional da equipe de trabalho, organizando um processo para acompanhamento dos resultados e ainda, estruturar quais as providncias tomar quando no so obtidas informaes de algum entrevistado, ou quando no encontrado o indivduo. A conduo do levantamento amostral deve ser muito bem planejada, j prevendo quaisquer imprevistos da no obteno de dados. Deve-se neste caso sortear alguns elementos reservas para eventuais substituies na amostra. j) Anlise dos dados Uma vez coletados os dados deve-se fazer a sua compilao e conferncia, a fim de corrigir eventuais falhas de registro. A seguir os dados so processados organizando-se os dados em Quadros e tabelas de onde so calculadas as estimativas desejadas. Sempre que possvel, as estimativas devem ser apresentadas, acompanhadas dos erros-padro, construindo-se intervalos de confiana, conforme o grau de preciso prestabelecido. A ilustrao dos resultados utilizando-se Grficos e Figuras sempre recomendada, pois facilita o entendimento do fenmeno estudado. k) Sugestes As informaes pr-amostrais so de grande valia na determinao do mtodo de amostragem a ser adotado. Desta forma, cada levantamento pode fornecer valiosas sugestes para outras pesquisas anlogas futuras, principalmente no que tange a falhas cometidas. A6

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

quantificao da variabilidade da populao bastante dimensionamento de novas amostras para novos estudos. Amostragem probabilstica e no probabilstica

til

no

Quando se planeja cientificamente um levantamento por amostragem, usualmente se leva em conta que todas as amostras possveis da populao tem probabilidade diferente de zero de ser selecionada. Neste caso a escolha da amostra feita por processo aleatrio, o que permite a aplicao da teoria envolvida nas distribuies probabilsticas da estatstica. H casos em que restries de ordem prtica impedem que a seleo da amostra seja totalmente aleatria e nesse caso a amostra no probabilstica. Como exemplo de amostra no probabilstica podem ser citados os seguintes casos: a) amostra de Convenincia a amostra identificada primariamente por convenincia, devido principalmente: a1) Acessibilidade A amostra atinge apenas a parte acessvel da populao. Num vago de minrio, por exemplo, a amostra pode ser feita em alguns casos apenas nos 20cm superiores, por dificuldades de se atingir todos os pontos do vago. a2) amostra tomada ao acaso A amostra constituda pelos elementos que se consegue tomar de uma populao. Num galpo de aves, por exemplo, a amostra pode ser constituda das aves que forem tomadas no instante de coleta dos dados, sem entretanto ter havido um sorteio prvio. a3) Amostra de voluntrios Casos onde o processo de obteno de dados desagradvel (amostra envolvida num estudo com doadores de sangue ou portadores de doenas fatais) ou o oramento baixo (uso de voluntrios para uma pesquisa escolar). b) Amostra de julgamento ou intencional O pesquisador escolhe a seu juzo os elementos da populao que julga representativos, para constiturem a sua amostra, mas sem fazer sorteio. perigoso pois pode ocorrer de se confundir amizade com profissionalismo, e os constituintes da amostra serem as pessoas que o entrevistador tem melhor relao, grau de parentesco, etc. Exemplo: um reprter pode amostrar dois ou trs senadores, julgando que eles reflitam a opinio geral de todos os senadores sobre determinada situao.

7

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

O questionrio e a entrevista Em algumas reas como a psicologia e a psiquiatria possvel a obteno de dados apenas com a observao das pessoas, com alta preciso. No entanto, na maioria das reas como as que se voltam para a tomada de decises administrativas e na epidemiologia, necessrio se faz levantamento de dados com o preenchimento de questionrios ou em entrevistas, satisfazendo a pesquisa do tipo Survey para coleta de dados: a) obteno de dados mediante perguntas Por meio de perguntas feitas em questionrios ou em entrevistas, permitem obter informaes de: comportamento; atitudes; motivaes; expectativas; crenas. b) Vantagens e limitaes dos questionrios e das entrevistas No questionrio, as perguntas propostas pelo pesquisador so respondidas por escrito pelo pesquisado, enquanto que na entrevista as respostas do entrevistado so anotadas pelo pesquisador. A tcnica de questionrio se desdobra em: b1) enviado pelo correio a mais barata e garante o anonimato do entrevistado, uma vez que este no precisa identificar-se. Exige que o entrevistado saiba ler e esteja disposto a responder. Dessa forma, boa parte dos questionrios enviados pelo correio no devolvida. b2) aplicado em grupo permite rapidez na aplicao, pois aps os esclarecimentos so preenchidos e recolhidos imediatamente, proporcionando maior garantia de retorno. A tcnica de entrevista se desdobra em: 1) entrevista face a face bem flexvel pois permite ajustar-se aos mais diversos tipos de problemas e de informantes. Permite obter respostas em profundidade, complexas, detalhadas, ligadas intimidade do entrevistado, desde que o pesquisador tenha habilidade e treinamentos adequados. O entrevistador deve ser omisso em relao as suas idias para no influenciar o entrevistado. 2) por telefone bastante adotada em pesquisas de opinio de mercado, sendo rpida, econmica e garantindo altas taxas de resposta. A desvantagem desta tcnica que nem sempre a amostra obtida representativa da populao, pois nem todos possuem telefone. 3) Pela internet tambm pode ser rpida a resposta, porm apresenta a limitao de nem todos terem acesso a um computador. c) Construo de questionrios O questionrio deve traduzir os objetivos da pesquisa em itens bem redigidos. Para tanto importante que os objetivos tenham sido bem definidos. As perguntas devem ter contedos adequados para obteno dos dados do entrevistado, podendo ser feitas de forma aberta ou8

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

fechada. Em estudos iniciais podem ser usadas perguntas abertas, onde o entrevistado responde com suas prprias palavras sem qualquer restrio. As perguntas fechadas so mais freqentemente usadas. Nesse tipo de pergunta, as respostas so fixadas de antemo. Exemplo 1: Qual forma de pagamento aceita: ( ) dinheiro em moeda nacional ( ) dinheiro em moeda de outro pas ( ) cheque ( ) cheque pr-datado ( ) carto de crdito ( ) outro Exemplo 2: Coloque um X na opo correspondente ao seu nvel de renda lquida: ( ) abaixo de R$ 1.000,00 ( ) de R$ 1.000,00 a R$ 1.999,00 ( ) de R$ 2.000 a R$ 2.999,00 ( ) de R$ 3.000 a R$ 3.999,00 ( ) de R$ 4.000 a R$ 4.999,00 ( ) acima de R$ 5.000,00 Nesse momento para melhor entendimento do que estamos falando, recorra unidade I (p. 15), onde na figua 6 retratamos um exemplo de formulrio que pode ser aplicado na forma de entrevista. Nesse exemplo verifica-se um questionrio contendo 10 perguntas, sendo duas abertas e oito fechadas. Lembramos que o nmero de perguntas de um questionrio no deve ultrapassar a trinta. A ordem das perguntas importante devendo-se evitar mudanas bruscas de tema sem antes oferecer as explicaes necessrias. Recomenda-se que a pergunta refira-se a uma nica idia de cada vez, possibilitando interpretao nica. De maneira nenhuma a pergunta deve sugerir a resposta. Deve-se evitar tambm que o entrevistado se sinta julgado ou exposto na pergunta. Voltamos a falar aqui sobre a necessidade de se fazer um pr-teste para evidenciar possveis falhas tais como: complexidade das perguntas, impreciso da redao, questes desnecessrias, cansao e constrangimento do entrevistado. d) conduo de entrevista O pesquisador deve ser cuidadoso e habilidoso na realizao da entrevista. Recomenda-se uma conversa inicial, de forma amistosa, sobre qualquer tema que possa interessar ao entrevistado procurando obter a sua confiana. Em seguida so feitos esclarecimentos sobre a finalidade da pesquisa. O entrevistado deve sentir-se absolutamente livre de qualquer presso ou intimidao. Ao se fazer as perguntas recomenda-se ter o cuidado de no se deixar implcito as respostas, ou seja, o entrevistado no deve ser induzido a uma resposta especfica.

9

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Terminada a entrevista, a boa educao sugere que o entrevistado seja tratado com respeito. Como existe a possibilidade de uma nova entrevista a posteriori, convm ao pesquisador conseguir que a porta fique aberta para provveis novos encontros. Tipos de amostragem Probabilstica Entre os tipos de amostragem probabilstica, os mais usados so: amostra aleatria simples; amostra aleatria sistemtica; amostra aleatria estratificada; amostra aleatria por conglomerado. Amostragem aleatria simples Est na dependncia do tipo de populao, finita ou infinita Amostra aleatria simples (populao finita) Uma amostra aleatria simples de tamanho n de uma populao finita de tamanho N uma amostra selecionada tal que cada possvel amostra de tamanho n tem a mesma probabilidade de ser selecionada. Para selecionar os elementos da amostra de populaes finitas, podemos usar de recursos como sorteios com uso de dado, papis numerados, ou mais freqentemente e corretamente as tabelas de nmeros aleatrios (vide como exemplo o Quadro 26). Os nmeros aleatrios podem ser selecionados de qualquer lugar do Quadro. importante manter uma seqncia lgica (coluna de cima para baixo, linha esquerda para a direita, etc). Existem vrias tabelas de nmeros aleatrios com seqncia de trs, quatro ou cinco nmeros. Essas tabelas tambm podem ser obtidas em programas como Excel. Para o Excel entre em inserir funo - aleatrioentre. Designe o menor e o maior nmero do intervalo e posteriormente arraste o mouse correspondente ao nmero de clulas que seja o tamanho da amostra. Exemplos: 1) A Fortune publica dados sobre vendas, lucros, lucro lquido dos acionistas, valor de mercado e ganhos por ao para as 500 maiores empresas industriais dos Estados Unidos (The Fortune 500, 1998). Suponha que voc quer selecionar uma amostra aleatria simples de 10 empresas da lista de Fortune 500. Use os ltimos 3 dgitos na coluna 9 do Quadro 26, comeando com 554. Leia a coluna de cima para baixo e identifique os nmeros das 10 empresas que seriam selecionadas. Resoluo: 459 147 385 113 340 401 215 002 033 348

10

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Tabela de Nmeros aleatrios (Anderson et al., 2002).63271 88547 55957 46276 55363 69393 13186 17726 36520 81628 84649 63291 70502 06426 20711 41990 72452 37042 53766 90585 32001 62606 10078 91561 13091 59986 09896 57243 87453 07449 92785 29431 28652 64465 36100 48968 11618 53225 24771 55609 70538 36618 40318 52875 58955 96293 64324 28073 46145 98112 71744 95436 83865 44790 34835 49902 88190 56836 05550 39254 75215 12613 03655 59935 29430 77191 76298 57099 15987 53122 37203 46354 85389 24177 53959 51102 79115 09911 67122 15290 58447 04588 78351 30157 56835 75498 75055 05915 49801 70165 25860 26678 10528 46962 16025 64516 72157 50324 15294 79607 15141 08303 19761 45573 76616 42048 38733 47327 82242 37636 49539 43915 37140 11082 45406 55204 89334 09925 67342 84299 51530 67248 14500 10061 52244 80714 01041 66535 84358 67191 30378 81290 18518 29520 02421 74240 26488 57051 66762 78484 73417 33938 89773 77592 53310 37069 20135 15562 98124 63303 58683 20030 40102 21625 12777 87618 89541 92222 69753 98063 03466 41116 48393 94477 31639 83920 95567 41335 57651 67380 40261 49804 64165 75732 10413 93108 63754 26646 16999 21861 26933 70290 55201 72602 89641 49292 64531 91322 02494 52009 69468 29380 96244 95508 84249 61374 09226 06125 00815 63839 13554 08459 60147 13385 68689 40640 40113 27340 23756 64953 36401 56827 25653 88215 18873 74972 75906 29002 80033 25348 05815 64419 71353 83452 74762 79945 28364 15702 22785 03263 16281 08243 10493 54935 99337 45525 30825 06543 27191 96927 38712 91807 46453 69828 04332 06714 29457 77669 97355 50289

2) Suponha que queremos identificar uma amostra aleatria simples de 12 mdicos de um total de 372 de uma cidade. Os nomes dos mdicos esto disponveis na organizao mdica local. Use a oitava coluna de nmeros aleatrios de cinco dgitos do Quadro 26 para identificar os 12 mdicos da amostra. Ignore os dois primeiros dgitos aleatrios em cada um dos grupos de nmeros aleatrios de cinco dgitos. Esse processo comea com o nmero aleatrio 108 e continua de cima para baixo na coluna de nmeros aleatrios. Resoluo: 108 290 201 292 322 009 244 249 226 125 147 113

11

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

3) A Airport Transport Association of America forneceu a seguinte lista das dez maiores linhas areas no mundo (The Book of Mosts, 1997): 01. Aeroflot (Rssia) 06. JAL (Japo) 02. Air France (Frana) 07. Lufthansa (Alemanha) 03. Americam Airlines (EUA) 08. Northwest Airlines (EUA) 04. British Airways (Inglaterra) 09. United Airlines (EUA) 05. Delta Airlines (EUA) 10. USAir (EUA) a) Assuma que uma amostra aleatria de cinco dessas linhas areas sero selecionadas para um estudo profundo de fatores tais como o nmero de avies em servio, o total de milhas anuais voadas pelos passageiros e assim por diante. Comeando com o primeiro dgito aleatrio do Quadro 26 e lendo a coluna para baixo, selecione as cinco linhas areas a serem usadas no estudo. Resoluo: 06 10 09 07 05, ou seja: 05. Delta Airlines (EUA) 06. JAL (Japo) 07. Lufthansa (Alemanha) 09. United Airlines (EUA) 10. USAir (EUA) b) Quantas amostras aleatrias simples diferentes de tamanho cinco podem ser selecionadas da lista de dez linhas areas? Resoluo: Trata-se de um caso de combinaes. N N! 10! = n ( N n )!n! = 5!5! = 252 amostras aleatrias simples Amostra aleatria simples (populao infinita) Na prtica, uma populao considerada infinita se ela envolve um processo contnuo que torna impossvel a contagem de cada elemento na populao. Na amostragem a partir de uma populao infinita, precisamos usar uma nova definio de amostra aleatria simples. Alm disso, como os elementos de uma populao infinita no podem ser numerados, precisamos usar um processo diferente para selecionar os elementos para a amostra. Uma amostra aleatria simples a partir de uma populao infinita uma amostra selecionada tal que as seguintes condies so satisfeitas: a) cada elemento selecionado vem da mesma populao; 2) cada elemento selecionado de forma independente. Como exemplo de como selecionar os elementos de uma amostra, consideremos: queremos estimar o tempo mdio entre fazer um pedido e receber a comida para os clientes em um restaurante fast food durante o horrio de almoo das 11h30 s 13h. Se considerarmos a populao como a visita de todos os possveis clientes, vemos que no seria vivel especificar um limite finito ao nmero de possveis visitas. De fato, se

12

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

definirmos a populao como todas as visitas de clientes que poderiam concebivelmente ocorrer durante o horrio de almoo, podemos considerar a populao como sendo infinita. Um procedimento para selecionar a amostra poderia ser: se alguns clientes possuem cupons que lhes oferece desconto, o prximo cliente servido selecionado para a amostra. Como os clientes apresentam cupons de desconto de forma aleatria e independente, a empresa est satisfeita de que o plano de amostragem cumpra as duas condies: uma amostra aleatria simples a partir de uma populao infinita. Para o caso de populaes consideradas infinitas, fica claro que a amostra aleatria simples constituda sem qualquer auxlio de tabelas de nmeros aleatrios. A Figura a seguir representa a amostra aleatria simples. Selecionamos aleatoriamente uma parte da populao com caractersticas diversas para compor a amostra. Repare que embora haja uma segmentao das caractersticas da populao, representada por desenhos variados, estes segmentos esto embaralhados dentro da populao.

Amostra

PopulaoAmostragem aleatria sistemtica uma variao da amostra aleatria simples. Sua aplicao exige que a populao esteja devidamente ordenada de tal forma que cada um dos seus elementos possa ser unicamente identificado por sua localizao. Isto ocorre, por exemplo, quando todos os elementos de uma populao esto anotados em uma listagem, quando um grupo de pessoas est colocado em uma fila ou ainda quando se considera o conjunto das fichas de inscrio referentes aos candidatos de um concurso. Para efetuar a seleo da amostra, procede-se ao sorteio de um ponto de partida entre 1 e o fator de expanso, k, definido pela razo entre o nmero de elementos da populao e o nmero de elementos da amostra, isto :

k=

N n

13

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Uma vez sorteado o primeiro elemento da amostra, os demais sero encontrados, somando-se k, 2k, 3k, ... at completar a amostra. Portanto se a populao tem N = kn elementos, existem k possveis amostras sistemticas de tamanho n. Como exemplo, seja uma populao com N = 50 elementos. Tomando-se amostras sistemticas n = 10, existem

k=

N n

k=

50 =5 10

possveis amostras sistemticas

Amostras Elementos 1 1 6 11 16 21 26 31 36 41 46 2 2 7 12 17 22 27 32 37 42 47 3 3 8 13 18 23 28 33 38 43 48 4 4 9 14 19 24 29 34 39 44 49 5 5 10 15 20 25 30 35 40 45 50 Admitindo que o primeiro elemento sorteado tenha sido o 3, a amostra selecionada constituda pelos elementos: 3 8 13 18 23 28 33 38 43 48 Na prtica comum ocorrer que N kn. Neste caso as amostras tero tamanhos diferentes. Considere uma populao com N = 26, da qual sero extradas amostras sistemticas n = 9. Portanto: k = 26/9 = 2,9 3. Como k exigiu arredondamento, em conseqncia as amostras tero tamanhos diferentes, conforme listados a seguir: Amostras Elementos 1 1 4 7 10 13 16 19 22 25 2 2 5 8 11 14 17 20 23 26 3 3 6 9 12 15 18 21 24 Se se comear com o elemento 1, a amostra ser constituda pelos elementos: 1 4 7 10 13 16 19 22 25 Se se comear com o elemento 3, a amostra ser constituda pelos elementos: 3 6 9 12 15 18 21 24 A amostra sistemtica apresenta as seguintes vantagens em relao amostra aleatria simples: a) maior simplicidade no processo de seleo dos elementos que comporo a amostra. O sorteio do primeiro elemento define os (n 1) outros do rol dos dados que comporo a amostra. Isto facilita a superviso da coleta dos dados controlando facilmente os erros; b) a amostra sistemtica se distribui mais uniformemente na populao podendo levar a uma maior representatividade; c) a populao fica dividida em n estratos de tamanho k, sendo tomado um elemento de cada estrato. A preciso das estimativas quase sempre maior.

14

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Amostra aleatria estratificada A amostragem estratificada pressupe a diviso da populao em subgrupos (estratos) de itens similares, procedendo-se ento a amostragem em cada subgrupo. Deve ser usada quando a populao heterognea. A lgica do processo que, dispondo os itens da populao em subgrupos homogneos, a variabilidade menor que a da populao global, o que leva a um menor tamanho de amostra. Consideremos alguns exemplos onde a amostragem estratificada deve ser adotada: 1) Um estudo do volume de vendas comparado com o gasto com propaganda, desde que haja muitas firmas includas no estudo; 2) Estudo do tempo que indivduos de vrias categorias de rendas despendem com o lazer; 3) Percentagem de salrios gastos com recreao, por pessoas de vrias categorias de rendas; 4) Em pesquisa poltica, tambm pose-se adotar amostra estratificada, considerando que em pocas de eleies as regies da cidade se transformam em centros de influncia de alguns candidatos, o que poderia de alguma forma influenciar as concluses finais sobre inteno de voto; 5) Nmero de carros por famlia numa cidade, considerando que existem bairros que residem famlias de melhor poder aquisitivo e bairros que residem famlias sem condies de sustentar um carro; Ilustrativamente, possuo uma amostra de tamanho 8 com relao ao nmero de carros por famlia numa cidade:Identificao da Famlia Bairro A 1 2 3 4 Bairro B 5 6 7 8 Carros (n) 3 2 4 3 1 0 1 0

O nmero mdio de carros por famlia de 1,75 e o desvio padro de 1,49. No entanto, se eu considerar cada bairro isoladamente, o desvio padro para o bairro A ser de apenas 0,82 e do bairro B ser de 0,58. Esse exemplo poderia ser claro para um mesmo bairro, por exemplo, o bairro de So Conrado no Rio de Janeiro, onde fica a favela da rocinha. Esse bairro segmentado em dois grupos pela classe social, e, portanto a estratificao se faz necessria. A figura a seguir ilustra esquematicamente a amostra estratificada. Todos os estratos so contemplados na amostra. Apesar da semelhana no mesmo quadrante, a estratificao se mostra necessria devido diferena entre os quatro quadrantes.

15

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Amostra

Populao

Amostragem aleatria por conglomeradoAo contrrio da amostra estratificada, os conglomerados so muito semelhantes uns aos outros. Logo, aqueles que compem a amostra tem a capacidade de representar os que no a pertencem. Quando realizamos uma pesquisa em um bairro de uma cidade onde as caractersticas de todos os consumidores se assemelham, independentemente do quarteiro selecionado, os quarteires no selecionados para participar da amostra sero representados pelos selecionados. Assim teremos uma viso de todo o bairro. Se o bairro fosse composto por pessoas de classes sociais diferentes, concentradas em determinados quarteires do bairro, a amostragem mais apropriada seria a por estratificao. A figura a seguir representa amostragem por conglomerados.

Populao Conglomerado = Amostra16

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

2) EstimaoPara trabalhos em epidemiologia, vide artigo a seguir: PEREIRA, Jlio C.R. Tamanho de amostra: uma necessidade real ou um capricho cultural? Arterola, v.4, n.1, p.13-16, 2002. Resumo de frmulas:

Populao InfinitaA. Estimativa de mdiasPontual Intervalar x conhecido

FinitaX

XX n sX n

XZx desconhecido

XZ

X n sX n

Nn N 1 Nn N 1

XtTamanho da amostra x conhecido

Xt

Z22 X n= 2 e n= Z2s 2 X e2X n sX n

Z22 N X n= 2 2 Z X + e 2 ( N 1) n= t 2s 2 N X 2 t 2 s X + e 2 ( N 1) X n sX nX n

x desconhecido

Erro x conhecido

e=Zx desconhecido

e=Z

Nn N 1 Nn N 1

e=t

e=t

B. Estimativa de proporesPontual (p) Intervalar (IC)

X n

X (X / n )[1 (X / n )] Z n nTamanho da amostra

X (X / n )[1 (X / n )] N n Z n n N 1

(X / n )[1 (X / n )] Z 2 (X / n )[1 (X / n )]( N) n = Z2 n= e2 ( N 1)e 2 + Z 2 (X / n )[1 (X / n )]

Erro

e=Z

(X / n )[1 (X / n )] n

e=Z

(X / n )[1 (X / n )] N n n N 1

17

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Sendo, X = nmero de itens na amostra Z = desvio padro normal, valor tabelado n = tamanho da amostra Alguns conceitos Populao: o conjunto de todos os elementos de interesse em um estudo. Amostra: um subconjunto da populao. Parmetro: uma caracterstica numrica da populao, como uma mdia da populao, um desvio padro da populao, uma proporo da populao e assim por diante. Estimador: um estimador de um parmetro qualquer funo das observaes da amostra aleatria X1, X2,..., Xn. Ele representa uma dada frmula de clculo que fornecer valores que sero diferentes, conforme a amostra selecionada. Exemplos: i) o estimador da mdia populacional ou X que uma mdia amostral. Teorema do limite central: um teorema que nos possibilita usar a distribuio normal de probabilidade para aproximar a distribuio de amostragem de X e de p sempre que o tamanho da amostra grande, usualmente maior que 30. Estimativas pontuais e intervalares Estimativa pontual: estimativa nica de um parmetro populacional Estimativa intervalar: d um intervalo de valores possveis, no qual se admite esteja o parmetro populacional. Estimativa da mdia de uma populao Depende se a populao finita ou infinita e se o desvio padro conhecido ou no. i) Para populaes infinitas n/N menor que 5% e com desviopadro conhecido. Depende do conhecimento ou no da varincia populacional. Consideremos que a mesma no seja conhecida. Como conhec-la? Podemos seguir alguns caminhos alternativos para conhecer a varincia amostral e inferir sobre a populao: a) usar uma varincia a partir de algum outro levantamento feito no passado referente ao mesmo tipo de pesquisa; b) tomar uma amostra de um tamanho compatvel, se possvel com folga, com o oramento da pesquisa. Com o resultado da pesquisa, estimar o valor da varincia. Ao aplicar o valor da varincia frmula e verificando-se que deve aumentar o tamanho da amostra, deve ser ento complementado o n;18

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

c) buscar um especialista no assunto em pauta e perguntar a ele qual o menor e maior valores para a varivel em questo. Desta forma, a varincia poder ser calculada por:

mximo mnimo = 3,92 A frmula acima pressupe que entre os limites mximo e mnimo h 3,92 desvios-padro. como se entre os dois limites existissem 95% dos casos possveis (lembre da tabela de Z). 1) Consideremos um exemplo: pesquisa sobre a mdia de consumo de sabonete (ao ms) por famlias de domiclios de um bairro. Consideremos que as famlias a serem pesquisadas consomem no mnimo 1 e no mximo 25 sabonetes ao ms.2

2

mximo mnimo 25 1 = 2 = = 37,5 3,92 3,92 O tamanho da amostra para se realizar a pesquisa sobre o consumo de sabonetes ser? Precisamos ainda considerar o erro mximo, pois a frmula ser: Z22 X n= e2 Considerando ento um erro de 1 sabonete por famlia (residncia) e confiana de 95%:2

2

2

Z22 (1,96) 2 37,5 X = n= = 144 residncias e2 12 Se aps a realizao das 144 entrevistas em domiclio, se verificar que a varincia inferior a 37,5, confirmaremos que o tamanho da amostra suficiente para garantir que o erro amostral seja inferior ao fixado: 1 no exemplo em questo (sabonetes). Se a varincia calculada a partir da amostra dos 144 domiclios for superior a 37,5, devemos complementar a amostra calculando o seu novo tamanho a partir da nova varincia. Suponha que o valor da varincia calculada a partir da amostra seja (1,96) 2 40 = 154 residncias . Como j 40. O tamanho da amostra deve ser: n = 12 foram entrevistados 144 domiclios, basta apenas mais 10 para completa o tamanho da amostra. Se eu desejasse uma confiana de 99%: (2,58) 2 40 n= = 267 residncias 12 Percebe-se que o tamanho da amostra aumenta medida que aumentamos o grau de confiana (1 - ) e possumos varincia de valor elevado. Aumenta tambm mediada que diminui o tamanho do erro tolerado (e). n=

19

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

2) O departamento de habitao e de desenvolvimento urbano dos Estados Unidos publica dados sobre o aluguel mensal de mercado para moradia de um quarto na rea metropolitana (Levine et al., 2000, apud The federal register, 30 de abril de 1997). O desvio-padro para o aluguel de aproximadamente U$80,00. Considere que uma amostra das reas metropolitanas ser selecionada de modo a se estimar o aluguel mdio mensal da populao para moradia de um quarto. Use uma confiana de 95%. a) Qual o tamanho da amostra se a margem de erro desejada de U$ 25,00? Resoluo: Z22 (1,96) 2 (80) 2 X n= n= = 40 moradias e2 (25) 2 b) Qual o tamanho da amostra se a margem de erro desejada de U$ 15,00? Resoluo: Z22 (1,96) 2 (80) 2 X n= n= = 110 moradias e2 (15) 2 3) Um estudo prvio que investigou o custo do aluguel de automveis nos Estados Unidos concluiu que a diria de um automvel de tamanho mdio variou de U$ 36,00 em Oakland, Califrnia, at U$ 73,50 em Hartford, Connecticut (USA Today, 16 de outubro de 1998). Considere que a organizao que realizou o estudo gostaria de realizar um novo estudo de modo a estimar o custo mdio atual da diria de aluguel da populao de automveis de tamanho mdio nos Estados Unidos. Na concepo do novo estudo, o diretor do projeto especificou que o custo mdio da diria de aluguel da populao deveria ser estimado com uma margem de erro de U$ 2,00 e um nvel de confiana de 95%. Qual o tamanho da amostra para um novo estudo? Resoluo: 2 2 mximo mnimo 73,50 36 2 = 2 = = 91,51 3,92 3,92 n= Z22 (1,96) 2 91,51 X = n= = 88 aluguis de automveis de tamanho mdio e2 22

4) Determine o nmero de observaes necessrio para estimar o tempo mdio de servio de atendimento a chamadas de um bombeiro hidrulico, se o erro mximo deve ser de 0,6 hora para um nvel de confiana de 95%, sabendo-se que o tempo de atendimento tem um desvio padro de uma hora. necessrio supor a normalidade da populao? Resoluo: Z22 1,96 212 X n= = 11 observaes n= 0,6 2 e2

20

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Como n menor que 30, preciso saber se a populao normal, ou pelo menos aproximadamente normal. ii) Para populaes infinitas n/N menor que 5% e com desviopadro desconhecido. Para esses casos, quando usualmente n menor que 30. Usa-se a frmula: Z2s 2 n = 2X e 1) Considere que a administrao de uma empresa concordou em treinar 15 empregados com um novo mtodo. Os dados de tempo de treinamento, em dias, dos 15 empregados esto listados a seguir:Empregado Tempo Empregado Tempo Empregado Tempo

1 52 6 59 11 54 2 44 7 50 12 58 3 55 8 54 13 60 4 44 9 62 14 62 5 45 10 46 15 63 A mdia de tempo gasto foi de 53,87 dias de treinamento e o desvio-padro foi de 6,82 dias de treinamento. a) Qual o erro ( X ) computado para o tempo de treinamento? Resoluo: s 6,82 e = t X e = 2,145 = 3,78 dias 15 n b) Qual a variao de tempo (intervalo de confiana) para o tempo de treinamento? Resoluo: s IC = X t X 53,87 3,78 = 50,09 a 57,65 dias de treinament o n

iii) Para populaes finitas n/N maior que 5% e com desviopadro populacional conhecido. 1) Determine um intervalo de 95% confiana: n = 100 N = 1000 X = 15 = 2,0 Resoluo: n/N = 100/1000 = 10% Portanto, devemos utilizar o fator de correo finita. A frmula para o intervalo de confiana :

21

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

IC = X Z

Xn

N n N 1

IC = 15 1,96

1000 100 = 15 0,372 = 14,63 a 15,372 999 100 2

iv) Para populaes finitas n/N maior que 5% e com desviopadro populacional desconhecido. 1) Determine um intervalo de 95% confiana: n = 16 N = 200 X = 15 s = 2,0 Resoluo: n/N = 16/200 = 8% Portanto, devemos utilizar o fator de correo finita. A frmula para o intervalo de confiana : s IC = X t X n IC = 15 2,131 2 16 N n N 1

200 16 = 15 1,025 = 13,98 a 16,025 199

2) Solicitou-se a 100 estudantes de um colgio que anotassem suas despesas com alimentao e bebidas num perodo de uma semana. H 500 estudantes no colgio. O resultado foi uma despesa mdia de $40,00 com um desvio padro de $ 10,00. a) construa um intervalo de 95% de confiana para a verdadeira mdia; b) se desejamos um erro de no mximo $ 5,00 em relao verdadeira mdia populacional, qual deveria ser o tamanho da amostra, para uma confiana de 95%? Resoluo: a) n/N = 100/500 = 20%. Trata-se de uma populao finita s N n IC = X t X n N 1 10 100 500 200 = 40 1,755 = 38,25 a 41,755 499

IC = 40 1,98

b) n =

1,98 210 2 500 196020 = = 16 estudantes 2 2 2 1,98 10 + 5 (500 1) 12867,04

22

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Propores Para saber se a populao finita, Populaes Infinitas a) Intervalo de confiana 1) Determine um intervalo de 98% de confiana para a verdadeira proporo populacional, se X = 50 e n = 200. Resoluo: A proporo amostral X/n = 50/200 = 0,25 Z = ? 98% quer dizer que sob a curva normal padro h 98%/2 = 49% de rea ou probabilidade em cada lado da curva simtrica. Consultando a tabela de Z para rea de 49% = 0,49, teremos valor de Z = 2,33 desvios padres. IC = proporo erro IC = proporo Z x desvio padro da proporo ( X / n)[1 ( X / n)] X IC = Z n n IC = IC =n n > 0,05 e para infinita, < 0,05 N N

X (X / n )[1 (X / n )] Z n n 50 (50 / 200)[1 (50 / 200)] 2,33 200 200 (0,25)(0,75)] 200

IC = 0,25 2,33

IC = 0,25 0,07 IC = 0,18 a 0,32 Enquanto a proporo populacional 0,25, com 98% de certeza podemos dizer que a verdadeira proporo populacional est entre 0,18 e 0,32. 2) Uma amostra de 200 pessoas alrgicas foi tratada com uma droga A., ficando curadas 180 pessoas. Encontre um intervalo de confiana de 95% para a proporo de pessoas curadas pela droga A. Resoluo: ( X / n)[1 ( X / n)] X IC = Z n n IC =

180 (180 / 200)[1 (20 / 200)] 1,96 200 200

23

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

IC = 0,90 1,96

(0,90)(0,10)] 200(e = 4,2%)

IC = 0,90 0,042

IC = 0,86 a 0,94 Enquanto a proporo dos curados pela droga A 0,90, com 95% de certeza podemos dizer que a verdadeira proporo populacional est entre 0,86 e 0,94, ou seja, entre 86% e 94% so curados pela droga A. b) Erro 1) Uma amostra de 200 observaes acusou 20 baterias defeituosas numa remessa. Usando uma confiana de 99%, determine o erro de estimao. Resoluo: A proporo amostral X/n = 20/200 = 0,10 Z = ? 99% quer dizer que sob a curva normal padro h 99%/2 = 49,5% de rea ou probabilidade em cada lado da curva simtrica. Consultando a tabela de Z para rea de 49,5% = 0,495, teremos valor de Z = 2,58 desvios padres.

e=Z e = 2,58

(X / n )[1 (X / n )] n

ou

e=Z

p(1 p) n

(0,10)(0,90)] = 0,055 200 O erro de estimao de 0,055 ou 5,5%.

c) Determinao do tamanho da amostra 1) Qual o tamanho da amostra necessrio para obter um intervalo de 95% de confiana para a proporo populacional, se o erro tolervel 0,08? Resoluo: Como o enunciado do problema no contm informao sobre o tamanho possvel da proporo populacional, os clculos devem basear-se no intervalo mais amplo possvel, o que ocorre quando o valor amostral igual a 0,5. Z = ? 95% quer dizer que sob a curva normal padro h 95%/2 = 47,5% de rea ou probabilidade em cada lado da curva simtrica. Consultando a tabela de Z para rea de 47,5% = 0,475, teremos valor de Z = 1,96 desvios padres. (X / n )[1 ( X / n )] n = Z2 e2

ou

p(1 p) n = Z2 2 e

24

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

p(1 p) 2 (0,5)(0,5) n = Z2 2 = 1,96 0,08 2 = 149,5 e O tamanho da amostra ser 150. Importante: Vejamos outra maneira de encontrar o valor do tamanho da amostra para cada erro tolerado considerando confiana de 95% e o no conhecimento da proporo. Inicialmente representamos os valores de p (1 p) para possveis valores de p, na tabela a seguir. Valores assumidos por p (1 p), de acordo com a proporo p p (1-p) p (1 p) 0,0 1,0 0,000 0,1 0,9 0,090 0,2 0,8 0,160 0,3 0,7 0,210 0,4 0,6 0,240 0,5 0,5 0,250 0,6 0,4 0,240 0,7 0,3 0,210 0,8 0,2 0,160 0,9 0,1 0,090 1,0 0,0 0,000 Os valores de p (1 p) em funo de p so representados na Figura a seguir.0,3 0,25 p (1 - p) 0,2 0,15 0,1 0,05 0 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 p 1

FIGURA - Valores assumidos por p (1 p), em funo de p.

25

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Enfatizamos o valor de p (1 p) = 0,25 quando p vale 0,5. Consideremos a frmula para tamanho da amostra (n) em caso de populao infinita:

p(1 p) n = Z2 2 eObserva-se pela frmula, que quanto maior o valor de p (1 p) maior ser o tamanho da amostra. Na prtica, quando no dispomos de qualquer informao sobre o valor de p, usa-se p = 0,5 e assim trabalhando-se com uma amostra de tamanho grande, h maior segurana nos resultados encontrados. Dessa forma, usando-se p = 0,5 e confiana de 95% para populao infinita, a frmula se reduz a:

0,96 p(1 p) n = Z2 2 n = e2 e Pode-se ento compilar a tabela a seguir, que nos fornece o tamanho da amostra de acordo com o erro mximo tolervel: Tamanho da amostra de acordo com o erro para p desconhecido, confiana de 95% e pop. infinita e (%) n 1 9600 2 2400 3 1067 4 600 5 384 6 267 7 196 8 150 9 119 10 96 No exerccio em questo, para um erro de 0,08 = 8%, o tamanho da amostra 150. Nesse mesmo exerccio, se o erro tolerado fosse 2%, o tamanho da amostra seria 2400. A tabela tambm nos mostra que se quisermos estimar uma proporo, com um erro mximo de 5% e confiana de 95%, teremos que tomar uma amostra de 384 (na rea de marketing, poderia ser 384 consumidores entrevistados). de praxe na rea de marketing, bem como em outros ramos da cincia, considerar o erro mximo de 5%. Logo, na maioria dos casos o tamanho satisfatrio da amostra ser 384. Quando conhecemos uma faixa de variao de p devemos utilizar na frmula, o valor que mais se aproxime a 0,5. Por exemplo, se soubermos que a proporo p est:26

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Faixa de p 0,00 a 0,20 0,20 a 0,35 0,75 a 0,85 0,40 a 0,70

p a ser usado 0,20 0,35 0,75 0,50

2) Determine o tamanho da amostra necessrio para estimar a verdadeira percentagem populacional a menos de 4%, usando um intervalo de confiana de 90%. razovel suspeitar que o verdadeiro valor seja 0,30 ou menos. Resoluo: Z = ? 90% quer dizer que sob a curva normal padro h 90%/2 = 45% de rea ou probabilidade em cada lado da curva simtrica. Consultando a tabela de Z para rea de 45% = 0,45, teremos valor de Z = 1,65 desvios padres. p(1 p) 2 (0,3)(0,7) n = Z2 2 = 1,65 0,04 2 = 357,3 e O tamanho da amostra ser 358. Aplicaes prticas populaes infinitas 1) Foi realizada uma pesquisa numa cidade sobre a preferncia do eleitorado nas vsperas do segundo turno de uma eleio para prefeito. Os resultados obtidos foram os seguintes: Candidato A B Brancos/Nulos Indeciso/No respondeu Total N de eleitores favorveis 503 529 66 102 1200

a) Estime a proporo de votos de cada candidato e os respectivos erros de estimativa ( = 0,05). Resoluo: pA = X/n = 503/1200 = 0,419 = 41,90% (X / n )[1 (X / n )] eA = Z n

e A = 1,96IC A =

(0,419)(0,581)] = 1,96x 0,014243 = 0,028 = 2,8% 1200

X e A = 0,419 0,028 = 0,39 a 0,447 n

pB = 529/1200 = 0,441 = 44,10%B

27

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

eB = Z e B = 1,96IC B =

(X / n )[1 (X / n )] n

(0,441)(0,559)] = 1,96x 0,0143329 = 0,028 = 2,8% 1200

X e B = 0,441 0,028 = 0,413 a 0,469 n

b) Pelos resultados obtidos, se a eleio fosse realizada no mesmo dia da pesquisa seria possvel prever o candidato vitorioso? Resoluo: ? c) Qual deveria ser o tamanho da amostra para que fosse possvel prever o candidato vitorioso com uma confiana de 95% e um erro de 2%? Resoluo: Admitindo que no haja mais estratgias de ltima hora na campanha que possa alterar a tendncia do eleitorado, para que seja feita a previso do vitorioso com uma confiana de 95% e um erro mximo de 2,0%, que inferior a diferena entre os ndices de preferncia dos candidatos, o tamanho da amostra deveria ser de:

p(1 p) n = Z2 2 e (0,441)(0,559) n = 1,96 2 = 2367,57 = 2368 eleitores 0,02 2 Observe pelo tabela pgina 26, que se p = 0,5 o nmero de eleitores a serem entrevistados seria de 2400 para um erro de 2% e confiana de 95%. 2) Uma amostra de 200 pessoas alrgicas foi tratada com uma droga A., ficando curadas 180 pessoas. Quantas pessoas voc recomenda usar num novo teste com a droga A para estimar sua eficincia com 95% de confiana e um erro mximo de 3%? Resoluo: (0,9)(0,1) p(1 p) n = Z2 = 1,96 2 = 384,16 385 pessoas 2 2 e 0,03 3) Um fabricante de flashes deseja estimar a probabilidade de um flash funcionar. Como se trata de um teste destrutivo, ele deseja manter o tamanho da amostra o menor possvel. Determine o nmero de observaes que devem ser feitas para estimar a probabilidade a menos de 0,04 com 95% de confiana, se: a) ele no tem idia da percentagem de defeituosos; b) se ele cr que a percentagem de defeituosos no supere 6%.

28

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

Resoluo: p(1 p) 2 0,25 a) n = Z 2 2 = 1,96 0,04 2 = 600,25 601 flashes e p(1 p) 2 (0,06)(0,94) b) n = Z 2 = 135,41 136 flashes 2 = 1,96 0,04 2 e Populaes finitas A populao considerada finita quando o tamanho da amostra mais que 5% da populao. a) Erro e Intervalo de confiana 1) Determine um intervalo de confiana de 95% para a percentagem populacional de defeituosos para os seguintes dados: N = 2000 Resoluo: Como n/N = 400/2000 = 0,20 = 20%, necessrio o fator de correo finita. Z = ? 95% quer dizer que sob a curva normal padro h 95%/2 = 47,5% de rea ou probabilidade em cada lado da curva simtrica. Consultando a tabela de Z para rea de 47,5% = 0,475, teremos valor de Z = 1,96 desvios padres. n = 400 X/n = 0,10

IC =IC = 0,10 1,96

( X / n)[1 ( X / n)] N n X Z n n N 1

(0,10)(0,90)] 2000 400 400 2000 1

IC = 0,10 0,0265 = 10% 2,65% = 7,35% a 12,65% e = 2,65% b) Determinao do tamanho da amostra 1) Determine o tamanho amostral com confiana de 95% para a percentagem populacional de defeituosos para os seguintes dados, considerando e = 2%: N = 2000 Resoluo: n = 400 X/n = 0,10 n/N = 400/2000 = 0,20

n=

Z 2 ( X / n )[1 ( X / n )]( N ) ( N 1)e 2 + Z 2 ( X / n )[1 ( X / n )]

29

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

1,96 2 (0,10)(0,90)(2000) 691,488 n= = = 603,73 = 604 2 2 1,145 (1999)0,02 + 1,96 (0,10)(0,90)]Aplicaes prticas populaes finitas 1) Seja uma pesquisa realizada numa indstria de 1500 empregados, usando uma amostra aleatria simples de tamanho n = 100. Os resultados mostraram a distribuio salarial nas seguintes faixas: Faixa Salarial (R$) Empregados (n) FS1 - < 300,00 52 FS2 [300,00 a 600,00] 28 FS3 [600,00 a 1000,00] 12 FS4 - 1000,00 08 Total 100 Na amostra foram obtidas ainda, por meio de questionrio, as seguintes informaes: Possui casa prpria Faixa Salarial Total Sim No FS1 5 47 52 FS2 12 16 28 FS3 8 4 12 FS4 6 2 8 Total 31 69 100 a) Estime a proporo de funcionrios em cada faixa salarial e os respectivos intervalos de confiana ( = 0,05). Resoluo: FS1 - < 300,00 n/N = 100/1500 = 0,0667. A populao finita (> 0,05) X1 = 52 p1 = X1/n = 52/100 = 0,52 (X / n )[1 (X / n )] N n e=Z n N 1

e = 1,96

(0,52)(0,48)] 1500 100 = 0,0946327 100 1500 1IC p1 =

IC(p1)

( X / n)[1 ( X / n)] N n X Z n n N 1 = 0,52 0,0946327 = 0,425 a 0,615

FS2 [300,00 a 600,00] X2 = 28 p2 = X2/n = 28/100 = 0,28

30

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

e=Z e = 1,96

(X / n )[1 (X / n )] N n n N 1

(0,28)(0,72)] 1500 100 = 0,085 100 1500 1IC p 2 =

IC(p2)

( X / n)[1 ( X / n)] N n X Z n n N 1 = 0,28 0,085 = 0,195 a 0,365

FS3 [600,00 a 1000,00] X3 = 12 p3 = X3/n = 12/100 = 0,12

e=Z e = 1,96

(X / n )[1 (X / n )] N n n N 1

(0,12)(0,88)] 1500 100 = 0,0616 100 1500 1IC p3 =

IC(p3)

( X / n)[1 ( X / n)] N n X Z n n N 1 = 0,12 0,0616 = 0,058 a 0,182

FS4 - 1000,00 X4 = 08 p4 = X4/n = 8/100 = 0,08

e=Z e = 1,96

(X / n )[1 (X / n )] N n n N 1

(0,08)(0,92)] 1500 100 = 0,0514 100 1500 1IC p 4 =

IC(p4)

( X / n)[1 ( X / n)] N n X Z n n N 1 = 0,08 0,0514 = 0,029 a 0,131

b) Estime a proporo de funcionrios da indstria que tem casa prpria e o intervalo de confiana ( = 0,05). Resoluo: X = 31 p = X/n = 31/100 = 0,31 (X / n )[1 (X / n )] N n e=Z n N 1

e = 1,96

(0,31)(0,69)] 1500 100 = 0,0876 100 1500 1IC =

( X / n)[1 ( X / n)] N n X Z n n N 1

31

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

IC = 0,31 0,0876 = 0,222 a 0,398 c) Estime em cada faixa salarial a proporo de funcionrios com casa prpria e o intervalo de confiana ( = 0,05). Resoluo: FS1 com Casa prpria X = 05 p = X/n = 5/52 = 0,0962 (X / n )[1 (X / n )] N n e=Z n N 1

e = 1,96

(0,0962)(0,9038)] 1500 52 = 0,078 52 1500 1IC =

( X / n)[1 ( X / n)] N n X Z n n N 1 IC = 0,0962 0,078 = 0,018 a 0,174 FS2 com Casa prpria X = 12 p = X/n = 12/28 = 0,4286

e=Z e = 1,96

(X / n )[1 (X / n )] N n n N 1

(0,4286)(0,5714] 1500 28 = 0,181 28 1500 1IC =

( X / n)[1 ( X / n)] N n X Z n n N 1 IC = 0,4286 0,181 = 0,248 a 0,610 FS3 com Casa prpria X=8 p = X/n = 8/12 = 0,6667

e=Z e = 1,96

(X / n )[1 (X / n )] N n n N 1

(0,6667)(0,3333)] 1500 12 = 0,266 12 1500 1IC =

( X / n)[1 ( X / n)] N n X Z n n N 1 IC = 0,6667 0,266 = 0,401 a 0,933 FS4 com Casa prpria X=6 p = X/n = 6/8 = 0,75

e=Z

(X / n )[1 (X / n )] N n n N 1

32

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

e = 1,96

(0,75)(0,25] 1500 8 = 0,299 8 1500 1IC =

( X / n)[1 ( X / n)] N n X Z n n N 1 IC = 0,75 0,299 = 0,45 a 1,05 Obs.: 0,45 a 1,05 = 45% a 105%. Como no existe 105% com casa prpria, o valor passa a ser entendido como 100% e portanto, IC = 0,45 a 1,00d) Dimensione a amostra para um novo estudo considerando e = 6%. Resoluo: No clculo da amostra ser considerado a estimativa da proporo da faixa salarial 1 (FS1), onde p = 0,52, pois a estimativa que fornece maior valor para p (p 1). Assim, n= n= Z 2 (X / n )[1 (X / n )]( N) ( N 1)e 2 + Z 2 (X / n )[1 (X / n )] = 226,32 227

1,96 2 (0,52)(0,48)(1500) =1438,3/6,355 (1500 1)0,06 2 + 1,96 2 (0,52)(0,48) funcionrios. Observaes Importantes:

a) Quando a populao muito pequena at 100, digamos at 100 consumidores, melhor entrevistar a todos. Isto , devemos realizar um censo sem utilizar a teoria da amostragem, j que para este tamanho de mercado teramos que conviver com um erro de amostragem, alm do custo do censo ser praticamente o mesmo que o da amostragem. b) Se no possuo qualquer informao sobre p e desejo calcular o tamanho da amostra para populaes finitas com confiana de 95% e 384 erro mximo de 5%, posso usar a frmula resumida: n = 384 1+ N c) Considerando variados valores de p e erros de 2% e 5% para confiana de 95% para populaes finitas, teremos os tamanhos amostrais constantes nas tabelas a seguir. d) Existe um tamanho N para dizer se a populao finita ou infinita? Alguns pesquisadores preferem adotar uma regra prtica que : de N = 100 a 5000 usa-se a frmula de dimensionamento da amostra que considera a correo para populao finita. Alm de 5000, usa-se a frmula para populao infinita. Um exemplo: Para 95% de confiana e

33

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

erro de 5% , na populao infinita n = 384 e para populao finita (N = 5000), n = 357. Ou seja, o tamanho da amostra nesses dois casos praticamente igual. Tamanho da amostra em funo de p e N para 95% de confiana, populao finita e erro de 2% Valor aproximado de p antes da pesquisaTamanho do Mercado91% a 100% ou 0% a 10%

81% a 90% 71% a 80% 61% a 70% 51% a 60% ou ou ou ou 11% a 20% 21% a 30% 31% a 40% 41% a 50%

20 30 50 100 200 300 500 1000 2000 5000 10000 20000 30000 50000 100000

20 29 47 90 162 223 317 464 603 737 795 828 840 849 857

20 29 48 94 177 251 377 606 869 1175 1331 1426 1461 1490 1513

20 30 49 95 182 261 401 668 1004 1437 1678 1831 1889 1938 1976

20 30 49 96 184 265 411 697 1071 1577 1873 2066 2140 2203 2252

20 30 49 96 185 267 414 706 1091 1622 1935 2143 2222 2290 2344

Tamanho da amostra em funo de p e N para 95% de confiana, populao finita e erro de 5% Valor aproximado de p antes da pesquisa Tamanho do Mercado 20 30 50 100 200 300 500 1000 2000 5000 10000 20000 30000 50000 10000091% a 100% ou 0% a 10%

81% a 90% 71% a 80% 61% a 70% 51% a 60% ou ou ou ou 11% a 20% 21% a 30% 31% a 40% 41% a 50%

17 25 37 58 82 95 108 121 129 135 136 137 138 138 138

18 27 42 71 110 135 165 197 219 234 240 243 244 245 245

19 27 43 76 123 155 196 244 278 303 312 317 319 320 322

19 28 44 79 130 165 212 269 311 343 356 362 364 366 367

19 28 44 79 132 168 217 277 322 357 370 377 379 381 38334

Unidade IV Teoria da Amostragem Bioestatstica Prof. Edlson R. Schmildt

2) De um grupo de 20 secretrias de uma grande firma de advocacia, escolhidas aleatoriamente, cinco no se mostram satisfeitas com o trabalho que vem executando. H 50 secretrias empregadas na firma. a) Construa um intervalo de 90% de confiana para a proporo de secretrias insatisfeitas. Resoluo: N = 50 n = 20 X = 5 X/n = 5/20 = 0,25 n/N = 20/50 = 0,40 (pop. finita) ( X / n)[1 ( X / n)] N n X IC = Z n n N 1 IC = 0,25 1,65

(0,25)(0,75) 50 20 = 0,25 0,160 = 0,09 a 0,41 20 50 1

b) Converta o intervalo da parte a em nmero de secretrias. Resoluo: 9% a 41% de 50 = 4,5 a 20,5 secretrias insatisfeitas.

35