Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
ESTATÍSTICA I
Prof. Msc. Jeferson Gomes Moriel Junior
Secretariado Executivo (Bacharelado) 5º semestre - Noturno
2012/1
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DE MATO GROSSO
IFMT / campus Cuiabá
4/18/2012
1
Estatística I
Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior
Secretariado Executivo (Bacharelado)Secretariado Executivo (Bacharelado)5º semestre 5º semestre -- NoturnoNoturno
Todos os direitos reservados.
Quem sou eu?
Quem são vocês?
O que é esta disciplina?
Quem sou eu?Quem sou eu?
MirassolMirassolSão José do Rio PretoSão José do Rio PretoUnespUnesp: : LicLic. Matemática. Matemática
LondrinaLondrinaUelUel: Mestrado: Mestrado
UelUel: Depto. de Estatística: Depto. de EstatísticaUelUel: Depto. de Matemática : Depto. de Matemática
ParanavaíParanavaíFafipaFafipa: Depto. de Matemática: Depto. de Matemática
São Vicente São Vicente CuiabáCuiabáIFMTIFMT
Doutorando em Educação em Doutorando em Educação em Ciências e Matemática Ciências e Matemática ––
UFMT/REAMECUFMT/REAMEC
JefersonMorielJunior.pbworks.comInformações e arquivos das disciplinassitesite
jeferson moriel@cba ifmt edu [email protected] institucional
facebook.com/ProfMorielJuniorCurtir a página para obter informações rápidas da disciplina
Quem são vocês?Quem são vocês?
4/18/2012
2
O que é esta disciplina?O que é esta disciplina?
• Carga horária, ementa, objetivos e avaliação• Procedimentos de ensino/aprendizagem e bibliografia
• Carga horária33 horas
Quinta‐feira: 2 primeiras aulas
• Ementa
‐ Séries estatísticas, gráficos e distribuição de frequência.
‐ Análise de dados, apresentações estatística. ‐ Descrição de dados: Medidas de posição, Medidas de variabilidade, probabilidade.
‐ Distribuição discreta de probabilidade. ‐ Distribuições contínuas de probabilidade: Normal e Exponencial.
• Avaliação
Nota1 = 8 pts de trabalhos/apresentações/provasNota1 = 8 pts de trabalhos/apresentações/provas + 2 pts de conceito (conforme Estatudo do IFMT)
Nota2 = 5 pts do Trabalho de Pesquisa + 3 pts de trabalhos/apresentações/provas + 2 pts de conceito
Bibliografia
• FONSECA, J. S. da., MARTINS, G. de A. Curso de estatística. São Paulo: Atlas, 1995.
• FONSECA, J. S. da., MARTINS, G. de A., TOLEDO, G. L. Estatística aplicada. São Paulo: Atlas, 1995.
•• Bibliografia Complementar• KAZMIER, L. J. Estatística aplicada à economia e administração. São Paulo: McGraw‐Hill, 1982.
• MARTINS, G. de A., DONAIRE, D. Princípios de estatística. São Paulo: Atlas, 1995
Uma dica interessante
4/18/2012
3
APRENDEMOS RETEMOS
•1% por meio do gosto•1,5% por meio do tato•3,5% por meio do olfato•11% por meio do ouvido
•10% do que lemos•20% do que escutamos•30% do que vemos•50% do que vemos e escutamos•11% por meio do ouvido
•83% por meio da visão•50% do que vemos e escutamos•70% do que ouvimos e logo discutimos•90% do que ouvimos e logo realizamos
Extraído de Ensino‐aprendizagem com modelagem matemática de Rodney Bassanezzi, p. 179.
Algumas noções introdutórias
• Dados são observações que tenham sido coletadas(por exemplo, medidas realizadas, respostas depesquisas, etc)
• População (ou Universo) é a coleção de todos osobjetos, indivíduos ou informações que apresentampelo menos uma característica em comum, cujocomportamento interessa‐nos analisarcomportamento interessa‐nos analisar.
• Exemplos: Em uma dada comunidade o conjunto deTODAS as estaturas constitui uma população deestaturas; o conjunto de TODOS os carros constitui umapopulação de carros. Logo, população não implicanecessariamente gente, pessoas. O que importa é avariável estudada.
• Mas, se uma população for muito grande o pesquisadorpoderá ter um trabalho astronômico para estudá‐la. Alémdisso, o processo de pesquisa pode ser destrutivo: porexemplo, se tivermos uma população de fósforos e quisermosavaliar a porcentagem de falhas.
• Nestes casos, recorre‐se a uma amostra que basicamenteconstitui uma redução da população a dimensões menoresconstitui uma redução da população a dimensões menores,sem perda das características essenciais.
• Em outras palavras, uma amostra deve conter em proporçãotudo o que a população possui qualitativa equantitativamente (isto é, ser representativa). E para serconsiderada representativa tem de ser selecionada de modoaleatório, isto é, todos os elementos da população devem terigual oportunidade de fazer parte da amostra.
• Censo é o conjunto de dados obtidos de todos osmembros da população.
• Estatística é uma coleção de métodos para oplanejamento de experimentos, obtenção de dados
ü t i ã t ãe, conseqüente organização, resumo, apresentação,análise, interpretação e elaboração de conclusõesbaseadas nos dados.
• ESTATÍSTICA DESCRITIVA E INFERÊNCIA ESTATÍSTICA
• Teste com 6 carros: Ao descrever tais característicasdeste conjunto de dados estamos trabalhando com a Estatística Descritiva.
• Se concluíssemos que todos os carros importadosnaquele ano poderiam acelerar de 0 a 100 km/h emmenos de 17 0 s; estaríamos generalizando usandomenos de 17,0 s; estaríamos generalizando, usandodados amostrais para fazer inferências sobre umapopulação. Esta última parte é a Inferência Estatísticaque é a parte da estatística que tem por objetivoobter e generalizar conclusões para o todo a partir daanálise de uma parcela.
4/18/2012
4
• Na transferência das conclusões (da amostra para apopulação), um instrumento torna‐se muitoimportante, a Teoria das Probabilidades. Essapermite analisar o tamanho do erro que se cometeao fazer inferências.
O QUE É MAIS FÁCIL?
Ser atacado por um tubarão?
Ganhar na mega sena?
Ser atingido por um raio?
O QUE É MAIS FÁCIL?
1º RAIO
2º MEGA SENA
3º TUBARÃO
• É mais provável ganhar na Mega‐Sena do que ser Atacado por um tubarão.
• Segundo dados de ataques mundiais em 2003 compilados pelo International Shark Attack File do Florida Museum of Natural History e comparados com a população mundial no mesmo ano, as chances são de 1/60.000.000
• No entanto, é mais fácil ser atingido por um raio do que acertar as seis dezenas da Caixa.
• Segundo a National Oceanic and AtmosfericAdministration, a chance de um raio cair em vocês ao longo da sua vida é de 1/6250. (Probabilidade estimada para moradores dos Estados Unidos baseada no Censo 2008).
• No quadro a seguir há notas de uma prova de uma turma com 80 alunos em determinada universidade.
0 80 59 61 2 98 60 1463 36 85 6 52 63 27 6762 84 92 14 15 10 35 5190 1 81 54 25 9 57 5576 20 96 48 45 54 84 2894 22 88 92 7 32 14 8714 58 90 67 98 85 84 91
• Você pode enxergar algum padrão nestas notas? • Pode descrevê‐las em poucas palavras? Em poucas frases? • Pode dizer se são particularmente altas ou baixas como um
todo?
81 30 35 31 49 75 95 4995 29 44 90 11 55 39 79
24 64 74 90 96 74 12 25
4/18/2012
5
4/18/2012
6
4/18/2012
7
Dados e variáveis
Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior
Secretariado Executivo (Bacharelado)Secretariado Executivo (Bacharelado)5º semestre 5º semestre -- NoturnoNoturno
Assuntos da aula
• DadosTipos e fontes
• VariáveisTipos e mensuração
• Questionários
Situações que exigem dados• Um analista de pesquisas de mercado precisa avaliar
a eficácia de uma nova propaganda de TV;• Um farmacêutico precisa determinar se uma nova
droga é mais eficaz do que aquelas atualmente emuso;uso;
• Um auditor deseja analisar as transações financeirasde determinada empresa para verificar se ela estácumprindo princípios contábeis adequados;
• Um gerente de operações deseja monitorar umprocesso de produção com o objetivo de descobrir sea qualidade do produto fabricado está conforme ospadrões da empresa.
Tipos de dadosDados primários e Dados Secundários
• Dados Primários: quando os dados sãoobtidos diretamente com os elementos daobtidos diretamente com os elementos dapopulação investigada;
• Dados Secundários: quando não se precisair até os elementos da população para seobter os dados necessários, pois eles jáexistem em uma ou mais publicações ouarquivos.
Fontes de dadosSão quatro as fontes de dados:
• Dados distribuídos por uma organização ou indivíduo Exemplo: Relatórios do governo
• Experimento projetadoExemplo: Testes de laboratório
• Pesquisa de levantamento ou surveyExemplo: Pesquisas de opinião com entrevista ou questionário
• Estudo baseado em observaçõesExemplo: Análise de comportamento para pesquisas de mercado
Dados
Dados Brutos
São observações que tenham sido coletadas(por exemplo medidas realizadas respostas(por exemplo, medidas realizadas, respostasde pesquisas, etc) e que ainda não foramorganizadas.
O conjunto dessas informações compõe o quese denomina de Banco de Dados.
4/18/2012
8
N Estado CivilGrau de
InstruçãoNo de filhos
Salário(x s.mínimo) idade
Região de Procedência
1 solteiro fundamental - 2,00 26 interior2 casado fundamental 0 2,56 32 capital3 casado fundamental 2 3,25 36 capital4 solteiro médio - 3,73 20 outra5 solteiro fundamental - 2,26 40 outra6 casado fundamental 1 4,66 28 interior7 solteiro fundamental - 2,86 41 interior8 solteiro fundamental - 2,39 43 capital9 casado médio 1 4,59 34 capital
Perfil dos trabalhadores na construção do Ed. XXX, Cuiabá, em Set./2011
10 solteiro médio - 4,44 23 outra11 casado médio 2 4,12 33 interior12 solteiro fundamental - 2,46 27 capital13 solteiro médio - 5,74 37 outra14 casado fundamental 3 2,95 44 outra15 casado médio 0 4,13 30 interior16 solteiro médio - 5,35 38 outra17 casado médio 1 6,77 31 capital18 casado fundamental 2 3,8 39 outra19 solteiro superior - 10,53 25 interior20 solteiro médio - 6,76 37 interior21 casado médio 1 5,06 30 outra22 solteiro médio - 4,59 34 capital
ROL
•Rol é o arranjo dos dados brutos numéricosem ordem crescente ou decrescente, se osdados forem qualitativos o rol é construído emordem alfabéticaordem alfabética.
•Pode-se, pelo rol, verificar de maneira maisclara e rápida o comportamento dos dadosdo conjunto identificando o maior e o menorvalor, além de alguns elementos que podem serepetir várias vezes.
ROL
Idades de funcionários em uma empresa (emforma de rol).
20 23 25 26 26 27 28 29 3030 31 31 32 32 33 33 34 3435 35 36 36 37 37 38 39 4040 41 41 43 43 44 46 46 48
Variáveis
• Variáveis são características que podem serobservadas (ou medidas) em cada elementoda população.
Tipos de Variáveis
Variável Tipos Descrição Exemplos
QualitativaNominal Sem ordenação. Cor dos olhos, sexo, etc.
Qualitativa(Categórica) Ordinal Com ordenação. Grau de instrução, classesocial, etc.
Quantitativa
(Numérica)
Discretas Por contagem.Número de funcionários;número acidentes de trabalhoocorrido durante um mês, etc.
Contínuas Por medição. Medidas de altura e peso,tempo, etc.
Variáveis• Qualitativas: quando resulta de uma classificação por
tipos, atributos ou qualidade (profissão, nacionalidade, grau de instrução, etc).
• Quantitativas: quando seus valores indicam quantidade, que pode ser:que pode ser:
• – discreta (os valores possíveis formam um conjunto enumerável, finito ou infinito, isto é, assumem valores inteiros, como número de peças defeituosas por lote, número de acidentes de trabalho por mês, etc);
• – contínua (assume qualquer valor dentro de um certointervalo de valores sem vazios, interrupções ou saltos, como peso, altura, pressão, volume, tempo, etc).
4/18/2012
9
Mensuração para variável Qualitativa Nominal
• Trabalhar na sua área de estudo( ) Sim ( ) Não
• Principal característica pessoal( ) Inteligência ( ) Beleza ( ) Modéstia ( ) Outros
Mensuração para variável Qualitativa Ordinal
• Satisfação com o produto( ) Muito satisfeito( ) Relativamente satisfeito( ) Neutro( ) Relativamente insatisfeito( ) Muito insatisfeito( ) Muito insatisfeito
• Nível de escolaridade completo( ) Pós-graduação ( ) Graduação ( ) Ensino médio( ) Ensino fundamental( ) Nenhum
Mensuração para variável Quantitativa discreta
• Número de ligações recebidas______ ligações.
• Ano de formatura• Ano de formatura______
• Número de cursos de aprimoramento_____ cursos.
Mensuração para variável Quantitativa contínua
• Salário do funcionário.R$ __________.
• Tempo atendimento ao consumidor ______ hora(s) _______ minutos
Exercício 1. Para cada pergunta do questionário acima escreva qual é a variável abordada e classifique-a.
4/18/2012
10
Exercício 2. Classifique cada uma das variáveis a seguir:
a. Bebidas vendidas numa lanchonete (refrigerante, chá, café e água)b. Tamanho de refrigerantes vendidos numa lanchonete (pequeno, médio
e grande)c. Tempo necessário para baixar um arquivo da internetd. Quantidade de livros comprados no mês
Exercício 3. Uma das variáveis mais incluídas em pesquisas é a renda.Algumas vezes a pergunta é assim formulada “Qual é sua renda (em
i )? R$ ” E t i li it t i t dreais)? R$ _______”. Em outras pesquisas, solicita-se ao entrevistadoque “Marque um X no seu nível de renda” e é fornecida várias faixasde renda para escolha.
a. No primeiro formato, explique a razão pela qual a renda pode ser considerada tanto discreta quanto contínua
b. Qual desses dois formatos você preferiria utilizar em uma pesquisa? Por quê?
c. Qual desses dois formatos iria possivelmente trazer a você uma maior taxa de resposta? Por quê?
Cuidados na elaboração de Questionário
• Não incluir jamais uma pergunta sem ter uma ideia clara da forma de utilizar a sua informação e quanto contribuirá aos objetivos da pesquisa.
• Utilizar vocabulário preciso para perguntar o que realmente se deseja saber Evitar palavras confusas erealmente se deseja saber. Evitar palavras confusas e termos técnicos que não sejam do conhecimento da população a ser entrevistada.
• Evitar duas perguntas em uma.• Facilitar a memória. Limitar as perguntas a um passo
próximo e ajudar o entrevistado a retroceder no tempo passo a passo, até recordar a informação que nos interessa.
• Não obrigar a fazer cálculos. Por exemplo: Quantos pares de meias você compra no ano?
• Não fazer perguntas embaraçosas. Por exemplo: De quantos em quantos dias você toma banho?
• Não fazer uma pergunta que já contenha em si a resposta. Por exemplo: Vai ao parque pelo menos uma vez?
• As perguntas não devem estar direcionadas, nem refletir a posição do pesquisador em relação a determinado assunto. Devem ser formuladas de tal forma que o entrevistado não se considere pressionado a dar uma resposta que acredita ser a opinião do pesquisador.
• Ver mais orientações em (Barbetta, 2008, p. 34-36).
Pré-teste (Questionário piloto) • Refere-se à aplicação prévia do questionário a um
grupo que apresente as mesmas características da população incluída na pesquisa. Serve para:
• Revisar e direcionar aspectos da investigação • Treinar os entrevistadores e analisar os problemas
apresentados durante sua consecução. • Detectar as dificuldades práticas do questionário• Situações em que pouco se conhece sobre o
assunto• Analisar as categorias OUTROS e NÃO SABE
Que programas de televisão o Sr.(a) prefere?
Evidentemente, devem ser acrescentadas novascategorias, tais como novelas, filmes etc. Noquestionário definitivo, a categoria OUTROS deveestar reduzida a uma frequência mínima.
Pré-testePode ser aplicado mais de uma vez, tendo emvista o seu aprimoramento, serve também paraverificar se o questionário apresenta trêsimportantes elementos:
• Fidedignidade: qualquer pessoa que o aplique obterá sempre os mesmos resultados;• Validade: os dados recolhidos são necessários à pesquisa;• Operatividade: vocabulário acessível e significado claro.
4/18/2012
11
1. Quantos dias transcorreram entre a encomenda da mercadoria e seu recebimento? _________ dias.
2. Essa foi sua primeira compra na JEFX? ( ) Sim ( ) Não
3. Você está propensa a adquirir novos produtos da JEFX, durante os próximos 12 meses? ( ) Sim ( ) Não
Perguntas
próximos 12 meses? ( ) Sim ( ) Não
4. Como você classifica o serviço prestado pela JEFX com relação à sua compra recente?( ) Excelente ( ) Muito bom ( ) Regular ( ) Precário
5. Como você classifica a qualidade dos itens que você adquiriu recentemente da JEFX?( ) Excelente ( ) Muito bom ( ) Regular ( ) Precário
EXEMPLO DE PROJETO DE PESQUISA
• Objetivo geral: Conhecer a relação entre o aluno e oseu curso (de Ciências da Computação da UFSC), paraservir de subsídio nas políticas de melhoria do curso.
• Objetivos específicos:
1) Avaliar o nível de satisfação do aluno com o curso que está realizando.
2) Verificar se existe associação entre o nível de satisfação do aluno com o seu desempenho no curso.
3) Levantar os aspectos positivos e negativos do curso, na visão do aluno.
EXEMPLO DE PROJETO DE PESQUISA
• População: Estudantes que estavam cursando as trêsúltimas fases do curso de Ciências da Computação daUFSC, semestre 2011/1.
• Amostra: Optou-se por um processo rápido e fácil paraa seleção da amostra. Foram tomadas três disciplinasç pobrigatórias das três últimas fases e aplicou-se oquestionário em sala de aula. A amostra foi, então,formada pelos alunos presentes nos dias de aplicaçãodos questionários.
Exercício 4. Suponha que o diretor de pesquisa de mercado de uma grandecadeia de lojas de departamentos desejasse conduzir uma pesquisa em umaárea metropolitana para determinar a quantidade de tempo que mulheres quetrabalham fora gastam comprando roupas, em um mês típico.a. Descreva a população e a amostra de interesse, e indique o tipo de
dados que o diretor desejaria coletar.b. Desenvolva um primeiro esboço de questionário necessário em (a),
redigindo três perguntas categóricas e três perguntas numéricas que você acredita apropriadas para essa pesquisa.
E í i 5 U i i t l li d j t 53 000 (NExercício 5. Uma pesquisa virtual realizada junto a quase 53.000 pessoas (N.Hellmich, “Americans go for the quick fix for dinner”, USA Today, 14 fev2005, p. B1) indicou que 37% decidem no último minuto o que fazer parao jantar em casa e que o montante de tempo necessário para preparar ojantar gira em torno de 12 minutos, enquanto o montante de temponecessário para cozinhar o jantar é em média 28 minutos.
a. Qual dentre as quatro categorias de fontes de dados foi utilizada neste estudo?
b. Apresente uma variável categórica discutida neste artigo.c. Apresente uma variável numérica discutida neste artigo.
Exercício 6 (Pesquisa). O Instituto Gallup apresenta os resultados depesquisas recentes em seu endereço http://galluppoll.com. Vá a esseendereço e leia a principal análise feita no dia de sua leitura.a. De um exemplo de variável categórica encontrada na pesquisa.b. De um exemplo de variável numérica encontrada na pesquisa.
Respostas dos exercícios1. 1) qualitativa nominal, 2) quantitativa discreta, 3) quantitativa contínua, 4) qualitativa
nominal, 5) quantitativa contínua, 6) qualitativa nominal, 7) quantitativa contínua, 9) qualitativa ordinal 10) quantitativa discreta 11) quantitativa discreta 12) quantitativaqualitativa ordinal, 10) quantitativa discreta, 11) quantitativa discreta, 12) quantitativa discreta, 13) quantitativa discreta, 14) quantitativa contínua.
2. a) categórica nominal, b) categórica ordinal, c) numérica contínua, d) numérica discreta
3. a) Pois podem haver valores tanto na forma R$ 1200 (aproximados e sem centavos), quanto R$ 985,67 (exatos e com centavos). b) O primeiro se o questionário fosse anônimo (possibilitando respostas mais precisas) e a segunda se houvesse identificação do respondente (usando faixas por salários mínimos). c) O primeiro formato, pois a quantidade de respostas é infinita.
5. a) Pesquisa de levantamento ou survey, b) Decidir fazer o jantar no último minuto. c) A quantidade de tempo necessária para preparar o jantar.
Referência: Cap. 1 de Levine, Stephan, Krehbiel, Berenson. Estatística: usando o Microsoft Excel em português. 5 ed., p. 8-15, LTC.
AMOSTRAGEM
Amostragem é o processo de se obter uma amostra. A pesquisa eleitoral é um caso típico de levantamento por amostragem.
Fonte: Barbetta (2009) • Por que realizar amostragem em levantamentos de grandes populações?
Economia. Em geral, torna-se bem mais
econômico o levantamento de somente uma parte da população.
Tempo. Numa pesquisa eleitoral, a três dias de uma eleição presidencial, não haveria tempo suficiente para pesquisar toda a população de eleitores do país, mesmo que houvesse recursos financeiros em abundância.
Confiabilidade dos dados. Quando se pesquisa um número reduzido de elementos, pode-se dar mais atenção aos casos individuais, evitando erros nas respostas.
Operacionalidade. É mais fácil realizar operações de pequena escala. Um dos problemas típicos nos grandes censos é o controle dos entrevistadores.
• Quando o uso de amostragem não é
interessante?
População pequena. Se a população for
pequena (digamos, de 50 elementos) para termos uma amostra capaz de gerar resultados precisos para os parâmetros da população, necessitamos de uma amostra relativamente grande (em torno de 80% da população).
Característica de fácil mensuração. Talvez a população não seja tão pequena, mas a variável que se quer observar é de tão fácil acesso que não compensa investir num plano de amostragem. Por exemplo, para verificar a porcentagem de funcionários favoráveis à mudança no horário de um turno de trabalho,
podemos entrevistar toda população no próprio local de trabalho.
Necessidade de alta precisão. A cada dez anos o IBGE realiza um censo demográfico para estudar diversas características da população brasileira. Dentre estas, tem-se o parâmetro número de habitantes residentes no país, que é fundamental para o planejamento por parte do governo. Desta forma, este parâmetro precisa ser avaliado com grande precisão e, por isso, se pesquisa toda população.
TIPOS DE AMOSTRAGEM
Existem dois tipos de amostragem, a probabilística e a não probabilística.
AMOSTRAGEM PROBABILÍSTICA
A – Amostragem Aleatória Simples (AAS) ou
Casual
No início deste processo todos os elementos da população têm a mesma probabilidade de fazer parte da amostra.
É equivalente a um sorteio lotérico. Pode ser feita mediante sorteio manual, uso de tabela de números aleatórios ou com o auxílio de programa computacional que gere números aleatórios. B – Amostragem Estratificada
Existem casos em que a população pode ser dividida em grupos que são homogêneos internamente e heterogêneos entre si. Estes grupos bem definidos são denominados de estratos. O sorteio das unidades que farão parte da amostra é efetuado em cada um dos estratos com o uso da amostragem aleatória simples (sorteio).
Situação exemplar: Pesquisa com o público do IFMT/Cuiabá: existem os seguintes estratos bem definidos: Docentes, Técnicos e Estudantes. Caso 1: Amostragem estratificada proporcional
Neste caso, a proporcionalidade do tamanho de cada estrato da população é mantida na amostra. Por exemplo, se um estrato corresponde a 30% da população, ele deve corresponder também a 30% da amostra.
Uma amostragem estratificada proporcional tende a favorecer resultados mais precisos do que uma amostragem aleatória simples quando os subgrupos forem mais homogêneos do que a população como um todo.
JefersonTypewritten Text12
Caso 2: Amostragem estratificada uniforme
Nesta, seleciona-se a mesma quantidade de elementos em cada estrato. No exemplo anterior, para selecionar uma amostra estratificada uniforme de, por exemplo, n = 15 indivíduos do IFMT/Cuiabá, devemos ter 5 Docentes, 5 Técnicos e 5 Estudantes.
A amostragem estratificada uniforme costuma ser usada em situações em que o maior interesse é obter estimativas separadas para cada estrato, ou ainda, quando se deseja comparar os diversos estratos. Assim, os cálculos de médias e proporções devem ser feitos em cada estrato. Caso queira uma média ou proporção global, deve-se agregar os resultados de cada estrato por uma média aritmética ponderada, levando-se em consideração a proporcionalidade de cada estrato na população. C – Amostragem por conglomerados
Consiste em definir uma subpopulação (parte da população que possui suas características gerais) e analisar todas as unidades ali presentes. Por exemplo, numa população de domicílios residenciais de uma cidade, os quarteirões formam conglomerados de domicílios. Então, são selecionados alguns conglomerados e depois investigam todos os elementos do conglomerado.
Ela pode ser feita em vários estágios, em pesquisas de larga escala. Exemplo: “para
selecionar uma amostra de domicílios de Santa Catarina, podemos selecionar municípios (primeiro estágio); dos municípios escolhidos, selecionar setores censitários (segundo estágio); e dos setores censitários escolhidos, selecionar domicílios (terceiro estágio)” (Barbetta, 2009).
Ao contrário da amostragem estratificada, esta tende a produzir uma amostra que gera resultados menos precisos quando comparada com uma amostra aleatória simples de mesmo tamanho. Contudo, seu custo benefício tende a ser bem menor. D – Amostragem Sistemática
É uma variação da AAS, usada quando a população está naturalmente ordenada (exemplo: lista telefônica, lista de chamada, banco de dados, disposição das casas em uma rua, etc). O processo consiste em: 1) Calcular o intervalo de amostragem (salto): S =
Nn , aproximando para o número inteiro mais
próximo. 2) Sortear um número X entre 1 e S. 3) Formar a amostra com os elementos:
x; x + a; x + 2a; x + 3a; x + 4a; ...
AMOSTRAGEM NÃO PROBABILÍSTICA
A – Amostragem Acidental
A amostra é formada por elementos que vão aparecendo no local da coleta de dados. Geralmente utilizada em pesquisas de opinião. Exemplo: pesquisar a opinião das pessoas que passam em uma determinada praça sobre o uso de cosmético para rugas. B – Amostragem por quotas
Semelhante à amostragem estratificada proporcional, mas não faz sorteio. C – Amostragem por Julgamento ou por Conveniência
Consistem em selecionar a amostra com elementos julgados como típicos da população que se deseja estudar. Exemplo: pesquisar a opinião sobre o uso de cosmético para rugas abordando somente mulheres que aparentam ter idade superior a 40 anos.
ATIVIDADE: Analise o(s) tipo(s) de amostragem utilizada em cada situação a seguir. 1) Para coletar dados sobre a saúde de um rebanho de vacas, seleciona-se por sorteio 2 por cento das vacas. 2) Para saber a opinião dos alunos do curso de Ciências Contábeis da UEL, um pesquisador sorteia uma turma e entrevista todos os alunos da mesma. 3) Para identificar a situação do mercado de cimento de determinada cidade, se obtém a lista de todas as lojas de construção da mesma e se escolhe a oitava de cada vinte lojas, ordenadas alfabeticamente. 4) Desejo saber como vai a popularidade de meu oponente político. Para isso, envio o questionário a vinte de meus amigos. 5) Quando escreveu Woman in Love: A Cultural Revolution, a autora Shere Hite baseou suas conclusões em 4.500 respostas de 100.000 questionários distribuídos a mulheres, segundo sua percepção de respostas melhores. 6) Uma psicóloga da Universidade de Nova York faz uma pesquisa sobre alguns alunos selecionados aleatoriamente de todas as 20 turmas que participaram desta pesquisa. 7) Um sociólogo da Universidade Federal do Paraná sorteia 12 homens e 12 mulheres de cada uma de quatro turmas de inglês. 8) A empresa Sony seleciona cada 200º. CD de sua linha de produção e faz um teste de qualidade rigoroso. 9) Um cabo eleitoral escreve o nome de cada senador dos EUA em cartões separados, mistura-os e extrai 10 nomes aleatoriamente. 10) Gerente comercial da America OnLine testa uma nova estratégia de vendas selecionando aleatoriamente 250
JefersonTypewritten Text13
consumidores com renda inferior a US$50.000,00 e 250 consumidores com renda de ao menos de US$50.000,00. 11) O programa Planejamento Familiar sorteia e pesquisa 500 homens e 500 mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais. 12) Um repórter da revista Business Week entrevista todo o 50.º gerente geral constante da relação das 1.000 empresas com maior cotação de suas ações. 13) Um repórter da revista Business Week obtém uma relação numerada das 1.000 empresas com maior cotação de ações na bolsa, utiliza um computador para gerar 25 números aleatórios e então entrevista gerentes gerais das empresas correspondentes aos números extraídos. 14) Um pesquisador precisa saber o estado de saúde bucal dos habitantes de uma cidade. Para isso, divide-a em regiões com características homogêneas internamente e heterogêneas entre si, e entrevista 5% dos habitantes de cada região, selecionados aleatoriamente dentro de cada região. 15) Um repórter de noticiário da rede Globo analisa a reação a uma história impressionante entrevistando pessoas que passam em frente ao seu estúdio. 16) O comissário de jurados do Condado de Dutches obtém uma lista de 42.763 proprietários de carros e obtém um conjunto de jurados selecionando cada centésimo nome da lista. 17) Em uma pesquisa do Gallup de 1059 adultos, os sujeitos da entrevista foram selecionados usando-se um computador para gerar aleatoriamente números de telefones, que eram então discados. 18) Uma pesquisadora da General Motors dividiu todos os carros registrados em categorias de subcompacto, compacto, médio, intermediário e grande. Ele está sorteando e pesquisando 200 proprietários de carro de cada categoria. 19) Motivado pelo fato de um estudante ter morrido por excesso de bebida, uma faculdade fez um estudo do hábito de bebida dos estudantes, selecionando aleatoriamente 10 classes diferentes e entrevistando todos os estudantes em cada uma dessas classes. 20) Em um ponto de checagem de sobriedade da polícia, cada quinto chofer era parado e entrevistado. 21) Um economista está estudando o efeito da educação sobre o salário e realiza uma pesquisa com 150 trabalhadores selecionados aleatoriamente de cada uma das seguintes categorias: menos do que Ensino Médio; Ensino Médio; mais do que Ensino Médio. 22) Uma rede de notícias está planejando uma pesquisa na qual 100 seções eleitorais serão selecionadas aleatoriamente e todos os eleitores serão entrevistados ao deixarem o local. 23) Um estudante de estatística obtém dados sobre altura/peso entrevistando membros da família. 24) Um pesquisador da UEL examina todos os pacientes cardíacos de cada um dos 30 hospitais selecionados aleatoriamente.
25) Um especialista em Marketing para a MTV está planejando uma pesquisa na qual 500 pessoas serão selecionadas aleatoriamente de cada faixa etária de 10-19, 20-29, e assim por diante. 26) Um farmacêutico mistura bem um recipiente com 1000 comprimidos de Bufferin e retira, então, 50 que devem ser testados para verificar o conteúdo exato de aspirina. 27) Um repórter de notícias se coloca em uma esquina e obtém uma amostra de residentes da cidade selecionando cinco adultos que passam e perguntando sobre seus hábitos de fumo. 28) Um engenheiro de controle da qualidade seleciona cada centésima fonte de computador que passa em uma esteira transportadora. 29) O shopping do Vale planeja realizar uma pesquisa de mercado com 100 homens e 100 mulheres em Cachoeirinha, a qual possui um número aproximadamente igual de homens e mulheres. 30) Uma loja de construção classificou toda sua carteira de clientes como compradores de pequeno, médio e grande porte, contabilizando 450, 750 e 300 clientes, respectivamente. Em seguida, sorteou e pesquisou 30, 50 e 20 clientes de cada categoria, respectivamente.
Uma fórmula para calcular o tamanho mínimo da
amostra
Sejam : N o tamanho (número de elementos) da população; n o tamanho (número de elementos) da amostra; n0 uma primeira aproximação para o tamanho da amostra E0 o erro amostral tolerável. Um primeiro cálculo do tamanho da amostra pode ser feito, mesmo sem conhecer o tamanho da população, através da seguinte expressão:
2
0
0
1
En
Conhecendo o tamanho N da população, podemos
corrigir o cálculo anterior, por:
0
0.
nN
nNn
Interpretação do Erro Amostral
Na divulgação de pesquisas eleitorais, é comum encontrarmos no relatório: “a presente pesquisa tolera
um erro de 2%”. Isto quer dizer que quando a pesquisa
aponta determinado candidato com 30% de preferência do eleitorado, está afirmando que a preferência por este candidato em toda população é um valor do intervalo de 28% a 32% (isto é, 30% 2%).
JefersonTypewritten Text14
Respostas: 1) AAS 2) Conglomerado 3) Sistemática 4) Julgamento 5) Julgamento 6) AAS 7) Estratificada unif. 8) Sistemática 9) AAS 10) Estratificada unif. 11) Estratificada unif. 12) Sistemática 13) AAS 14) Estratificada unif. 15) Acidental 16) Sistemática 17) AAS 18) Estratificada unif. 19) Conglomerado 20) Sistemática 21) Estratificada unif. 22) Conglomerado 23) Julgamento 24) Conglomerado 25) Estratificada unif. 26) AAS 27) Julgamento 28) Sistemática 29) Cotas 30) Estratificada proporcional.
Atenção:
“O cálculo do tamanho da amostra é um problema complexo e [...] ficaremos restritos ao caso da amostragem
aleatória simples. Também não abordaremos aspectos financeiros, mesmo sabendo que muitas vezes o tamanho da amostra fica restrito aos recursos disponíveis. A heterogeneidade da população e os tipos de parâmetros que se quer estimar (proporções, médias, etc) são pontos importantes na determinação do tamanho da amostra. Esses pontos entrarão em fórmulas mais refinadas [posteriormente nesta disciplina]. Ficaremos restritos a uma formulação bastante genérica, usada em pesquisas em que queremos usar a amostra para estimar diversas proporções (ou porcentagens)” (Barbetta, 2008, p. 57). Conceito de erro amostral
Parâmetro é uma medida que descreve certa característica da população. Estatística (ou estimador) é uma medida que descreve certa característica da amostra. Uma estatística é usada para avaliar ou estimar um parâmetro. Exemplo:
Na população de trabalhadores em uma obra, a porcentagem de trabalhadores com graduação é o parâmetro π. Numa amostra de trabalhadores de uma obra, a porcentagem de trabalhadores com graduação é a estatística P Assim, P é um estimador do parâmetro π. Erro amostral é a diferença entre a estatística e o parâmetro que se quer estimar.
“Para a determinação do tamanho da amostra, o pesquisador precisa definir o erro amostral tolerável, ou seja, quanto ele admite errar na avaliação do(s) parâmetro(s) de interesse. Por exemplo, na divulgação de pesquisas eleitorais, é comum encontrarmos no relatório: “a presente pesquisa tolera um erro de 2%”. Isto quer dizer que
quando a pesquisa aponta determinado candidato com 30% de preferência do eleitorado, está afirmando que a preferência por este candidato em toda população é um valor do intervalo de 28% a 32% (isto é, 30% 2%).
A especificação do erro amostral tolerável deve ser feita sob um enfoque probabilístico, pois, por maior que seja a amostra, existe o risco de o sorteio gerar uma amostra com características bem diferentes das características da população de onde ela está sendo extraída. Consideraremos o nível de confiança de 95%. Assim, se fixarmos o erro amostral em 2% estaremos afirmando que uma estatística, calculada com base na amostra a ser selecionada, não deve diferir do parâmetro em mais do que 2%, com 95% de probabilidade.”
(Barbetta, 2008, p. 57-58).
JefersonTypewritten Text15
Exemplo 01: Deseja-se fazer um levantamento por amostragem para avaliar certas características da população das N = 15.000 alunos do IFMT. Qual deve ser o tamanho mínimo de uma amostra aleatória simples, de maneira que possamos admitir com alta confiança, que os erros amostrais não ultrapassem 2% (E0 = 0,02)?
RESOLUÇÃO
– Uma primeira aproximação: n0 = 2) 0,02 (1 =
0004,0
1 = 2.500 alunos.
– Fazendo a correção, em função do tamanho da população, teremos:
n = 2.143 2.500 15.000
2.500 x 000.15
alunos .
– Para manter o erro amostral, foi necessária uma amostra abrangendo 14,3% da população (2.143 elementos extraídos de 15.000).
OBSERVAÇÃO: De uma maneira geral, se a população for muito grande, podemos usar o n0 como o tamanho da amostra. Então, o cálculo do tamanho da amostra pode ser feito pela expressão:
n = n0 = 20
1
E
sem levar em consideração o tamanho da população. Exercício: Complete a tabela abaixo calculando o tamanho mínimo da amostra.
Tabela. Tamanho mínimo de amostra calculado para uma margem de erro de 3% e 5%.
POPULAÇÃO
(N)
TAMANHO MÍNIMO DA AMOSTRA (n)
MARGEM DE ERRO
3%
MARGEM DE ERRO
5%
100 1.000 5.000 20.000 100.000 500.000
1.000.000 Resposta: 3%: 92, 527, 910, 1053, 1099, 1109, 1110, ; 5%: 80, 286, 371, 393, 399, 400, 400
JefersonTypewritten Text16
4/18/2012
17
Distribuição de frequências e Tabelas
Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior
Secretariado Executivo (Bacharelado)Secretariado Executivo (Bacharelado)5º semestre 5º semestre -- NoturnoNoturno
N Estado CivilGrau de
InstruçãoNo de filhos
Salário(x s.mínimo) idade
Região de Procedência
1 solteiro fundamental - 2,00 26 interior2 casado fundamental 0 2,56 32 capital3 casado fundamental 2 3,25 36 capital4 solteiro médio - 3,73 20 outra5 solteiro fundamental - 2,26 40 outra6 casado fundamental 1 4,66 28 interior7 solteiro fundamental - 2,86 41 interior8 solteiro fundamental - 2,39 43 capital9 casado médio 1 4,59 34 capital
Perfil dos funcionários da empresa JEFX, Cuiabá, em Abril/2011
10 solteiro médio - 4,44 23 outra11 casado médio 2 4,12 33 interior12 solteiro fundamental - 2,46 27 capital13 solteiro médio - 5,74 37 outra14 casado fundamental 3 2,95 44 outra15 casado médio 0 4,13 30 interior16 solteiro médio - 5,35 38 outra17 casado médio 1 6,77 31 capital18 casado fundamental 2 3,8 39 outra19 solteiro superior - 10,53 25 interior20 solteiro médio - 6,76 37 interior21 casado médio 1 5,06 30 outra22 solteiro médio - 4,59 34 capital
Como pesquisadores procedem para transformar essa massa de dados em uma forma resumida e de maior facilidade de
compreensão?compreensão?
Um primeiro modo é construir distribuições de frequência, ou seja, tabelas.
Etapas da construção de distribuição de frequências
1º – Definir as classes disjuntas (intervalos ou categorias) em que os dados serão agrupados; 2º – Enquadramento dos dados nessas classes; 3º – Contagem do número de elementos em cada classe.
Exercício:
Vamos construir Distribuições de frequências
para cada variável dopara cada variável do Banco de Dados a seguir.
1º para variáveis qualitativas2º para variáveis quantitativas
N Estado CivilGrau de
InstruçãoNo de filhos
Salário(x s.mínimo) idade
Região de Procedência
1 solteiro fundamental - 2,00 26 interior2 casado fundamental 0 2,56 32 capital3 casado fundamental 2 3,25 36 capital4 solteiro médio - 3,73 20 outra5 solteiro fundamental - 2,26 40 outra6 casado fundamental 1 4,66 28 interior7 solteiro fundamental - 2,86 41 interior8 solteiro fundamental - 2,39 43 capital9 casado médio 1 4,59 34 capital10 solteiro médio - 4,44 23 outra11 casado médio 2 4 12 33 interior
Perfil dos funcionários da empresa JEFX, Cuiabá, em Abril/2011
11 casado médio 2 4,12 33 interior12 solteiro fundamental - 2,46 27 capital13 solteiro médio - 5,74 37 outra14 casado fundamental 3 2,95 44 outra15 casado médio 0 4,13 30 interior16 solteiro médio - 5,35 38 outra17 casado médio 1 6,77 31 capital18 casado fundamental 2 3,8 39 outra19 solteiro superior - 10,53 25 interior20 solteiro médio - 6,76 37 interior21 casado médio 1 5,06 30 outra22 solteiro médio - 4,59 34 capital23 solteiro médio - 5,74 37 outra24 casado fundamental 3 2,95 44 outra25 casado médio 0 4,13 30 interior
4/18/2012
18
Distribuição de Variáveis contínuas
Analisando a variável Salário
As classes não são dadas, então temos que calcular :
(n < 30)
(n > 30)
Exercício 1: Construa uma distribuição de frequenciapara o consumo anual de papel (em toneladas) de 50empresas em Cuiabá:
Resposta: Distribuição de frequência completaResposta: Distribuição de frequência completa
20 23 25 26 26 27 28 29 30 3030 31 31 32 32 33 33 34 34 3435 35 36 36 40
Exercício 2: Construa uma distribuição de frequênciacom os dados das idades dos funcionários de umaempresa:
Exercício 3: A reforma na sede da empresa JEFX temocasionado transtorno no trânsito, pois bloqueia parte da ruapara o descarregamento de um caminhão. Em cada dia queisto ocorria, era anotado o número de horas de obstrução darua:
2 1 3 2 3 5 3 1 2 61 4 3 1 3 1 5 3 4 42 1 3 1 2 2 1 2 2 1
a) Construa uma distribuição de frequência com 6 classes. b) Em quantos dias houve mais de 4 horas de obstrução?c) Em quantos dias houve exatamente 2 horas de obstrução?d) Em quantos dias houve mais de 2 e menos de 6 horas de
obstrução?
2 1 3 1 2 2 1 2 2 11 1 1 2 4 5 3 4 3 43 3 5 2 1 6 1 2 4 6
Exercício 4: Os valores a seguir representam o númerode clientes de 40 empresas.
62 63 48 66 69 54 70 66 64 6559 75 55 63 71 72 70 57 76 5757 65 58 58 60 58 63 65 64 7850 68 66 69 52 70 72 65 62 64
Utilize o símbolo “|⎯” que significa que o intervalo é fechadono extremo inferior e aberto no superior.a) Construir uma distribuição de frequência adequada.b) Encontrar a frequência acumulada crescente e o ponto
médio para todas as classes.
Exercício 5: No rol abaixo estão as receitas brutas 50empresas (em milhões de reais).
1,2 1,8 3,3 3,3 3,4 3,6 3,7 3,7 3,9 4,24,3 4,8 4,9 5,4 5,4 5,5 5,5 5,6 5,8 6,06,3 6,5 6,6 6,3 6,3 6,9 6,1 6,4 8,5 8,58,9 9,4 9,5 9,7 10,0 10,2 10,5 11,0 11,5 11,6
Construa a distribuição de frequência completa para os dadosacima. Utilize o símbolo “|⎯” que significa que o intervalo éfechado no extremo inferior e aberto no superior.
12,6 12,8 13,4 13,9 14,1 16,6 17,0 17,2 19,8 22,9
4/18/2012
19
Tabelas (ou Séries)
Tabelas
Elementos essenciais
• Título – indica a natureza do fato estudado(o quê?), o local (onde?) e a época( q ) ( ) p(quando?).• Corpo – é o conjunto de linhas e colunas quecontém as informações.• Cabeçalho – designa a natureza doconteúdo de cada coluna.• Coluna indicadora – mostra a natureza doconteúdo de cada linha.
Tabelas TabelasSinais Convencionais
- (hífen), quando o valor numérico é nulo;
... (reticência), quando não se dispõe do dado;... (reticência), quando não se dispõe do dado;
0; 0,0; 0,00 (zero), quando o valor numérico é muito pequeno para ser expresso pela unidade utilizada, respeitando o número de casas decimais adotado;
Nenhuma casela da tabela deve ficar em branco,apresentando sempre um número ou sinal.
Tabelas
RODAPÉ
• Fonte – é o indicativo da entidade responsável pela sua organização ouresponsável pela sua organização ou fornecedora dos dados primários.• Notas – são colocadas para esclarecimentos de ordem geral.• Chamadas – servem para esclarecer minúcias em relação às “caselas”, colunas ou linhas.
EXCESSO!EXCESSO!
4/18/2012
20
Tipos de Tabelas (ou Séries)
CronológicaGeográficaCategórica
Dupla entrada
CRONOLÓGICA
Ano Quantidade de funcionários
2006 41
Número de funcionários da empresaJEFX, Cuiabá (2006-2010)
2006 412007 462008 552009 702010 83
Fonte: Dados fictícios.
GEOGRÁFICA
Município População (hab.)Cuiabá 530 308
População de cidades de Mato Grosso em 2010
Cuiabá 530.308Várzea Grande 248.130Rondonópolis 189.975
Sinop 111.643Fonte: IBGE.
CATEGÓRICA
Superior Tecnlógico Valor (R$)
1 Secretariado 1167,312 Construção Civil 1000,623 Mecânica 972 46
Cursos com melhores bolsas-auxílio no Brasil - 2011
3 Mecânica 972,464 Comércio Exterior 893,355 Processos Gerais 873,096 Informática 841,957 Sistemas de informação 813,008 Gestão de Qualidade 807,559 Marketing 786,1310 Design 742,80
Fonte: Núcleo Brasileiro de Estágios - Nube. "Valores pagos aos estagiários do Brasil". 2011.Acesso em http://www.abres.org.br/v01/stats/
CATEGÓRICA
Nível de escolaridade completo Percentual
Nenhum 5Ensino fundamental 10
Ensino Médio 40
Nível de escolaridade de funcionários na empresa JEFX (Cuiabá, 2011)
Ensino Médio 40Superior 20
Especialização 10Mestrado 5Doutorado 5
Pós-doutorado 0Outros 5Total 100
Fonte: Dados fictícios.
População de cidades do Mato Grosso em 2000 e 2010.
TABELA DE DUPLA ENTRADA
Município 2010 2000
Fonte: IBGE.
Cuiabá 530.308 483.346Várzea Grande 248.130 215.298Rondonópolis 189.975 150.227
Sinop 111.643 74.831Cáceres 83.631 85.857
4/18/2012
21
Dados sobre estágio de nível superior no Brasil por regiões (2010)
TABELA DE DUPLA ENTRADA
Fonte: ABRES disponível em http://www.abres.org.br/v01/stats/
Exercício
Classifique cada uma das tabelas a seguirem cronológica, geográfica, categórica oudupla entradadupla entrada.
Tabela 1 Tabela 2
Geração de vagas formais na área de Secretariado Executivo
Tabela 3
Fonte: Dados fictícios.
Tabela 4
4/18/2012
22
Tabela 5
Taxa de homicídios (2005)
Estado QuantidadeMinas Gerais 4 087
Número de divórcios em 2011 no Sudeste do país
Tabela 6
Minas Gerais 4.087Espírito Santo 746Rio de Janeiro 2.492
São Paulo 8.468Fonte: Dados fictícios.
Superior Valor (R$)
1 Economia 1.089,572 Engenharia 1.053,403 Secretariado Exec Trilíngue 1 009 53
Cursos com melhores bolsas-auxílio no Brasil - 2011
Tabela 7
3 Secretariado Exec.Trilíngue 1.009,534 Agronomia 1.007,255 Comércio Exterior 989,566 Arquitetura 964,937 Química 964,238 Ciências Atuarias 956,619 Estatística 949,07
10 Rel.Internacionais 942,75Fonte: Núcleo Brasileiro de Estágios - Nube. "Valores pagos aos estagiários do Brasil". 2011.Acesso em http://www.abres.org.br/v01/stats/
Tabela 8
4/18/2012
23
Gráficos estatísticos
Prof. Prof. MscMsc. Jeferson Gomes . Jeferson Gomes MorielMoriel JuniorJunior
Secretariado Executivo (Bacharelado)Secretariado Executivo (Bacharelado)5º semestre 5º semestre -- NoturnoNoturno
Gráficos
• Além da apresentação de sériesestatísticas na forma tabular (tabelas),podemos representá-las graficamente.
• O gráfico constitui um elemento básico naanálise e apresentação dos trabalhosestatísticos, trabalhos estes queencontramos nas mais diversas áreas.
1. Elementos de um gráfico2. O que não fazer num gráfico!3. Principais tipos de gráfico4. Qual gráfico usar?5. Construindo gráficos (manualmente)
1. Elementos de um gráficog
• O gráfico deverá possuir:
- Título geral indicando “o que”, “quando” e“onde” da situação estudada;
- as escalas e as respectivas unidades dedidmedida;
- fonte de informação de onde foram retiradosos valores;
- legendas e notas, quando necessário.
Umidade do ar de Natal/RN (2001 a 2003)
(%)
4/18/2012
24
• Os gráficos são úteis para apresentarinformações com:
Simplicidade Conter somente o essencial
ClarezaPossibilitar “boa” compreensão e ser autoexplicativo
VeracidadeCorresponder à realidade pesquisada
2. O que não fazer num gráficoq g
Quatro mandamentos
Não poluirásNão poluirás.Não distorcerás.
Não perspectivarás.Não ocultarás.
Quatro mandamentos
Não poluirásNão poluirás.Não distorcerás.
Não perspectivarás.Não ocultarás.
Quatro mandamentos
Não poluirásNão poluirás.Não distorcerás.
Não perspectivarás.Não ocultarás.
4/18/2012
25
Umidade do ar de Natal/RN (2001 a 2003)
As variações mensais da umidade do ar nos três anosparecem acontecer de forma bem suave (lenta)...Uma escala inadequada para o gráfico pode confundiro leitor.
Umidade do ar de Natal/RN (2001 a 2003)
• Recomenda-se que o gráfico possua um formatoaproximadamente quadrado.
REFRIGERANTES PREFERIDOS DE 950CRIANÇAS DA ESTÔNIA (2001)
500
Qtde de
FONTE: Dados fictícios.
250
0
e crianças
Marca de refrigerante
Quatro mandamentos
Não poluirásNão poluirás.Não distorcerás.
Não perspectivarás.Não ocultarás.
QUANTIDADE DE USUÁRIOS DO ORKUT EM 2008
110
120
130
140
150
Índices da Indústria.
1975
1976
1977
1978
1979
1980
1981
1982
1983
1984
90
100
Emprego Produção
FONTE: Braule, R. 2001.
4/18/2012
26
Quatro mandamentos
Não poluirásNão poluirás.Não distorcerás.
Não perspectivarás.Não ocultarás.
Quantidade de açúcar nos cereais para crianças (Mercado brasileiro - 2000).
Errado! Pode induzir a uma interpretação distorcida
Quantidade de açúcar nos cereais para crianças (Mercado brasileiro - 2000).
Um gráfico, construído para mostrar grandezas absolutas,deverá ter uma linha zero claramente definida e uma escala dequantidades ininterrupta.
Consumo de cimento no Sudeste do Brasil (1992)
MG
? ? ?MGESRJSP
?
Quatro mandamentos
Não poluirás.Não distorcerás.
Não perspectivarás.ão pe spec a ásNão ocultarás.
Para ver mais usos indevidos de gráficos e questões éticas consultar Seção 2.6 (p.56) de Levine, Stephan, Krehbiel, Berenson. Estatística: usando o Microsoft Excel em português. 5 ed. LTC.
3. Principais tipos de gráficop p g
4/18/2012
27
• Podemos dividir os gráficos em grupos:
• os cartogramas;g ;• os pictogramas;• os estereogramas e• os diagramas.
• Cartograma - Mapa ou quadro em que, pormeio de pontos, figuras e linhas,previamente convencionados sepreviamente convencionados, serepresenta um fenômeno quanto à sua áreade ocorrência, importância, movimentaçãoe evolução.
Censo 2010 sobre população brasileira
• Pictograma – constitui um dos processosgráficos que melhor fala ao público, pelasua forma ao mesmo tempo atraente esua forma ao mesmo tempo atraente esugestiva. A representação gráfica constade figuras.
REFRIGERANTES PREFERIDOS DE 950CRIANÇAS DA ESTÔNIA (2001)
500
Qtde de
FONTE: Dados fictícios.
250
0
e crianças
Marca de refrigerante
4/18/2012
28
• Estereograma - representa volumes e éapresentado em três dimensões sendo,portanto necessário algum conhecimentoportanto, necessário algum conhecimentode perspectiva.
• Diagrama é um gráfico geométrico disposto emduas dimensões.
• São os gráficos mais usados.• Apresentam uma grande variedade de tipos,
dentre os quais estudaremos:
Gráfico de curvas;Gráfico de curvas; Gráfico de barras;
Gráfico de colunas;Gráfico de setores;
Histogramas;Polígono de frequência e Box plot (posteriormente).
Gráfico de curvas
Evidencia como o fenômeno está crescendo oudecrescendo em um período de tempo.
600 000
800.000
1.000.000
1.200.000
e(e
mre
ais)
Faturamento mensal da Indústriade Mato Grosso (1980-2010)
0
200.000
400.000
600.000
1.975 1.980 1.985 1.990 1.995 2.000 2.005 2.010 2.015
Fatu
ram
ente
AnoFonte: Dados fictícios
4/18/2012
29
MATO GROSSO
Ano Faturamento
1.980 395.7901.981 442.5821.982 201.3461.983 216.2881.984 208.4701.985 267.1671.986 286.6321.987 299.0621.988 348.9171.989 370.5711.990 340.6241.991 315.2521.992 300.1811.993 337.269
600.000
800.000
1.000.000
1.200.000
ento
(em
reai
s)
Faturamento mensal da Indústria de MatoGrosso (1980-2010)
1.994 417.3011.995 370.8691.996 440.2631.997 480.3421.998 498.6381.999 540.0862.000 572.8742.001 639.8922.002 718.8832.003 668.5752.004 716.6822.005 737.6342.006 701.5482.007 840.9012.008 994.9572.009 998.4652.010 1.095.492
0
200.000
400.000
1.970 1.980 1.990 2.000 2.010 2.020
Fatu
ram
e
Ano
Gráfico de Barras/Colunas
• Tem por finalidade comparar grandezas,por meio de retângulos de igual largura,porém de alturas proporcionais aos dadosporém de alturas proporcionais aos dados.
Barras (vertical)Colunas (horizontal)
Ônibus
Outros
rans
port
eModo como os empregados de uma empresa deCuiabá vão ao trabalho – Jun/2000
0% 20% 40% 60% 80% 100%
Bicicleta
Divide carro
Percentual
Mei
o de
tr
superior
nsin
o
Escolaridade dos trabalhadores da empresa JEFX,Cuiabá, em Set./2011
0% 10% 20% 30% 40% 50% 60%
fundamental
médio
Nív
elde
e
Cursos com as melhores bolsas-auxílio no Brasil em 2011
800
1000
1200
1400
0
200
400
600
Secretariado Construção Civil
Mecânica Comércio Exterior
Processos Gerais
Informática Sistemas de informação
Gestão de Qualidade
Marketing Design
Fonte: Núcleo Brasileiro de Estágios ‐ Nube. "Valores pagos aos estagiários do Brasil". 2011.
4/18/2012
30
Avaliação do Workshop realizado pela turma X de Secretariado Executivo do IFMT (2011)
25%
30%
35%
40%
45%
entu
al
Fonte: Dados fictícios.
0%
5%
10%
15%
20%
Muito Satisfeito
Pouco Satisfeito
Regular Pouco insatisfeito
Muito insatisfeito
Perc
e
Nível de satisfação
Pra que três gráficos se podemos fazer só um?
139
181
115
166
100
120
140
160
180
200
sde
USD
$
Balança comercial do Brasil (2009-2010)
23 15
-
20
40
60
80
2009 2010
Bilh
ões
Exportações Importações Diferença
300.000
400.000
500.000
600.000
População de cidades de Mato Grosso, 2011
0
100.000
200.000
Cuiabá Várzea Grande
Rondonópolis Sinop Cáceres
População em 2010 População em 2000Fonte: Dados fictícios.
4/18/2012
31
40%50%60%70%80%90%
100%
Médio
Nível de instrução por estrato social (SC/2000)
0%10%20%30%
0%
(Nível B) (Nível C) (Nível E)
Res. Monte Verde Parque da Figueira Encosta do Morro
Localidade
FundamentalNenhum
Gráfico de Setores
• Usado para evidenciar quanto cada parterepresenta no todo, através do uso deum círculoum círculo.
Nível de escolaridade de funcionários da Empresa JEFX, 2011
Nenhum 5% Ensino
fundamental 10%
Especialização
Mestrado 5%
Doutorado 5%
Pós-doutorado 0%
Outros 5%
Fonte: Dados fictícios.
Ensino Médio 40%
Superior 20%
10%
Nenhum 5%
Ensino fundamental 10%
Especialização 10%
Mestrado 5%
Doutorado 5%
Pós-doutorado 0%
Outros 5%
Nível de escolaridade de funcionários da Empresa JEFX, 2011
Ensino Médio 40%
Superior 20%
Fonte: Dados fictícios.
Histograma
• É usado para construir um gráfico a partirde uma distribuição de frequência, ondetemos os intervalos de classe.
• As colunas ficam justapostas (aocontrário do gráfico de colunas) porqueonde termina o primeiro intervalo declasse começa o segundo e assimsucessivamente (variável contínua).
iEstaturas
(cm)fi
12
150 |-- 154154 | 158
49
Tabela. Estaturas de 40 alunos do IFMT/2011
6789
101112
ênci
as
Estaturas de 40 alunos do IFMT/2011
23456
154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174
911853
Dados: Fictícios.
0123456
142 146 150 154 158 162 166 170 174 178 182
Estaturas (cm)
Freq
üê
4/18/2012
32
Representação Gráfica de uma Distribuição de Freqüências
• Podemos representargraficamente a distri-buição de freqüências,ao lado por 3 modos
iEstaturas
(cm)fi
Tabela 5.6 Estaturas de 40 alunos do IFMT/2011
ao lado, por 3 modosdiferentes:
123456
150 |-- 154154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174
4911853
Dados: Fictícios.
• Histograma• Polígono de Freqüência• Polígono de Freqüência Acumulada
iEstaturas
(cm)fi
12
150 |-- 154154 | 158
49
Tabela 5.6 Estaturas de 40 alunos do IFMT/2011
6789
101112
ênci
as
Histograma
23456
154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174
911853
Dados: Fictícios.
0123456
142 146 150 154 158 162 166 170 174 178 182
Estaturas (cm)
Freq
üêi
Estaturas(cm)
fi
12
150 |-- 154154 | 158
49
Tabela 5.6 Estaturas de 40 alunos do IFMT/2011
6789
101112
ênci
as
23456
154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174
911853
Dados: Fictícios.
0123456
142 146 150 154 158 162 166 170 174 178 182
Estaturas (cm)
Freq
üê
Encontremos o Ponto médio de cada intervalo (Xi)
152 156 160 164 168 172
iEstaturas
(cm)fi
12
150 |-- 154154 | 158
49
Tabela 5.6 Estaturas de 40 alunos do IFMT/2011
6789
101112
ênci
as
148 176
23456
154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174
911853
Dados: Fictícios.
0123456
142 146 150 154 158 162 166 170 174 178 182
Estaturas (cm)
Freq
üê
Encontremos o Ponto médio de cada intervalo (Xi)
152 156 160 164 168 172
iEstaturas
(cm)fi
12
150 |-- 154154 | 158
49
Tabela 5.6 Estaturas de 40 alunos do IFMT/2011
6789
101112
ênci
as
148 176
23456
154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174
911853
Dados: Fictícios.
0123456
142 146 150 154 158 162 166 170 174 178 182
Estaturas (cm)
Freq
üê
152 156 160 164 168 172
iEstaturas
(cm)fi
12
150 |-- 154154 | 158
49
Tabela 5.6 Estaturas de 40 alunos do IFMT/2011
6789
101112
ênci
as
Polígono de Freqüência
148 176
23456
154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174
911853
Dados: Fictícios.
0123456
142 146 150 154 158 162 166 170 174 178 182
Estaturas (cm)
Freq
üê
152 156 160 164 168 172
4/18/2012
33
iEstaturas
(cm)fi Fac
12
150 |-- 154154 | 158
49
413
Tabela 5.6 Estaturas de 40 alunos do IFMT/2011
Polígono de Freqüência Acumulada
202428323640
Acu
mul
ada
23456
154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174
911853
1324323740
Dados: Fictícios.
Calculemos a Freqüência Acumulada de cada intervalo (Fac)
048
121620
142 146 150 154 158 162 166 170 174 178 182
Estaturas (cm)
Freq
üênc
ia 20
2428323640
Acu
mul
ada
iEstaturas
(cm)fi Fac
12
150 |-- 154154 | 158
49
413
Tabela 5.6 Estaturas de 40 alunos do IFMT/2011
Polígono de Freqüência Acumulada
048
121620
142 146 150 154 158 162 166 170 174 178 182
Estaturas (cm)
Freq
üênc
ia 2
3456
154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174
911853
1324323740
Dados: Fictícios.
202428323640
Acu
mul
ada
iEstaturas
(cm)fi Fac
12
150 |-- 154154 | 158
49
413
Tabela 5.6 Estaturas de 40 alunos do IFMT/2011
Polígono de Freqüência Acumulada
048
121620
142 146 150 154 158 162 166 170 174 178 182
Estaturas (cm)
Freq
üênc
ia 2
3456
154 |-- 158158 |-- 162162 |-- 166166 |-- 170170 |-- 174
911853
1324323740
Dados: Fictícios.
Exercício. Construa um Gráfico de polígonode frequência e outro de Polígono defrequência acumulada para cada conjuntoq p jde dados a seguir (utilize a frequenciarelativa).
(Observação: se você fez os exercícios da aula de“Distribuição de Frequência e Tabelas” você já fez ametade deste exercício)
Exercício 1: Consumo anual de papel (em toneladas)de 50 empresas em Cuiabá:
Resposta: Distribuição de frequência completaResposta: Distribuição de frequência completa
20 23 25 26 26 27 28 29 30 3030 31 31 32 32 33 33 34 34 3435 35 36 36 40
Exercício 2: Idades dos funcionários de uma empresa:
Exercício 3: A reforma na sede da empresa JEFX temocasionado transtorno no trânsito, pois bloqueia parte da ruapara o descarregamento de um caminhão. Em cada dia queisto ocorria, era anotado o número de horas de obstrução darua:
2 1 3 2 3 5 3 1 2 61 4 3 1 3 1 5 3 4 42 1 3 1 2 2 1 2 2 11 1 1 2 4 5 3 4 3 43 3 5 2 1 6 1 2 4 6
4/18/2012
34
Exercício 4: Os valores a seguir representam o númerode clientes de 40 empresas.
62 63 48 66 69 54 70 66 64 6559 75 55 63 71 72 70 57 76 5757 65 58 58 60 58 63 65 64 7850 68 66 69 52 70 72 65 62 64
Exercício 5: No rol abaixo estão as receitas brutas 50Exercício 5: No rol abaixo estão as receitas brutas 50empresas (em milhões de reais).
1,2 1,8 3,3 3,3 3,4 3,6 3,7 3,7 3,9 4,24,3 4,8 4,9 5,4 5,4 5,5 5,5 5,6 5,8 6,06,3 6,5 6,6 6,3 6,3 6,9 6,1 6,4 8,5 8,58,9 9,4 9,5 9,7 10,0 10,2 10,5 11,0 11,5 11,612,6 12,8 13,4 13,9 14,1 16,6 17,0 17,2 19,8 22,9
4/18/2012
35
4. Que tipo de gráfico usar?p g
• Variável mudando ao longo do tempo:
Gráfico de curvas
• Qualitativa nominal (com poucas categorias)
Gráfico de setores
sim
não
• Qualitativa nominal: (com muitas categorias):
Gráfico Barras/colunas
Os campeões da poluição (volume de dióxido de carbono lançado na atmosfera
desde 1950, em bilhões de toneladas).
050
100150
200
Estad
os U
nidos
China
Bras
il
Gráfico de setores
NÚMERO DE VEÍCULOS MOTORIZADOS REGISTRADOSNO ESTADO DO PARANÁ NO ANO DE 2000.
Barco a Motor, 2,1 %
Moto, 12,9 %
Caminhão multieixos, 2,8 %
Caminhão de 2 eixos, 9,8 %
Minivan, 14,5 %
Carro de passageiro, 57,9 %
• Qualitativa ordinal:(Muitas categorias / Manter a ordem das categorias)
Gráfico Barras/Colunas
0
5
10
15
20
25
30
Muito satisfeito
Pouco satisfeito
Sem opinião Pouco insatisfeito
Muito insatisfeito
• Quantitativa contínua:
Histograma
5. Construindo gráficos (manualmente)(manualmente)
ExercíciosExercício 1. O gráfico abaixo trata de ganhos profissionaisde tempo integral de trabalho, mas apresenta problemas.Construa um gráfico mais adequado e justifique sua opçãodecisão.
4/18/2012
36
Uma resposta:
Fonte: Desconhecida.
Exercício 2. Um artigo (R. Richmond, “Anatomy of a threat”, The WallStreet Journal, 13 fev 2006, pp. R5-6) discutiu sobre os custos dasempresas ao defender suas redes informatizadas de ataquesexternos. A tabela a seguir apresenta a discriminação dos custos:
Custo PercentagemConsultoria 7,6
Ferramentas de hardware 8,2Mão-de-obra 25,9
a. Que tipo de gráfico é melhor para retratar estes dados? Construa-o.b. b. que conclusões pode-se tirar com relação aos custos das
empresas para defender suas redes informatizadas de ataquesexternos?
Mão de obra 25,9Negócios perdidos/receita bruta 23,6
Tempo não-produtivo de empregados 15,5Ferramentas de software 14,2
Outros 5,0
Exercício 3. Construa um Histograma paracada conjunto de dados a seguir (utilize afrequencia relativa).q )
(Observação: se você fez os exercícios da aula de“Distribuição de Frequência e Tabelas” você já fez ametade deste exercício)
E1: Consumo anual de papel (em toneladas) de 50empresas em Cuiabá:
Resposta: Distribuição de frequência completaResposta: Distribuição de frequência completa
20 23 25 26 26 27 28 29 30 3030 31 31 32 32 33 33 34 34 3435 35 36 36 40
E2: Idades dos funcionários de uma empresa:
E3: A reforma na sede da empresa JEFX tem ocasionadotranstorno no trânsito, pois bloqueia parte da rua para odescarregamento de um caminhão Em cada dia que istodescarregamento de um caminhão. Em cada dia que istoocorria, era anotado o número de horas de obstrução da rua:
2 1 3 2 3 5 3 1 2 61 4 3 1 3 1 5 3 4 42 1 3 1 2 2 1 2 2 11 1 1 2 4 5 3 4 3 43 3 5 2 1 6 1 2 4 6
E4: Os valores a seguir representam o número de clientesde 40 empresas.
62 63 48 66 69 54 70 66 64 6559 75 55 63 71 72 70 57 76 5757 65 58 58 60 58 63 65 64 7850 68 66 69 52 70 72 65 62 64
E5: No rol abaixo estão as receitas brutas 50 empresasE5: No rol abaixo estão as receitas brutas 50 empresas(em milhões de reais).
1,2 1,8 3,3 3,3 3,4 3,6 3,7 3,7 3,9 4,24,3 4,8 4,9 5,4 5,4 5,5 5,5 5,6 5,8 6,06,3 6,5 6,6 6,3 6,3 6,9 6,1 6,4 8,5 8,58,9 9,4 9,5 9,7 10,0 10,2 10,5 11,0 11,5 11,612,6 12,8 13,4 13,9 14,1 16,6 17,0 17,2 19,8 22,9
INTERPRETAÇÃO DE TABELAS E GRÁFICOS
Exemplo de Relatório A amostra investigada contém 120 chefes de família de três localidades diferentes de Florianópolis, distribuídos de modo mais ou menos equitativo (40 de Nivel B, 43 de Nível C e 37 de Nível E), conforme se vê na tabela a seguir.
Tabela 1. Distribuição de frequência do Nível de instrução do chefe do imóvel,
divida por localidades de Florianópolis/SC, 1988
Nível de instrução
Localidade Res. Monte Verde
(Nível B) Parque da Figueira
(Nível C) Encosta do Morro
(Nível E) Nenhum 6 (15%) 14 (32,6%) 18 (48,7%)
Fundamental 11 (27,5%) 14 (32,6%) 13 (35,1%) Médio 23 (57,5%) 15 (34,8%) 6 (16,2%) Total 40 (100%) 43(100%) 37 (100%)
A grande maioria dos pesquisados que moram num local “melhor” possuem um nível de instrução mais elevado (57,5% do Residencial Monte Verde) e praticamente metade dos moradores da “pior” localidade possuem o menor nível de instrução (48,7% da Encosta do Morro). Assim, o nível da localidade da moradia diminui na medida em que também diminui o nível de escolaridade do chefe da casa, conforme Gráfico 1. Portanto, a pesquisa realizada evidenciou a existência de associação entre essas duas variáveis (nível de instrução do chefe da casa e localidade da moradia).
Gráfico 1. Distribuição de frequência do Nível de instrução do chefe do imóvel,
divida por localidades de Florianópolis/SC, 1988
0%10%20%30%40%50%60%70%80%90%
100%
(Nível B) (Nível C) (Nível E)
Res. Monte Verde Parque da Figueira Encosta do Morro
Localidade
Médio
Fundamental
Nenhum
JefersonTypewritten Text37
Atividade avaliativa – Interpretação de Tabelas e Gráficos
Entrega dia ________. 1. Foi selecionada uma amostra de 500 consumidores em uma grande área metropolitana para
determinar várias informações relacionadas ao comportamento do consumidor. Dentre as perguntas feitas estava: “Você gosta de comprar roupas?” Os resultados estão resumidos na tabela de classificações cruzadas apresentada a seguir.
Tabela 1. Gosto po compras dividido por gênero (local e datas desconhecidos)
Gosta de comprar roupas
Gênero Masculino Feminino Total
Sim 136 224 360 Não 104 36 140
Total 240 260 500
a) Reconstrua a tabela calculando as porcentagens em relação ao total para a tabela. b) Construa um gráfico a partir da Tabela 1. c) Que porcentagem da amostra é do gênero masculino? d) Que porcentagem da amostra é mulher e não gosta de comprar roupas? e) Qual a porcentagem de homens os entrevistados que gostam de comprar roupas? f) Qual o gênero que tem maior tendência para comprar roupas? Por quê? g) Faça um relatório dizendo o que se pode concluir quanto à relação entre gênero e gosto para
comprar roupas? Incorpore dados e um gráfico ao seu relatório.
JefersonTypewritten Text38
[01] [ENEM-adaptada] Imagine uma eleição envolvendo 3 candidatos A, B, C e 33 eleitores (votantes). Cada eleitor vota fazendo uma ordenação dos três candidatos. Os resultados são os seguintes:
A primeira linha do quadro descreve que 10 eleitores escolheram A em 1º lugar, B em 2º lugar, C em 3º lugar e assim por diante.
Ordenação No de votantes A B C 10 A C B 04 B A C 02 B C A 07 C A B 03 C B A 07
Total de votantes 33
Considere o sistema de eleição no qual cada candidato ganha 3 pontos quando é escolhido em 1º lugar, 2 pontos quando é escolhido em 2º lugar e 1 ponto se é escolhido em 3º lugar. O candidato que acumular mais pontos é eleito. Nesse caso, diga qual é o candidato eleito e com quantos pontos ele se elegeu? [02] [UFMT] Com base na figura abaixo, julgue os itens.
Muitos doentes, pouco tratamento
No Brasil são 9 milhões de diabéticos.
Deles, 50% não sabem que estão doentes.
Dos que sabem, 23% não se tratam.
Cresce o número de óbitos por causa do diabetes.
14 000
1985
18 000
1990
24 000
1995
Fontes: Federação Nacional de Associações de Diabéticos e Ministério da Saúde. Revista VEJA -22/07/98.
( ) A metade dos diabéticos no Brasil não sabe que está doente. ( ) Dos que sabem que estão doentes 1,035 milhões não se tratam. ( ) O número de óbitos por causa do diabetes, de 1985 para 1990, aumentou em 40%. ( ) O número de óbitos por causa do diabetes em 1995 foi 4/3 do número de óbitos em 1990. [03] [FUVEST-SP] Considere os seguintes dados, obtidos em 1996 pelo censo do IBGE: 1. A distribuição da população por grupos de idade é:
Idade No de pessoas de 4 a 14 anos 37 049 723
de 15 a 17 anos 10 368 618 de 18 a 49 anos 73 644 508 50 anos ou mais 23 110 079
2. As porcentagens de pessoas maiores de 18 anos filiadas ou não a sindicatos, órgãos comunitários, órgãos de classe são:
3. As porcentagens de pessoas maiores de 18 anos filiadas a sindicatos, órgãos comunitários e órgãos de classe são:
A partir dos dados acima, pode-se afirmar que o número de pessoas, maiores de 18 anos, filiadas a órgãos comunitários é, aproximadamente, em milhões:
a) 2 b) 6 c) 12 d) 21 e) 31 [04] [FUVEST] Uma prova continha cinco questões, cada uma valendo 2 pontos. Em sua correção, foram atribuídas a cada questão apenas as notas 0 ou 2, caso a resposta estivesse respectivamente, errada ou certa. A soma dos pontos obtidos em cada questão forneceu a nota da prova de cada aluno. Ao final da correção, produziu-se a seguinte tabela, contendo a porcentagem de acertos em cada questão:
QUESTÃO 1 2 3 4 5 % DE ACERTO 30 10 60 80 40
Logo, a média das notas da prova foi:
a) 3,8 b) 4,0 c) 4,2 d) 4,4 e) 4,6 [05] [ENEM] Um sistema de radar é programado para registrar automaticamente a velocidade de todos os veículos trafegando por uma avenida, onde passam em média 300 veículos por hora, sendo 55 km/h a máxima velocidade permitida. Um levantamento estatístico dos registros do radar permitiu a elaboração da distribuição percentual de veículos de acordo com sua velocidade aproximada.
A velocidade média, em km/h, dos veículos que trafegam nessa avenida é de:
a) 85 b) 76 c) 55 d) 44 e) 35
53% 39% 8%
69% 31%
JefersonTypewritten Text39
[06] [ENEM] Boa parte da água utilizada nas mais diversas atividades humanas não retorna ao ambiente com qualidade para ser novamente consumida. O gráfico mostra alguns dados sobre esse fato, em termos dos setores de consumo.
Total Com base nesses dados, é possível afirmar que: a) mais da metade da água restituída sem qualidade para o consumo contém algum teor de agrotóxico ou adubo. b) as atividades industriais são as maiores poluidoras de água. c) mais da metade da água usada não é devolvida ao ciclo hidrológico. d) cerca de um terço do total de água restituída sem qualidade é proveniente de atividades energéticas. e) o consumo doméstico, dentre as atividades humanas, é o que mais consome e repõe água com qualidade. [07] A tabela abaixo se refere a uma pesquisa, realizada com 200 alunos de uma escola, a respeito do esporte preferido:
Esporte Freqüência Absoluta Freqüência
Relativa Porcentagem
Futebol 108 Vôlei 0,21
Basquete Natação 12 Outros 8,5% Total 200 1,00 100%
Complete os espaços da tabela. [08] Os “pesos” (em kg) de 16 atletas estão indicados a seguir: 78, 75, 79, 83, 81, 72, 68, 79, 72, 85, 76, 80, 78, 71, 69 e 70. a) Encontre o valor da média, da mediana e da moda dos “pesos” dos atletas. b) Qual a porcentagem do total de atletas que têm “peso” inferior a 80 kg?
JefersonTypewritten Text40
4/18/2012
41
O que fazer depois de aplicar os questionários
(ou fazer as entrevistas)?
Tabular os dados!
Um exemplo de questionário:
Como tabular os dados obtidos por meio de questionários?
• Os questionários respondidos devem ser enumerados.
• Em seguida passamos a tabular as informações (ou seja, inserir em uma planilha eletrônica).
Como tabular os dados obtidos por meio de questionários?
•Para o questionário do Sujeito 1 obtivemos as seguintes respostas.
ComputaçãoComputaçãoÚltimaÚltima
Como tabular os dados obtidos por meio de questionários?
•Para o questionário do Sujeito 1 obtivemos as seguintes respostas.
ComputaçãoComputaçãoÚltimaÚltima
Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 3
Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?
O questionário abaixo foi respondido pelo Sujeito 2.Vamos inserir as informações na planilha!
MatemáticaMatemáticaComumComum
Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 3
4/18/2012
42
Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?
O questionário abaixo foi respondido pelo Sujeito 2.Vamos inserir as informações na planilha!
MatemáticaMatemáticaComumComum
Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 32 Matemática 4 3 3 2 4 3 3
Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?
O questionário abaixo foi respondido pelo Sujeito 3.Vamos inserir as informações na planilha!
MatemáticaMatemáticaEspecíficaEspecífica
Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 32 Matemática 4 3 3 2 4 3 3
Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?
O questionário abaixo foi respondido pelo Sujeito 3.Vamos inserir as informações na planilha!
MatemáticaMatemáticaEspecíficaEspecífica
Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 32 Matemática 4 3 3 2 4 3 33 Matemática 3 3 3 2 3 3 4
Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?
O questionário abaixo foi respondido pelo Sujeito 4.Vamos inserir as informações na planilha!
C SociaisC Sociais2º ano2º ano
Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 32 Matemática 4 3 3 2 4 3 33 Matemática 3 3 3 2 3 3 4
Como tabular os dados obtidos por meio de questionários?Como tabular os dados obtidos por meio de questionários?
No final teremos:
Sujeito Curso didática Conhecimento BibliografiaLaboratóriosConteúdos Encadeamento Satisfação geral1 Computação 3 4 2 3 5 2 32 Matemática 4 3 3 2 4 3 33 Matemática 3 3 3 2 3 3 44 C. Sociais 2 2 4 4 2 3 55 Matemática 1 4 4 2 3 5 36 C. Sociais 1 1 5 1 3 4 37 Matemática 5 4 2 4 1 4 58 C S 1 2 1 28 C. Sociais 4 1 2 1 5 4 29 Computação 1 4 3 4 4 4 3
10 Matemática 1 5 5 4 3 4 411 Matemática 5 2 2 1 3 2 212 C. Sociais 1 2 4 5 4 3 113 Matemática 4 3 1 5 5 1 414 Matemática 1 2 5 2 4 5 315 C. Sociais 3 4 3 4 3 1 116 Computação 5 2 2 2 5 5 317 Matemática 5 3 4 2 2 2 518 C. Sociais 3 2 4 5 5 1 3
Questionário Local Residência Instrução Tam. da fam. Renda1 Monte Verde Própria médio 4 10,32 Monte Verde Alugada médio 4 15,43 Monte Verde Própria fundamental 4 9,64 Monte Verde Alugada fundamental 5 5,5 Construir tabelas e gráficos usando o Banco de dados5 Monte Verde Própria médio 4 96 Monte Verde Própria nenhum 1 2,4 Passos:7 Monte Verde Alugada médio 2 4,18 Monte Verde Própria médio 3 8,4 > Inserir9 Monte Verde Própria médio 6 10,3 > Tabela Dinâmica10 Monte Verde Própria fundamental 4 4,6 .. Selecionar os dados (incluindo os Rótulos na 1ª linha)11 Monte Verde Alugada fundamental 6 18,6 .. Marcar "Nova planilha"12 Monte Verde Própria nenhum 4 7,1 .. Clicar em OK13 Monte Verde Alugada fundamental 4 12,914 Monte Verde Alugada fundamental 6 8,415 Monte Verde Alugada médio 3 19,316 Monte Verde Alugada fundamental 5 10,417 Monte Verde Própria médio 3 8,918 Monte Verde Alugada médio 4 12,919 Monte Verde Alugada médio 4 5,120 Monte Verde Própria médio 4 12,221 Monte Verde Própria médio 5 5,822 Monte Verde Própria médio 5 12,923 Monte Verde Alugada médio 5 7,724 Monte Verde Alugada fundamental 4 1,125 Monte Verde Alugada fundamental 8 7,526 Monte Verde Própria médio 4 5,827 Monte Verde Própria nenhum 5 7,228 Monte Verde Alugada médio 3 8,629 Monte Verde Própria fundamental 4 5,130 Monte Verde Alugada médio 5 2,631 Monte Verde Própria médio 5 7,732 Monte Verde Própria fundamental 2 2,433 Monte Verde Própria médio 5 4,834 Monte Verde Própria nenhum 2 2,135 Monte Verde Própria nenhum 6 436 Monte Verde Própria nenhum 8 12,537 Monte Verde Própria médio 3 6,838 Monte Verde Própria médio 5 3,939 Monte Verde Alugada médio 5 940 Monte Verde Alugada médio 3 10,941 Pq. Da Figueira Própria fundamental 5 5,442 Pq. Da Figueira Própria nenhum 3 6,443 Pq. Da Figueira Própria nenhum 6 4,444 Pq. Da Figueira Própria nenhum 5 2,545 Pq. Da Figueira Alugada nenhum 6 5,546 Pq. Da Figueira Própria nenhum 8 647 Pq. Da Figueira Própria médio 4 1448 Pq. Da Figueira Própria fundamental 4 8,549 Pq. Da Figueira Própria nenhum 5 7,750 Pq. Da Figueira Alugada fundamental 3 5,851 Pq. Da Figueira Própria médio 5 552 Pq. Da Figueira Alugada nenhum 3 4,853 Pq. Da Figueira Própria fundamental 2 2,854 Pq. Da Figueira Própria fundamental 4 4,255 Pq. Da Figueira Própria médio 3 10,256 Pq. Da Figueira Própria fundamental 4 7,457 Pq. Da Figueira Própria fundamental 5 558 Pq. Da Figueira Alugada médio 2 6,459 Pq. Da Figueira Alugada médio 4 5,760 Pq. Da Figueira Própria fundamental 4 10,861 Pq. Da Figueira Alugada médio 1 2,362 Pq. Da Figueira Própria nenhum 7 6,163 Pq. Da Figueira Própria nenhum 3 5,564 Pq. Da Figueira Própria nenhum 7 3,565 Pq. Da Figueira Própria médio 3 966 Pq. Da Figueira Própria médio 6 5,867 Pq. Da Figueira Alugada nenhum 6 4,268 Pq. Da Figueira Própria médio 3 6,869 Pq. Da Figueira Própria fundamental 5 4,870 Pq. Da Figueira Própria médio 5 671 Pq. Da Figueira Própria fundamental 7 972 Pq. Da Figueira Própria nenhum 4 5,373 Pq. Da Figueira Própria médio 4 3,174 Pq. Da Figueira Alugada médio 1 6,475 Pq. Da Figueira Própria nenhum 3 3,976 Pq. Da Figueira Própria fundamental 3 6,477 Pq. Da Figueira Própria médio 4 2,778 Pq. Da Figueira Alugada fundamental 4 2,479 Pq. Da Figueira Alugada fundamental 4 3,6
JefersonTypewritten Text43
Tam. da fam. Renda4 10,34 15,4 Função Estatística Descritiva4 9,65 5,5 Passos:4 91 2,4 > Dados2 4,1 > Análise de dados3 8,4 > Estatística Descritiva
Para habilitar esta função:
Vá em Botão Office > Opções do Excel > Suplementos > 3 8,4 > Estatística Descritiva
6 10,3 .. Selecionar os dados (atenção para Rótulos na 1ª linha)4 4,6 .. Marcar "Resumo estatístico"6 18,6 .. Marcar "Nova planilha"4 7,1 .. Clicar em OK4 12,96 8,43 19,35 10,43 8,94 12 9
Resultado! A tabela a seguir será apresentada:
Para habilitar esta função:
Vá em Botão Office > Opções do Excel > Suplementos > Ir...Marque Ferramentas de análise.Clique em OK!
4 12,94 5,14 12,2 Média5 5,8 Erro padrão5 12,9 Mediana5 7,7 Modo4 1,1 Desvio padrão8 7,5 Variância da amostra4 5,8 Curtose5 7,2 Assimetria5 7,2 Assimetria3 8,6 Intervalo4 5,1 Mínimo5 2,6 Máximo5 7,7 Soma2 2,4 Contagem5 4,82 2,16 48 12,53 6 83 6,85 3,95 93 10,95 5,43 6,46 4,45 2,56 5,58 68 64 144 8,55 7,73 5,85 53 4,82 2,84 4,23 10,24 7 44 7,45 52 6,44 5,74 10,81 2,37 6,13 5,57 3,53 93 96 5,86 4,23 6,85 4,85 67 9
JefersonTypewritten Text44
ESTATÍSTICA
BACH. SECRETARIADO EXECUTIVO
PROF. MSC. JEFERSON GOMES MORIEL JUNIOR
45
MEDIDAS DE TENDÊNCIA CENTRAL
3.1- Introdução.
Como na representação tabular e gráfica dos dados a Estatística Descritiva consiste num conjunto de métodos que ensinam a reduzir uma quantidade de dados bastante numerosa por um número pequeno de medidas, substitutas e representantes daquela massa de dados. Agora passaremos a estudar as principais medidas da Estatística Descritiva, agrupadas em medidas de tendência central (ou de posição ou de localização), medidas de dispersão (ou de variabilidade) e medidas de assimetria e curtose. Estas últimas serão vistas na aula 4. Um valor para representar a todos. Algumas medidas sugerem uma concentração em torno delas, sendo por isso denominadas de MEDIDAS DE TENDÊNCIA CENTRAL. Para uma amostra, as três medidas mais conhecidas são a MÉDIA ARITMÉTICA, a MEDIANA e a MODA.
3.2- Média aritmética.
Podemos pensar na média aritmética como o valor “típico” do conjunto de dados e é considerada a principal medida de tendência central. Algumas das razões que fazem com que seja a medida de posição mais recomendada são:
É definida rigorosamente e pode ser interpretada facilmente; Considera todas as observações efetuadas; e Calcula-se com facilidade.
Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito sensível a valores extremos, isto é, a valores excessivamente pequenos ou excessivamente grandes, em relação às demais observações do conjunto de dados. Exemplo: Estamos interessados em conhecer o salário médio mensal de certa empresa com cinco funcionários. Temos o seguinte conjunto de salários mensais, em reais: 123 - 145 - 210 - 225 - 2.500. Podemos observar que quatro dos cinco salários apresentam valores entre 123 e 225 reais, porém a média salarial de 640,6 reais é bastante distinta desse conjunto pela influência do salário de 2.500 que puxou o valor médio para cima. A média aritmética pode ser calculada de duas formas: média aritmética simples e média aritmética ponderada.
3.2.1- Média aritmética simples. Sejam n21 x,...,x,x , n valores que a variável X pode assumir. A média aritmética simples é definida como:
1
n
i
i
x
Xn
ou, de forma mais simplificada, por x
Xn
.
ESTATÍSTICA
BACH. SE