49
- 1 - Uanderson Rebula de Oliveira Estatística Universidade Estácio de Sá Engenharia de Produção PROBABILIDADE E ESTATÍSTICA ESTATÍSTICA Prof. Uanderson Rebula de Oliveira [email protected] www.uandersonrebula.blogspot.com | www.iluminaconsultoria.com.br

1 apostila de estatística eng.2010

Embed Size (px)

Citation preview

Page 1: 1   apostila de estatística   eng.2010

- 1 -

Uanderson Rebula de Oliveira Estatística

Universidade Estácio de Sá

Engenharia de Produção PROBABILIDADE E ESTATÍSTICA

ESTATÍSTICA Prof. Uanderson Rebula de Oliveira

[email protected] www.uandersonrebula.blogspot.com | www.iluminaconsultoria.com.br

Page 2: 1   apostila de estatística   eng.2010

- 2 -

Uanderson Rebula de Oliveira Estatística

 

EMENTA DE ESTATÍSTICA:  Estatística: conceito e fases de estudo. Variáveis. População, amostra e métodos de amostragem. Estatística descritiva e  inferencial. Séries estatísticas: conceitos, distribuição  de  frequência  e  representação  gráfica.  Medidas  de  Tendência Central: Média, moda e mediana. Medidas de Variação: Variância, desvio padrão e coeficiente de variação. 

 OBJETIVO: 

Refletir a partir da Estatística Básica sobre as ferramentas consolidadas pelo uso e pela ciência, disponíveis a todos, que auxiliam na tomada de decisão.

Engenharia de Produção PROBABILIDADE E ESTATÍSTICA

UANDERSON REBULA DE OLIVEIRA Mestrando em Engenharia (ênfase em Engenharia de Produção)-Universidade Estado de São Paulo-FEG-UNESP

Pós-graduado em Controladoria e Finanças-Universidade Federal de Lavras-UFLA Pós-graduado em Logística Empresarial-Universidade Estácio de Sá-UNESA

Graduado em Ciências Contábeis-Universidade Barra Mansa-UBM Técnico em Metalurgia-Escola Técnica Pandiá Calógeras-ETPC

Técnico em Segurança, Saúde e Higiene do Trabalho-ETPC Operador Siderúrgico e Industrial-ETPC

Professor na Universidade Barra Mansa – UBM. Professor da Universidade Estácio de Sá - UNESA nas disciplinas de Gestão Financeira de Empresas, Fundamentos da Contabilidade e Matemática Financeira, Probabilidade e Estatística,

Ergonomia, Higiene e Segurança do Trabalho, Gestão de Segurança e Análise de Processos Industriais, Gestão da Qualidade: programa 5S (curso de férias). Ex-professor Conteudista na UNESA (elaboração de Planos de Ensino e

de Aula, a nível nacional). Professor em escolas técnicas nas disciplinas de Estatística Aplicada, Estatística de Acidentes do Trabalho, Probabilidades, Contabilidade Básica de Custos, Metodologia de Pesquisa Científica,

Segurança na Engenharia de Construção Civil e Higiene do Trabalho. Ex-professor do SENAI. Desenvolvedor e instrutor de diversos cursos corporativos na CSN, a níveis Estratégicos, Táticos e Operacionais.

Membro do IBS–Instituto Brasileiro de Siderurgia.

Resende - 2010

ESTATÍSTICA

Page 3: 1   apostila de estatística   eng.2010

- 3 -

Uanderson Rebula de Oliveira Estatística

APRESENTAÇÃO DA DISCIPLINA

Uma das ferramentas mais utilizadas hoje em dia pelos cientistas,  analistas  financeiros, médicos,  engenheiros,  jornalistas etc. é a Estatística, que descreve os dados observados e desenvolve a metodologia para a tomada de decisão em presença da incerteza. O verbete estatística  foi  introduzido no século XVIII, tendo origem na palavra  latina  status  (Estado), e  serviu  inicialmente a objetivos ligados  à  organização  político‐social,  como  o  fornecimento  de dados  ao  sistema  de  poder  vigente. Hoje  em  dia,  os modelos  de aplicação da Teoria Estatística  se estendem por  todas as áreas do conhecimento,  como  testes  educacionais,  pesquisas  eleitorais, análise  de  riscos  ambientais,  finanças,  controle  de  qualidade, análises  clínicas,  índices  de  desenvolvimento,  modelagem  de fenômenos atmosféricos etc. Podemos  informalmente dizer que a Teoria  Estatística  é  uma  ferramenta  que  ajuda  a  tomar  decisões com  base  na  evidência  disponível,  decisões  essas  afetadas  por margens de erro, calculadas através de modelos de probabilidade.  

No  entanto,  a  probabilidade  se  desenvolveu  muito antes  de  ser  usada  em  aplicações  da  Teoria  Estatística.  Um  dos marcos  consagrados  na  literatura  probabilística  foi  a correspondência  entre  B.  Pascal  (1623‐1662)  e  P.  Fermat  (1601‐1665), onde o tema era a probabilidade de ganhar em um jogo com dois  jogadores,  sob  determinadas  condições.  Isso  mostra  que  o desenvolvimento  da  teoria  de  probabilidades  começou  com  uma paixão humana, que  são os  jogos de  azar, mas  evoluiu para uma área  fortemente  teórica,  em  uma  perspectiva  de  modelar  a incerteza,  derivando  probabilidades  a  partir  de  modelos matemáticos.  

A  análise  combinatória  deve  grande  parte  de  seu desenvolvimento  à  necessidade  de  resolver  problemas probabilísticos  ligados à contagem, mas hoje há diversas áreas em que seus  resultados são  fundamentais para o desenvolvimento de teorias, como, por exemplo, a área de sistemas de informação. 

 Nesta  apostila  encontraremos  as  definições  de  

Estatística,  vocabulário  básico,  população  e  amostra,  séries estatísticas,  medidas  de  tendência  central,  medidas  de variabilidade. Probabilidades serão tratadas em outra apostila.  

Page 4: 1   apostila de estatística   eng.2010

- 4 -

Uanderson Rebula de Oliveira Estatística

Falou mais o Senhor a Moisés, no deserto de Sinai, na tenda da congregação, no primeiro dia do mês segundo, no segundo ano da sua saída da terra do Egito, dizendo: Tomai a soma de toda a congregação dos filhos de Israel, segundo as suas gerações, segundo a casa dos seus pais, conforme o número dos nomes de todo o varão, cabeça por cabeça; Da idade de vinte anos e para cima, todos os que saem à guerra em Israel; a estes contareis segundo os seus exércitos, tu e Aarão. Estará convosco, de cada tribo, um homem que seja cabeça da casa dos seus pais. Todos os contados, pois, foram seiscentos e três mil, quinhentos e cinquenta.

Números 1: 1-4; 46

Page 5: 1   apostila de estatística   eng.2010

- 5 -

Uanderson Rebula de Oliveira Estatística

Sumário 1 – CONCEITOS PRELIMINARES  

1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA, 7 1.2 FASES DO ESTUDO ESTATÍSTICO, 13 1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA, 15 1.4 POPULAÇÃO E AMOSTRA, 17 

MÉTODOS DE AMOSTRAGEM PROBABILÍSTICOS, 18 Amostragem aleatória simples, 18 Amostragem aleatória estratificada, 20 Amostragem aleatória por conglomerado, 21 Amostragem sistemática, 23 

1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL , 24  2 – SÉRIES ESTATÍSTICAS  

2.1 CONCEITOS E TIPOS DE SÉRIES ESTATÍSTICAS,  26 Tabelas, 26 Gráficos, 27 

2.2 DISTRIBUIÇÃO DE FREQUÊNCIA, 30 Freqüência absoluta e histograma, 30 Freqüência relativa, absoluta acumulada e relativa acumulada, 31 Agrupamento em classes, 32 Polígono de freqüência e ogiva, 33  

 3 – MEDIDAS                     3.1 MEDIDAS DE TENDÊNCIA CENTRAL, 35 

MÉDIA, 35 Média simples, 35 Média aparada, 36 Média ponderada, 36 Média de distribuição de frequência, 37 Média geométrica, 38 

MEDIANA, 39 MODA, 40 RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA, 41 

3.2 MEDIDAS DE VARIAÇÃO, 42 VARIÂNCIA E DESVIO PADRÃO, 43 COEFICIENTE DE VARIAÇÃO,  45 

 REFERÊNCIAS BIBLIOGRÁFICAS, 46                                                                                                                                    

ANEXO I – LIVROS RECOMENDADOS, 47  ANEXO II –  Software BIOESTAT , 48 ANEXO III – ESTATÍSTICA NO EXCEL, 49                       

Page 6: 1   apostila de estatística   eng.2010

- 6 -

Uanderson Rebula de Oliveira Estatística

1

CONCEITOS PRELIMINARES

Page 7: 1   apostila de estatística   eng.2010

- 7 -

Uanderson Rebula de Oliveira Estatística

1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA  

ESTATÍSTICA NA PRÁTICA  

Analise as informações abaixo para melhor compreensão do conceito e importância da Estatística.  

 ACIDENTES DO TRABALHO no Brasil – 1970 a 2005 Conceito resumido: Lesão corporal ou doença, relacionada com o exercício do trabalho. Legislação: Lei 8.213/91 – art. 19 a 21  INSS: Órgão público responsável pela coleta, organização e representação dos dados.   

Coleta: Por meio de um formulário eletrônico denominado “CAT – Comunicação de Acidente do Trabalho”, enviado pelas empresas quando da ocorrência, conforme determina o art. 22 da Lei 8.213/91. 

Organização: Através de um grande banco de dados do INSS.  Representação: Através de um documento denominado “Anuário Estatístico de Acidentes do Trabalho”, contendo 

tabelas, gráficos e diversas análises. Disponível no site www.previdencia.gov.br, na seção “Estatística”. Motivo: Quando o trabalhador se afasta por motivo de acidente o INSS concede benefícios acidentários, como auxílio doença acidentário, auxílio acidente, aposentadoria por invalidez, pensão por morte, reabilitação entre outros. Mais informações na apostila Profº Uanderson “Ergonomia, Higiene e Segurança do Trabalho”, pág. 50‐52;136, disponível no portal www.uandersonrebula.blogspot.com. 

 COMPILAÇÃO E ANÁLISE DE DADOS (INFORMAÇÕES) sobre acidentes do trabalho, de 1970 a 2005:              

 

Observa‐se ao longo dos anos o aumento gradativo da quantidade de trabalhadores no Brasil, de 7.284.022 chegando a  33.238.617,  reflexo do  crescimento  econômico do País.  Essas  informações  (dados)  são  importantes para  fins de comparação com a evolução da quantidade de acidentes do trabalho no mesmo período, como segue abaixo: 

            

7.284.0228.148.987

11.537.024

14.945.48916.638.799

18.686.35519.476.36219.673.915

22.163.82723.661.57923.198.656

22.272.84323.667.24123.830.312

24.491.63526.228.629

27.189.61428.683.91329.544.927

31.407.57633.238.617

0

5.000.000

10.000.000

15.000.000

20.000.000

25.000.000

30.000.000

35.000.000

1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005

Evolução da QUANTIDADE de TRABALHADORES no Brasil - 1970 a 2005.

FONTE: Revista Proteção Anos

1.220.111

1.504.723

1.796.6711.743.825

1.551.4611.464.211

1.178.472

961.575

1.207.859

991.581

693.572

532.514

388.304 395.455414.341

363.868340.251393.071 399.077465.700 491.711

0

250.000

500.000

750.000

1.000.000

1.250.000

1.500.000

1.750.000

2.000.000

1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005

Involução da QUANTIDADE de ACIDENTES DO TRABALHO no Brasil - 1970 a 2005.

Anos FONTE: Revista Proteção

Aprovação das NR’s

Page 8: 1   apostila de estatística   eng.2010

- 8 -

Uanderson Rebula de Oliveira Estatística

No  período  de  1970  a  1976  a  quantidade  de  acidentes  foi  alta,  comparando‐se  com  a  pequena quantidade de trabalhadores no mesmo período. Somente a partir de 1978 os acidentes começaram a reduzir,  em  razão  da  aprovação  das  Normas  Regulamentadoras  –  NR’s  (disponível  no www.mte.gov.br),  tornando‐se de aplicação obrigatória em  todo o País. Esta  redução pode  ser vista como positiva, entretanto, não podemos  comemorar esses números, pois a quantidade de acidentes ainda é alarmante e está praticamente estagnada, desde 1994. 

 E as  regiões? Como esses acidentes estão distribuídos nas  regiões do país? Qual a pior  região? Qual a melhor? Vejamos abaixo em um Cartograma (mapa com dados), SOMENTE NO ANO DE 2005 (491.711 acidentes):                        

Observa‐se que a região em 1°  lugar em número de acidentes é a Sudeste, em 2° está a região Sul, em 3° a região Nordeste, em 4° a região Centro‐Oeste e por último a Norte. Ao analisarmos este gráfico podemos tomar diversas conclusões, porém,  tais  conclusões  somente  são possíveis através de um  estudo, o que demanda  tempo.  Todavia, observa‐se  que  a  quantidade  de  acidentes  acompanha  a  porcentagem  da  participação  do  PIB  da  região.  Esta correlação pode ser resultado do reflexo da economia da região. Ora, a região Sudeste, por exemplo, corresponde a 56,5% do PIB do País. Logicamente esta  região possui um maior número de empresas e, consequentemente, maior número  de  mão‐de‐obra  e  atividades  produtivas,  fato  que  pode  justificar  a  enorme  quantidade  de  acidentes comparada com as demais regiões. Esses dados também podem estar relacionados com as políticas dos estados e das empresas,  a  atuação  das  fiscalizações  do  Ministério  do  Trabalho,  as  culturas  das  regiões,  os  investimentos empresariais, a  capacitação de mão de  obra  (treinamentos)  entre  outros  fatores.  Entende‐se por Produto  Interno Bruto (PIB) a soma, em valores monetários, de todos os bens e serviços finais produzidos em uma determinada região. 

 

Mais dados  vocês  encontrarão na Apostila  “Ergonomia, higiene  e  segurança do  trabalho”, do profº Uanderson Rebula,  disponível  no  portal  www.uandersonrebula.blogspot.com  ou  no  “Anuário  Estatístico  de  Acidentes  do Trabalho”, disponível no portal www.previdencia.gov.br, na seção “Estatística”.  Tradicionalmente, no Brasil, as políticas de desenvolvimento  têm se restringido aos aspectos econômicos e vêm sendo traçadas de maneira paralela ou pouco articuladas com as políticas sociais, cabendo a estas últimas arcarem com  os  ônus  dos  possíveis  danos  gerados  sobre  a  saúde  da  população,  dos  trabalhadores  em  particular  e  a degradação ambiental. Para que o Estado cumpra seu papel para a garantia desses direitos, é mister a formulação e implementação de políticas e ações de governo. 

Distribuição da quantidade e porcentagem de acidentes de trabalho no Brasil por Regiões, correlacionados com o Produto Interno Bruto ‐ PIB ‐ ano 2005. 

FONTE: Adaptado da Revista Proteção e do IBGE (www.ibge.gov.br)

NORDESTE  • Acidentes: 49.010 (10% do total) • PIB: 13,1% de participação 

SUDESTE  • Acidentes: 279.689 (57% do total) • PIB: 56,5% de participação  

NORTE  • Acidentes: 19.117 (4% do total) • PIB: 5% de participação  

CENTRO‐OESTE  • Acidentes: 31.470 (6% do total) • PIB: 8,9% de participação  

SUL  • Acidentes: 112.425 (23% do total) • PIB: 16,6% de participação 

Espírito Santo ‐ 11.039 acidentes Minas Gerais ‐ 52.335 acidentes Rio de Janeiro ‐ 34.610 acidentes São Paulo ‐ 181.705 acidentes

São  campeões  de  acidentes  no  Brasil,  participando  com 181.705, o que corresponde a 37% do total; por conseguinte o  seu  PIB  também  é  o  maior  do  País,  com  33,9%  de participação.

Page 9: 1   apostila de estatística   eng.2010

- 9 -

Uanderson Rebula de Oliveira Estatística

POSSÍVEIS SOLUÇÕES PARA REDUZIR OS ACIDENTES  A partir da análise dos dados podemos concluir que a política de  segurança do  trabalho adotada no País está estagnada. A  simples  aplicação da norma  regulamentadora não  está  sendo  suficiente para  reduzir o  índice de acidentes. Os dados nos mostram que não haverá mudanças significativas se não forem feitas alterações nessa política.  Para  contornar  a  situação,  os Ministérios  do  Trabalho,  da  Saúde  e  da  Previdência  Social  publicaram,  para consulta pública, em 29.12.2004 a PNSST  ‐ POLÍTICA NACIONAL DE SEGURANÇA E SAÚDE DO TRABALHADOR, com  a  finalidade  de  promover  a melhoria  da  qualidade  de  vida  e  da  saúde  do  trabalhador.  Esse  plano  está disponível no portal www.mte.gov.br.  

 

Os Ministérios reconheceram a deficiência da segurança do trabalho no país, carecendo de mecanismos que: 

• Incentivem medidas de prevenção; • Responsabilizem os empregadores; • Propiciem o efetivo reconhecimento dos direitos do trabalhador; • Diminuam a existência de conflitos institucionais;  • Tarifem de maneira mais adequada as empresas e possibilite um melhor gerenciamento dos fatores 

de riscos ocupacionais. 

Face ao exposto, a PNSST propõe, dentre outras, as seguintes ações a serem desenvolvidas de modo articulado e cooperativo pelos três Ministérios: 

Área  Ações 

   

Tributos1, financiamentos e licitações. 

Estabelecer política  tributária que privilegie  empresas  com menores  índices de acidentes  e que invistam na melhoria das condições de trabalho; 

Criar  linhas de  financiamento para a melhoria das  condições de  trabalho,  incluindo máquinas e equipamentos, em especial para as pequenas e médias empresas; 

Incluir  requisitos de  Segurança do  Trabalho  ‐  SST para  concessão de  financiamentos públicos  e privados; 

Incluir requisitos de SST nos processos de licitação dos órgãos públicos;  Instituir a obrigatoriedade de publicação de balanço de SST para as empresas, a exemplo do que já 

ocorre com os dados contábeis; 

   

Educação e pesquisa 

Incluir conhecimentos básicos em SST no currículo do ensino fundamental e médio;  Incluir disciplinas em SST no currículo de ensino superior, em especial nas carreiras de profissionais 

de saúde, engenharia e administração;  Estimular a produção de estudos e pesquisas na área de interesse desta Política;  Articular instituições de pesquisa e universidades para a execução de estudos e pesquisas em SST, 

integrando uma rede de colaboradores para o desenvolvimento técnico ‐ cientifico na área;  Desenvolver um amplo programa de  capacitação dos profissionais, para o desenvolvimento das 

ações em segurança e saúde do trabalhador; 

Ambientes nocivos 

Eliminar as políticas de monetarização dos riscos (adicionais de riscos).  Outras ações 

Coleta de dados 

Compatibilizar os instrumentos de coleta de dados e fluxos de informações.  Incluir nos Sistemas e Bancos de Dados as  informações contidas nos  relatórios de  intervenções e análises dos ambientes de trabalho, elaborados pelos órgãos de governo envolvidos nesta Política. 

A gestão do PNSST prevê o seu desenvolvimento pelo Grupo Executivo Interministerial de Segurança e Saúde do Trabalhador – GEISAT, integrado por representantes do Ministério do Trabalho, da Saúde e da Previdência Social. Ressalta‐se que no PNSST não está previsto o prazo para execução das ações propostas.  Infelizmente este plano permanece no papel até os dias de hoje e sem sinais de sua saída desta condição tão cedo.    _________________ 1. Tributo: Impostos; taxas e contribuições de melhoria, devida ao poder público. 

Page 10: 1   apostila de estatística   eng.2010

- 10 -

Uanderson Rebula de Oliveira Estatística

CONSIDERAÇÕES FINAIS SOBRE O ESTUDO DE ACIDENTES  O que acabamos de ver é um estudo estatístico.  Como vimos, os dados sobre acidentes do trabalho no Brasil são controladas pelo Ministério da Previdência Social, junto ao  INSS  (Instituto Nacional de Seguridade Social). A comunicação de acidentes permite ao  INSS estimar e acompanhar  o  real  impacto  do  trabalho  sobre  a  saúde  e  a  segurança  da  população  brasileira. O  INSS  coleta, organiza, apresenta e publica as estatísticas de acidentes do trabalho no Brasil.  Conforme observado, quando ocorre um acidente, a empresa, por força de lei, é obrigada a enviar a CAT ao INSS, alimentando, assim, o seu grande banco de dados.   

 As estatísticas de acidentes no Brasil podem ser visualizadas no site da Previdência Social através do endereço eletrônico www.previdencia.gov.br. O interessante neste site é a existência de um documento, disponível para download, denominado “Anuário estatístico da previdência social”. Nele  estão  contidos  todos  os  dados  estatísticos  da  Previdência  Social,  inclusive  os  dados referentes  a  acidentes  do  trabalho,  distribuídos  por  região,  idade,  tipos,  parte  do  corpo mais  atingida  dentre outros. É um importante documento para os estudiosos no assunto. 

 É  importante  ressaltar que os dados de acidentes de  trabalho não  se constituem,  tão somente,  num  importante  registro  histórico, mas  sim  numa  ferramenta  inestimável para os profissionais que desempenham atividades nas áreas de saúde e segurança do trabalhador,  assim  como  pesquisadores  e  demais  pessoas  interessadas  no  tema.  A análise desses dados possibilita a construção de um diagnóstico mais preciso acerca da epidemiologia dos acidentes, propiciando, assim, a elaboração de políticas mais eficazes para as áreas relacionadas com o tema, como vimos no PNSST.  

 TÓPICO PARA REFLEXÃO

Acidente do Trabalho: o

problema do Brasil.

 

Os acidentes de  trabalho afetam a produtividade econômica,  são  responsáveis por um  impacto  substancial sobre o sistema de proteção social e influenciam o nível de satisfação do trabalhador e o bem estar geral da população.  Estima‐se que a ausência de segurança nos ambientes de trabalho no Brasil tenha gerado, no ano de 2003, um custo  de  cerca  de  R$32,8  bilhões  para  o  país.  Deste  total,  R$  8,2  bilhões  correspondem  a  gastos  com benefícios acidentários e aposentadorias especiais, equivalente a 30% da necessidade de  financiamento do Regime Geral de Previdência Social ‐ RGPS verificado em 2003, que foi de R$ 27 bilhões. O restante da despesa corresponde  à  assistência  à  saúde  do  acidentado,  indenizações,  retreinamento,  reinserção no mercado de trabalho e horas de trabalho perdidas.  Isso sem  levar em consideração o sub‐dimensionamento na apuração das contas da Previdência Social, que desembolsa  e  contabiliza  como  despesas  não  acidentárias  os  benefícios  por  incapacidade,  cujas  CAT  não foram emitidas. Ou seja, sob a categoria do auxílio doença não ocupacional, encontra‐se encoberto um grande contingente de acidentes que não compõem as contas acidentárias.  Parte  deste  “custo  segurança  no  trabalho”  afeta  negativamente  a  competitividade  das  empresas,  pois  ele aumenta o preço da mão‐de‐obra, o que se reflete no preço dos produtos. Por outro lado, o incremento das despesas  públicas  com  previdência,  reabilitação  profissional  e  saúde  reduz  a  disponibilidade  de  recursos orçamentários para outras áreas ou induz o aumento da carga tributária sobre a sociedade.  De outro lado, algumas empresas afastam trabalhadores, e muitas vezes os despedem logo após a concessão do beneficio. Com isso, o trabalhador se afasta, já sendo portador de doença crônica contraída no labor, e o desemprego poderá se prolongar na medida em que, para obter o novo emprego, será necessária a realização do  exame  admissional,  no  qual  serão  eleitos  apenas  aqueles  considerados  como  “aptos”  e,  portanto,  não portadores de enfermidades.  Fonte: RESOLUÇÃO CNPS Nº 1.269, DE 15 DE FEVEREIRO DE 2006 

  

Page 11: 1   apostila de estatística   eng.2010

- 11 -

Uanderson Rebula de Oliveira Estatística

CONCEITO DE ESTATÍSTICA  

É A CIÊNCIA QUE SE DEDICA EM COLETAR, ORGANIZAR, APRESENTAR, ANALISAR E  INTERPRETAR DADOS (INFORMAÇÕES) PARA TOMADA DE DECISÃO. 

 

Estatística é a  ciência dos dados. A Estatística  lida  com a  coleta, o processamento e disposição de dados (informações), atuando como ferramenta fundamental nos processos de soluções de problemas. A Estatística  facilita o estabelecimento de  conclusões  confiáveis  sobre algum fenômeno que esteja sendo estudado (WERKEMA, 1995).  

 

É por meio da análise e  interpretação dos dados estatísticos que é possível o conhecimento de uma realidade, de seus problemas, bem como,  a  formulação  de  soluções  apropriadas  por  meio  de  um planejamento  objetivo  da  ação,  para  além  dos  “achismos”  e “casuismos” comuns. 

 

No uso diário o termo “estatística” refere‐se a fatos numéricos. Tenha em mente, entretanto, que estatística é bem diferente de matemática. Estatística é, antes de qualquer coisa, um método científico que determina questões de pesquisa; projeta estudos e experimentos; coleta, organiza, resume e analisa dados; interpreta resultados  e esboça  conclusões. Ou  seja, utiliza‐se dados  como  evidências para  responder  a  interessantes questões  sobre  o mundo.  A matemática  só  é  utilizada  para  calcular  a  estatística  e  realizar  algumas  das análises, mais  isso  é  apenas  uma  pequena  parte  do  que  realmente  é  a  estatística.  Portanto,  a  estatística mantém  com  a matemática  uma  relação  de  dependência,  solicitando‐lhe  auxílio,  sem  o  qual  não  poderia desenvolver‐se. 

 

A  Estatística  é  uma  ciência  interdisciplinar,  ou  seja,  é  comum  a  duas  ou mais  disciplinas  ou  ramos  de conhecimento.  Assim,  a  Estatística  é  aplicada  na  Medicina,  Administração,  Engenharias,  Economia, Contabilidade, Direito, Segurança do Trabalho, Qualidade, Marketing entre outras áreas. Veja abaixo. 

 

   

 

Medicina. Estudos de epidemiologia, inter‐relações  dos  determinantes  da freqüência  e  distribuição  de  doenças populacionais 

*Engenharia de Produção. Estudos de um  conjunto  de  dados  de  todas  as fases de um processo produtivo. 

Segurança  do  Trabalho.  Estudos  de acidentes  e  doenças,  suas  causas, quantidade, parte atingida, setores, % de afastamentos etc. 

Contabilidade.  Estudos  das informações financeiras das empresas públicas e privadas. 

Finanças.  Estudos  de  uma  série  de informações estatísticas para orientar investimentos. 

Economia.  Estudos  de  taxas  de inflação,  índice  de  preços,  taxa  de desemprego, futuro da economia. 

 

*Engenharia de Produção – A aplicação da Estatística na produção merece especial atenção. A atual ênfase na qualidade torna o controle da qualidade uma importante aplicação da estatística na área da produção. Usa‐se uma série de mapas estatísticos de controle de qualidade para monitorar o resultado (output) de um processo de  produção.  Suponha,  por  exemplo,  que  uma máquina  preencha  recipientes  com  2  litros  de  determinado refrigerante. Periodicamente, um operador do setor de produção seleciona uma quantidade de recipientes e verifica a exatidão, ou seja, se não há desvios. A Estatística também é usada na Engenharia de Produção para Estratificação, que consiste no agrupamento da  informação  (dados)  sob vários pontos de vista, de modo a focalizar a ação, considerando os fatores equipamento, tempo entre outros. Exemplo:  

Tipo de dano:  Operador:  Máquina de lavar: Roupas danificadas  em uma lavanderia  Tipo de roupa:  Marca do sabão:  Máquina de secar: 

Page 12: 1   apostila de estatística   eng.2010

- 12 -

Uanderson Rebula de Oliveira Estatística

UM POUCO DE HISTÓRIA E ATUALIDADE   O termo “Estatística” provém da palavra “Estado” e foi utilizado originalmente para  denominar  levantamentos  de  dados  (riquezas,  impostos,    nascimentos, mortalidade,  batizados,  casamentos,  habitantes  etc.),  cuja  finalidade  era orientar o Estado em suas decisões.   

Segundo  Costa  (2005,  p.  5)  em  1085,  Guilherme  “O  Conquistador”, ordenou  que  se  fizesse  um  levantamento  na  Inglaterra,  que  deveria incluir  informações  sobre  terras,  proprietários,  uso  da  terra, empregados,  animais  e  serviria,  também,  de  base  para  cálculo  de impostos. Tal levantamento originou um volume intitulado “domesday book”. 

  No  século  XVIII  o  estudo  dos  dados  foi  adquirindo,  aos  poucos,  feição verdadeiramente  científica.  A  palavra  Estatística  apareceu  pela  primeira vez no século XVIII e foi sugerida pelo alemão Godofredo Achenwall (1719‐1772), onde determinou o seu objetivo e suas relações com as ciências. 

  Desde essa época, a Estatística deixou de ser a simples catalogação de dados numéricos coletivos e  se tornou o estudo de como chegar a conclusões sobre o todo, partindo da observação e análise de partes desse todo. Essa é sua maior riqueza.  

  Atualmente  a  sociedade  está  completamente  tomada  pelos  números.  Eles aparecem  em  todos  os  lugares  para  onde  você  olha,  de  outdoors mostrando  as últimas  estatísticas  sobre  aborto,  passando  pelos  programas  de  esporte  que discutem as  chances de um  time de  futebol  chegar à  final do  campeonato, até o noticiário  da  noite,  com  reportagens  focadas  no  índice  de  criminalidade,  na expectativa de vida de uma pessoa que não come alimentos saudáveis e no índice de aprovação do presidente.  

 Em um dia comum, você pode se deparar com cinco, dez ou, até mesmo, vinte diferentes estatísticas  (ou até muito mais  em  um  dia  de  eleição).  Se  você  ler  todo  o  jornal  de  domingo,  irá  se  deparar  com  centenas  de estatísticas em reportagens, propagandas e artigos sobre todo tipo de assunto: desde sopa (quanto em média uma pessoa consome por ano?) até castanhas (quantas castanhas você precisa comer para aumentar seu QI?).  Nas  empresas  a  Estatística  desempenha  um  papel  cada  vez  mais  importante  para  os  Gerentes.  Esses responsáveis pela tomada de decisão utilizam a estatística para:  

Apresentar e descrever apropriadamente dados e informações sobre a empresa; 

Tirar conclusões sobre grandes populações, utilizando informações coletadas a partir de amostras; 

Realizar suposições confiáveis sobre a atividade da empresa;  Melhorar os processos da empresa. 

 A estatística é um  instrumento eficiente para a compreensão e  interpretação da realidade e não deve ser subestimada. Realmente existem pesquisas feitas de forma incorreta e que, por isso, não são confiáveis. Mas, em geral, quando um estudo estatístico é feito com critério, seus resultados permitem obter conclusões e prever  tendências sobre  fatos e  fenômenos. Um estudo bem  feito não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor possível.   

 

Page 13: 1   apostila de estatística   eng.2010

- 13 -

Uanderson Rebula de Oliveira Estatística

1.2 FASES DO ESTUDO ESTATÍSTICO  Um estudo estatístico confiável depende do planejamento e da correta execução das seguintes etapas:  1. Definir o que será estudado e a natureza dos dados, como exemplo:  

ESTUDO NATUREZA DOS DADOS

Acidentes do Trabalho  no Brasil 

Quantidade e período  Por regiões, estados ou municípios  Por atividade econômica  Por idade dos acidentados  Por parte do corpo atingida  Por causas dos acidentes etc. 

Peças danificadas  na linha A 

Tipo de peça   |  Tipo de defeito  Quantidade   Período  Turnos  Máquinas  Operadores  Matéria prima etc. 

  É preciso definir com clareza os objetivos da pesquisa, ou  seja, o que  se pretende apurar, que  tipo de problema buscará detectar. 

2. Coletar dados Após a definição do que será estudado e o estabelecimento do planejamento do  trabalho  (forma de coleta dos dados,  cronograma  das  atividades,  custos  envolvidos,  levantamento  das  informações  disponíveis),  o  passo seguinte é o da coleta de dados, que consiste na busca ou compilação dos dados, componentes do fenômeno a ser estudado.  Nessa etapa  recolhem‐se os dados  tendo o cuidado de controlar a qualidade da  informação. O sucesso de uma pesquisa depende muito da qualidade dos dados recolhidos.  Podem ser por meio de:  

• Criação de Softwares, a exemplo da CAT; • Uso de Softwares da empresa; • Dados históricos da empresa (físicos); • Pesquisas com questionários etc.

3. Organizar e contar dados

À  procura  de  falhas  e  imperfeições,  os  dados  devem  ser  cuidadosamente organizados  e  contados,  a  fim  de  não  incorrermos  em  erros  grosseiros  que possam influenciar nos resultados.  No exemplo da “Estatística na prática”, após a coleta da quantidade de acidentes por meio  da  CAT,  organiza‐os  por  período,  regiões  etc.  Da  mesma  maneira,  se  você  usa  um questionário para coletar dados na empresa, organiza‐os da  forma necessária à pesquisa, além da contagem a ser feita. 

Page 14: 1   apostila de estatística   eng.2010

- 14 -

Uanderson Rebula de Oliveira Estatística

4. Apresentação de dados Os dados devem ser apresentados sob a forma de tabelas ou gráficos, a fim de tornar mais fácil e rápido o exame daquilo que está sendo estudado.  5. Análise dos dados e tomada de decisão

Chegamos à fase mais complexa do processo estatístico, que consiste na análise dos  dados.  Por  fim,  a  partir  da  análise  realizada,  poderemos  chegar  a  uma tomada de decisão.  Observe  o  estudo  “Estatística  na  prática”.  O  que  resultou  a  análise  dos acidentes  no Brasil,  no  período  de  1970  a  2005? Veja  que  os Ministérios  do Trabalho, Previdência Social e da Saúde  se mobilizaram para  resolverem essa questão de saúde pública, com diversas ações a serem implementadas no país.    

A partir dessa discussão, fica claro que um profissional com conhecimentos de Estatística terá maior facilidade em identificar  um  problema  em  sua  área  de  atuação,  determinar  os  tipos  de  dados  que  irão  contribuir  para  sua análise, coletar esses dados e a seguir estabelecer conclusões e determinar um plano de ação para a solução do problema detectado.               

1.220.111

1.504.723

1.796.6711.743.825

1.551.4611.464.211

1.178.472

961.575

1.207.859

991.581

693.572

532.514

388.304 395.455414.341

363.868340.251393.071 399.077465.700 491.711

0

250.000

500.000

750.000

1.000.000

1.250.000

1.500.000

1.750.000

2.000.000

1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005

Involução da QUANTIDADE de ACIDENTES DO TRABALHO no Brasil - 1970 a 2005.

Anos FONTE: Revista Proteção

Aprovação das NR’s

Page 15: 1   apostila de estatística   eng.2010

- 15 -

Uanderson Rebula de Oliveira Estatística

1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA  O vocabulário utilizado em estudos estatísticos teve sua origem nos primeiros estudos feitos pela humanidade e que  eram  relativos  à  demografia  (estudo  estatístico  das  populações).  Por  isso  a  Estatística  emprega  termos próprios dessa área de conhecimento, mas com um sentido diferenciado. Assim, para dar prosseguimento, é de extrema importância destacar alguns termos utilizados no jargão estatístico.  

VARIÁVEL – É o termo usado para aquilo que você está pesquisando, estudando, analisando.  

No  estudo  representado  no  gráfico  abaixo  a  variável  é  o  acidente  do  trabalho.  Utilizada  como  um  adjetivo  do vocabulário do dia‐a‐dia, variável sugere que alguma coisa se modifica ou varia.  

 

São exemplos de Variáveis

Doenças, Sexo, Estaturas, Peso, Idade, Renda, Natalidade, Mortalidade, PIB, Inflação, Exportações brasileiras, Produção de café, Alimentação, Peças produzidas por hora, Paradas de produção no mês, Rotatividade de estoque por ano, Poluição, Clima na região sudeste, Consumo de energia no mês, Vendas mensais de uma empresa, Produção diária de automóveis etc.

 EXEMPLO DE APLICAÇÃO: A associação dos moradores de um bairro queria traçar um perfil dos freqüentadores de um parque ali situado. Uma equipe de pesquisa elaborou questões a fim de reunir as  informações procuradas. Numa manhã de quarta‐feira, 6 pessoas  foram entrevistadas e cada uma  respondeu a questões para  identificar  idade, número de vezes que freqüenta o parque por semana, estado civil, meio de transporte utilizado para chegar ao parque, tempo de permanência no parque e renda familiar mensal. Os resultados são mostrados na tabela a seguir:   

  Cada um dos aspectos investigados — os quais permitirão fazer a análise desejada — é denominado variável. 

1.220.111

1.504.723

1.796.6711.743.825

1.551.4611.464.211

1.178.472

961.575

1.207.859

991.581

693.572

532.514

388.304 395.455414.341

363.868340.251393.071 399.077465.700 491.711

0

250.000

500.000

750.000

1.000.000

1.250.000

1.500.000

1.750.000

2.000.000

1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2001 2002 2003 2004 2005

Involução da QUANTIDADE de ACIDENTES DO TRABALHO no Brasil - 1970 a 2005.

FONTE: Revista Proteção Anos

VARIÁVEL

Variáveis

Page 16: 1   apostila de estatística   eng.2010

- 16 -

Uanderson Rebula de Oliveira Estatística

TIPOS DE VARIÁVEIS  Há,  pois,  uma  divisão  principal  para  as  variáveis  estatísticas,  que  consiste  em  considerá‐las  como  Variáveis Quantitativas (contínuas ou discretas) e Variáveis Qualitativas. Esta divisão é de facílima compreensão! Veja o esquema abaixo.  

Esquema básico Tipo de VARIÁVEL Resposta fornecida à pesquisa Exemplos

Quantitativa Em números Discreta Inteiros 0,1, 2, 3,...,9 Gols de futebol, Idade (anos) Contínua Não inteiros 0,12 1,64 Altura (cm), Peso (kg), Tempo

Qualitativa Em nomes, atributos Sexo, Cor, Nacionalidade, Raça Tipos de Variáveis da pesquisa em um parque:

 Se a dúvida persiste, no quadro abaixo você pode observar os esclarecimentos do Esquema básico. 

Esclarecimentos do Esquema básico

Tipo de VARIÁVEL Resposta fornecida à pesquisa

Quantitativa (Em números)

Será Quantitativa a variável para a qual  se possa atribuir um valor numérico. Se a  resposta fornecida  à  pesquisa  estiver  expressa  por  um  número,  então  a  variável  é  quantitativa.  Por exemplo:  quantos  livros  você  lê  por  ano?  A  resposta  é  um  número?  Então,  variável quantitativa.  Quantas  pessoas  moram  em  sua  casa?  A  resposta  é  um  número?  Então, novamente, variável quantitativa.  Exemplo. No  caso do estudo  “ACIDENTE DO TRABALHO”, é uma variável quantitativa, pois o objeto do estudo foi a quantidade de acidentes no período de 1970 a 2005

Discreta (números inteiros)

(contagem)

Variável  Quantitativa  Discreta  é  a  variável  quantitativa  que  assume  somente  números inteiros. Resulta,  geralmente, de  contagem.  Esta  variável não  pode  assumir qualquer  valor, dentro  de  um  intervalo  de  valores  de  resultados  possíveis.  Por  exemplo,  se  eu  pergunto quantos  irmãos você  tem, a  resposta  jamais poderia ser “tenho 3,75  irmãos”, ou “tenho 4,8 irmãos”, ou seja, a resposta não poderia assumir todos os valores de um intervalo! Este acima é  o  conceito  formal  de  variável  discreta!  O  conceito  para memorizar  é  o  seguinte:  aquela variável  obtida  por meio  de  uma  contagem.  Em  outras  palavras:  a  variável  discreta  você conta!.  Exemplos: quantas pessoas moram na  sua  casa? Quantos  livros  você  tem? Quantos carros você tem? Se, para responder à pergunta, você faz uma contagem, então está diante de uma variável quantitativa discreta. 

Contínua (Números não inteiros)

(medição)

Variável  Quantitativa  Contínua  é  aquela  que  pode  assumir  qualquer  valor  dentro  de  um intervalo de resultados possíveis. Se eu pergunto quantos quilos você pesa, a resposta pode ser 65,35kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta pode ser 27,35°C. Para facilitar a memorização, basta  lembrar que a variável quantitativa  contínua pode  ser obtida por uma medição, ou seja, a variável contínua você mede! Exemplos: peso, altura, duração de tempo para resolução de uma prova, pressão, temperatura etc. 

Qualitativa (nomes, atributos)

Se a pergunta é “qual a sua cor preferida?”, logicamente a resposta não será um número, daí estaremos tratando de uma variável qualitativa, ou seja, aquela para a qual não se atribui um valor numérico. Exemplos: Sexo: masculino ou feminino 

Qualitativa

Quantitativa discreta 

Quantitativa contínua 

Page 17: 1   apostila de estatística   eng.2010

- 17 -

Uanderson Rebula de Oliveira Estatística

1.4 POPULAÇÃO E AMOSTRA  

Quando você quer saber se a sopa ficou boa, o que você faz? Mexe a panela, retira um pouco com uma colher e prova. Depois tira uma conclusão sobre todo o conteúdo da panela sem, na verdade, ter provado tudo. Portanto, é possível ter uma idéia de como a sopa está sem ter que comer tudo. Isso é o que se faz em estatística.  A estatística deixou de ser a simples catalogação de dados numéricos e se tornou o estudo de como chegar a conclusões sobre o  todo  (população), partindo da observação e análise de partes desse todo (amostra). Essa é sua maior riqueza. Assim, podemos conceituar população e amostra como: 

 POPULAÇÃO É UM CONJUNTO DE TODOS OS ELEMENTOS EM ESTUDO. 

AMOSTRA É UMA PARTE DA POPULAÇÃO.      

             

Muitas vezes quando queremos fazer um estudo estatístico, não é possível analisar toda a população envolvida com o fato que pretendemos investigar, como exemplo o sangue de uma pessoa ou a poluição de um rio. É impossível o teste do todo. Há situações também em que é inviável o estudo da população, por  exemplo,  a  pesquisa  com  todos  os  torcedores  em  um  estádio  de  futebol  durante  uma  partida. Nesses  casos,  o  estatístico  recorre  a  uma  amostra  que,  basicamente,  constitui  uma  redução  da população a dimensões menores, sem perda das características essenciais. 

  Os resultados fundamentados em uma amostra não serão exatamente os mesmos que você encontraria se estudasse  toda a população, pois, quando você  retira uma amostra, você não obtém  informações a respeito  de  todos  em  uma  dada  população.  Portanto,  é  importante  entender  que  os  resultados  da amostra fornecem somente estimativas dos valores das características populacionais. Com métodos de amostragens apropriados, os  resultados da amostra produzirão  “boas” estimativas da população, ou seja, um estudo bem feito não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor possível. Quando aprendemos estatística inferencial, também aprendemos técnicas para controlar esses erros de amostragem. 

 4 razões para selecionar uma amostra

O número de elementos em uma população é muito grande;  Demanda menos tempo do que selecionar todos os itens de uma população;  É menos dispendioso (caro) do que selecionar todos os itens de uma população;  Uma análise amostral é menos cansativa e mais prática do que uma análise da população inteira.  

Podemos visualizar o conceito de  população  e  amostra  na figura ao lado.  Quando  pesquisamos  toda  a população, damos o nome de censo.  A  precisão  depende  do tamanho  da  amostra,  e quanto  maior  é  o  tamanho amostral,  maior  será  a precisão das informações. 

AMOSTRA(uma parte da população)

POPULAÇÃO(todos os elementos em estudo)

AMOSTRA(uma parte da população)

POPULAÇÃO(todos os elementos em estudo)

N é designado para População n é designado para Amostra

“N”

“n”

Page 18: 1   apostila de estatística   eng.2010

- 18 -

Uanderson Rebula de Oliveira Estatística

São exemplos de População e Amostra: MEDICINA.  Pretende‐se  estudar  o  efeito  de  um  novo  medicamento  para  curar  determinada  doença.  É selecionado um grupo de 50 doentes, administrando‐se o novo medicamento a 10 desses doentes escolhidos ao acaso e o medicamento habitual aos restantes.  

População: Todos os 50 doentes com a doença que o medicamento a estudar pretende tratar. Amostra: Os 10 doentes selecionados. 

CONTROLE DE QUALIDADE. O Gerente de Produção de uma fábrica de parafusos pretende assegurar‐se de que a  porcentagem  de  peças  defeituosas  não  excede  um  determinado  valor,  a  partir  do  qual  determinada encomenda poderia ser rejeitada.  

População: Todos os parafusos fabricados ou a fabricar, utilizando o mesmo processo. Amostra: Parafusos escolhidos ao acaso entre os lotes produzidos. 

ESTUDOS DE MERCADO. O gerente de uma fábrica de produtos desportivos pretende lançar uma nova linha de esquis, pelo que encarrega uma empresa especialista em estudos de mercado de “estimar“ a porcentagem de potenciais compradores desse produto. 

População: conjunto de todos os praticantes de desportos de neve. Amostra: conjunto de alguns praticantes inquiridos pela empresa. 

SISTEMAS DE PRODUÇÃO. Um fabricante de pneus desenvolveu um novo tipo de pneu e quer saber o aumento da durabilidade em  termos de kilometragem em  relação à atual  linha da empresa. Produz diariamente 1000 pneus e selecionou 120 para testes. 

População: 1000 pneus. Amostra: 120 pneus. 

 A amostra na prática - Oxford Cereais (Levine et al, 2008, p.218)

A Oxford Cereais abastece milhares de caixas de cereais durante um turno de oito horas. Como gerente de operações da unidade de produção, você é responsável por monitorar a quantidade de cereal colocada em cada caixa. Para ser coerente com o conteúdo especificado na embalagem, as caixas devem conter 368 gramas de cereal. Em razão da velocidade do processo, o peso do cereal varia  de  caixa  para  caixa,  fazendo  com  que  algumas  caixas  fiquem mal  abastecidas  enquanto outras  ficam hiperabastecidas. Se o processo não estiver  funcionando de maneira apropriada, o peso das caixas pode se desviar demasiadamente do peso especificado no rótulo, 368 gramas, e se tornar inaceitável. Uma vez que a pesagem de cada caixa individual consome uma quantidade 

demasiadamente grande de tempo, é dispendiosa e  ineficiente, você deve extrair uma amostra de caixas. Para cada amostra selecionada, você planeja pesar caixas  individuais. Com base em  sua análise, você  terá que decidir entre manter, alterar ou interromper o processo. 

 MÉTODOS DE AMOSTRAGEM PROBABILÍSTICOS

 

  Amostragem Aleatória Simples – É a técnica de amostragem em que cada um dos elementos da população tem a mesma chance de ser selecionado. 

Uma característica importante de uma boa pesquisa é que a amostra da população alvo seja selecionada aleatoriamente.  Aleatoriamente  significa  que  todos  os  membros  da  população  alvo  devem  ter  as mesmas  chances  de  serem  incluídos  na  amostra.  Ou  seja,  o  processo  usado  para  a  seleção  de  sua amostra não pode ser parcial. “Aleatório” = Dependente de fatores incertos. 

 Suponha que você  tenha um  rebanho com 500 novilhos   e precisa  retirar uma amostra aleatória de 50 deles para fazer um exame para uma doença. Retirar os 50 primeiros novilhos que vierem em sua direção não se encaixaria na definição de amostra aleatória. Os primeiros novilhos que forem capazes de  vir  em  sua  direção,  provavelmente  são  os  que  têm menos  chances  de apresentarem qualquer tipo de doença ou, talvez, sejam os mais velhos e mais amigáveis, que realmente são os mais  suscetíveis  a doenças. De qualquer  forma,  a pesquisa  foi  tendenciosa. Como  coletar uma amostra  aleatória  dos  novilhos?  Os  animais  provavelmente  possuem  etiquetas  com  um  número  de identificação, assim você deve conseguir uma lista com todos os números de identificação, selecione uma amostra aleatória desses números e localize os animais.  

Page 19: 1   apostila de estatística   eng.2010

- 19 -

Uanderson Rebula de Oliveira Estatística

Uma amostra  aleatória é boa; ela dá a mesma  chance a  todos os membros de uma população de  ser selecionado, além de utilizar mecanismos de casualidade para escolhê‐los, como a  tabela de números aleatórios. O método é semelhante a um sorteio. 

Tabela de números aleatórios  

Um dos mecanismos utilizados para seleção é a tabela de números aleatórios, que consiste em uma série de números listados em uma sequência aleatoriamente gerada.  Esta tabela tem duas características que a tornam particularmente adequada: primeiro, os números estão dispostos de tal maneira que a chance de  qualquer  um  deles  aparecer  em  determinada  sequência  é  igual  à  chance  do  aparecimento  em qualquer outra posição; segundo, cada uma de  todas as combinações de dois algarismos  tem a mesma chance de ocorrência, como também todas as combinações de três algarismos, e assim por diante.  

  Sistemas  computacionais  elaboram  números  aleatórios. O  Excel  dispõe  da função “ALEATÓRIO” para gerar números aleatórios (veja figura ao lado).   

 

A  tabela  de  números  aleatórios  abaixo  foi  construída  de  modo  que  os  dez  algarismos  (0  a  9)  são distribuídos ao acaso, pelo Excel, identificadas pelas linhas (1, 2, 3, 4...) e colunas (A, B, C, D ...): 

  

Tabela de números aleatórios   A  B  C  D  E  F  G  H  I  J  K  L  M  N O P Q R S T U V W X Y Z a b  c  d  e  f  g  h i  j  k l 1  9  3  3  1  2  1  6  6  3  3  9  0  7  0 4 0 4 4 1 3 8 1 6  5 8 8 9 8  6  5  0  6  3  3 1 2 4 82  0  7  6  8  1  4  5  0  5  8  6  6  1  4 2 6 7 5 6 0 5 7 7  9 6 3 2 6  3  4  5  9  8  6 5 2 1 13  6  5  1  5  3  4  4  2  3  7  9  1  4  8 5 8 7 2 4 7 3 7 0  6 2 2 1 3  5  0  8  9  4  7 1 6 4 44  9  7  0  2  6  7  3  2  6  7  4  9  1  6 2 7 7 8 6 8 4 7 8  1 5 7 1 2  6  6  6  3  5  6 0 8 2 15  5  5  6  5  1  6  4  8  3  3  1  5  3  8 8 2 3 8 8 7 7 4 5  0 4 5 1 8  7  2  3  2  9  6 4 7 7 96  8  3  4  8  8  3  8  0  6  4  8  2  3  5 2 5 3 7 1 7 6 8 2  9 5 3 4 3  7  0  3  9  7  0 1 5 7 27  3  1  2  7  5  4  7  1  3  5  2  4  1  5 1 3 1 8 0 5 8 8 6  0 6 6 9 5  5  5  3  5  8  5 6 7 1 28  3  6  3  1  1  7  6  9  5  3  3  5  3  5 6 3 3 3 4 3 6 8 4  5 5 8 8 1  9  2  5  7  8  7 7 5 8 79  4  2  0  4  7  2  7  9  3  3  3  3  3  2 8 7 1 8 0 6 1 5 3  4 0 6 3 2  8  3  3  0  7  2 7 2 4 210  6  8  7  0  3  9  9  9  8  6  8  2  1  5 8 7 4 5 5 2 6 3 4  1 1 2 2 1  2  9  4  0  5  8 7 0 6 811  7  9  1  6  5  8  1  4  3  7  9  1  2  5 3 4 1 6 3 1 6 3 2  5 1 9 5 7  7  5  6  6  8  4 6 5 7 112  8  1  4  6  3  8  8  4  7  1  3  6  3  7 7 5 2 6 2 4 8 6 3  2 1 4 8 3  1  7  0  8  1  9 4 1 2 313  8  1  7  9  3  4  3  6  9  5  9  2  1  7 3 8 7 5 2 2 7 6 0  6 1 8 1 2  1  4  8  5  2  7 3 3 8 514  2  8  8  4  4  0  4  3  2  2  8  1  1  0 2 8 1 8 1 4 5 1 8  1 8 3 3 4  5  6  6  8  1  4 7 4 3 315  3  3  7  2  0  0  2  9  5  5  6  8  2  4 5 7 4 0 6 7 3 2 6  3 7 6 7 2  7  2  2  7  6  4 1 6 1 116  0  2  7  8  1  7  7  6  0  4  3  4  5  8 7 8 3 0 3 1 2 7 8  5 2 3 2 5  7  5  7  4  3  5 2 9 4 617  1  1  0  5  9  6  6  2  7  2  2  7  1  8 5 5 2 7 5 9 5 0 3  7 0 3 1 5  4  2  9  7  4  4 2 6 0 518  1  9  0  4  1  1  4  3  3  1  5  6  7  0 1 2 2 2 4 4 9 2 2  1 9 7 1 5  9  1  1  5  8  9 7 2 2 219  6  9  7  4  5  0  1  0  6  6  2  1  5  2 1 8 8 2 5 2 2 2 8  1 2 3 8 1  3  5  7  6  7  8 1 6 7 120  2  7  1  2  1  6  3  1  1  7  1  2  3  4 8 8 1 1 7 1 1 1 3  6 2 1 1 7  9  2  2  5  3  2 2 2 7 621  9  5  5  5  2  2  0  1  3  6  9  6  5  3 2 2 6 3 1 4 4 4 3  1 6 7 0 5  5  1  0  7  3  1 2 1 5 322  4  2  4  9  7  3  1  8  3  4  8  3  7  1 3 1 1 6 4 8 2 3 3  1 4 7 3 8  6  3  1  8  0  2 8 1 0 823  5  8  3  1  1  3  8  2  5  3  8  6  2  2 7 8 1 1 1 3 4 4 8  8 6 4 2 3  1  8  6  1  8  4 9 1 5 624  8  4  3  2  1  3  5  7  6  7  3  3  6  1 9 4 7 6 5 6 6 7 2  6 5 7 0 8  2  6  4  9  1  4 7 7 3 425  1  2  8  1  0  5  4  3  8  5  1  1  8  9 1 3 8 7 4 5 0 4 7  0 8 3 8 9  6  2  3  7  1  4 6 2 9 426  7  7  5  7  9  2  4  5  7  8  7  1  4  8 4 1 6 4 9 7 5 9 4  1 4 4 3 2  2  5  8  0  2  3 4 5 4 227  7  2  8  8  8  3  8  5  5  4  4  5  9  4 9 2 3 1 1 1 2 7 6  3 5 1 4 0  6  2  7  7  7  7 7 7 0 428  8  7  7  1  9  6  7  6  6  5  5  9  1  6 5 6 1 2 2 3 2 5 7  5 6 9 5 0  3  1  7  1  1  5 5 2 6 629  1  4  8  2  2  1  9  5  2  6  6  3  4  0 1 3 0 5 5 6 9 1 7  8 8 8 2 7  7  9  7  5  0  3 6 2 4 430  7  6  1  9  0  5  1  4  4  4  1  0  1  6 4 3 7 3 7 1 0 7 4  1 6 8 9 9  7  9  6  2  7  6 3 7 0 131  1  5  8  1  0  4  3  9  2  4  5  6  6  8 2 2 3 1 2 8 4 5 9  1 7 4 7 6  7  1  6  1  8  0 4 6 2 932  3  2  2  2  1  1  4  5  8  0  2  4  5  8 3 3 0 9 3 9 8 9 6  9 8 8 4 5  9  8  1  3  3  5 8 9 0 633  6  5  4  6  5  9  5  1  0  0  1  4  2  7 7 7 7 8 0 3 2 7 7  2 8 7 5 8  1  3  8  7  6  4 0 0 2 634  5  0  8  7  8  1  3  5  1  4  6  1  5  5 6 6 0 3 5 5 0 3 6  5 4 1 4 1  4  0  6  9  5  2 2 0 5 5 

Page 20: 1   apostila de estatística   eng.2010

- 20 -

Uanderson Rebula de Oliveira Estatística

Como usar a tabela de números aleatórios

1º Numerar todos os elementos da população N;  

2º Determinar as combinações dos algarismos para assegurar correspondência entre os dígitos aleatórios e os elementos da população (ex.: se o último número da população for 80, por exemplo, devem ser lidos números de dois algarismos; caso o último número seja 456, devem ser lidos números de três algarismos, e assim por diante; 

 

3º Escolher um ponto de partida arbitrário da tabela. A  leitura pode ser feita horizontalmente →← (da direita  para  a  esquerda  ou  vice‐versa),  verticalmente  ↓↑  (de  cima  para  baixo  ou  vice‐versa), diagonalmente ↗↙↖↘ (no sentido ascendente ou descendente) ou formando o desenho de uma  letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo; 

 

4º Descartar os números maiores que o tamanho da população e/ou numeral repetido;  

5º Usar os números escolhidos para identificar os elementos da população.  EXEMPLO. Uma empresa pecuária possui uma população de novilhos de tamanho N = 80 e precisa retirar amostras de  tamanho  n  =  12  (15%  da  população)  para  fazer  exame  de  uma  determinada  doença. Utilize  o método  de amostragem  aleatória  simples,  considerando  a  tabela,  a  partir  da  4ª  linha,  coluna  D,  sentido  horizontal,  da esquerda para direita (→).  Informar, também, os números descartados.  

SOLUÇÃO.  Como  a  população  N=80  teve  dois  algarismos,  então  combinamos  dois  algarismos  na  tabela  (00), descartando os números repetidos e/ou maiores que o tamanho da população (Ex.: 81, 82, 83...) e escolhendo outra combinação de algarismos. Este procedimento é repetido até a amostra de tamanho n=12 ser escolhida. Então:    A  B  C  D  E  F  G  H  I  J  K  L  M  N  O P Q R S T U V W X Y Z a b c  d  e  f  g  h  i  j  k l 1  9  3  3  1  2  1  6  6  3 3  9  0  7  0  4 0 4 4 1 3 8 1 6  5 8 8 9 8 6  5  0  6  3  3  1 2 4 82  0  7  6  8  1  4  5  0  5 8  6  6  1  4  2 6 7 5 6 0 5 7 7  9 6 3 2 6 3  4  5  9  8  6  5 2 1 13  6  5  1  5  3  4  4  2  3 7  9  1  4  8  5 8 7 2 4 7 3 7 0  6 2 2 1 3 5  0  8  9  4  7  1 6 4 4

4  9  7  0  2  6  7  3  2  6 7  4  9  1  6  2 7 7 8 6 8 4 7 8  1 5 7 1 2 6  6  6  3  5  6  0 8 2 1

5  5  5  6  5  1  6  4  8  3 3  1  5  3  8  8 2 3 8 8 7 7 4 5  0 4 5 1 8 7  2  3  2  9  6  4 7 7 9

6  8  3  4  8  8  3  8  0  6 4  8  2  3  5  2 5 3 7 1 7 6 8 2  9 5 3 4 3 7  0  3  9  7  0  1 5 7 2 

n =   26  73  74  62  77  78  15  71  66  35  60  56  

Descartados por repetição: 26    26    15 

Descartados por serem maiores que a população: 91    86    84    82     

 

  Amostragem Aleatória Estratificada – É a técnica de amostragem em que dividimos todos os elementos da população em grupos (estratos) de idênticas características.

 Às  vezes,  a  população  é  heterogênea  (ex.:  sexo masculino  e  feminino;  peça A, B  e  C)  e  a  amostra  aleatória simples não apresentaria esta heterogeneidade. Seria, então, necessário homogeneizar as amostras em grupos, estratos.  Neste  caso  recorremos  à  amostragem  aleatória  estratificada.  “Estratificar”  sugere  “formar‐se  em camadas”.  

A  estratificação mais  simples que  encontramos na população do  rebanho de  tamanho N=80  é  a divisão  entre novilhos e novilhas. Supondo que haja 35 novilhos e 45 novilhas, teremos a seguinte formação dos estratos: 

 

 

População (80)

Novilhos (35) Novilhas (45)

Estrato 1 Estrato 2

Page 21: 1   apostila de estatística   eng.2010

- 21 -

Uanderson Rebula de Oliveira Estatística

São,  portanto,  dois  estratos  (novilhos  e  novilhas).  Como  queremos  uma  amostra  de  tamanho  n=12  (15%  da população), por estrato, temos:  

Rebanho População 15% Amostra Novilho (estrato 1)  35  35*15% = 5,25  5 Novilha (estrato 2)  45  45*15%= 6,75  7 

TOTAL  80  80*15% = 12  12  O próximo passo é extrair as amostras dentro de cada estrato. Então, numeramos o rebanho de 01 a 80, sendo que de 01 a 35 correspondem novilhos e de 36 a 80, as novilhas.  Tomando na tabela de números aleatórios, a partir da 4ª linha, coluna D, sentido horizontal, da esquerda para direita (→), obtemos os seguintes números:    A  B  C  D  E  F  G  H  I  J  K  L  M  N  O P Q R S T U V W X Y Z a b c  d  e  f  g  h  i  j  k l 1  9  3  3  1  2  1  6  6  3 3  9  0  7  0  4 0 4 4 1 3 8 1 6  5 8 8 9 8 6  5  0  6  3  3  1 2 4 82  0  7  6  8  1  4  5  0  5 8  6  6  1  4  2 6 7 5 6 0 5 7 7  9 6 3 2 6 3  4  5  9  8  6  5 2 1 13  6  5  1  5  3  4  4  2  3 7  9  1  4  8  5 8 7 2 4 7 3 7 0  6 2 2 1 3 5  0  8  9  4  7  1 6 4 4

4  9  7  0  2  6  7  3  2  6 7  4  9  1  6  2 7 7 8 6 8 4 7 8  1 5 7 1 2 6  6  6  3  5  6  0 8 2 1

5  5  5  6  5  1  6  4  8  3 3  1  5  3  8  8 2 3 8 8 7 7 4 5  0 4 5 1 8 7  2  3  2  9  6  4 7 7 9

6  8  3  4  8  8  3  8  0  6 4  8  2  3  5  2 5 3 7 1 7 6 8 2  9 5 3 4 3 7  0  3  9  7  0  1 5 7 2 

Temos, então: 1 a 35 →  Novilhos n =  26  15  35  31  23     36 a 80 →  Novilhas n =  73  74  62  77  78  71  66   Descartados 

  Notas importantes sobre este tipo de amostragem

Como é provável que a variável em estudo apresente, de estrato para estrato, um comportamento  heterogêneo  e,  dentro  de  cada  estrato,  um  comportamento homogêneo,  convém  que  a  amostragem  seja  feita  por  estratos.  Portanto,  a amostragem estratificada é, em geral, usada para reduzir a variação nos resultados. 

A amostragem estratificada é mais eficiente do que a amostragem aleatória simples, uma vez que fica assegurada a representatividade de elementos ao  longo de toda a extensão  da  população.  A  homogeneidade  de  itens  dentro  de  cada  estrato proporciona maior precisão. Da mesma maneira, em um sistema produtivo, podemos estratificar as amostras em, por exemplo, peça A, peça B, peça C e assim por diante. 

  Amostragem Aleatória por Conglomerado- É a técnica de amostragem em que dividimos todos os elementos da população em diversos grupos (conglomerados).

 

A conglomeração mais simples que encontramos na população do rebanho de novilhos de tamanho N=80 é a sua divisão,  por  exemplo,  em  10  grupos  (conglomerados),  cada  um  com  8  elementos  da  população.  Depois numeramos cada conglomerado, como mostrado na figura abaixo:  

 O  próximo passo  é  extrair uma  amostra  aleatória  simples  dos  conglomerados.    Supondo o  tamanho  amostral n=24, teremos, portanto, 3 conglomerados a considerar. Partindo da 1ª linha, coluna A, sentido horizontal e da esquerda para direita (→) da tabela aleatória, temos, então:  

Conglomerados selecionados:  06  07  02 Agora,  é  só  coletar  todos  os  elementos  desses conglomerados selecionados e estudar todos os itens. 

População (80)

Conglomerado 1 Conglomerado 2 Conglomerado 3 Conglomerado 5 Conglomerado 4

Conglomerado 6 Conglomerado 7 Conglomerado 8 Conglomerado 10 Conglomerado 9

8 novilhos (as) para cada conglomerado

Número de amostras

estratificadas

Page 22: 1   apostila de estatística   eng.2010

- 22 -

Uanderson Rebula de Oliveira Estatística

Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de amostragem é um grupo de elementos. Uma das principais aplicações da amostragem por conglomerados é a amostragem por áreas geográficas, como cidades, municípios, setores de uma empresa, quarteirões de cidades, domicílios, território de vendas etc.  Segundo Levine et al (2008, p. 222) e Anderson et al (2009, p.263) a amostragem por conglomerados têm as seguintes características: 

  Todos os elementos contidos em cada conglomerado amostrado formam a amostra;  Cada conglomerado é uma versão representativa em pequena escala da população inteira;  Tende a produzir melhores resultados quando os elementos neles contidos não são similares;   De  um  modo  geral,  é  mais  eficaz  em  termos  de  custo  do  que  a  amostragem  aleatória  simples, particularmente se a população estiver dispersa ao  longo de uma extensa área geográfica. Entretanto, a amostragem por  conglomerado  geralmente demanda um maior  tamanho de amostra para que  sejam produzidos resultados tão precisos quanto aqueles que seriam obtidos da amostragem aleatória simples ou estratificada. 

 Segundo Triola (2008, p. 23) outro exemplo de amostra por conglomerado pode ser encontrado nas pesquisas eleitorais, onde selecionamos aleatoriamente 30 zonas eleitorais dentre um grande número de zonas e, em seguida, entrevistamos todos os eleitores daquelas seções (zonas selecionadas).  Isso é muito mais rápido e muito menos dispendioso do que selecionar uma pessoa de cada uma das zonas na área populacional.  

 

ATENÇÃO!

É fácil confundir amostragem estratificada com a amostragem por conglomerado, porque ambas envolvem  a  formação  de  grupos.  Porém,  a  amostragem  por  conglomerado  usa  todos  os elementos  de  um  grupo  selecionado,  enquanto  a  amostragem  estratificada  usa  amostras  de elementos de todos os estratos. 

  

                             

Figura.  Amostragem por  Conglomerados em quarteirões de um bairro. 

Page 23: 1   apostila de estatística   eng.2010

- 23 -

Uanderson Rebula de Oliveira Estatística

  Amostragem Sistemática - É a técnica de amostragem em que retiramos os elementos da população periodicamente, definida pelo pesquisador.

 Utilizamos  este  tipo  de  amostragem  quando  os  elementos  de  uma  população  se  encontram  ordenados,  por exemplo, a coleta de amostras de um determinado produto em uma linha de produção.  

  

Nestes casos, a  seleção dos elementos que constituirão a amostra pode  ser  feita por um  sistema  imposto pelo pesquisador.  Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste  caso, estaríamos  fixando o  tamanho amostral de 10% da população. 

 Uma amostragem é sistemática quando a retirada dos elementos da população é  feita periodicamente, sendo o intervalo de seleção calculado, por meio da divisão do tamanho da população pelo tamanho da amostra a ser selecionada.  EXEMPLO. Deseja‐se retirar uma amostra de n = 10 unidades de peças de uma população de tamanho N = 800. O intervalo de seleção é, então, 800/10 = 80. Desse modo, 80 seria o primeiro elemento a ser considerado para a amostra;  os  demais  elementos  seriam  periodicamente  considerados  de  80  em  80.  Nesse  caso  escolhem‐se aquelas que estiverem nas seguintes posições: 80, 160, 240, 320, 400, 480, 560, 640, 720, 800. 

          

    

Outras amostragens (não probabilísticas) Amostragem  por  julgamento  –  A  pessoa  que  conhece  mais  profundamente  o  tema  do  estudo  escolhe  os elementos que  julga  serem mais  representativos da população.  Por  exemplo, um  repórter pode  tomar  como amostra dois ou três senadores, julgando que eles refletem a opinião geral de todos os senadores. A qualidade dos resultados depende do julgamento da pessoa que a seleciona.   Amostragem  por  conveniência  –  a  amostra  é  identificada  primeiramente  por  conveniência  (cômodo,  útil, favorável).  Como  exemplo  estudantes  de  uma  universidade  voluntários  para  compor  uma  amostra  de  uma determinada pesquisa escolar. 

Amostras Coleta de Amostras

0 80 160 240 320 400 480 560 640 720 800

1 2 3 4 5 6 7 8 9 10Amostra

Nº da peça

População = 800Amostra = 10

800/10 = 80

80                    80                     80                  80                    80                     80              80                      80                       80

0 80 160 240 320 400 480 560 640 720 800

1 2 3 4 5 6 7 8 9 10Amostra

Nº da peça

População = 800Amostra = 10

800/10 = 80

80                    80                     80                  80                    80                     80              80                      80                       80

Page 24: 1   apostila de estatística   eng.2010

- 24 -

Uanderson Rebula de Oliveira Estatística

AMOSTRA(uma parte da população)

POPULAÇÃO(todos os elementos em estudo)

AMOSTRA(uma parte da população)

POPULAÇÃO(todos os elementos em estudo)

1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL   Estatística descritiva – É o ramo da estatística que  envolve  a  organização,  o  resumo  e  a representação  dos  dados  para  tomada  de decisão.  Estatística inferencial – É o ramo da estatística que envolve o uso da  amostra para  chegar  a grandes  conclusões  sobre  a  população.  Uma ferramenta  básica  no  estudo  da  estatística inferencial é a probabilidade.  Algumas ferramentas aplicadas à Estatística Inferencial:  

Probabilidades Uma Probabilidade é uma medida numérica que representa a chance de um evento ocorrer. Ex.: Ao lançar um dado, qual a probabilidade de obter o valor 4? R = 1/6 = 16%  

Estimação, margem de erro e intervalo de confiança Suponha que o tempo médio que você leva para chegar ao trabalho de carro é de 35’, com uma margem de erro 

de 5’ para mais ou para menos. A estimativa é de que o tempo médio gasto até chegar  ao  trabalho  fica em algum ponto entre 30’ e 40’. Esta estimativa é um intervalo de confiança, pois leva em consideração o fato de que os resultados da amostra irão variar e dá uma indicação de uma variação esperada. 

A margem  de  erro  é  uma medida de  quão  próximo  você  espera  que seus resultados representem toda a população  que  está  sendo estudada.  Vários  fatores influenciam  a  amplitude  de  um intervalo de confiança, tais como o tamanho amostral, a variabilidade da população e o quanto você espera obter de precisão. A maioria dos pesquisadores contenta‐se com 95% de  confiança  em  seus  resultados.  Estar  95%  confiante  indica  que  se  você  coletar muitas, mas muitas  amostras  e  calcular  o  intervalo  de confiança para todas, 95% dessas amostras terão intervalos de confiança que abrangerão o alvo. 

 Teste de hipótese Teste de hipótese é um procedimento estatístico em que os dados são coletados e medidos para comprovar uma alegação feita sobre uma população. Por exemplo, se uma pizzaria alega entregar as pizzas dentro de 30’ a partir do  pedido,  você  pode  testar  se  essa  alegação  é  verdadeira,  coletando  uma  amostra  aleatória  do  tempo  de entrega durante um  determinado período de tempo e observar o tempo médio de entrega para essa amostra.    

     

Page 25: 1   apostila de estatística   eng.2010

- 25 -

Uanderson Rebula de Oliveira Estatística

              

                                

2

SÉRIES ESTATÍSTICAS

Page 26: 1   apostila de estatística   eng.2010

- 26 -

Uanderson Rebula de Oliveira Estatística

2.1 CONCEITOS E TIPOS DE SÉRIES  

As  tabelas  e  gráficos  constituem  um  importante  instrumento  de  análise  e  interpretação  de  um  conjunto  de  dados. Diariamente é possível encontrar  tabelas e  gráficos nos mais  variados  veículos de  comunicação  (jornais,  revistas,  televisão, Internet),  associadas  a  assuntos  diversos  do  nosso  dia‐a‐dia,  como  resultados  de  pesquisas  de  opinião,  saúde  e desenvolvimento humano, economia, esportes, cidadania, etc. A importância das tabelas e dos gráficos está ligada sobretudo à facilidade e rapidez na absorção e interpretação das informações por parte do leitor e também às inúmeras possibilidades de ilustração e resumo dos dados apresentados.  TABELAS

 

São quadros que resumem um conjunto de dados.  

  

Tipos de Tabelas  

SÉRIE HISTÓRICA Descreve  os  valores  da  variável, discriminados  por  TEMPO  (anos, meses, dias, horas, etc. 

 

  

SÉRIE GEOGRÁFICA Descreve  os  valores  da  variável, discriminados por REGIÕES (países, cidades, bairros, ruas, layout, etc) 

 

 

SÉRIE ESPECÍFICA Descreve  os  valores  da  variável, discriminados  por  temas ESPECIFICOS.  

 

  

SÉRIE CONJUGADA É utilizado quando temos a necessidade de apresentar em uma única tabela  a  variação  de  valores  DE MAIS  DE UMA  VARIÁVEL,  isto  é, fazer de forma conjugada de duas ou mais séries.    Esta série, por exemplo, é GEOGRÁFICA – HISTÓRICA 

    

Título – conjunto de informações sobre o estudo. 

Cabeçalho –especifica o conteúdo das colunas 

Coluna indicadora –especifica o conteúdo das linhas 

Coluna numérica ‐–especifica  a quantidade das linhas 

Linhas – retas imaginárias de dados 

Célula – espaço destinado a um só número 

Rodapé – simplesmente a fonte dos dados

Page 27: 1   apostila de estatística   eng.2010

- 27 -

Uanderson Rebula de Oliveira Estatística

GRÁFICOS  

A  importância  dos  gráficos  está  ligada  à  facilidade  e  rapidez  na  absorção  e  interpretação  das  informações  e também às inúmeras possibilidades de ilustração e resumo dos dados apresentados. Eis os mais usados: 

 Gráfico em Linha (para séries históricas) É a representação dos valores por meio de linhas. Usamos quando precisamos de uma informação rápida de um valor ao longo do tempo.  

 

      

        

  

 

             

 Gráfico em Colunas É  a  representação  dos  valores  por  meio  de  retângulos,  dispostos  verticalmente.  Utiliza‐se  muito  quando necessitamos saber a quantidade de valor.  

 

      

       

ACIDENTES DO TRABALHO EM SÃO PAULO: 1989 ‐ 1991

0

500

1000

1500

2000

2500

1989 1990 1991

anos

Quantidade

São Paulo

Guarulhos

Campinas

Osasco

Santos

FONTE: Dados fictícios

 QUANTIDADE DE ACIDENTES DO TRABALHOSÃO PAULO: 1989 ‐ 1994

62547265

63255458

86589578

0

2000

4000

6000

8000

10000

12000

1989 1990 1991 1992 1993 1994

Anos

Qua

ntidad

e

FONTE: Dados fictícios

 ACIDENTES DO TRABALHOSÃO PAULO: 1989 ‐ 1994

6254

7265

6325

5458

8658 9578

0

2000

4000

6000

8000

10000

1989 1990 1991 1992 1993 1994

Anos

Qua

ntidad

e

FONTE: Dados fictícios

Page 28: 1   apostila de estatística   eng.2010

- 28 -

Uanderson Rebula de Oliveira Estatística

Gráfico em Barras É o mesmo conceito que o de Colunas, porém utiliza‐se sempre que os dizeres a serem inscritos são extensos.   

 

               

 Gráfico em Setores Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação de um dado no total, geralmente na forma de porcentagem.  

 

          

  

Gráfico Polar É  o  gráfico  ideal  para  representar  séries  temporais  cíclicas,  isto  é,  séries  temporais  que  apresentam  em  seu desenvolvimento determinada periodicidade, por exemplo, o mês de janeiro a dezembro. 

  

   

 QUANTIDADE DE ACIDENTES DO TRABALHOEM SÃO PAULO ‐ POR TIPO ‐  1989

55

1396

698

3578

598

0 1000 2000 3000 4000

Impacto

Perfuração

Atrito

Queda

Corte

Tipo

QuantidadeFONTE: Dados fictícios

ACIDENTES DO TRABALHOSÃO PAULO ‐ 1989 

FONTE: Dados fictícios

ACIDENTES DO TRABALHOSÃO PAULO ‐ 1989 

FONTE: Dados fictícios

Page 29: 1   apostila de estatística   eng.2010

- 29 -

Uanderson Rebula de Oliveira Estatística

Número de cada Delegacia 

Gráfico de Pareto É  um  gráfico  de  colunas  na  qual  a  altura  de  cada  barra  representa  os  dados,  porém  na  ordem  de  altura decrescente,  com  a  coluna  mais  alta  posicionada  à  esquerda.  Tal  posicionamento  ajuda  a  enfatizar  dados importantes e é frequentemente usado nos negócios.  

Os cinco veículos mais vendidos no Brasil em janeiro de 1995 

 

Veículo Quantidade (milhões) 

Ômega  34 Monza  30 Gol  25 Corsa  22 Fusca  15 

FONTE: dados fictícios 

      

       

 Gráfico de Dispersão É usado para representar a relação entre duas variáveis quantitativas, por meio de pontos e linhas.  

Investimentos versus vendas  no setor da empresa X 

 Anos  Investimentos  Vendas  1999  500  3000 2000  3000  2000 2001  1300  4000 2002  2000  2500 

FONTE: dados fictícios 

 

   

Gráfico Cartograma Este gráfico é empregado quando o objetivo é o de  figurar os dados estatísticos diretamente  relacionados com áreas geográficas ou políticas (mapas), corpo humano entre outras figuras 

 

 

Os cinco veículos mais vendidos no Brasil em janeiro de 1995

15

2225

3034

0

10

20

30

40

Ômega Monza Gol Corsa Fusca

VeículosQuantidade (m

ilhõe

s)FONTE: Dados fictícios

FONTE: SSP/SP 

Page 30: 1   apostila de estatística   eng.2010

- 30 -

Uanderson Rebula de Oliveira Estatística

2.2 DISTRIBUIÇÃO DE FREQUÊNCIA  

FREQUÊNCIA ABSOLUTA E HISTOGRAMA  

  Ao se trabalhar com grandes conjuntos de dados, em geral é útil organizá-los e resumi-los em uma tabela, chamada Distribuição de frequência.

 

Na distribuição de frequência listamos todos os valores coletados, um em cada linha, marcam‐se as vezes em que eles aparecem,  incluindo as  repetições, e conta‐se a quantidade de ocorrências de cada valor. Por este motivo,  tabelas que apresentam valores e suas ocorrências denominam‐se distribuição de freqüências. 

O termo “freqüência” indica o número de vezes que um dado aparece numa observação estatística.  

EXEMPLO 1  

Um professor organizou os resultados obtidos em uma prova com 25 alunos da seguinte forma:                                       Notas dos 25 alunos                                                                                                 Comentário 

4,0  5,0  7,0  9,0  9,0 4,0  5,0  7,0  9,0  9,0 4,0  5,0  7,0  9,0  9,0 4,0  6,0  8,0  9,0  9,0 4,0  6,0  8,0  9,0  9,0 

  Agora  ele  pode  fazer  uma  representação  gráfica  para  analisar  o desempenho da  turma. Em primeiro  lugar, o professor pode  fazer uma tabulação dos dados, ou seja, organizá‐los de modo que a consulta a eles seja  simplificada.  Então,  faremos  a  distribuição  de  freqüência  destas notas, por meio da contagem de dados. 

                                Distribuição de freqüência                                                                                           Comentário 

Nota   Freqüência absoluta, f (nº de alunos) 

4,0  5 5,0  3 6,0  2 7,0  3 8,0  2 9,0  10   ∑f=25 

  Esta  forma  de  organizar  dados  é  conhecida  como  distribuição  de frequência, e o número de  vezes que um dado  aparece é  chamado de frequência absoluta, representado por f. Exemplos:   

A frequência absoluta da nota 4,0 é 5.  A freqüência absoluta da nota 9,0 é 10. 

 

O  símbolo  grego  ∑  “sigma”  significa  “somatório”,  muito  usado  em Estatística. Portanto, ∑f=25 significa a soma de 5+3+2+3+2+10.  Representamos a freqüência por um gráfico, chamado Histograma. 

                                                                                                                                                                                      HISTOGRAMA                                                                                                         Comentário 

 

 ESTA FREQUÊNCIA QUE ACABAMOS DE ESTUDAR É DENOMINADA FREQUENCIA 

ABSOLUTA (f), QUE É SIMPLESMENTE A CONTAGEM DOS DADOS.  

Em Estatística não trabalhamos somente com frequência absoluta (f), mas também com outros tipos de freqüências, que são: freqüência relativa (fr), frequência absoluta acumulada (Fa) e frequência relativa acumulada (FRa). 

  Estudaremos agora cada uma delas. 

Quando  os  dados  numéricos  são  organizados,  eles  geralmente  são ordenados  do  menor  para  o  maior,  divididos  em  grupos  de  tamanho razoável  e,  depois,  são  colocados  em  gráficos  para  que  se  examine  sua forma, ou distribuição  (no exemplo:  4,0 – 5,0 – 6,0 – 7,0 – 8,0 – 9,0). Este gráfico é chamado de Histograma.   

Um histograma é um gráfico de  colunas  juntas.  Em um histograma não existem espaços entre as colunas adjacentes, como ocorre em um gráfico de  colunas. No exemplo, a escala horizontal  (→)  representa as notas e a escala vertical (↑) as freqüências.  

O histograma ao lado indica que cinco alunos tiraram a nota 4,0; três alunos tiraram a nota 5,0; dois alunos tiraram a nota 6,0; três alunos tiraram a nota 7,0; dois alunos tiraram 8,0 e dez alunos tiraram 9,0. 

5

32

32

10

0

2

4

6

8

10

12

Núm

ero de alun

os

4,0 5,0 6,0 7,0 8,0 9,0

Nota

Desempenho dos alunos na prova

Page 31: 1   apostila de estatística   eng.2010

- 31 -

Uanderson Rebula de Oliveira Estatística

FREQUENCIA RELATIVA (fr) %  Conceito. Representado por fr, significa a relação existente entre a frequência absoluta (f) e a soma das freqüências (∑f). É a porcentagem (%) do número de vezes que cada dado aparece em relação ao total.  EXEMPLO 1a

                                                                f/∑f*100→5/25*100= 20%        freqüência relativa (fr)%                                                                                            Comentários aos cálculos Nota  f  fr(%) 4,0  5  20% 5,0  3  12% 6,0  2  8% 7,0  3  12% 8,0  2  8% 9,0  10  40%   ∑f=25  100 

  A frequência relativa (fr) é obtida por f/∑f *100, conforme abaixo:  

A fr(%) da nota 4,0 é fr = 5/25 = 0,2 = 20%.  A fr(%) da nota 5,0 é fr = 3/25 = 0,12 = 12%  A fr(%) da nota 6,0 é fr = 2/25 = 0,08 = 8%  A fr(%) da nota 7,0 é fr = 3/25 = 0,12 =12%  A fr(%) da nota 8,0 é fr = 2/25 = 0,08 = 8%  A fr(%) da nota 9,0 é fr = 9/25 = 0,4 = 40%. 

 

 FREQUENCIA ABSOLUTA ACUMULADA (Fa)  Conceito. Representado por Fa, significa a soma das freqüências absolutas até o elemento analisado.  EXEMPLO 1b

                                                                                Fa2=5+3 = 8      frequência absoluta acumulada (Fa)                                                                                            Comentários aos cálculos 

Nota  f  fr(%)  Fa 4,0  5  20%  5 5,0  3  12%  8 6,0  2  8%  10 7,0  3  12%  13 8,0  2  8%  15 9,0  10  40%  25   ∑f=25  100  ‐ 

  A frequência absoluta acumulada (Fa) é obtida conforme abaixo:  

A “Fa” da nota 4,0 é 5 (sempre repete a primeira).  A “Fa” das notas 4,0 e 5,0 é 5+3=8.  A “Fa” das notas 4,0, 5,0 e 6,0 é 5+3+2=10.  A “Fa” das notas 4,0, 5,0, 6,0 e 7,0 é 5+3+2+3=13.  A “Fa” das notas 4,0, 5,0, 6,0, 7,0 e 8,0 é 5+3+2+3+2=15.  A “Fa” das notas 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 5+3+2+3+2+10=25 

 

 FREQUENCIA RELATIVA ACUMULADA (FRa) %  Conceito. Representado por FRa, significa soma das freqüências relativas (fr) até o elemento analisado.  EXEMPLO 1c

                                                                                             20%+12% = 32%              frequência relativa acumulada (FRa)                                                                                 Comentários aos cálculos 

Nota  f  fr(%)  Fa  FRa(%) 4,0  5  20%  5  20% 5,0  3  12%  8  32% 6,0  2  8%  10  40% 7,0  3  12%  13  52% 8,0  2  8%  15  60% 9,0  10  40%  25  100%   ∑f=25  100  ‐  ‐ 

  A frequência relativa acumulada (FRa) é obtida conforme abaixo:  

A “FRa” de 4,0 é 20% (sempre repete a primeira).  A “FRa” de 4,0 e 5,0 é 20+12 = 32%  A “FRa” de 4,0, 5,0 e 6,0 é 20+12+8 = 40%  A “FRa” de 4,0, 5,0, 6,0 e 7,0 é 20+12+8+12 = 52%  A “FRa” de 4,0, 5,0, 6,0, 7,0 e 8,0 é 20+12+8+12+8 = 60%  A “FRa” de 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 20+12+8+12+8+40=100% 

 NOTA IMPORTANTE SOBRE DISTRIBUIÇÃO DE FREQUÊNCIA: 

Nota  f  fr(%)  Fa  FRa(%)       25  100   ∑f=25  100  ‐  ‐ 

  Para saber se o desenvolvimento da distribuição de freqüência por completo está correto, os valores ao lado, em vermelho, deverão coincidir. 

 

Page 32: 1   apostila de estatística   eng.2010

- 32 -

Uanderson Rebula de Oliveira Estatística

AGRUPAMENTO EM CLASSES  

  Em uma distribuição de frequência, ao se trabalhar com grandes conjuntos de dados e com valores dispersos, podemos agrupá-los em classes.

 

Se um conjunto de dados  for muito disperso, uma  representação melhor seria através do agrupamento dos dados com a construção de classes de frequência. Caso isso não ocorresse, a tabela ficaria muito extensa. Veja abaixo: 

 

EXEMPLO 2  

Um radar instalado na Dutra registrou a velocidade (em Km/h) de 40 veículos, indicadas abaixo:                                                                                            

   Velocidade de 40 veículos (Km/h) 

 Distribuição de frequência 

              

                    

   É  fácil  ver  que  a  distribuição  de  frequências diretamente  obtida  a  partir  desses  dados  é dada uma tabela razoavelmente extensa.   

70  90  100    110   123 71  93  102   115    123 73  95  103   115  123 76  97  105   115  123 80  97  105   117  124 81  97  109   117  124 83  99  109   121  128 86  99  109   121  128 

Nota  f 

70  1 71  1 73  1 76  1 80  1 81  1 83  1 86  1 90  1 93  1 95  1 97  3 99  2 100  1 102  1 103  1 105  2 109  3 110  1 115  3 117  2 121  2 123  4 124  2 128  2   ∑f=40 

       Distribuição de freqüência com classes 

i  Velocidade (Km/h)  f 

1  70 |⎯  80  4 2  80 |⎯  90  4 3    90 |⎯  100  8 4         100 |⎯  110  8 5         110 |⎯  120  6 6         120 |⎯  130  10     ∑f=40 

 A  criação  de grupos de  frequências,  chamado  de  ”classes”,  é  como  se  fosse uma  compressão  dos  dados.  Imagine  se  fizéssemos  uma  distribuição  de freqüência  de  todas  velocidades,  desde  70  até  128.  A  distribuição  ficaria imensa! Por este motivo existe a distribuição de frequência com classes.  

Como criar uma Distribuição de Freqüência com classes  1. Calcule a quantidade de  classes  (i), obtida por meio da  raiz da 

quantidade de dados. Neste exemplo:  40  = 6,3 ≅ i = 6 classes.  2. Calcule a amplitude de classe (h) que nada mais é o tamanho da 

classe, representado por “h”, sendo:  

Maior valor  – Menor valor   =   128 – 70    =   9,6  ≅  h=10            quantidade de classes (i)                  6 

                                          Nota: o Maior valor e o Menor valor são obtidos da relação das velocidades dos 40 veículos, ou seja,o maior valor é 128 e o menor valor é 70.  

3. Montar  as  classes  a  partir  do  Menor  valor  (70  no  exemplo), somando com a amplitude de classe (10 no exemplo) até que se chegue na 6ª classe, assim: 

      

CONCEITOS IMPORTANTES: TIPOS DE INTERVALO DE CLASSE:       No  Brasil  costuma‐se  utilizar  o  intervalo  |⎯  (Resolução  866/66  do  IBGE).  Já  na literatura estrangeira, a exemplo de Triola (2008), Anderson et al (2009) e Levine et al (2008), utiliza‐se somente com intervalo fechado.  

LIMITES DE CLASSE  ‐   São os extremos de cada classe, no exemplo 70  |⎯ 80, temos que o limite inferior é 70 e o limite superior  80. 

Classes

i  Velocidade (Km/h)   1  70  +10   80 2...  80  +10   90  ...6  120  +10  130 

Tipo  Representação  Dados do intervalo Aberto   70 ⎯  80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 

Fechado à esquerda   70 |⎯ 80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 Fechado    70 |⎯| 80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 

Fechado à direita    70  ⎯| 80  70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 

Page 33: 1   apostila de estatística   eng.2010

- 33 -

Uanderson Rebula de Oliveira Estatística

0

2

4

6

8

10

12

Quantidade de

 veículos

Resultados dos registros de um radar

             70  75   80   85   90    95  100  105  110  115 120  125  130    

Velocidade (Km/h) 

AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) – É a diferença entre o  limite superior da última classe e o  limite  inferior da primeira classe, no exemplo 130 – 70 = 60. AMPLITUDE AMOSTRAL  (AA) – É a diferença entre o valor máximo e o valor mínimo da amostra, no exemplo 128 – 70 = 58. 

 Abaixo vemos as distribuições de frequências absoluta, relativa, absoluta acumulada e relativa acumulada, bem como o Histograma desta distribuição. 

                      Distribuição de freqüência com classes f, fr, Fa e FRa 

 

         

  

OUTRAS REPRESENTAÇÕES GRÁFICAS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA  

POLÍGONO DE FREQUÊNCIA – É um gráfico em linha que representa os pontos centrais dos intervalos de classe.  

Calcule o ponto central de classe  (x), que é o ponto que divide o  intervalo de classe em duas partes  iguais. Por exemplo, a velocidade dos veículos da 1ª classe pode ser representada por  70 + 80  = 75Km/h                                                                                                                                                               2 

            

A  construção  de  um  polígono  de  frequências  é  muito  simples.  Primeiro, construímos  um  histograma;  depois marcamos  no  “telhado”  de  cada  coluna  o ponto central e unimos sequencialmente esses pontos.   OGIVA –  (pronuncia‐se o’jiva). Conhecida também por polígono de frequência acumulada. É um gráfico em linha que representa freqüências acumuladas (FRa), levantada nos pontos correspondentes aos limites superiores dos intervalos de classe.   

           

  

 

i  Velocidade (Km/h)  f  Fr(%)  Fa  FRa(%) 

1  70 |⎯  80  4  10%  4  10% 

2  80 |⎯  90  4  10%  8  20% 

3   90 |⎯  100  8  20%  16  40% 

4      100 |⎯  110  8  20%  24  60% 

5      110 |⎯  120  6  15%  30  75% 

6      120 |⎯  130  10  25%  40  100% 

                                         ∑f=40  100% 

i  Velocidade (Km/h)  f  x 

1  70 |⎯  80  4  75 

2  80 |⎯  90  4  85 

3    90 |⎯  100  8  95 

4       100 |⎯  110  8  105 

5       110 |⎯  120  6  115 

6       120 |⎯  130  10  125 

                                         ∑f=40   

i  Velocidade (Km/h)  f  FRa 

1  70 |⎯  80  4  4 

2  80 |⎯  90  4  8 

3   90 |⎯  100  8  16 

4      100 |⎯  110  8  24 

5      110 |⎯  120  6  30 

6      120 |⎯  130  10  40 

                                         ∑f=40   

4 4

8 8

6

10

0

2

4

6

8

10

12

Quantidade de

 veículos

Resultados dos registros de um radar

70         80        90         100       110        120       130  

Velocidade (Km/h) 

70 |⎯  80

Ponto central 75Km/h

Velocidade (Km/h) 

4 48 8 6

10

0

510

15

20

25

3035

40

Quantidade de

 veículos

Resultados dos registros de um radar

70          80           90          100         110         120         130 

4 8 

16 

24 

30 

40 

Page 34: 1   apostila de estatística   eng.2010

- 34 -

Uanderson Rebula de Oliveira Estatística

                                                                                                            

3

MEDIDAS   

  

Para  resumir  a quantidade de  informação  contida  em um  conjunto de dados, os estatísticos  definem  medidas  que  descrevem,  através  de  um  só  elemento, características dos dados. Algumas medidas descrevem a tendência central, isto é, a tendência que os dados têm de se agrupar em torno de certos valores. 

      

Page 35: 1   apostila de estatística   eng.2010

- 35 -

Uanderson Rebula de Oliveira Estatística

3.1 MEDIDAS DE TENDÊNCIA CENTRAL  

São medidas que utilizamos para obter um número que represente o valor central de um conjunto de dados. As Medidas de Tendência Central mais utilizadas são: Média, Mediana e Moda.  

 

Uma maneira de pensar o que o centro de um conjunto de dados significa é perguntar: “qual seria um valor normal”? ou, “onde está o meio dos dados”?    

Por exemplo, pode‐se, ao  identificar‐se um grupo de  idosos,  referir‐se ao grupo como  tendo “em torno de 70 anos”. O que se quer dizer com  isso? Por certo que as  idades dos membros que formam o grupo estão próximas de 70 anos, para mais ou para menos. 

 Quando as pessoas conversam sobre “um valor normal” ou “valor do meio” ou “valor mais freqüente”, elas estão falando informalmente sobre a média, a mediana e a moda. 

 

MÉDIA  

MÉDIA SIMPLES  

  É uma medida que representa um valor típico ou normal num conjunto de dados.  

A média simples serve como um “ponto de equilíbrio” em um conjunto de dados  (como o ponto de apoio de uma gangorra). Cada dado tem igual importância e peso. Sofre a influência de todos os dados. 

 

A Média simples é obtida pela seguinte fórmula:  

x  = ∑x     →          soma dos valores dos dados             n      →              quantidade de dados  

 A Média é representada por 

x (lê‐se “x barra”)  

 EXEMPLO  

 

Supondo que uma  escola  adote  como  critério  de  aprovação  a Média  7,0  e,  considerando  as  quatro notas de João e Maria durante o ano, informe se foram aprovados. 

 Notas de João: 3,5 | 6,0 | 9,5 | 9,0 |  

        x  = ∑x       3,5 + 6,0 + 9,5 + 9,0                   n                   4  

        x  = 7,0  →  aprovado    

 Notas de Maria: 3,5 | 4,0 | 5,5 | 9,5 |  

        x  = ∑x       3,5 + 4,0 + 5,5 + 9,5                   n                     4  

        x  = 5,6  →  reprovada    

Média de João

Média de Maria

Média exigida

3,5

6,07,0

9,5 9,0

0,0

2,0

4,0

6,0

8,0

10,0

Notas

1º Bim 2º Bim Média 3º Bim 4º BimBimestres

Média das notas de João 

3,5 4,0

5,6 5,5

9,5

0,0

2,0

4,0

6,0

8,0

10,0

Notas

1º Bim 2º Bim Média 3º Bim 4º BimBimestres

Média das notas de Maria 

Page 36: 1   apostila de estatística   eng.2010

- 36 -

Uanderson Rebula de Oliveira Estatística

MÉDIA APARADA   Semelhante à Média simples, porém, descartando-se em partes iguais alguns

números nos extremos inferior e superior.

Também chamada de Média podada, truncada, ajustada. A média simples possui uma deficiência por ser facilmente  influenciada  por  valores  discrepantes  (valores muito  grandes  ou muito  pequenos  em  um conjunto de dados) Ex.:   x  de 10, 15, 13, 18, 525 = 116. Assim, devido a maneira como a média é calculada (cada dado  tem  igual  importância e peso), os valores discrepantes muito altos  tendem a elevar a média, enquanto que valores discrepantes muito baixos tendem a reduzir a média. Portanto, a média sempre será atraída para o valor mais afastado dos demais. 

  Por isso, dizemos que a média simples não é uma medida robusta de tendência central. A média aparada é 

mais  resistente.  Segundo Anderson  et al  (2009, p.  77)  e  Triola  (2007, p.  74)  ela  é obtida ordenando os dados e excluindo‐se igualmente uma porcentagem (entre 5% e 10%) dos valores menores e maiores de um conjunto de dados e calculando‐se então a média dos valores restantes.  

Exemplo: Supondo a Média simples dos salários de 12 empregados de uma empresa:  $500 $2.000 $2.050 $2.100 $2.150 $2.200 

$2.200 $2.250 $2.300 $2.300 $2.350 $6.000 

x  = ∑x           12  

x = 2.366 

   

Supondo a Média  aparada em 5% dos salários  de  12  empregados  de  uma empresa:  

5% de 12 = 0,6 ≅  1 $500 $2.000 $2.050 $2.100 $2.150 $2.200 

$2.200 $2.250 $2.300 $2.300 $2.350 $6.000 

 

    ax  = ∑x               10 

 

    ax = 2.190  

 

Neste  caso,  5% de  12  =  0,6. O arredondamento desse  valor para  1  indica que a média aparada de  5%  significa eliminar 1 menor valor (no exemplo, $500) e 1 maior valor (no exemplo, $6.000). A média aparada de 5%, usando‐se as 10 observações restantes será, então, 2.190. 

MÉDIA PONDERADA

   Semelhante a Média simples, porém, atribuindo-se a cada dado um peso que

retrate a sua importância.  

O termo “ponderação” é sinônimo de peso, importância, relevância. Sugere, então, a atribuição de um peso a  um  determinado  dado.  Em  alguns  casos,  os  valores  variam  em  grau  de  importância,  de modo  que podemos  querer  ponderá‐los  apropriadamente.  É  calculada multiplicando‐se  um  peso  por  cada  valor, fazendo com que alguns valores influenciem mais fortemente a média do que outros. 

 

500

2000 2050 2100 2150 2200 2200 2250 2300 2300 23502366

6000

0

1000

2000

3000

4000

5000

6000

7000

Quantidade

Salários dos empregados

Média aritmética simples salarial de uma empresa 

Média simples 

2000 20502100 2150 2190 2200 2200 2250 2300 2300 2350

0

1000

2000

3000

4000

5000

6000

7000

Quantidade

Salários dos empregados

Média aritmética aparada (5%)   salarial de uma empresa 

Médiaaparada 

$6.000

$500 

Page 37: 1   apostila de estatística   eng.2010

- 37 -

Uanderson Rebula de Oliveira Estatística

A Média ponderada é obtida pela seguinte fórmula:  

px = ∑(x . p)     →      soma dos valores . pesos               ∑ p        →             soma dos pesos 

 

p representa o peso  e x representa o valor do dado 

Vamos representar a Média ponderada por 

px  

 

 EXEMPLO  

 

Supondo que uma escola adote como critério de aprovação a Média 7,0, sendo que as provas bimestrais são  ponderadas  com  pesos  1,  2,  3  e  4,  respectivamente  para  o  1º  bim,  2º  bim,  3º  bim  e  4º  bim. Considerando as notas de João (na ordem bimestral crescente), informe se foi aprovado.  Notas de João:  | 9,0  |   8,0   |  6,0  |  5,0  

px = ∑(x . p)           ∑ p 

 

   px =   (9,0.1) + (8,0.2) + (6,0.3) + (5,0.4)      1+2+3+4 

 

   px = 6,3  →  reprovado  Nota. Em uma média simples ele seria aprovado por 7,0. 

Algumas vezes, em especial nos colégios, é comum que sejam atribuídos “pesos” às notas de determinadas provas. A atribuição de pesos visa fazer com que determinados valores tenham mais influência no resultado final do que outros. Também pode aplicado, por exemplo, em cálculos de  índices de  inflação, atribuindo pesos para setor de vestuário, alimentação, etc.

MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA Quando trabalhamos com dados resumidos em uma distribuição de frequência, não sabemos  os valores exatos que caem em determinada classe. Para tornar possíveis os cálculos, consideramos que, em cada classe, todos os valores amostrais sejam iguais ao ponto central de classe. Por exemplo, considere o intervalo de classe 70 |⎯  80, com uma frequência de 4. Admitimos que todos os 4 valores sejam  iguais a 75 (o ponto central de classe). Com o total de 75 repetido 4 vezes, temos um total de 75 x 4 = 300. Podemos, então, somar esses produtos obtidos de cada classe para encontrar o total de todos os valores, os quais, então, dividimos pela quantidade de dados.  

 

É importante salientar que a distribuição de frequência resulta em uma aproximação de  x porque não se baseia na lista original exata dos valores amostrais. 

   

 

i  Velocidade (Km/h)  f  x  f . x 

1  70 |⎯  80  4  75  300 2  80 |⎯  90  4  85  340 3    90 |⎯  100  8  95  760 4     100 |⎯  110  8  105  840 5     110 |⎯  120  6  115  690 6     120 |⎯  130  10  125  1250     ∑f=40  ‐  ∑(f.x) = 4180 

Procedimento: 1. Multiplicar  as  frequências  f  pelos  pontos 

centrais de classe x e adicionar os produtos. 2. Somar as frequências f; 3. Somar os produtos (f.x); 4. Aplicar a fórmula abaixo:  

x  =    ∑(f.x)   →    4180  =  104,5 Km/h                 ∑f      →       40  

Ponto central de classe 

x                  =  

9,0

1

8,0

2

6,36,0

3

5,0

4

0,0

2,0

4,0

6,0

8,0

10,0

Notas e pesos

1º Bim 2º Bim Média 3º Bim 4º BimBimestres

Média ponderada das notas de João 

Média ponderada 

Page 38: 1   apostila de estatística   eng.2010

- 38 -

Uanderson Rebula de Oliveira Estatística

 

Nota (x)   f (nº de alunos) 

f . x 

4,0  5  20 5,0  3  15 6,0  2  12 7,0  3  21 8,0  2  16 9,0  10  90   ∑f=25  ∑(f.x) = 174 

  

Quando a distribuição não  tem agrupamento de classes,  consideraremos  as  frequências  como sendo os pesos dos elementos correspondentes: 

   

x  =∑(f.x)   →    174  =  6,96                        ∑f      →    25 

  

  MÉDIA GEOMÉTRICA

  Medida que representa as taxas médias de variações de uma variável ao longo dos

anos.

A Média geométrica é obtida pela seguinte fórmula:  

Gx =  n x∏  

O símbolo grego ∏ (lê‐se “PI”) representa produtório (multiplicação) 

Vamos representar a Média geométrica por 

Gx   

Exemplo Supondo que a categoria de operários de uma fábrica teve um aumento salarial de 20% em 1999,  12% em 2000 e 7% em 2001. Qual o percentual médio anual de aumento?  Para acumularmos aumento de 20%, 12% e 7%, devemos multiplicá‐lo  por  1,2,  1,12  e  1,07  que  são  os  *fatores correspondentes a tais percentuais.  

Então:  Gx =  3 07,1 . 12,1 . 2,1  

 

Gx =  3 43808,1 = 1,1287 = 12,87% 

  Use a calculadora científica: Introduza 3 x 1,43808 

Um fator de 1,1287 corresponde a 12,87% de aumento. Este é o valor percentual médio anual do aumento salarial, ou seja,  se  aplicarmos  três  vezes  consecutivas  o  percentual  12,87%,  no  final  teremos  o  mesmo  resultado  que  se tivéssemos  aplicado  os  percentuais  20%,  12%  e  7%. Digamos  que  o  salário  desta  categoria  de  operários  seja  de R$ 1.000,00, aplicando‐se os sucessivos aumentos temos: 

Salário inicial  + % informado  Salário final  //  Salário inicial  + % médio  Salário final 

R$ 1.000  20%  R$ 1.200     R$ 1.000  12,87%  R$ 1.128 

R$ 1.200  12%  R$ 1.344     R$ 1.128  12,87%  R$ 1.274 

R$ 1.344  7%  R$ 1.438     R$ 1.274  12,87%  R$ 1.438 

Observe que o resultado final de R$ 1.438,08 é o mesmo nos dois casos. Se tivéssemos utilizado a média simples no lugar da média geométrica, os valores finais seriam distintos, pois a média simples de 13% resultaria em um salário final de R$ 1.442,90,  ligeiramente maior como  já era esperado,  já que o percentual de 13% utilizado é  ligeiramente maior que os 12,87% da média geométrica.  

  

  X                                  =  

20%

12%

7%

12,87%

0

10

20

30

Porcentagem

 %

1999 2000 2001 MédiaAnos

Percentual médio anual dos salários dos operários

Page 39: 1   apostila de estatística   eng.2010

- 39 -

Uanderson Rebula de Oliveira Estatística

*FATOR DE MULTIPLICAÇÃO:  É  frequente  o  uso  de  expressões  que  refletem  acréscimos  ou  reduções  em  preços, números ou quantidades, sempre tomando por base 100 unidades. Exemplo:  A gasolina teve um aumento de 15%    →     Significa que em cada R$100 houve um acréscimo de R$15, logo: R$115 

 Se há um acréscimo de 15% a um valor, podemos calcular o novo valor apenas multiplicando‐o por 1,15, que é o fator de multiplicação.  

EXEMPLO Se o preço da gasolina é R$2,55 e teve aumento de 15%; 

então 2,55 *1,15 = R$2,93.  Se  o  acréscimo  for  de  20%,  multiplicamos  por  1,20,  e  assim  por  diante.  Veja  a  tabela  abaixo:  

Acréscimo   Fator de Multiplicação 6%  1,06 15%  1,15 20%  1,20 47%  1,47 67%  1,67 

MEDIANA    Medida que representa exatamente o valor do MEIO de um conjunto de dados.

Uma  desvantagem  da  Média  simples  é  que  ela  é  sensível  a  qualquer  valor,  de  modo  que  um  valor excepcional pode afetar drasticamente a média. A Mediana supera grandemente essa desvantagem, pois não é afetada pelos valores extremos.  Pelo fato de a Mediana não ser tão sensível a valores extremos, ela é, em geral, usada para conjunto de dados com um número relativamente pequeno de valores extremos. Por exemplo, segundo Triola (2008, p. 65), a agência do Censo dos Estados Unidos registrou recentemente que a renda familiar mediana anual é 36.078 dólares. A mediana foi usada porque há um pequeno número de famílias com renda realmente alta.

A Mediana é o valor que está no meio de tal no sentido de que cerca de metade dos valores no conjunto de dados está abaixo da mediana e metade está acima dela. É representada por Md.

 Para encontrar a Mediana basta ordenar os valores e depois siga um dos procedimentos seguintes: 

 

Se o número de valores for ímpar, a mediana será o número localizado no meio exato da lista.  

Mediana = 138   

 

Se o número de valores for par, a mediana será encontrada pelo cálculo da média dos dois números do meio. 

 

Mediana = 138 + 140 = 139           2 

 Para encontrar, por exemplo, a mediana do conjunto de dados  {03, 36, 41, 22, 59, 43, 12, 07, 17} NÃO ESQUEÇA DE ORDENÁ‐LOS PRIMEIRO!  

Page 40: 1   apostila de estatística   eng.2010

- 40 -

Uanderson Rebula de Oliveira Estatística

MODA   Medida que representa o valor que mais se REPETE em um conjunto de dados.

Na  linguagem coloquial, moda é algo que está em evidência, ou  seja, algo que  se vê bastante! Na Estatística,  como o próprio nome  sugere, a Moda é aquele elemento que mais  vezes aparece no conjunto! (é o elemento de maior freqüência). Sua determinação é simples, como se verá adiante.  

 

               

Repete uma vez = Moda Repete duas vezes = Bimodal Repete + de duas vezes = Polimodal Não repete = Amodal 

 Da mesma maneira, a Moda pode ocorrer com dados quantitativos. Exemplo: Um professor organizou os resultados obtidos em uma prova com 25 alunos, conforme abaixo. Determine a Moda.  

 

 A Moda será 9,0, pois é a nota que 

mais se repete no conjunto de dados. 

4,0  5,0  7,0  9,0  9,04,0  5,0  7,0  9,0  9,0 4,0  5,0  7,0  9,0  9,0 4,0  6,0  8,0  9,0  9,0 4,0  6,0  8,0  9,0  9,0 

 

Outro exemplo: Um professor organizou os resultados obtidos em uma prova com 25 alunos, conforme abaixo. Determine a Moda.   

 A Moda será 4,0 e 7,0, pois são as 

notas que mais se repetem. Portanto o conjunto será Bimodal. 

4,0  4,0  6,0  7,0  8,04,0  4,0  6,0  7,0  9,0 4,0  5,0  7,0  7,0  9,0 4,0  5,0  7,0  7,0  9,0 4,0  5,0  7,0  8,0  9,0 

 

 José    Kelly      Maria      João      Mário       Kelly        Lúcio       →      Moda = Kelly 

 José    Kelly      Maria      João      Mário       Kelly        José         →      Bimodal = Kelly e José 

 José    Kelly      Maria      João       José         Kelly       José         →       Moda = José 

 José    Kelly      Maria     Mário   Mário     Kelly        José        →       Polimodal = Kelly, José e Mário

 José    Kelly      Maria      João       Mário     Kátia        Lúcio        →       Amodal 

5

32

32

10

0

2

4

6

8

10

12

Núm

ero de

 aluno

s

4,0 5,0 6,0 7,0 8,0 9,0Nota

Desempenho dos alunos na prova

Moda9,0 

7

32

7

2

4

0

2

4

6

8

10

12

Núm

ero de

 aluno

s

4,0 5,0 6,0 7,0 8,0 9,0Nota

Desempenho dos alunos na prova

Bimodal4,0 e 7,0 

Page 41: 1   apostila de estatística   eng.2010

- 41 -

Uanderson Rebula de Oliveira Estatística

RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA.  

Quando a Média, Mediana e Moda se coincidem, chamamos a distribuição dos dados de simétrica.               

 Média = 70(3) + 80(4) + 90(7) + 100(4) + 110(3) = 90 

3+4+7+4+3  

Mediana = 90   Moda = 90 

  Quando a Média, Mediana e Moda não se coincidem, chamamos a distribuição dos dados de assimétrica.               

Assimétrica à direita   Média = 70(1) + 80(3) + 90(6) + 100(9) + 110(2) = 94 

3+4+7+4+3  

Mediana = 100   Moda = 100 

               

Assimétrica à esquerda   Média = 70(2) + 80(9) + 90(6) + 100(3) + 110(1) = 86 

3+4+7+4+3  

Mediana = 80   Moda = 80 

    

34

7

43

0

2

4

6

8

10

Quantidade de

 veículos

Resultados dos registros de um radar

        70            80           90            100          110          

Velocidade (Km/h) 

MédiaMediana Moda 

1

3

6

9

2

0

2

4

6

8

10

12

Quantidade de

 veículos

Resultados dos registros de um radar

        70           80              90           100        110         Velocidade (Km/h) 

MedianaModa 

Média 

2

9

6

3

1

0

2

4

6

8

10

12

Quantidade de

 veículos

Resultados dos registros de um radar

        70           80              90           100        110         Velocidade (Km/h) 

Mediana Moda 

Média 

Page 42: 1   apostila de estatística   eng.2010

- 42 -

Uanderson Rebula de Oliveira Estatística

3.2 MEDIDAS DE VARIAÇÃO (OU DISPERSÃO) 

O termo “variação” sugere tornar vário ou diverso; alterar, diversificar; mudar; ser inconstante; não ser conforme, discrepar. Na maioria dos casos existirá variação em um conjunto de dados, independente da característica que você esteja medindo, pois nem todos os indivíduos terão o mesmo exato valor para todas as variáveis. 

EXEMPLO    

Durante o ano letivo a Média das notas de João, Mário, Maria e José foi 7,0. Se considerarmos apenas a Média, não notaremos qualquer diferença entre os quatro alunos. No entanto, observa‐se que as notas são muito  diferentes  em  relação  a Média. Há  variação  de  notas  e,  no  caso  de  João  e  José,  é  bem discrepante. Veja abaixo:            

 

  

 

Diante  deste  contexto,  podemos  questionar:  qual  o  aluno  é  mais  estável?  Qual  teve  melhor desempenho? Qual o aluno com pior desempenho? Notadamente o aluno de melhor desempenho é o Mário, pois todas as suas notas foram 7,0 e, portanto, não houve nenhuma variação em relação a Média. Já José e João tiveram o pior desempenho pois suas notas estiveram muito distantes da Média.   

Neste capítulo vamos desenvolver maneiras específicas de  realmente medirmos a variação, de modo que possamos usar números específicos em lugar de julgamento subjetivo. 

Outros exemplos de variações: 

 

Os preços das casas variam de casa para casa, de ano para ano e de estado para estado.   Os preços de um produto variam de supermercado para supermercado.  O tempo que você leva para chegar ao trabalho varia dia a dia.  O tamanho das peças produzidas em uma empresa também varia.   A renda familiar varia de família para família, de país para país e de ano para ano.    Os resultados das partidas de futebol, de temporada para temporada, variam.   As notas que você tira nas provas, não diferente, também variam.   Seu saldo bancário também varia, podendo ser de hora em hora, dia a dia, mês a mês. 

3,5

6,07,0

9,5 9,0

0,0

2,0

4,0

6,0

8,0

10,0

Notas

1º Bim 2º Bim Média 3º Bim 4º BimBimestres

Média das notas de João 

7,0 7,0 7,0 7,0 7,0

0,0

2,0

4,0

6,0

8,0

10,0

Notas

1º Bim 2º Bim Média 3º Bim 4º BimBimestres

Média das notas de Mário 

6,5 6,5 7,0 7,5 7,5

0,0

2,0

4,0

6,0

8,0

10,0

Notas

1º Bim 2º Bim Média 3º Bim 4º BimBimestres

Média das notas de Maria

4,0

9,5

7,08,5

6,0

0,0

2,0

4,0

6,0

8,0

10,0

Notas

1º Bim 2º Bim Média 3º Bim 4º BimBimestres

Média das notas de José 

Nenhuma variação a partir da Média 

Grande variação a partir da Média 

Pequena variação a partir da Média 

Grande variação a partir da Média 

Page 43: 1   apostila de estatística   eng.2010

- 43 -

Uanderson Rebula de Oliveira Estatística

VARIÂNCIA E DESVIO PADRÃO (amostral)

  São medidas que representam “um valor médio de variação” em torno da média.

 O desvio padrão é um modo que se usa para medir a variabilidade entre os números em um conjunto de dados. Assim como o termo sugere, um desvio padrão é um padrão (ou seja, algo típico) de desvio (ou distância) da média. O desvio padrão é uma estatística  importante, mas,  frequentemente, é omitida quando os  resultados  são  relatados. Sem ele, você  está  recebendo  apenas uma parte da história  sobre os dados. Os  estatísticos  gostam de  contar  a história do homem que estava com um dos pés em um balde de água gelada e o outro em um balde de água fervendo. O homem dizia que, na média, ele estava se sentindo ótimo! Mas imagine a variabilidade da temperatura para cada um dos pés. Agora, colocando os pés no chão, o preço médio de uma casa, por exemplo, não  lhe diz nada  sobre a variedade de preços de casas com a qual você pode se deparar enquanto estiver procurando uma casa para comprar. A média dos salários pode não representar o que realmente está se passando em sua empresa se os salários forem extremamente discrepantes. 

        Entendendo a Variância e o Desvio Padrão                  Calculando a Variância e o Desvio Padrão  

Desvios em torno da Média das notas de João         

     

No  gráfico  percebemos  que  o  desvio  determina  o quanto  cada  elemento  do  conjunto  de  dados  se distancia da média 7,0. No 1º Bim. faltam  ‐3,5 para se chegar a Média e no 2º Bim.  ‐1,0.  Já nos 3º e 4º Bim. temos  +2,5  e  +2,0  acima  da média,  respectivamente. Transpondo essas informações para uma tabela, temos: 

 Notas  (x) 

   Média ( x ) 

Desvios  (x ‐  x ) 

3,5  ‐3,5 6,0  ‐1,0 9,5  2,5 9,0 

7,0 

2,0 ‐  ‐  ∑=0 

 Perceba que  a  soma dos desvios  é  igual  a  zero.  Esta característica  não  é  exclusiva  deste  exemplo.  Ela sempre ocorre e prende‐se ao fato de que a média é o ponto de equilíbrio em um conjunto de dados.   Como  os  desvios  indicam  o  grau  de  variação  dos valores em  relação à média,  seria  interessante poder encontrar um único número que o representasse. Algo como a média dos desvios. Mas, para fazer essa média, precisamos  somar  os  desvios  e  acabamos  de  ver  que essa soma é sempre igual a zero.  

Este  problema  foi  resolvido  pelos  matemáticos:  basta elevar   cada desvio ao quadrado antes de somá‐los. Um número ao quadrado é sempre positivo, portanto a soma não  se  anula mais,  e  a média  dos  desvios  ao  quadrado pode ser calculada: 

 

Notas (x) 

Média ( x ) 

Desvios  (x ‐  x ) 

Desvios elevado ao quadrado  (x ‐  x )2 

3,5  ‐3,5  (‐3,5)2 = 12,25 6,0  ‐1,0       (‐1,0)2 =  1 9,5  2,5        (2,5)2 =   6,25 9,0 

7,0 

2,0        (2,0)2 =   4 n=4  ‐  ∑=0     ∑ = 23,5 

 

Variância amostral Agora  podemos  calcular  a  média  dos  quadrados  dos desvios, chamada de Variância, representada por S2:  

S2 = ∑ − )( xx  2 →

     n ‐ 1 

     23,5   =  7,8    4 ‐ 1 

A divisão por n−1 aparece por fornecer um melhor resultado do que a divisão por n. 

 

Desvio padrão amostral Mas,  se  elevamos  os  desvios  ao  quadrado  para  poder calcular  sua  média,  não  seria  correto  que  agora fizéssemos a  raiz quadrada dessa média, para desfazer a potenciação? Sim, e o valor dessa raiz é chamado Desvio padrão, representado por S:  

Desvio padrão   →   S =  8,7 = 2,8  

O desvio padrão  indica que a maioria das notas de  João estão concentradas dentro dos limites de  ± 2,8 em torno da média 7,0. Ou seja, se concentrando entre 4,2 e 9,8.  

Fórmula da Variância e do Desvio padrão Podemos concluir, então, o uso das fórmulas:  

      da Variância  

S2 = ∑ − )( xx  2

 n ‐ 1 

do Desvio padrão  

S =  2S               

3,5

6,0

7,0

9,5 9,0

0,0

2,0

4,0

6,0

8,0

10,0

Notas

1º Bim 2º Bim Média 3º Bim 4º BimBimestres

   ‐3,5   ‐1,0 

             2,5 

           2,0

Page 44: 1   apostila de estatística   eng.2010

- 44 -

Uanderson Rebula de Oliveira Estatística

Interpretação do Desvio padrão O  desvio  padrão  é  sempre  um  valor  que  está  na  mesma  unidade  dos  dados  originais.  Um  desvio  padrão  pequeno, basicamente, significa que os valores do conjunto de dados estão, na média, próximos do centro desse conjunto, enquanto um desvio padrão grande significa que os valores do conjunto de dados estão, na média, mais afastados do centro. Então, quanto mais espalhados ou dispersos forem os dados, maior será o desvio padrão e, quanto mais concentrados ou homogêneos forem os dados, menor será o desvio padrão. Se os valores forem iguais, ou seja, sem variação, o desvio padrão será zero.  Um desvio padrão pequeno pode  ser um bom objetivo em determinadas  situações, onde os  resultados  são  restritos,  como exemplo, na produção e no controle de qualidade de uma indústria. Uma determinada peça de carro que deve ter centímetros de diâmetro para encaixar perfeitamente não pode apresentar um desvio padrão grande, nesse caso, significaria que acabariam sendo jogadas fora, pois ou não se encaixariam adequadamente ou os carros teriam problemas.  Observe que o desvio padrão das notas de João indica que estão concentradas dentro dos limites de  ± 2,4 em torno da média 7,0. Ou seja, se concentrando entre 4,6 e 9,4.  Isto representa um desvio padrão grande. 

Calculando a Variância e o Desvio padrão das notas de Maria, José e Mário – passo a passo 

Notas de Maria (x)           6,5   6,5   7,5   7,5 1º Calcular a Média  

            n

xx

∑=  

 

x  = 6,5+6,5+7,5+7,5                      4  

=x    428    →     7,0 

2º Calcular a Variância  

S2 =  1

)( 2

−∑n

xx 

  

S2 = (6,5 – 7,0)2 +  (6,5 – 7,0)2 + (7,5 – 7,0)2 + (7,5 – 7,0)2  4 – 1 

 

S2 = (– 0,5)2 +  (– 0,5)2 + (0,5)2 + (0,5)2   = 0,33                                    3 

3º Calcular o Desvio padrão  

S =  2S   

S =  33,0  

 S = 0,5 

 Interpretação: O resultado indica que a maioria das notas de Maria estão concentradas dentro dos limites de  ± 0,5 em torno da Média 7,0. Ou seja, se concentrando entre 6,5 e 7,5. 

Notas de José (x)           4,0   9,5    8,5   6,0 

1º Calcular a Média  

          n

xx

∑=  

x  = 4,0+9,5+8,5+6,5                      4  

=x    428    →     7,0 

                               

2º Calcular a Variância  

S2 =  1

)( 2

−∑n

xx 

  

S2 = (4,0 – 7,0)2 +  (9,5 – 7,0)2 + (8,5 – 7,0)2 + (6,0 – 7,0)2  4 ‐ 1 

 

S2 = (–3,0)2 +  (2,5)2 + (1,5)2 + (–1,0)2   = 6,16                                    3 

3º Calcular o Desvio padrão  

S =  2S   

S =  16,6  

 S = 2,5 

  

Interpretação: O resultado indica que a maioria das notas de João estão concentradas dentro dos limites de ± 2,5 em torno da Média 7,0. Ou seja, se concentrando entre 4,5 e 9,5. 

Notas de Mário (x)           7,0   7,0   7,0   7,0 

1º Calcular a Média 

n

xx

∑=  

x  = 7,0+7,0+7,0+7,0                      4 

=x    428    →     7,0       

2º Calcular a Variância  

S2 =  1

)( 2

−∑n

xx 

  

S2 = (7,0 – 7,0)2 +  (7,0 – 7,0)2 + (7,0 – 7,0)2 + (7,0 – 7,0)2  = 0 4 ‐ 1 

3º Calcular o Desvio padrão    

S = 0  

Interpretação: O resultado indica que todas as notas de João estão dentro do limite de ± 0 em torno da Média 7,0. Ou seja, se concentrando exatamente na média 7,0. Portanto, sem variação. 

Page 45: 1   apostila de estatística   eng.2010

- 45 -

Uanderson Rebula de Oliveira Estatística

COEFICIENTE DE VARIAÇÃO   É a medida relativa de variação que é sempre expressa sob a forma de

porcentagem (%).

Em  algumas  situações,  podemos  estar  interessados  em  uma  estatística  que  indique  qual  é  o tamanho do desvio padrão em relação à média. A melhor  forma de representá‐la é através do coeficiente de variação por ser expressa na forma de porcentagem. 

O  coeficiente  de  variação, representado  por  Cv,  é  calculado  da seguinte maneira:  

Cv =  S  x 100% 

                x   Ou seja:    

CV = Desvio padrão  x 100%                           Média 

Exemplo:  Considerando  a Média  7,0  de  João  e  o  Desvio padrão de 2,8, temos:   

Cv =  S  x 100%   → 

          x  

Cv =  2,8  x 100%   →    40%            7,0 

 O resultado  indica que a Média 7,0 de João teve um desvio padrão em torno de 40%. 

Fazendo a Distribuição de Variabilidade das notas de João, Maria, José e Mário, temos: 

Alunos 

   Média ( x ) 

Desvio padrão (S)  Cv (%)  Memória de cálculo 

de Cv (%) 

João  2,8  40%  →   2,8/7,0 x 100 Maria  0,5  7%  →   0,5/7,0 x 100 José  2,5  36%  →   2,5/7,0 x 100 Mário 

7,0 

0  0%    ‐ 

Assim, podemos concluir que o desempenho dos alunos será:  1º ‐ Mário 2º ‐ Maria 3º ‐ José 4º ‐ João 

Page 46: 1   apostila de estatística   eng.2010

- 46 -

Uanderson Rebula de Oliveira Estatística

REFERÊNCIAS BIBLIOGRÁFICAS   ANDERSON, David R.; SWEENEY, Dennis J.; WILLIANS, Thomas A. Estatística aplicada à administração e economia. 2 ed. São Paulo: Cengage Learning, 2009. 597 p. BRUNI, Adriano Leal. Estatística para concursos. São Paulo: Atlas, 2008. 197p. COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 4 ed. São Paulo: Harbra, 2005. 399 p. CRESPO, Antônio Arnot. Estatística fácil. 17 ed. São Paulo: Saraiva, 1999. 224 p. FARIAS, Alfredo Alves et al. Introdução à estatística. 2 ed. Rio de Janeiro: LTC, 2003, 320 p. GIOVANNI José Ruy; BONJORNO, José Roberto; GIOVANNI JR., José Rui. Matemática fundamental: uma nova abordagem – volume único. São Paulo: FTD, 2002. 712 p. HAZZAN, Samuel. Fundamentos da matemática elementar: Matemática financeira, comercial e estatística descritiva. Volume 11. 1 ed. São Paulo: Atual editora, 2004. 230p. HELP! Sistema de consulta interativa. Matemática. Rio de Janeiro: O globo, 1997. 319 p. Instituto Brasileiro de Geografia e Estatística – IBGE. A instituição. Disponível em <http://www.ibge.gov.br/home/disseminacao/eventos/missao/default.shtm>. Acesso em 06 abr 2010. LAPPONI, Juan Carlos. Estatística usando o Excel. 4 ed. Rio de Janeiro: Elsevier, 2005. 476 p. LARSON, Ron; FARBER, Betsy. Estatística aplicada. 4 ed. São Paulo: Pearson, 2010. 637 p. LEVINE, David M. et al. Estatística: teoria e aplicações. 5 ed. Rio de Janeiro: LTC, 2008. 752 p. LOPES, Paulo Afonso. Probabilidade e estatística: conceitos, modelos e aplicações em Excel. Ernesto Reichmann, 1999. 174 p. MONTGOMERY, Douglas C.; RUNGER, George C. Estatística aplicada e probabilidade para engenheiros. 2 ed. Rio de Janeiro: LTC, 2003. 465 p. MORETTIN, Luiz Gonzaga. Estatística básica e probabilidade. 7 ed. São Paulo: Makron books,1999. 209 p. OLIVEIRA, Uanderson Rebula de. Ergonomia, higiene e segurança do trabalho. Resende-RJ: Apostila. Universidade Estácio de Sá, 2009. 199 p.. Resumão – estatística. 2 ed. São Paulo: Barros, fischer & Associados, novembro 2006. 6 p. RUMSEY, Deborah. Estatística para leigos. Rio de Janeiro: Alta books, 2009. 350 p. SILVA, Ermes Medeiros et al. Estatística: para os cursos de Economia, Administração e Ciências Contábeis - volume 1. 2 ed. São Paulo: Atlas, 1996. 189 p. SMOLE, Kátia Stocco; DINIZ, Maria Ignez. Matemática–ensino médio. 5 ed. São Paulo: Saraiva, 2005. 558p. TRIOLA, Mario F. Introdução à estatística. 10 ed. Rio de Janeiro: LTC, 2008. 696 p. VASCONCELLOS, Maria José Couto; SCORDAMAGLIO, Maria Terezinha; CÂNDIDO, Suzana Laino. Coleção Matemática. 1ª e 3ª série do ensino médio. São Paulo: Editora do Brasil, 2004. 232 p. WERKEMA, Maria Cristina Catarino. As ferramentas da qualidade no gerenciamento dos processos. Belo Horizonte: EDG, 1995. 128 p.

Page 47: 1   apostila de estatística   eng.2010

- 47 -

Uanderson Rebula de Oliveira Estatística

SITES PARA CONSULTA www.brasilescola.com Instituto de pesquisa econômica aplicada - http://www.ipea.gov.br Instituto brasileiro de geografia e estatística - http://www.ibge.gov.br Associação Brasileira de Estatística - http://www.ime.usp.br/~abe/ www.ibope.com.br

ANEXO I - LIVROS RECOMENDADOS

Um livro introdutório de estatística que inclui um estilo de escrita amigável, conteúdo que reflete as características importantes de um curso introdutório moderno de estatística, o uso da tecnologia computacional mais recente, de conjuntos de dados interessantes e reais, e abundância de componentes pedagógicos. O CD-ROM inclui os conjuntos de dados do Apêndice B do livro. Esses conjuntos de dados encontram-se armazenados em formato texto, planilhas do Minitab, planilhas do Excel e uma aplicação para a calculadora TI-83. Inclui também programas para a calculadora gráfica TI-83 Plus®, o Programa Estatístico STATDISK (Versão 9.1) e um suplemento do Excel, desenvolvido para aumentar os recursos dos programas estatísticos do Excel.

Este livro diferencia-se dos tradicionais livros, materiais de referência e manuais de estatísticas, pois possui: Explicações intuitivas e práticas sobre conceitos estatísticos, ideias, técnicas, fórmulas e cálculos. Passo a passo conciso e claro de procedimentos que intuitivamente explicam como lidar com problemas estatísticos. Exemplos interessantes do mundo real relacionados ao cotidiano pessoal e profissional. Respostas honestas e sinceras para perguntas como “O que isso realmente significa?” e “Quando e como eu vou usar isso?” Neste livro você encontrará: Explicações em português de fácil entendimento. Informações fáceis de localizar e passo-a-passo. Ícones e outros recursos de identificação e memorização. Folha de cola para destacar com informações práticas. Listas dos 10 melhores relacionados ao assunto. Um toque de humor e diversão.

Onde comprar: www.submarino.com.br

Page 48: 1   apostila de estatística   eng.2010

- 48 -

Uanderson Rebula de Oliveira Estatística

ANEXO II - SOFTWARE BIOESTAT

Texto extraído da tese de doutorado em Engenharia de Ualison Rebula de Oliveira 

  

Existem  inúmeros  recursos  tecnológicos  para  a  análise  estatística  de  dados,  que  vão  desde calculadoras,  a  exemplo  da  TI  –  83  PLUS,  a  aplicativos  específicos,  tais  como  o  STATDISK  e  o MINITAB  (TRIOLA,  2005).  Assim,  buscando‐se  recursos  computacionais  que  facilitassem  o tratamento de dados, vários aplicativos e softwares estatísticos  foram pesquisados, dos quais se destacam  a  planilha  Excel,  o  STATDISK,  o MINITAB,  o  BioEstat,  o  SPSS  e  algumas  páginas  na Internet  que  oferecem  programas  em  Javascript  para  cálculos  on‐line,  a  exemplo  da  página  na Internet www.stat.ucla.edu.  Após análise de pós e contras de cada aplicativo pesquisado,  selecionou‐se o pacote estatístico BioEstat,  disponível  para  download  no  site  www.mamiraua.org.br,  por  possuir  as  seguintes características positivas: i) serventia tanto para a Estatística descritiva como para testes estatísticos não‐paramétricos; ii) ser em português; iii) possuir manual em PDF com diversos exemplos; iv) ser de  fácil  utilização;  v)  ser  gratuito;  vi)  ser  referenciado  em  vários  livros,  sites  e  entidades  de pesquisa – conforme Siegel & Castellan Junior (2006), o BioEstat é o melhor programa disponível na atualidade para o cálculo do qui‐quadrado; vii) possuir apoio do CNPQ; e viii) estar na versão 5.0 e possuir mais de 20 anos de criação. 

   

INTERFACE BIOESTAT                           

Baixar software: www.mamiraua.org.br 

  

Page 49: 1   apostila de estatística   eng.2010

- 49 -

Uanderson Rebula de Oliveira Estatística

Anexo III - ESTATÍSTICA NO EXCEL O Excel dispõe da  função “Estatística”. Assim,  tudo que vimos poderá ser desenvolvido pelo excel, bastando inserir os valores da variável de interesse.

Para  saber mais,  basta  adquirir  o  livro  “Estatística  usando  o  excel”,  de  Juan  Carlos Lapponi. WWW.SUBMARINO.COM.BR 

 4ª Edição,  Edição 2005, 496 págs.  Editora Elsevier Campus  ‐ Acompanha CD‐ROM com Planilhas, Modelos, Simuladores etc. para Excel.  O conteúdo deste  livro é útil para: Estudantes que cursam Estatística nas diversas áreas do conhecimento e em  diferentes  níveis  de  graduação  como,  em  ordem  alfabética,  Administração,  Biologia,  Contabilidade, Economia,  Engenharia,  Finanças,  Marketing,  Medicina,  etc.  Estudantes  que  necessitam  aprimorar  ou complementar  seus  conhecimentos  de  Estatística  utilizando  o  Excel.  Profissionais  das  diversas  áreas  que utilizam  os  conceitos  de  Estatística  e  necessitam,  ou  gostariam,  de  utilizar  as  funções  estatísticas,  as ferramentas de análise, planilhas, modelos e simuladores de estatística em Excel. Todos aqueles que poderão utilizar  as planilhas, modelos  e  simuladores de  estatística  em  Excel da  forma  como  estão no CD‐Rom, ou modificando‐os, para atender às  suas necessidades. Alunos de áreas  correlatas que utilizarão estatística e 

desejam  antecipar  seu  aprendizado  e  agregar  valor  ao  seu  conhecimento  visando o mercado de  trabalho. Usuários  de  Excel que desejam conhecer e aprender a utilizar os recursos de Estatística disponíveis.  TÓPICOS •  DADOS, VARIÁVEIS E AMOSTRAS  •  DESCRIÇÃO DE AMOSTRAS COM TABELAS E GRÁFICOS  •  MEDIDAS DE TENDÊNCIA CENTRAL  •  MEDIDAS DE DISPERSÃO/VARIAÇÃO •  PROBABILIDADE  •  CORRELAÇÃO  •  VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS  •  DISTRIBUIÇÕES CONTÍNUAS  •  COMBINAÇÃO LINEAR DE VARIÁVEIS ALEATÓRIAS  •  DISTRIBUIÇÃO AMOSTRAL  •  ESTIMAÇÃO  •  TESTE DE HIPÓTESES  •  TESTES DE HIPÓTESES COM DUAS AMOSTRAS  •  ANÁLISE DA VARIÂNCIA  •  REGRESSÃO LINEAR  •  AJUSTE NÃO LINEAR