125
ESTATÍSTICA BÁSICA Professor: Narcelio de Araújo Pereira [email protected] 2010

99358-Apostila de Introdução a Estatística Ifce.2010

Embed Size (px)

DESCRIPTION

Estatistica-Basica APOSTILA MUITO BOA.PDF

Citation preview

  • ESTATSTICA BSICA

    Professor: Narcelio de Arajo Pereira [email protected]

    2010

  • 2

    SUMRIO

    INTRODUO ............................................................................................ 03

    UNIDADE 1: A NATUREZA DA ESTATSTICA ................................... 05

    UNIDADE 2: GENERALIDADES E CONCEITOS BSICOS .............. 10

    UNIDADE 3: SRIES ESTATSTICAS.................................................... 15

    UNIDADE 4: GRFICOS ........................................................................... 24

    UNIDADE 5: DISTRIBUIO DE FREQUENCIA ................................ 34

    UNIDADE 6: MEDIDAS DE POSIO ................................................... 46

    UNIDADE 7: MEDIDAS DE DISPERSO OU VARIABILIDADE....... 70

    UNIDADE 8: PROBABILIDADE .............................................................. 80

    UNIDADE 9: DISTRIBUIO BINOMIAL E NORMAL ..................... 87

    REFERENCIAS ......................................................................................... 102

    ANEXOS ..................................................................................................... 103

    EXERCCIOS DE FIXAO .................................................................. 108

  • 3

    INTRODUO

    Na antiguidade os povos j registravam o nmero de habitantes, nascimentos,

    bitos. Faziam "estatsticas". Na idade mdia as informaes eram tabuladas

    com finalidades tributrias e blicas.

    No sculo XVI surgem as primeiras anlises sistemticas, as primeiras tabelas

    e os nmeros relativos.

    No sculo XVIII a estatstica com feio cientfica batizada por

    GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as

    primeiras representaes grficas e os clculos de probabilidades. A estatstica

    deixa de ser uma simples tabulao de dados numricos para se tornar "O

    estudo de como se chegar a concluso sobre uma populao, partindo da

    observao de partes dessa populao (amostra)".

    Ao longo do sculo XX, os mtodos estatsticos foram desenvolvidos como

    uma mistura de cincia, tecnologia e lgica para a soluo e investigao de

    problemas em vrias reas do conhecimento humano (Stigler, 1986). Ela foi

    reconhecida como um campo da cincia neste perodo, mas sua histria tem

    incio bem anterior a 1900.

    A estatstica moderna uma tecnologia quantitativa para a cincia

    experimental e observacional que permite avaliar e estudar as incertezas e os

    seus efeitos no planejamento e interpretao de experincias e de observaes

    de fenmenos da natureza e da sociedade.

    A estatstica no uma caixa-preta, nem bola de cristal, nem mgica.

    Tampouco um conjunto de tcnicas teis para algumas reas isoladas ou

    restritas da cincia. Por exemplo, ao contrrio do que alguns imaginam, a

    estatstica no um ramo da matemtica onde se investigam os processos de

    obteno, organizao e anlise de dados sobre uma determinada populao.

    A estatstica tambm no se limita a um conjunto de elementos numricos

    relativos a um fato social, nem a nmeros, tabelas e grficos usados para o

    resumo, organizao e apresentao dos dados de uma pesquisa, embora este

    seja um aspecto da estatstica que pode ser facilmente percebido no cotidiano

    (basta abrir os jornais e revistas para ver o "bombardeio" de estatsticas). Ela

    uma cincia multidisciplinar: um mesmo programa de computador que

    permite a anlise estatstica de dados de um fsico poderia tambm ser usado

    por um economista, agrnomo, qumico, gelogo, matemtico, bilogo,

    socilogo, psiclogo e cientista poltico. Mesmo que as interpretaes dessas

    anlises sejam diferentes por causa das diferenas entre as reas do

  • 4

    conhecimento, os conceitos empregados, as limitaes das tcnicas e as

    conseqncias dessas interpretaes so essencialmente as mesmas.

    Segundo Rao (1999), a estatstica uma cincia que estuda e pesquisa sobre: o

    levantamento de dados com a mxima quantidade de informao possvel para

    um dado custo; o processamento de dados para a quantificao da quantidade

    de incerteza existente na resposta para um determinado problema; a tomada de

    decises sob condies de incerteza, sob o menor risco possvel. Finalmente, a

    estatstica tem sido utilizada na pesquisa cientfica, para a otimizao de

    recursos econmicos, para o aumento da qualidade e produtividade, na

    otimizao em anlise de decises, em questes judiciais, previses e em

    muitas outras reas.

  • 5

    I - A NATUREZA DA ESTATSTICA

    MTODO ESTATSTICO

    O Mtodo Cientfico

    Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso

    e, outros, por necessidades prticas, sem aplicao de um mtodo.

    Atualmente, quase todo acrscimo de conhecimento resulta da observao e

    do estudo. Se bem que muito desse conhecimento possa ter sido observado

    inicialmente por acaso, a verdade que desenvolvemos processos cientficos

    para seu estudo e para adquirirmos tais conhecimentos. Podemos ento dizer

    que:

    Mtodo: um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja, ou seja, um meio mais eficaz para atingir determinada meta.

    Dos mtodos cientficos, vamos destacar o Mtodo experimental e Mtodo

    estatstico.

    O Mtodo Experimental - o mtodo preferido pela fsica, Qumica, etc.

    Mtodo experimental: consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador

    possa descobrir seus efeitos, caso existam.

    O Mtodo Estatstico

    Muitas vezes temos necessidade de descobrir fatos em um campo em que o

    mtodo experimental no se aplica (nas cincias sociais), j que os vrios

    fatores que afetam o fenmeno em estudo no podem permanecer constantes

    enquanto fazemos variar a causa que, naquele momento, nos interessa.

    Nesses casos, lanamos mo de outro mtodo, embora mais difcil e menos

    preciso, denominado mtodo estatstico.

    Mtodo estatstico: diante da impossibilidade de manter as causas constantes, admitem todas essas causas presentes variando-as,

    registrando essas variaes e procurando determinar, no resultado final,

    que influncias cabem a cada uma delas.

  • 6

    A ESTATSTICA

    Exprimindo por meio de nmeros as observaes que se fazem de elementos

    com, pelo menos, uma caracterstica comum (por exemplo: os alunos do sexo

    masculino de uma comunidade), obtemos os chamados dados referentes a

    esses elementos.

    Podemos dizer, ento, que:

    A Estatstica uma parte da matemtica aplicada que fornece mtodos para a

    coleta, organizao, descrio, anlise e interpretao de dados e para a

    utilizao dos mesmos na tomada de decises.

    A Estatstica Descritiva se encarrega de fazer a coleta, organizao e descrio dos dados.

    A Estatstica Indutiva ou Inferencial se encarrega de fazer a anlise e interpretao dos dados.

    O aspecto essencial da Estatstica o de proporcionar mtodos

    infernciais, que permitam concluses que transcendam os dados obtidos

    inicialmente.

    Fases do Mtodo estatstico:

    Podemos distinguir no mtodo estatstico as seguintes fases:

    1 Definio do Problema

    Saber exatamente aquilo que se pretende pesquisar o mesmo que definir

    corretamente o problema.

    2 Planejamento

    Como levantar informaes? Que dados devero ser obtidos? Qual

    levantamento a ser utilizado? Censitrio? Por amostragem? E o cronograma

    de atividades? Os custos envolvidos? etc.

  • 7

    3 Coleta de Dados

    Aps cuidadoso planejamento e a devida determinao das caractersticas

    mensurveis do fenmeno coletivamente tpico que se quer pesquisar, damos

    incio coleta dos dados numricos necessrios sua descrio. Fase

    operacional. o registro sistemtico de dados, com um objetivo determinado.

    A coleta de dados pode ser direta ou indireta.

    3.1 Direta:

    Quando feita sobre elementos informativos de registro obrigatrio

    (nascimentos, casamentos, bitos, importao, exportao, etc.), elementos

    pertinentes aos pronturios dos alunos de uma escola ou, ainda, quando os

    dados so coletados pelo prprio pesquisador atravs de inquritos e

    questionrios, como o caso das notas de verificao e de exames, do censo

    demogrfico, etc.

    A coleta direta de dados pode ser classificada relativamente ao fator tempo

    em:

    Contnua (registro): quando feita continuamente, tal como a de

    nascimento, bitos e a freqncia dos alunos s aulas;

    Peridica: quando feita em intervalos constantes de tempo, como os

    censos (de 10 em 10 anos) e as avaliaes peridicas; recenseamento demogrfico, censo industrial;

    Ocasional: quando feita esporadicamente, a fim de atender a uma conjuntura ou a uma emergncia, como no caso de epidemias.

    3.2 Indireta:

    Quando inferida de elementos conhecidos (coleta direta) e/ou conhecimento

    de outros fenmenos relacionados com o fenmeno estudado.

    Ex: pesquisa sobre mortalidade infantil, que feita atravs de dados colhidos

    por uma coleta direta.

  • 8

    4 Crtica dos Dados

    Obtidos os dados, eles devem ser cuidadosamente criticados, procura de

    possveis falhas e imperfeies, a fim de no incorrermos em erros grosseiros

    ou de certo vulto, que possam influir sensivelmente nos resultados.

    A crtica dos dados se divide em: externa e interna

    Crtica externa quando visa s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que lhe

    foram feitas.

    Crtica interna quando visa observar os elementos originais dos dados da coleta.

    5 Apurao dos Dados

    Nada mais do que a soma e o processamento dos dados obtidos e a

    disposio mediante critrios de classificao. Resumo dos dados atravs de

    sua contagem e agrupamento. a condensao e tabulao de dados.

    Pode ser manual, eletromecnica ou eletrnica.

    6 Exposio ou Apresentao dos Dados

    Por mais diversa que seja a finalidade que se tenha em vista, os dados devem

    ser apresentados sob forma de tabelas e grficos (unidade 4), pois tornam mais

    fcil o exame daquilo que est sendo objeto de tratamento estatstico e ulterior

    obteno de medidas de disperso (unidade 6).

    7 Anlise dos Dados

    Como j dissemos, o objetivo ltimo da estatstica tirar concluses sobre o

    todo (populao) a partir de informaes fornecidas por parte representativa

    do todo (amostra). Assim, realizadas as etapas anteriores (estatstica

    descritiva), fazemos uma anlise dos resultados obtidos, atravs dos mtodos

    da Estatstica Indutiva ou Inferencial, que tem por base a induo ou

    inferncia, e tiramos desses resultados concluses e previses.

  • 9

    A ESTATSTICA NAS EMPRESAS

    No mundo atual, a empresa uma das vigas-mestras da economia dos povos.

    A direo de uma empresa, de qualquer tipo, incluindo as estatais e

    governamentais, exige de seu administrador a importante tarefa de tomar

    decises, e o conhecimento e o uso da estatstica facilitaro seu trplice

    trabalho de organizar, dirigir e controlar a empresa.

    Por meio de sondagem, de coleta de dados e de recenseamento de opinies,

    podemos conhecer a realidade geogrfica e social, os recursos naturais,

    humanos e financeiros disponveis, as expectativas da comunidade sobre a

    empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de

    serem alcanados a curto, mdio ou longo prazo.

    A estatstica ajudar em tal trabalho, como tambm na seleo e organizao

    da estratgia a ser adotada no empreendimento e, ainda, na escolha das

    tcnicas de verificao e avaliao da quantidade e da qualidade do produto e

    mesmo dos possveis lucros e/ou perdas.

    Tudo isso que se pensou, se planejou, precisa ficar registrado, documentado

    para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e

    do material e, ainda, para controle eficiente do trabalho.

    O esquema do planejamento o plano, que pode ser resumido, com auxlio da

    estatstica, em tabelas e grficos, que facilitaro a compreenso visual dos

    clculos matemtico-estatsticos que lhes deram origens.

  • 10

    II - GENERALIDADES E CONCEITOS BSICOS

    1 VARIVEL

    A cada fenmeno corresponde um nmero de resultados possveis. Assim, por

    exemplo:

    - para um fenmeno sexo so dois os resultados possveis: masculino e feminino;

    - para o fenmeno nmero de filhos h um nmero de resultados possveis expressos atravs dos nmeros naturais: 0,1,2,3,....,n;

    - para o fenmeno estatura temos uma situao diferente, pois os resultados podem tomar um nmero infinito de valores numricos dentro de

    um determinado intervalo.

    Varivel: , convencionalmente, o conjunto de resultados possveis de um fenmeno.

    Uma varivel pode ser: qualitativa ou quantitativa

    Qualitativa: quando seus valores so expressos por atributos; ex: sexo, cor da pele, etc;

    Quantitativa: quando seus valores so expressos em nmeros; ex: salrios, idade, altura, etc. Divide-se em discreta e contnua

    Discreta ou descontnua: seus valores so expressos geralmente atravs de nmeros inteiros no negativos. Resulta normalmente

    de contagens.

    Ex: nmeros de alunos presentes as aulas: ontem = 20, hoje = 23;

    N de alunos presentes s aulas de introduo estatstica no 1

    semestre de 1997: mar = 18, abr = 30, mai = 35, jun = 36.

    Contnua: resulta normalmente de uma mensurao, e a escala numrica de seus possveis valores corresponde ao conjunto R

    dos nmeros reais, ou seja, podem assumir, teoricamente,

    qualquer valor entre dois limites.

  • 11

    Exerccio resolvido:

    Classifique as variveis em qualitativas e quantitativas (contnuas ou

    discretas):

    a) Cor dos olhos Qualitativa b) ndice de liquidez nas Indstrias Cearenses Quantitativa contnua c) Produo de caf no Brasil Quantitativa contnua d) Nmero de defeitos em aparelhos de TV Quantitativa discreta e) Comprimento dos pregos produzidos por uma empresa Quantitativa contnua

    f) O ponto obtido em cada jogada de um dado quantitativa discreta

    2 POPULAO E AMOSTRA

    Dois conceitos devem estar bem claros: o de populao e o de amostra, pois

    delas que so extrados os dados que do origem s diversas relaes

    estatsticas, como a mdia, desvio-padro, etc., e que, em ltima anlise,

    possibilitam descreve-las sob os mais diversos aspectos.

    Populao: coleo completa de todos os elementos que so objeto de um

    estudo; conjunto de entes portadores de, pelo menos, uma caracterstica

    comum. A populao estatstica tambm conhecida como universo

    estatstico.

    Exemplo: pessoas que possuem automvel

    Amostras: so subconjuntos finitos representativos de uma dada populao.

    Exemplo: pessoas que possuem automvel da marca Fiat.

    Censo: exame de todos os elementos da populao.

    A amostra deve ser representativa da populao da qual foi extrada, ser

    parecida com ela (quantitativa e quantitativamente), devendo obedecer a dois

    princpios bsicos:

    Deve ser suficientemente grande;

    Seus constituintes devem ter sido selecionados ao acaso.

    Nem sempre possvel estudar exaustivamente todos os elementos da

    populao!

  • 12

    - Pode a populao ter dimenso infinita

    Exemplo: Populao constituda pelas presses atmosfricas, nos diferentes

    pontos de uma cidade.

    - Pode o estudo da populao levar destruio da populao

    Exemplo: Populao dos fsforos de uma caixa.

    - Pode o estudo da populao ser muito dispendioso

    Exemplo: Sondagens exaustivas de todos os eleitores, sobre determinado

    candidato.

    Quando no possvel estudar, exaustivamente, todos os elementos da

    populao, estudam-se s alguns elementos, a que damos o nome de Amostra.

    importante a fase de escolha da amostra?

    Sim, pois a amostra deve ser to representativa quanto possvel da Populao

    que se pretende estudar, uma vez que vai ser a partir do estudo da amostra,

    que vamos tirar concluses para a Populao.

    Quando a amostra no representa corretamente a populao diz-se

    destorcida e a sua utilizao pode dar origem a interpretaes erradas,

    como nos seguintes exemplos:

    - Utilizar uma amostra constituda por 10 flamenguistas, para prever o

    vencedor do prximo Flamengo X Vasco.

    - Utilizar uma amostra constituda pelos leitores habituais de determinada

    revista especializada, para tirar concluses sobre a populao geral.

    3 AMOSTRAGEM

    Conceito: uma tcnica especial para recolher amostras que garante, tanto quanto possvel, o acaso na escolha.

    Dessa forma, cada elemento da populao passa a ter a mesma chance de ser

    escolhido, o que garante amostra o carter de representatividade, e isto

    muito importante, pois, como vimos, nossas concluses relativas populao

    vo estar baseadas nos resultados obtidos nas amostras dessa populao.

  • 13

    Daremos, a seguir, trs das principais tcnicas de amostragem.

    3.1 Amostragem casual ou aleatria simples

    Esta tcnica de amostragem equivalente a um sorteio lotrico:

    Na prtica esta amostragem pode ser realizada da seguinte maneira:

    Enumera-se a populao de 1 a n;

    Sorteia-se K nmeros dessa seqncia, que representaro a amostra.

    Exemplo: Vamos obter uma amostra representativa para a pesquisa de peso de

    80 (oitenta) alunos de uma escola:

    Numeramos os alunos de 01 a 80 (populao);

    Colocamos os oitenta nmeros, em pedaos iguais de um mesmo papel, dentro de uma caixa. Agitamos e realizamos o sorteio de 8 alunos, que

    representa uma amostra de 10% desta populao.

    Quando o nmero de elementos da amostra grande, esse tipo de sorteio

    torna-se muito trabalhoso. A fim de facilit-lo, foi elaborada uma tabela Tabela de Nmeros Aleatrios -, construda de modo que os dez algarismos

    (de 0 a 9) so distribudos ao acaso nas linhas e colunas (ver anexo).

    3.2 Amostragem proporcional estratificada

    Muitas vezes a populao se divide em subpopulaes estratos

    Como provvel, que a varivel em estudo apresente, de estrato em estrato,

    um comportamento heterogneo e, dentro de cada estrato, um comportamento

    homogneo, convm que o sorteio dos elementos da amostra leve em

    considerao tais estratos.

    exatamente isso que fazemos quando empregamos a amostragem

    proporcional estratificada, que, alm de considerar a existncia de estratos,

    obtm elementos da amostra proporcional ao nmero de elementos desses

    estratos.

    Exemplo: Vamos obter uma amostra proporcional estratificada, de 10 % do

    exemplo anterior, supondo que dos 80 alunos, temos 44 meninos e 36

    meninas.

  • 14

    So, portanto dois estratos, (sexo masculino e sexo feminino). Temos:

    SEXO POPULAO 10 % AMOSTRA

    MASCULINO 44 10 x 44 = 4,4

    100

    4

    FEMININO 36 10 x 36 = 3,6

    100

    4

    TOTAL 80 10 x 80 = 8

    100

    8

    3.3 Amostragem sistemtica

    Quando os elementos da populao j se acham ordenados, no h

    necessidade de construir o sistema de referncia. So exemplos os pronturios

    mdicos de um hospital, os nmeros de uma rua, uma linha de produo, etc.

    Nestes casos, a seleo dos elementos que constituiro a amostra pode ser

    feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem

    denominamos sistemtica.

    Assim, no caso de uma linha de produo, podemos, a cada dez itens

    produzidos, retirar um para pertencer a uma amostra da produo diria. Neste

    caso, estaramos fixando o tamanho da amostra em 10% da populao.

    Exemplo: Supomos uma rua com 500 casas, das quais desejamos obter uma

    amostra formada por 20 casas para uma pesquisa de opinio.

    Neste caso, podemos usar o seguinte procedimento:

    Como 500/20 = 25, escolhemos por sorteio casual um nmero de 01 a 25;

    Este nmero indicar a primeira casa da amostra, vamos supor a casa de nmero 6;

    Os demais elementos da amostra seriam considerados de 25 em 25;

    Assim, as demais casas da amostra seriam as casas de nmeros 31 (6+25), 56 (31+25), 81 (56+25), etc.

  • 15

    III - SRIES ESTATSTICAS

    TABELAS

    Um dos objetivos da estatstica sintetizar os valores que uma ou mais

    variveis podem assumir, para que tenhamos uma viso global da variao

    dessa ou dessas variveis. Depois dos dados organizados, faz-se necessrio

    que essas informaes sejam apresentadas em formato de tabelas, pois iro

    nos fornecer rpidas e seguras informaes a respeito das variveis em estudo,

    permitindo-nos determinaes administrativas e pedaggicas mais coerentes e

    cientficas.

    TABELA: um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemtica.

    Uma tabela compe-se de: corpo, cabealho, coluna indicadora, linhas, casa

    ou clula e ttulo. Deste modo, uma tabela deve apresentar o seguinte esquema

    de representao:

    1. Corpo: conjunto de linhas e colunas que contm informaes sobre a varivel em estudo;

    2. Cabealho: parte superior da tabela que especifica o contedo das colunas;

    3. Coluna indicadora: parte da tabela que especifica o contedo das linhas;

    4. Linhas: retas imaginrias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com

    as colunas;

    5. Casa ou clula: cruzamento de uma coluna com uma linha, destinado a um s nmero (nunca deve ficar em branco);

    6. Ttulo: designao do fato observado, local e poca;

    H ainda que se considerar os elementos complementares, que so a fonte, as

    notas e as chamadas, colocadas, de preferncia, no seu rodap.

    Rodap: espao reservado, em seguida ao fecho da tabela, para insero de

    notas de natureza informativa;

  • 16

    Fonte: entidade responsvel pelo levantamento dos dados ou pela elaborao

    da tabela;

    Notas: so informaes de natureza geral, destinada a conceituar ou esclarecer

    o contedo das tabelas, ou indicar a metodologia adotada;

    Chamadas: informaes de natureza especfica sobre determinada parte da

    tabela, destinada a conceituar ou esclarecer dados.

    De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela

    devemos colocar:

    Um trao horizontal (-) quando o valor nulo;

    Trs pontos (...) quando no temos a informao;

    Zero (0) quando o valor muito pequeno para ser expresso pela

    unidade utilizada. Se os valores so expressos em numerais decimais,

    precisamos acrescentar parte decimal um nmero correspondente de

    zeros (0,0; 0,00; 0,000; .....);

    Um ponto de interrogao (?) quando temos dvida quanto exatido

    de determinado valor;

    A letra x quando o dado for omitido, a fim de evitar individualizao das informaes.

    Obs: Os lados direito e esquerdo de uma tabela oficial devem ser abertos.

  • 17

    Ex: Levantamento Epidemiolgico no Estado do Rio de Janeiro - 1970

    Especificao N de Casos N de bitos

    Sarampo (1) 115 15

    Varola ... 10

    Clera - -

    Meningite 35 5

    Total 150 30

    Fonte: Departamento Nacional de Endemias Rurais

    Nota: As atividades da campanha de vacinao abrangeram as reas de maior

    incidncia.

    (1) inclusive a rea urbana.

    SRIES ESTATSTICAS:

    Denominamos sries estatsticas toda tabela que apresenta a distribuio de

    um conjunto de dados estatsticos em funo da poca, do local ou da espcie.

    Dividem-se em sries homgradas e conjugadas.

    Sries Homgradas: so aquelas em que a varivel descrita apresenta variao discreta ou descontnua. Podem ser do tipo temporal,

    geogrfica ou especfica.

    a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O

    local e a espcie (fenmeno) so elementos fixos. Esta srie tambm

    chamada de histrica, cronolgica, marcha ou evolutiva.

    ABC VECULOS LTDA.

    Vendas no 1 bimestre de 1996

    PERODO UNIDADES

    VENDIDAS (mil)

    JAN/96 20

    FEV/96 10

    TOTAL 30

    b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A

    poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial,

    territorial ou de localizao.

  • 18

    ABC VECULOS LTDA.

    Vendas no 1 bimestre de 1996

    FILIAIS UNIDADES

    VENDIDAS (mil)

    SO PAULO 13

    RIO DE JANEIRO 17

    TOTAL 30

    c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm

    chamada de srie categrica.

    ABC VECULOS LTDA.

    Vendas no 1 bimestre de 1996

    MARCA UNIDADES

    VENDIDAS (mil)

    FIAT 18

    GM 12

    TOTAL 30

    Sries conjugadas: Tambm chamadas de tabelas de dupla entrada. So apropriadas apresentao de duas ou mais sries de maneira

    conjugada, havendo duas ordens de classificao: uma horizontal e

    outra vertical. O exemplo abaixo de uma srie geogrfica-temporal.

    ABC VECULOS LTDA.

    Vendas no 1 bimestre de 1996 (em mil unidades)

    FILIAIS JANEIRO FEVEREIRO

    SO PAULO 10 3

    RIO DE JANEIRO 12 5

    TOTAL 22 8

  • 19

    DADOS ABSOLUTOS E DADOS RELATIVOS

    Dados absolutos: so dados resultantes da coleta direta da fonte, sem outra manipulao seno a contagem ou medida.

    A leitura dos dados absolutos sempre enfadonha e inexpressiva; embora

    esses dados traduzam um resultado exato e fiel, no tm a virtude de ressaltar

    de imediato as suas concluses numricas. Da o uso imprescindvel que faz a

    Estatstica dos dados relativos.

    Dados relativos: so os resultados de comparaes por quocientes (razes) que se estabelecem entre dados absolutos e tm por finalidade

    realar ou facilitar as comparaes entre quantidades.

    Traduzem-se os dados relativos, em geral, por meio de percentagens, ndices,

    coeficientes e taxas.

    1 Percentagens

    Considere a srie:

    MATRCULAS NAS ESCOLAS DA CIDADE A 1995

    CATEGORIAS N. DE ALUNOS

    1 Grau 19286

    2 Grau 1681

    3 Grau 234

    TOTAL 21201 Dados fictcios.

    Calculemos as percentagens dos alunos da cada grau:

    1 grau 19286 x 100 = 90,96 = 91,0 21201

    2 grau 1681 x 100 = 7,92 = 7,9 21201

    3 grau 234 x 100 = 1,10 = 1,1 21201

  • 20

    Com esses dados, podemos formar uma nova coluna na srie em estudo:

    MATRCULAS NAS ESCOLAS DA CIDADE A 1995

    CATEGORIAS N. DE ALUNOS %

    1 Grau 19286 91,0

    2 Grau 1681 7,9

    3 Grau 234 1,1

    TOTAL 21201 100 Dados fictcios.

    Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A,

    91 esto matriculados no 1 grau, 8 aproximadamente no 2 grau e 1 no 3

    grau.

    O emprego da porcentagem de grande valia quando nosso intuito destacar

    a participao da parte no todo.

    NOTAS:

    Do mesmo modo que tomamos 100 para base de comparao, tambm podemos tomar outro nmero qualquer, entre os quais destacamos o

    nmero 1. claro que, supondo o total igual a 1, os dados relativos das

    parcelas sero todos menores que 1.

    Em geral, quando usamos 100 para base, os dados so arredondados at a primeira casa decimal; e quando tomamos 1 por base, so

    arredondados at a terceira casa decimal.

    Exerccio: Complete a tabela abaixo

    ESCOLAS N. DE ALUNOS DADOS RELATIVOS

    POR 1 POR 100

    A 175 0,098 9,8

    B 222

    C 202

    D 362

    E 280

    F 540

    TOTAL 1781 1,000 100,0

  • 21

    2 ndices

    Os ndices so razes entre duas grandezas tais que uma no inclui a outra.

    So exemplos de ndices:

    ndice ceflico = dimetro transversal do crnio x 100

    dimetro longitudinal do crnio

    Quociente intelectual = idade mental x 100

    idade cronolgica

    Densidade demogrfica = populao

    superfcie

    ndice econmicos:

    Produo per capta = valor total da produo

    populao

    Consumo per capta = consumo do bem

    populao

    Renda per capta = renda____

    populao

    Receita per capta = receita__

    populao

    3 Coeficientes

    Os coeficientes so razes entre o nmero de ocorrncias e o nmero total

    (nmero de ocorrncias e nmero de no-ocorrncias).

  • 22

    So exemplos de coeficientes:

    Coeficiente de natalidade = nmero de nascimentos

    populao total

    Coeficiente de mortalidade = nmero de bitos__

    populao total

    Coeficiente educacionais:

    Coeficiente de evaso escolar = n. de alunos evadidos__

    n. inicial de matrculas

    Coeficiente de aproveitamento escolar = n. de alunos aprovados

    n. final de matrculas

    Coeficiente de recuperao escolar = n. de alunos recuperados_

    n. de alunos em recuperao

    4 Taxas

    As taxas so os coeficientes multiplicados por uma potncia de 10 (10, 100,

    1000 etc.) para tornar o resultado mais inteligvel.

    So exemplos de taxas:

    Taxa de natalidade = Coeficiente de natalidade X 1000

    Taxa de mortalidade = Coeficiente de mortalidade X 1000

    Taxa de evaso escolar = Coeficiente de evaso escolar X 100

  • 23

    Exerccios:

    1 Considere a srie estatstica:

    SRIES ALUNOS MATRIC. %

    1 546

    2 328

    3 280

    4 120

    TOTAL 1274

    Complete-a, determinando as percentagens com uma casa decimal e fazendo a

    compensao, se necessrio.

    2 Uma escola apresentava, no final do ano, o seguinte quadro:

    SRIES MATRICULAS

    MARO NOVEMBRO

    1 480 475

    2 458 456

    3 436 430

    4 420 420

    TOTAL 1794 1781

    a. Calcule a taxa de evaso por srie

    b. Calcule a taxa de evaso da escola

    3 Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos pelo IBGE):

    Populao: 15.957,6 mil habitantes;

    Superfcie: 586.624 Km2;

    Nascimentos: 292036;

    bitos: 99281.

    Calcule:

    a. o ndice da densidade demogrfica;

    b. a taxa de natalidade;

    c. a taxa de mortalidade;

  • 24

    IV - GRFICOS ESTATSTICOS

    1- Conceito:

    O grfico um mtodo de representao de dados estatsticos em forma

    visual, por meio de figuras geomtricas. Devem corresponder, mas nunca

    substituir as tabelas estatsticas.

    uma forma de apresentao dos dados estatsticos, cujo objetivo o de

    produzir, no investigador ou no pblico em geral, uma impresso mais rpida

    e viva do fenmeno em estudo, j que os grficos falam mais compreenso

    que as sries.

    Para tornarmos possvel uma representao grfica, estabelecemos uma

    correspondncia entre os termos da srie e determinada figura geomtrica, de

    tal modo que cada elemento da srie seja representado por uma figura

    proporcional.

    A representao grfica deve obedecer a certos requisitos fundamentais como:

    Simplicidade deve proporcionar que o observador analise

    rapidamente o fenmeno apresentado;

    Clareza deve proporcionar que o observador tenha uma correta leitura

    dos valores representativos do fenmeno;

    Veracidade deve expressar a verdade sobre o fenmeno estatstico

    representado.

    2 - Caractersticas:

    Grficos de informao: So grficos destinados principalmente ao pblico

    em geral, objetivando proporcionar uma visualizao rpida e clara. So

    grficos tipicamente expositivos, dispensando comentrios explicativos

    adicionais. As legendas podem ser omitidas, desde que as informaes

    desejadas estejam presentes.

    Grficos de anlise: So grficos que se prestam melhor ao trabalho

    estatstico, fornecendo elementos teis fase de anlise dos dados, sem deixar

    de ser tambm informativos. Os grficos de anlise freqentemente vm

  • 25

    acompanhados de uma tabela estatstica. Inclui-se, muitas vezes um texto

    explicativo, chamando a ateno do leitor para os pontos principais revelados

    pelo grfico.

    Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto

    sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade,

    de um problema de construo de escalas.

    3 - Classificao dos grficos:

    Os principais grficos so os Diagramas, Estereogramas, Pictogramas e

    Cartogramas.

    3.1 - Diagramas:

    So grficos geomtricos dispostos, no mximo, em duas dimenses. So os

    mais usados na representao de sries estatsticas. Eles podem ser em linhas,

    em barras horizontais, em barras verticais (colunas), e em setores.

    Grficos em linhas ou lineares

    O grfico em linha constitui uma aplicao do processo de representao das

    funes num sistema de coordenadas cartesianas.

    Como sabemos, nesse sistema fazemos uso de duas retas perpendiculares; as

    retas so os eixos coordenados e o ponto de interseco, a origem. O eixo

    horizontal denominado eixo das abscissas (ou eixo dos x) e o vertical, eixo

    das ordenadas (ou eixo dos y). Para exemplificar considere a srie:

  • 26

    Determinamos, graficamente, todos os pontos da srie, usando as

    coordenadas, ligamos todos esses pontos, dois a dois, por segmentos de reta, o

    que ir nos dar uma poligonal, que o grfico em linha ou em curva

    correspondente a srie do exemplo.

    So freqentemente usados para representao de sries cronolgicas com um

    grande nmero de perodos de tempo. As linhas so mais eficientes do que as

    colunas, quando existem intensas flutuaes nas sries ou quando h

    necessidade de se representarem vrias sries em um mesmo grfico.

    Quando representamos, em um mesmo sistema de coordenadas, a variao de

    dois fenmenos, a parte interna da figura formada pelos grficos desses

    fenmenos denominada de rea de excesso.

  • 27

    Grficos em colunas ou barras

    a representao de uma srie por meio de retngulos, dispostos

    verticalmente (em colunas) ou horizontalmente (em barras).

    Quando em colunas, os retngulos tm a mesma base e as alturas so

    proporcionais aos respectivos dados.

    Quando em barras, os retngulos tm a mesma altura e os comprimentos so

    proporcionais aos respectivos dados.

    Exemplo: Grfico em colunas

  • 28

    Exemplo: Grfico em barras

    NOTAS:

    Quando as legendas no so breves usa-se de preferncia os grficos em barras horizontais;

    A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica;

    A distncia entre as colunas (ou barras), por questes estticas, no dever ser menor que a metade nem maior que os dois teros da largura

    (ou da altura) dos retngulos.

    Grficos em barras ou colunas mltiplas

  • 29

    Eles diferem dos grficos em barras ou colunas convencionais apenas pelo

    fato de apresentar cada barra ou coluna segmentada em partes componentes.

    Servem para representar comparativamente dois ou mais atributos.

    Grficos em setores

    Este grfico construdo com base em um crculo, e empregado sempre que

    desejamos ressaltar a participao do dado no total.

    O total representado pelo crculo, que fica dividido em tantos setores quantas

    so as partes.

    Os setores so tais que suas reas so respectivamente proporcionais aos

    dados da srie. Obtemos cada setor por meio de uma regra de trs simples e

    direta, lembrando que o total da srie corresponde a 360.

  • 30

    O grfico em setores s deve ser empregado quando h, no mximo, sete

    dados.

    Obs: As sries temporais geralmente no so representadas por este tipo de

    grfico.

  • 31

    3.2 - Estereogramas:

    So grficos geomtricos dispostos em trs dimenses, pois representam

    volume. So usados nas representaes grficas das tabelas de dupla entrada.

    Em alguns casos este tipo de grfico fica difcil de ser interpretado dada a

    pequena preciso que oferecem.

    3.3 - Pictogramas:

    So construdos a partir de figuras representativas da intensidade do

    fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do

    pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser

    auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma

    viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo

    abaixo:

  • 32

    3.4 - Cartogramas: So ilustraes relativas a cartas geogrficas (mapas). O

    objetivo desse grfico o de figurar os dados estatsticos diretamente

    relacionados com reas geogrficas ou polticas.

    Distinguimos duas aplicaes:

    a. representar os dados absolutos (populao) neste caso, lanamos mo, em geral, dos pontos, em nmero

    proporcional aos dados.

    b. representar dados relativos (densidade) - neste caso, lanamos mo, em geral, de hachuras ou cores.

  • 33

  • 34

    V - DISTRIBUIO DE FREQUENCIA

    1 Tabela Primitiva e Rol

    Considere a coleta de dados a seguir de uma varivel qualquer relativa a uma

    pesquisa com vinte pessoas:

    Ex: 45, 41, 42, 41, 42, 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51.

    Esse tipo de tabela chamada de tabela primitiva, ou seja:

    Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que

    no foram numericamente organizados.

    Assim, conhecidos os valores de uma varivel, difcil formarmos uma idia

    exata do comportamento do grupo como um todo, a partir de dados no

    ordenados. Em razo disso, pouca informao se consegue obter

    inspecionando os dados anotados. Mesmo uma informao to simples como a

    de saber o valor mximo e mnimo requer certo exame dos dados da tabela.

    ROL: a tabela obtida aps a ordenao dos dados, em ordem crescente ou

    decrescente.

    Para o exemplo acima temos:

    Rol: 41, 41, 41, 42, 42, 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60,

    60.

    Essa classificao dos dados proporciona algumas vantagens concretas com

    relao sua forma original:

    - possvel visualizar de forma ampla as variaes de consumo;

    - os valores extremos so percebidos de imediato;

    - possvel observar a tendncia de concentrao dos valores.

    Apesar de o rol propiciar ao analista mais informaes e com menos esforo

    de concentrao do que os dados brutos, ainda assim persiste o problema de a

    anlise ter que se basear nas 20 observaes. O problema se agravar quando

    o nmero de dados for muito grande.

  • 35

    2 Distribuio de Frequncia

    um tipo de tabela que condensa uma coleo de dados conforme as

    freqncias (repeties de seus valores). A forma pela qual podemos

    descrever os dados estatsticos resultantes de variveis quantitativas, como o

    caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de

    pessoas, salrios recebidos pelos operrios de uma fbrica etc.

    Frequncia: a quantidade que fica relacionada a um determinado valor da

    varivel.

    Distribuio de frequncia sem intervalos de classe: a simples

    condensao dos dados conforme as repeties de seus valores. Para um ROL

    de tamanho razovel esta distribuio de frequncia inconveniente, j que

    exige muito espao. Veja exemplo abaixo:

    Dados Frequncia

    41 3

    42 2

    43 1

    44 1

    45 1

    46 2

    50 2

    51 1

    52 1

    54 1

    57 1

    58 2

    60 2

    TOTAL 20

  • 36

    Distribuio de frequncia com intervalos de classe: Quando o tamanho da

    amostra elevado mais racional efetuar o agrupamento dos valores em

    vrios intervalos de classe.

    Classes Frequncias

    41 |------- 45 7

    45 |------- 49 3

    49 |------- 53 4

    53 |------- 57 1

    57 |------- 61 5

    Total 20

    3 Elementos de uma Distribuio de Frequncia com Intervalos de Classe:

    3.1 Classe

    As classes so representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k

    (onde K o nmero total de classes da distribuio).

    Na tabela do exemplo anterior, a distribuio formada por cinco classes,

    ento temos k = 5 e o intervalo de classe 49 |------- 53 representa a 3 classe,

    ou seja, i = 3.

    3.2 Limites de classe

    O menor nmero o limite inferior de classe (li) e o maior nmero, limite

    superior de classe (Li).

    Na classe 49 |------- 53, temos:,l3 = 49 e L3 = 53.

    O smbolo |------- representa um intervalo fechado esquerda e aberto

    direita. O dado 53 do ROL no pertence a classe 3 e sim a classe 4, que

    representada por 53 |------- 57.

    Classe de frequncia ou, simplesmente, classes so os intervalos de variao

    da varivel.

    Limites de classe so os extremos de cada classe.

  • 37

    3.3 Amplitude do intervalo de classe

    Ela obtida atravs da diferena entre o limite superior e inferior da classe e

    simbolizada por:

    Na tabela do exemplo anterior hi = 53 - 49 = 4. Obs: Na distribuio de

    frequncia com classes o hi ser igual em todas as classes, como mostrado a

    seguir:

    hi = 57 - 53 = 4

    hi = 49 - 45 = 4

    3.4 Amplitude total da distribuio

    Na tabela anterior AT = 61 - 41= 20

    Nota: evidente que, se as classes possuem o mesmo intervalo, verificamos a

    relao:

    3.5 Amplitude amostral

    Em nosso exemplo AA = 60 - 41 = 19.

    Obs: AT sempre ser maior que AA.

    Amplitude do intervalo de classe ou, simplesmente, intervalo a medida do

    intervalo que define a classe.

    Amplitude total da distribuio (AT) a diferena entre o limite superior da

    ltima classe e o limite inferior da primeira classe.

    AT = Lmax - lmin.

    hi = Li - li

    AT = k

    hi

    Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo

    da amostra (obtidos atravs do ROL).

    AA = Xmax - Xmin

  • 38

    3.6 Ponto mdio da classe

    Para obtermos o ponto mdio de uma classe, calculamos a semi-soma dos

    limites da classe (mdia aritmtica):

    No intervalo da 3 classe 49 |------- 53 o ponto mdio x3 calculado:

    x3 = (l3 + L3)/2 = (53 + 49)/2 = 51

    Obs.: O ponto mdio da classe o valor que a representa para efeito de

    clculos de medidas de posio e disperso ou variabilidade.

    3.7 Frequncia simples ou absoluta

    A frequncia simples simbolizada por fi (lemos f ndice i ou frequncia da

    classe i).

    Assim, considerando o exemplo abaixo, temos:

    ESTATURAS DE 40 ALUNOS NA ESCOLA A

    ESTATURA (cm) FREQUNCIA

    150 |------- 154 4

    154 |------- 158 9

    158 |------- 162 11

    162 |------- 166 8

    166 |------- 170 5

    170 |------- 174 3

    TOTAL 40

    f1 = 4; f2 = 9; f3 = 11; f4 = 8; f5 = 5 e f6 = 3.

    A soma das freqncias sempre igual ao total da amostra.

    Ponto mdio da classe (xi) , como o prprio nome indica, o ponto que divide

    o intervalo de classe em duas partes iguais.

    xi = li + Li

    2

    Frequncia simples ou frequncia absoluta ou simplesmente, frequncia de

    uma classe ou de um valor individual o nmero de observaes

    correspondentes a essa classe ou a esse valor.

  • 39

    Exerccio 1: As notas obtidas por 50 alunos de uma classe foram:

    1; 2; 3; 4; 5; 6; 6; 7; 7; 8; 2; 3; 3; 4; 5; 6; 6; 7; 8; 8; 2; 3; 4; 4; 5; 6; 6; 7; 8; 9;

    2; 3; 4; 5; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 7; 7; 8; 9;

    a) Complete a distribuio de frequncia abaixo:

    i Notas xi fi

    1 0 |--- 2

    2 2 |--- 4

    3 4 |--- 6

    4 6 |--- 8

    5 8 |--- 10

    Total 50

    b) Agora, responda:

    1. Qual a amplitude amostral?

    2. Qual a amplitude da distribuio?

    3. Qual o nmero de classes da distribuio?

    4. Qual o limite inferior da quarta classe?

    5. Qual o limite superior da classe de ordem 2?

    6. Qual a amplitude do segundo intervalo de classe?

    7. Qual a frequncia da terceira classe?

    c) Complete:

    1. h3 = .......

    2. n = ........

    3. l1 = ........

    4. L3 = ........

    5. x2 = ........

    6. f5 = ........

  • 40

    4 Tipos de Freqncias

    A soma das freqncias simples igual ao nmero total de dados da

    distribuio.

    A soma das frequncias relativas igual a 1 ou 100 %.

    Logo, para o exemplo da pgina 36 a frequncia da terceira classe :

    fr3 = f3/n ; fr3 = 11/40 = 0,275

    O propsito das frequncias relativas o de permitir a anlise ou facilitar as

    comparaes.

    Assim, no exemplo, a frequncia acumulada correspondente terceira classe

    :

    F3 = f1 + f2 + f3 = 4 + 9 + 11 = 24

    O que significa existirem 24 alunos com estatura inferior a 162 cm (limite

    superior do intervalo da terceira classe).

    Assim, no exemplo, para a terceira classe, temos:

    Fr3 = F3 / fi = 24/40 = 0,600

    Frequncia simples ou absolutas (fi) so os valores que realmente

    representam o nmero de dados de cada classe.

    Frequncias relativas: so os valores das razes entre as freqncias

    absolutas de cada classe e a frequncia total da distribuio.

    Frequncia acumulada de uma classe (Fi): o total das frequncias de todos

    os valores inferiores ao limite superior do intervalo de uma determinada

    classe:

    Fk = f1 + f2 + f3 + ...... + fK

    Frequncia acumulada relativa (Fri) de uma classe: a frequncia

    acumulada da classe, dividida pela frequncia total da distribuio.

    Fri = Fi / fi

  • 41

    Exerccio 2: Complete o quadro com as frequncia que se pede.

    CLASSE xi fi Fi fri (%) Fri (%)

    50 |----- 54 52 4

    54 |----- 58 56 9

    58 |----- 62 60 11

    62 |----- 66 64 8

    66 |----- 70 68 5

    70 |----- 74 72 3

    Total -- 40 -- 100 --

    Sendo xi = ponto mdio de classe; fi = frequncia simples; Fi = frequncia

    Acumulada; fri (%) = frequncia percentual e Fri (%) = frequncia percentual

    acumulada.

    5 - Mtodo Prtico para Construo de uma Distribuio de Freqncias com

    Classes:

    1 - Organize os dados brutos em um ROL.

    2 - Calcule a amplitude amostral AA. Para o exemplo da pgina 32, temos:

    AA = 60 - 41 = 19

    3 - Calcule o nmero de classes atravs da:

    a) Regra de Sturges:

    n i = n de classes

    3 ---- 5 3

    6 ---- 11 4

    12 ---- 22 5

    23 ---- 46 6

    47 ---- 90 7

    91 ---- 181 8

    182---- 362 9

    b) Raiz quadrada de n. (usa-se somente a parte inteira do nmero quando a

    raiz no for exata).

    Obs: Qualquer regra para determinao do n de classes da tabela no nos leva

    a uma deciso final; esta vai depender na realidade de um julgamento pessoal,

    que deve estar ligado natureza dos dados.

  • 42

    No nosso exemplo: n = 20 dados, ento, a regra sugere a adoo de 5 classes

    pela regra de Sturges e de 4 classes pela regra da raiz quadrada, ficando a

    critrio de quem vai fazer a distribuio de frequncia.

    4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe

    h > AA / i.

    No nosso exemplo: AA / i = 19/4 = 4,75. Obs: Como h > AA / i um valor

    ligeiramente superior para haver folga na ltima classe. Utilizaremos ento

    h = 5.

    5 - Temos ento o menor n da amostra, o n de classes e a amplitude do

    intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes

    com frequncia = 0 (zero).

    No nosso exemplo: o menor n da amostra = 41 + h = 46, logo a primeira

    classe ser representada por 41 |------- 46. As classes seguintes respeitaro o

    mesmo procedimento.

    O primeiro elemento da classe seguinte sempre ser formado pelo ltimo

    elemento da classe anterior.

    6 - Representao Grfica de uma Distribuio

    Uma distribuio de frequncia pode ser representada graficamente pelo

    Histograma, pelo Polgono de frequncia e pelo Polgono de frequncia

    acumulada (alguns autores denominam de ogiva de Galton).

    Em todos os grficos acima utilizamos o primeiro quadrante do sistema de

    eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das

    abscissas) colocamos os valores da varivel e na linha vertical (eixo das

    ordenadas), as frequncias.

    6.1 - Histograma

    A rea de um histograma proporcional soma das frequncias simples ou

    absolutas.

    O Histograma formado por um conjunto de retngulos justapostos, cujas

    bases se localizam sobre o eixo horizontal, de tal modo que seus pontos

    mdios coincidam com os pontos mdios dos intervalos de classe.

  • 43

    Para o exemplo a seguir, temos o seguinte histograma:

    ESTATURAS DE 40 ALUNOS NA ESCOLA A

    ESTATURA

    (cm)

    FREQUNCIA

    150 |------- 154 4

    154 |------- 158 9

    158 |------- 162 11

    162 |------- 166 8

    166 |------- 170 5

    170 |------- 174 3

    TOTAL 40

    6.2 Polgono de Frequncia

    Para realmente obtermos um polgono (linha fechada), devemos completar a

    figura, ligando os extremos da linha obtida aos pontos mdios da classe

    anterior primeira e da posterior ltima, da distribuio.

    O Polgono de frequncia um grfico em linha, sendo as frequncias

    marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos

    mdios dos intervalos de classe.

  • 44

    Para o exemplo anterior temos o seguinte Polgono de frequncia:

    6.3 Polgono de Frequncia Acumulada

    Para o exemplo em estudo temos o seguinte Polgono de frequncia

    acumulada:

    O Polgono de frequncia acumulada traado marcando-se as frequncias

    acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos

    correspondentes aos limites superiores dos intervalos de classe.

  • 45

    Uma distribuio de frequncia sem intervalos de classe representada

    graficamente por um diagrama onde cada valor da varivel representado por

    um segmento de reta varivel e de comprimento proporcional respectiva

    frequncia.

    Exerccio 3: Complete o quadro com as frequncia que se pede e com base

    nele construa o histograma, polgono de frequncia e polgono de frequncia

    acumulada.

    CLASSE xi fi Fi fi (%) Fi (%)

    50 |----- 54 52 4

    54 |----- 58 56 9

    58 |----- 62 60 11

    62 |----- 66 64 8

    66 |----- 70 68 5

    70 |----- 74 72 3

    Total -- 40 -- 100 --

    Sendo xi = ponto mdio de classe; fi = frequncia simples; Fi = frequncia

    Acumulada; fi (%) = frequncia percentual; Fi(%) = frequncia percentual

    acumulada.

  • 46

    VI - MEDIDAS DE POSIO

    1 Introduo

    O estudo que fizemos sobre distribuies de frequncia, at agora, permite-nos

    descrever, de modo geral, os grupos dos valores que uma varivel pode

    assumir. Dessa forma, podemos localizar a maior concentrao de valores de

    uma dada distribuio, isto , se ela se localiza no incio, no meio ou no final,

    ou ainda, se h uma distribuio por igual.

    Porm, para ressaltar as tendncias caractersticas de cada distribuio,

    isoladamente, ou em confronto com outras, necessitamos introduzir conceitos

    que se expressam atravs de nmeros, que nos permitam traduzir essas

    tendncias. Esses conceitos so denominados elementos tpicos da

    distribuio e so as:

    a. medidas de posio;

    b. medidas de variabilidade ou disperso;

    c. medidas de assimetria;

    d. medidas de curtose.

    Dentre os elementos tpicos, destacamos, neste captulo, as medidas de

    posio - estatsticas que representam uma srie de dados orientando-nos

    quanto posio da distribuio em relao ao eixo horizontal do grfico da

    curva de freqncia.

    As medidas de posies mais importantes so as medidas de tendncia

    central ou promdias, que recebem tal denominao pelo fato de os dados

    observados tenderem, em geral, a se agruparem em torno dos valores centrais.

    Dentre as medidas de tendncia central, destacamos:

    a. a mdia aritmtica;

    b. a moda;

    c. a mediana.

    Outras promdias menos usados so as mdias: geomtrica, harmnica,

    quadrtica, cbica e biquadrtica.

  • 47

    As outras medidas de posio so as separatrizes, que englobam: a prpria

    mediana, os decis, os quartis e os percentis.

    2 Mdia Aritmtica ( )

    Em um conjunto de dados, podemos definir vrios tipos de mdias. Porm, em

    nossos estudos iremos nos limitar mais importante: a mdia aritmtica.

    onde xi so os valores da varivel e n o nmero de valores.

    2.1 Dados no - agrupados

    Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de

    freqncias, determinamos a mdia aritmtica simples.

    Exemplo: Sabendo-se que a venda diria de arroz tipo A, durante uma semana,

    foi de 10, 14, 13, 15, 16, 18 e 12 kg, temos, para venda mdia diria na

    semana de:

    .= (10+14+13+15+16+18+12) / 7 = 14 kg

    Logo: .= 14 Kg

    s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados

    que ela representa. o que acontece quando temos os valores 2, 4, 6 e 8, para

    os quais a mdia 5. Esse ser o nmero representativo dessa srie de valores,

    embora no esteja representado nos dados originais. Neste caso, costumamos

    dizer que a mdia no tem existncia concreta.

    2.2 Desvio em relao mdia

    Mdia Aritmtica quociente entre a soma dos valores da varivel pelo

    nmero deles:

    Denominamos Desvio em relao mdia a diferena entre cada elemento de

    um conjunto de valores e a mdia aritmtica.

  • 48

    Designando o desvio por di, temos:.di = Xi -

    No exemplo anterior temos sete desvios:...

    d1 = 10 - 14 = - 4;

    d2 = 14 - 14 = 0;

    d3 = 13 - 14 = - 1;

    d4 = 15 - 14 = 1;

    d5 = 16 - 14 = 2;

    d6 = 18 - 14 = 4;

    d7 = 12 - 14 = - 2.

    2.3 .Propriedades da mdia

    1 propriedade: A soma algbrica dos desvios em relao mdia nula.

    Ou seja:

    No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0

    2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos

    os valores de uma varivel, a mdia do conjunto fica aumentada (ou

    diminuda) dessa constante.

    Se no exemplo anterior, somarmos a constante 2 a cada um dos valores da

    varivel temos:

    Y = (12+16+15+17+18+20+14) / 7 = 16 kg

    Ou seja, Y = .+ 2 = 14 +2 = 16 kg

  • 49

    3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de

    uma varivel por uma constante (c), a mdia do conjunto fica

    multiplicada (ou dividida) por essa constante.

    Se no exemplo anterior multiplicarmos a constante 3 a cada um dos valores da

    varivel temos:

    Y = (30+42+39+45+48+54+36) / 7 = 42 kg

    Ou seja, Y = x 3 = 14 x 3 = 42 kg

    2.4 Dados Agrupados

    A mdia aritmtica sem intervalos de classe

    Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando

    para varivel o nmero de filhos do sexo masculino. Calcularemos a

    quantidade mdia de meninos por famlia:

    N de meninos Freqncia = fi

    0 2

    1 6

    2 10

    3 12

    4 4

    = 34

    Neste caso, como as freqncias so nmeros indicadores da intensidade de

    cada valor da varivel, elas funcionam como fatores de ponderao, o que nos

    leva a calcular a mdia aritmtica ponderada, dada pela frmula:

  • 50

    O modo mais prtico de obteno da mdia ponderada abrir, na tabela, uma

    coluna correspondente aos produtos xifi:

    xi fi xi . fi

    0 2 0

    1 6 6

    2 10 20

    3 12 36

    4 4 16

    =34 =78

    Temos, xifi = 78 e f i = 34

    Logo xifi / f i = 78 / 34 = 2,3

    Portanto a mdia de 2,3 meninos por famlia

    Nota:

    - Sendo x uma varivel discreta, como interpretar o resultado obtido, 2

    meninos e 3 dcimos de menino?

    O valor mdio de 2,3 meninos sugere, neste caso, que o maior nmero de

    famlias tem 2 meninos e 2 meninas, sendo, porm, a tendncia geral de uma

    leve superioridade numrica em relao ao nmero de meninos.

    A mdia aritmtica com intervalos de classe

    Neste caso, convencionamos que todos os valores includos em um

    determinado intervalo de classe coincidem com o seu ponto mdio, e

    determinamos a mdia aritmtica ponderada por meio da frmula:

    Onde xi o ponto mdio da classe.

  • 51

    Exemplo: Considere a distribuio de frequncia abaixo, relativo a estaturas

    em cm de bebs. Calcular a estatura mdia de bebs conforme a tabela abaixo.

    i Estaturas (cm) fi

    1 50 |------- 54 4

    2 54 |------- 58 9

    3 58 |------- 62 11

    4 62 |------- 66 8

    5 66 |------- 70 5

    6 70 |------- 74 3

    = 40

    Pela mesma razo do caso anterior, vamos, inicialmente, abrir uma coluna

    para os pontos mdios (xi) e outra para os produtos xifi:

    i Estaturas (cm) fi xi xi.fi

    1 50 |------- 54 4 52 208

    2 54 |------- 58 9 56 504

    3 58 |------- 62 11 60 660

    4 62 |------- 66 8 64 512

    5 66 |------- 70 5 68 340

    6 70 |------- 74 3 72 216

    = 40 = 2.440

    Temos, xifi = 2440 e f i = 40; Logo xifi / f i = 2440 / 40 = 61

    Portanto, a estatura mdia dos bebs de 61 cm.

    2.5 Emprego da mdia

    A mdia utilizada quando:

    a. desejamos obter a medida de posio que possui a maior estabilidade;

    b. houver necessidade de um tratamento algbrico ulterior.

  • 52

    3 Moda

    Mo o smbolo da moda.

    Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais

    comum, isto , o salrio recebido pelo maior nmero de empregados dessa

    fbrica.

    3.1 Dados no - agrupados

    Quando lidamos com dados no-agrupados, a moda facilmente reconhecida:

    basta, de acordo com definio, procurar o valor que mais se repete.

    Exemplo: Na srie de dados {7, 8, 9, 10, 10, 10, 11, 12} a moda igual a 10.

    H sries nas quais no exista valor modal, isto , nas quais nenhum valor

    aparea mais vezes que outros.

    Exemplo: {3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.

    .Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos,

    ento, que a srie tem dois ou mais valores modais.

    Exemplo: {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7.

    A srie bimodal.

    3.2 Dados agrupados

    Sem intervalos de classe

    Uma vez agrupados os dados, possvel determinar imediatamente a moda:

    basta fixar o valor da varivel de maior freqncia.

    Exemplo: Qual a temperatura mais comum medida no ms abaixo:

    Temperaturas ( C) Freqncia

    0 3

    1 9

    2 12

    3 6

    Resp: 2 C a temperatura modal, pois a de maior freqncia (12 vezes).

    Denominamos Moda o valor que ocorre com maior freqncia em uma srie

    de valores.

  • 53

    Com intervalos de classe

    A classe que apresenta a maior freqncia denominada classe modal. Pela

    definio, podemos afirmar que a moda, neste caso, o valor dominante que

    est compreendido entre os limites da classe modal.

    O mtodo mais simples para o clculo da moda consiste em tomar o ponto

    mdio da classe modal. Damos a esse valor a denominao de moda bruta.

    Onde: l* = limite inferior da classe modal;

    L*= limite superior da classe modal.

    Exemplo: Calcule a estatura modal conforme a tabela abaixo.

    Classes

    (cm) Freqncia

    54 |-------- 58 9

    58 |-------- 62 11

    62 |-------- 66 8

    66 |-------- 70 5

    Resposta: A classe modal 58 |------ 62, pois a de maior frequncia.

    l* = 58 e L* = 62

    Mo = (58+62) / 2 = 60 cm (este valor estimado, pois no conhecemos o

    valor real da moda).

    H, para o clculo da moda, outros mtodos mais elaborados, como, por

    exemplo, o que faz uso da frmula de Czuber:

    Na qual:

    l* o limite inferior da classe modal;

  • 54

    h* a amplitude da classe modal;

    D1 = f* - f (ant.);

    D2 = f* - f (post.);

    Sendo:

    f* a frequencia simples da classe modal;

    f (ant.) a frequencia simples da classe anterior classe modal;

    f (post.) a frequencia simples da classe posterior classe modal.

    Exemplo: Considere a distribuio a seguir

    Classes fi

    150 |------ 154 4

    154 |------ 158 9

    158 |------ 162 11

    162 |------ 166 8

    166 |------ 170 5

    170 |------ 174 3

    Total 40

    Temos:

    D1 = 11 9 = 2 e D2 = 11 8 = 3;

    Mo = 158 + 2 x 4 = 159,6 cm

    2 + 3

    3.3 Emprego da moda

    A moda utilizada quando:

    a. desejamos obter uma medida rpida e aproximada de posio;

    b. quando a medida de posio deva ser o valor mais tpico da

    distribuio.

  • 55

    4 Mediana

    Smbolo da mediana: Md

    4.1 Dados no-agrupados

    Dada uma srie de valores como, por exemplo:

    {5, 2, 6, 13, 9, 15, 10}

    De acordo com a definio de mediana, o primeiro passo a ser dado o da

    ordenao (crescente ou decrescente) dos valores:

    {2, 5, 6, 9, 10, 13, 15}

    Em seguida, tomamos aquele valor central que apresenta o mesmo nmero de

    elementos direita e esquerda. Neste caso o valor que divide a srie acima

    em duas partes iguais o 9, logo a Md = 9.

    Se, porm, a srie dada tiver um nmero par de termos, a mediana ser, por

    definio, qualquer dos nmeros compreendidos entre os dois valores centrais

    da srie. Convencionou-se utilizar o ponto mdio.

    .Mtodo prtico para o clculo da Mediana

    a) Se a srie dada tiver nmero mpar de termos:

    O valor mediano ser o termo de ordem dado pela frmula:

    ( n + 1 ) / 2

    Exemplo: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 2, 5}

    1 - ordenar a srie {0, 0, 1, 1, 2, 2, 3, 4, 5}

    n = 9, logo (n + 1)/2 dado por (9 + 1) / 2 = 5, ou seja, o 5 elemento da srie

    ordenada ser a mediana.

    A mediana ser o 5 elemento = 2

    A Mediana de um conjunto de valores, dispostos segundo uma ordem

    (crescente ou decrescente), o valor situado de tal forma no conjunto que o

    separa em dois subconjuntos de mesmo nmero de elementos.

  • 56

    b) Se a srie dada tiver nmero par de termos:

    O valor mediano ser dado pela frmula:

    . [( n/2 ) +( n/2+ 1 )] / 2

    Obs.: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor

    correspondente.

    Exemplo: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}

    1 - ordenar a srie {0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }

    n = 10, logo a frmula ficar: [(10/2 ) + (10/2 + 1)] / 2

    [(5 + 6)] / 2, ser na realidade (5 termo+ 6 termo) / 2

    5 termo = 2 e 6 termo = 3

    A mediana ser = (2 + 3) / 2, ou seja, Md = 2,5. A mediana no exemplo ser a

    mdia aritmtica do 5 e 6 termos da srie.

    Notas:

    Quando o nmero de elementos da srie estatstica for mpar, haver

    coincidncia da mediana com um dos elementos da srie.

    Quando o nmero de elementos da srie estatstica for par, nunca haver

    coincidncia da mediana com um dos elementos da srie. A mediana

    ser sempre a mdia aritmtica dos 2 elementos centrais da srie.

    Em uma srie a mediana, a mdia e a moda no tm, necessariamente, o

    mesmo valor.

    A mediana depende da posio e no dos valores dos elementos na srie

    ordenada. Essa uma da diferenas marcantes entre mediana e mdia

    (que se deixa influenciar, e muito, pelos valores extremos). Vejamos:

    Em {5, 7, 10, 13, 15}; a mdia = 10 e a mediana = 10

    Em {5, 7, 10, 13, 65}; a mdia = 20 e a mediana = 10

    Isto , a mdia do segundo conjunto de valores maior do que a do primeiro,

    por influncia dos valores extremos, ao passo que a mediana permanece a

    mesma.

  • 57

    4.2 Dados agrupados

    Se os dados se agrupam em uma distribuio de frequncia, o clculo da

    mediana se processa de modo muito semelhante quele dos dados no-

    agrupados, implicando, porm, a determinao prvia das frequncias

    acumuladas.

    Ainda aqui, temos que determinar um valor tal que divida a distribuio em

    dois grupos que contenham o mesmo nmero de elementos.

    Sem intervalos de classe

    Neste caso, o bastante identificar a frequncia acumulada imediatamente

    superior metade da soma das frequncias. A mediana ser aquele valor da

    varivel que corresponde a tal frequncia acumulada.

    - Quando o somatrio das frequncias for mpar o valor mediano ser o termo

    de ordem dado pela frmula:

    Exemplo considere a distribuio abaixo:

    Varivel xi fi Fi

    0 2 2

    1 6 8

    2 9 17

    3 13 30

    4 5 35

    Total 35 --

    Como o somatrio das frequncias fi = 35, a frmula para calcular a mediana ser:

    (35+1) / 2 = 18 termo

    Pela distribuio temos a mediana igual ao valor da varivel correspondente

    ao 18 termo, ou seja, igual a 3.

  • 58

    - Quando o somatrio das frequncias for par o valor mediano ser o termo de

    ordem dado pela frmula:

    Exemplo - Calcule Mediana da tabela abaixo:

    Varivel xi fi Fi

    12 1 1

    14 2 3

    15 1 4

    16 2 6

    17 1 7

    20 1 8

    Total 8 --

    Aplicando frmula acima teremos:

    [(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2 = 15,5

    Logo, o valor da mediana para esta distribuio ser igual a 15,5.

    Com intervalos de classe

    Neste caso, o problema consiste em determinar o ponto do intervalo em que

    est compreendida a mediana.

    Para tanto, temos inicialmente que determinar a classe na qual se acha a

    mediana classe mediana.

    Devemos seguir os seguintes passos:

  • 59

    Exemplo: Considere a distribuio a seguir

    Classes fi Fi

    50 |------- 54 4 4

    54 |------- 58 9 13

    58 |------- 62 11 24

    62 |------- 66 8 32

    66 |------- 70 5 37

    70 |------- 74 3 40

    Total 40 --

    Temos: = 40 / 2 =.20

    Logo,.a classe mediana ser a terceira classe, ou seja, 58 |------ 62 e com base

    nesta classe temos ainda:

    l* = 58........... F(ant) = 13........... f* = 11........... h* = 4

    Substituindo esses valores na frmula acima, obtemos:

    Md = 58 + [(20 - 13) x 4] / 11 = 58 + (28/11) = 58 + 2,54 = 60,54

    Obs.: Este valor (Md = 60,54) estimado, pois no temos os 40 valores da

    distribuio.

    NOTA: No caso de existir uma frequncia acumulada exatamente igual a fi/2, a mediana ser o limite superior da classe correspondente.

  • 60

    Exemplo: Considere a distribuio a seguir

    i Classes fi Fi

    1 0 |------ 10 1 1

    2 10 |------ 20 3 4

    3 20 |------ 30 9 13

    4 30 |------ 40 7 20

    5 40 |------ 50 4 24

    6 50 |------ 60 2 26

    Total 26 --

    Temos: = 26 / 2 =.13

    Logo,.Md = L* = 30

    4.3 - Emprego da Mediana

    A mediana usada quando:

    a. desejamos obter o ponto que divide a distribuio em duas partes iguais;

    b. h valores extremos que afetam de maneira acentuada a mdia

    aritmtica;

    c. a varivel em estudo salrio.

    5 Posio Relativa da Mdia, Moda e Mediana

    Quando uma distribuio simtrica, as trs medidas coincidem. Porm, a

    assimetria torna-as diferentes e essa diferena tanto maior quanto maior a

    assimetria. Assim, em uma distribuio em forma de sino, temos:

    Media = Mediana = Moda, no caso da curva simtrica;

    Moda < Mediana < Media, no caso da curva assimtrica positiva;

    Media < Mediana < Moda, no caso da curva assimtrica negativa;

  • 61

    6 As Separatrizes

    Como vimos, a mediana caracteriza uma srie de valores devido sua posio

    central. No entanto, ela apresenta uma caracterstica, to importante quanto a

    primeira: ela separa a srie em dois grupos que apresentam o mesmo

    nmero de valores.

    Assim, alm das medidas de posio que estudamos, h outras que,

    consideradas individualmente, no so medidas de tendncia central, mas

    esto ligadas mediana relativamente sua segunda caracterstica, j que se

    baseiam em posio na srie. Essas medidas os quartis, os percentis e os decis so, juntamente com a mediana, conhecidas pelo nome genrico de separatrizes.

    6.1 Os quartis

    Denominamos quartis os valores de uma srie que a divide em quatro

    partes iguais.

  • 62

    H, portanto, trs quartis:

    a. O primeiro quartil (Q1) valor situado de tal modo na srie que uma quarta parte (25%) dos dados menor que ele e as trs quartas partes

    restantes (75%) so maiores.

    b. O segundo quartil (Q2) evidentemente, coincide com a mediana (Q2 = Md).

    c. O terceiro quartil (Q3) valor situado de tal modo na srie que as trs quartas partes (75%) dos termos so menores que ele e uma quarta parte

    restante (25%) maior.

    Quando os dados so agrupados, para determinar os quartis usamos a

    mesma tcnica do clculo da mediana, bastando substituir, na frmula da

    mediana, por:

    Sendo K o nmero de ordem do quartil. Assim temos:

  • 63

    Exemplo:

    Classes fi Fi

    150 |------- 154 4 4

    154 |------- 158 9 13

    158 |------- 162 11 24

    162 |------- 166 8 32

    166 |------- 170 5 37

    170 |------- 174 3 40

    Total 40 --

    Exerccio:

    1. Complete os esquemas para o clculo do primeiro e do terceiro quartis da distribuio de frequncia:

    (Q1)

    (Q3)

  • 64

    6.2 Os Decis

    Indicamos:

    D1, D2, D3, ............, D9

    evidente que:

    D5= Q2 = Md

    Denominamos decis os nove valores que separam uma srie em 10 partes

    iguais.

  • 65

    O clculo de um decil segue a mesma tcnica do clculo da mediana, porm, a

    frmula ser substituda por:

    Sendo K o nmero de ordem do decil. Assim temos:

    Exemplo: Calcule o stimo decil

    Classes fi Fi

    150 |------- 154 4 4

    154 |------- 158 9 13

    158 |------- 162 11 24

    162 |------- 166 8 32

    166 |------- 170 5 37

    170 |------- 174 3 40

    Total 40 --

    Stimo Decil:

    7 x fi/10 = 7 x 40/10 = 28

    D7 = 162 + (28 -24).4

    8

    D7 = 162 + 2 = 164

    10

    10

    10 D3

    D1

    (D7)

  • 66

    6.3 Os Percentis

    Indicamos:

    P1, P2, P3, ............, P99

    evidente que:

    P50= D5= Q2 = Md, P25= Q1, P75= Q3

    O clculo de um percentil segue a mesma tcnica do clculo da mediana,

    porm, a frmula ser substituda por:

    Sendo K o nmero de ordem do percentil. Assim para o 27 percentil, temos:

    Exemplo:

    Considerando a distribuio de frequncia, temos para o oitavo percentil:

    Classes fi Fi

    150 |------- 154 4 4

    154 |------- 158 9 13

    158 |------- 162 11 24

    162 |------- 166 8 32

    166 |------- 170 5 37

    170 |------- 174 3 40

    Total 40 --

    Denominamos percentis os noventa e nove valores que separam uma srie

    em 100 partes iguais.

    (P8)

  • 67

  • 68

    Exerccio:

    1. Complete o esquema para o clculo do vigsimo percentil da distribuio:

  • 69

    2. Calcule a mdia aritmtica das distribuies de frequncia abaixo:

    3. Calcule a mediana de cada uma das distribuies de frequncia do exerccio

    anterior.

    4. Calcule a moda de cada uma das distribuies de frequncia do exerccio

    anterior.

    5. Calcule o primeiro e o terceiro quartis de cada uma das distribuies de

    frequncia do exerccio anterior.

    5. Calcule o quarto e o nono decil de cada uma das distribuies de frequncia

    do exerccio anterior.

    6. Calcule o 1, o 10, o 15, o 23 e o 90 percentiis de cada uma da

    distribuio b) do exerccio anterior.

  • 70

    VII MEDIDAS DE DISPERSO OU VARIABILIDADE

    1 Disperso ou variabilidade

    Vimos anteriormente que um conjunto de valores pode ser convenientemente

    sintetizado, por meio de procedimentos matemticos, em poucos valores

    representativos mdia aritmtica, moda e mediana. Tais valores podem servir de comparao para dar a posio de qualquer elemento do conjunto.

    No entanto, quando se trata de interpretar dados estatsticos, mesmo aqueles j

    convenientemente simplificados, necessrio ter-se uma idia retrospectiva de

    como se apresentavam esses mesmos dados nas tabelas.

    Assim, no o bastante dar uma das medidas de posio para caracterizar

    perfeitamente um conjunto de valores. Vemos, ento, que a mdia ainda que considerada como um nmero que tem a faculdade de representar uma srie de

    valores no pode, por si mesma, destacar o grau de homogeneidade que existe entre os valores que compem o conjunto.

    Consideremos os seguintes conjuntos de valores das variveis x, y e z:

    X: 70, 70, 70, 70, 70

    Y: 68, 69, 70, 71, 72

    Z: 5, 15, 50, 120, 160

    Calculando a mdia aritmtica de cada um desses conjuntos, obtemos:

    mdia da varivel x = 70;

    mdia da varivel y = 70;

    mdia da varivel z = 70;

    Vemos, ento, que os trs conjuntos apresentam a mesma mdia aritmtica: 70

    Entretanto, fcil notar que o conjunto X mais homogneo que os

    conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y,

    por sua vez, mais homogneo que o conjunto Z, pois h menor

    diversificao entre cada um de seus valores e a mdia representativa.

    Chamando de disperso ou variabilidade a maior ou menor diversificao

    dos valores de uma varivel em torno de um valor de tendncia central tomado

    como ponto de comparao, podemos dizer que o conjunto X apresenta

  • 71

    disperso ou variabilidade nula e que o conjunto Y apresenta uma disperso

    ou variabilidade menor que o conjunto Z.

    Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior

    ou menor disperso ou variabilidade entre esses valores e a sua medida de

    posio, a Estatstica recorre s medidas de disperso ou de variabilidade.

    Dessas medidas, estudaremos a amplitude total, o Desvio-padro, a

    Varincia e o Coeficiente de variao.

    2 Amplitude Total

    2.1 Dados no-agrupados

    Exemplo: para os valores: 40, 45, 48, 52, 54, 62 e 70

    Temos: AT = 70 40 = 30, logo AT = 30.

    Quando dizemos que a amplitude total dos valores 30, estamos afirmando

    alguma coisa do grau de sua concentrao. evidente que, quanto maior a

    amplitude total, maior a disperso ou variabilidade dos valores da varivel.

    Relativamente aos trs conjuntos de valores (X, Y e Z) mencionados no incio

    deste captulo, temos:

    ATX = 70 70 = 0, (disperso nula)

    ATY = 72 68 = 4

    ATZ = 160 5 = 155

    2.2 Dados agrupados

    2.2.1 Sem intervalos de classe

    Neste caso, ainda temos:

    A Amplitude total a diferena entre o maior e o menor valor observado:

    AT = X (max) - X (min)

    AT = X (max) - X (min)

  • 72

    Exemplo:

    Considerando a tabela abaixo:

    Xi fi

    0 2

    1 6

    2 12

    3 7

    4 3

    Total 30

    Temos: AT = 4 0 = 4, logo AT = 4.

    2.2.2 Com intervalos de classe

    Neste caso, a amplitude total a diferena entre o limite superior da ltima

    classe e o limite inferior da primeira classe:

    Exemplo:

    Considerando a distribuio de frequncia abaixo:

    Classes fi

    150 |------- 154 4

    154 |------- 158 9

    158 |------- 162 11

    162 |------- 166 8

    166 |------- 170 5

    170 |------- 174 3

    Total 40

    Temos:

    AT = 174 150 = 24, logo: AT = 24 cm.

    A amplitude total tem o inconveniente de s levar em conta os dois valores

    extremos da srie, descuidando do conjunto de valores intermedirios, o que

    quase sempre invalida a idoneidade do resultado. Ela apenas uma indicao

    aproximada da disperso ou variabilidade.

    AT = L (max) - l (min)

  • 73

    3 Varincia e Desvio-padro

    3.1 Introduo:

    A varincia e o desvio-padro levam em considerao a totalidade dos valores

    da varivel em estudo, o que faz delas ndices de variabilidade bastante

    estveis e, por isso mesmo, os mais geralmente empregados.

    A varincia uma medida que tem pouca utilidade como estatstica descritiva,

    porm extremamente importante na inferncia estatstica e em combinaes

    de amostras.

    Quando se tratar de uma amostra devemos usar no denominador n 1.

    Sendo a varincia calculada a partir dos quadrados dos desvios, ela um

    nmero em unidade quadrada em relao varivel em questo, o que, sob o

    ponto de vista prtico inconveniente.

    Quando se tratar de uma amostra devemos usar no denominador n 1.

    NOTA:

    A varincia baseia-se nos desvios em torno da mdia aritmtica, porm

    determinando mdia aritmtica dos quadrados dos desvios. Assim,

    representando a varincia por s2, temos:

    Por isso mesmo, imaginou-se uma nova medida que tem utilidade e

    interpretaes prticas, denominada desvio-padro, definida como a raiz

    quadrada da varincia e representada por S.

  • 74

    Tanto o desvio-padro como a varincia so usados como medidas de disperso ou variabilidade. O uso de uma ou de outra depender da

    finalidade que se tenha em vista.

    Outra frmula bastante utilizada para calcular o desvio-padro de uma

    populao :

    3.2 Propriedades do desvio-padro

    O desvio padro uma medida que s pode assumir valores no negativos e

    quanto maior for o seu valor, maior ser a disperso dos dados.

    Algumas propriedades do desvio padro, que resultam imediatamente da

    definio, so:

    Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, o desvio padro no se altera.

    yi = xi c sy = sx

    Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante (diferente de zero), o desvio padro fica multiplicado

    (ou dividido) por essa constante.

    yi = xi . c sy = c . sx

    O desvio padro sempre no negativo e ser tanto maior, quanta mais

    variabilidade houver entre os dados.

    Se s = 0, ento no existe variabilidade, isto , os dados so todos iguais.

    Essas propriedades nos permitem introduzir, no clculo do desvio padro

    simplificaes teis.

    Para o clculo do desvio-padro, consideremos os seguintes casos:

  • 75

    3.3 Dados no-agrupados

    Devemos empregar uma das duas frmulas mostradas para clculo do desvio-

    padro.

    Exemplo: Calcular o desvio padro da populao representada por:

    Populao = {10, 6, 1, 3, 5}

    xi 10 5 5 25

    6 5 1 1

    1 5 - 4 16

    3 5 - 2 4

    5 5 0 0

    -- -- = 46

    Usando a frmula:

    Sabemos que n = 5 e que / n = 46 / 5 = 9,2.

    Logo, a raiz quadrada de 9,2 o desvio padro, S = 3,03

    Obs.: Podemos tambm calcular utilizando a outra frmula possvel.

    Quando nosso interesse no se restringe descrio dos dados, mas, partindo

    da amostra, visamos tirar inferncias vlidas para a respectiva populao,

    convm efetuar uma modificao, que consiste em usar o divisor (n 1) em lugar de n. A frmula ficar ento:

    Exemplo: Se os dados 10, 6, 1, 3 e 5 representassem uma amostra o desvio

    padro amostral seria a raiz quadrada de 46 / (5 -1) = 3,39

  • 76

    3.4 Dados agrupados

    Quando os dados esto agrupados (temos a presena de frequncias) a frmula

    do clculo do desvio padro para uma populao ficar:

    Quando se trata de uma amostra devemos usar a seguinte frmula:

    Podemos tambm calcular o desvio-padro populacional pela seguinte

    frmula:

    Exemplo:

    Calcule o desvio padro populacional da tabela abaixo:

    xi f i xi . f i . f i

    0 2 0 2,1 -2,1 4,41 8,82

    1 6 6 2,1 -1,1 1,21 7,26

    2 12 24 2,1 -0,1 0,01 0,12

    3 7 21 2,1 0,9 0,81 5,67

    4 3 12 2,1 1,9 3,61 10,83

    Total 30 63 -- Somatrio 32,70

    Sabemos que fi = 30 e . f i / n = 32,7 / 30 = 1,09.

    A raiz quadrada de 1,09 o desvio padro, ou seja, s = 1,044

  • 77

    Se considerarmos os dados como sendo de uma amostra o desvio padro seria:

    A raiz quadrada de 32,7 / (30 -1) = 1,062

    Obs: Nas tabelas de frequncias com intervalos de classe a frmula a ser

    utilizada a mesma do exemplo anterior.

    No exemplo anterior a varincia igual a:

    a) Para a populao

    S2 = (1,044)2 = 1,09

    b) Para a amostra: S2 = (1,062)2 = 1,13

    3.5 Entendendo o significado do desvio-padro:

    Em termos simples, desvio-padro um modo de representar a disperso dos

    dados ao redor da mdia. Se os dados obedecerem a uma distribuio normal,

    todos estaro compreendidos por uma curva em forma de sino; eles se

    distribuiro simetricamente ao redor da mdia.

    O quadro a seguir mostra os dados contidos entre desvio-padro para ambos

    os lados da mdia.

    Mdia + ou ( ) desvio-padro

    % da populao includa Grosseiramente

    1 68,3 2/3 da populao

    1,96 95,0

    2 95,5 95 % da populao

    2,58 99,0

    3 99,7 100 % da populao

  • 78

    1 - Aproximadamente 68% dos dados esto no intervalo

    2 - Aproximadamente 95% dos dados esto no intervalo

  • 79

    4 Coeficiente de Variao

    O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro

    de duas unidades pode ser considerado pequeno para uma srie de valores cujo

    valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode

    ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade

    dos dados limita o seu emprego quando desejamos comparar duas ou mais

    sries de valores, relativamente sua disperso ou variabilidade, quando

    expressas em unidades diferentes.

    Para contornar essas dificuldades e limitaes, podemos caracterizar a

    disperso ou variabilidade dos dados em termos relativos a seu valor mdio,

    medida essa denominada coeficiente de variao (CV):

    Exemplo:

    Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo

    grupo de indivduos:

    S

    Estaturas 175 cm 5,0 cm

    Pesos 68 Kg 2,0 Kg

    Temos:

    CVE = 5/175 x 100 = 2,85%

    CVP = 2/68 x 100 = 2,94%

    Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso

    que as estaturas.

  • 80

    VIII - PROBABILIDADE

    1 - Introduo:

    O clculo das probabilidades pertence ao campo da Matemtica, entretanto a

    maioria dos fenmenos de que trata a Estatstica so de natureza aleatria ou

    probabilstica. O conhecimento dos aspectos fundamentais do clculo da

    probabilidade uma necessidade essencial para o estudo da Estatstica

    Indutiva ou Inferencial.

    2 - Experimento Aleatrio

    Exemplo:

    Da afirmao " provvel que o meu time ganhe a partida hoje" pode resultar:

    - que ele ganhe - que ele perca - que ele empate

    Este resultado final pode ter trs possibilidades.

    3 - Espao Amostral

    No experimento aleatrio "lanamento de uma moeda" temos o espao

    amostral: {cara, coroa}.

    No experimento aleatrio "lanamento de um dado" temos o espao

    amostral: {1, 2, 3, 4, 5, 6}.

    No experimento aleatrio "dois lanamentos sucessivos de uma moeda" temos

    o espao amostral:

    {(ca,ca) ; (co,co) ; (ca,co) ; (co,ca)}

    So fenmenos que, mesmo repetidos vrias vezes sob condies semelhantes,

    apresentam resultados imprevisveis. O resultado final depende do acaso.

    Ao conjunto desses resultados possveis de um experimento aleatrio damos o

    nome de espao amostral ou conjunto universo, representado por S.

    .

  • 81

    Obs.: cada elemento do espao amostral que corresponde a um resultado

    recebe o nome de ponto amostral. No primeiro exemplo: cara pertence ao

    espao amostral {cara, coroa}.

    4 - Eventos

    Se considerarmos S como espao amostral e E como evento: Assim, qualquer

    que seja E, se E est contido em S, ento E um evento de S.

    Se E = S, E chamado de evento certo.

    Se E est contido em S e E um conjunto unitrio, E chamado de evento

    elementar.

    Se E = , E chamado de evento impossvel.

    5 - Probabilidade

    Dado um experimento aleatrio, sendo S o seu espao amostral, vamos

    admitir que todos os elementos de S tenham a mesma chance de acontecer, ou

    seja, que S um conjunto equiprovvel.

    Exemplos:

    1- No lanamento de uma moeda qual a probabilidade de obter cara em um evento A?

    S = {ca, co} = 2 A = {ca} = 1 P (A) = 1/2 = 0,5 = 50%

    qualquer subconjunto do espao amostral S de um experimento aleatrio.

  • 82

    2- No lanamento de um dado qual a probabilidade de obter um nmero par em um evento A?

    S = {1,2,3,4,5,6} = 6 A = {2,4,6} = 3 P (A) = 3/6 = 0,5 = 50%

    3- No lanamento de um dado qual a probabilidade de obter um nmero menor ou igual a 6 em um evento A?

    S = {1,2,3,4,5,6} = 6 A = {1,2,3,4,5,6} = 6 P (A) = 6/6 = 1,0 = 100%

    Obs: a probabilidade de todo evento certo igual a 1 ou 100%.

    4- No lanamento de um dado qual a probabilidade de obter um nmero maior que 6 em um evento A?

    S = {1,2,3,4,5,6} = 6 A = { } = 0 P (A) = 0/6 = 0 = 0%

    Obs: a probabilidade de todo evento impossvel igual a 0 ou 0%

    6 - Eventos Complementares

    Sabemos que um evento pode ocorrer ou no. Sendo p a probabilidade de que

    ele ocorra (sucesso) e q a probabilidade de que ele no ocorra (insucesso),

    para um mesmo evento existe sempre a