128
Probabilidade e Estatística 2015

ESTACIO EAD 2015_15 - Probabilidade e Estatistica_Versao WEB

Embed Size (px)

DESCRIPTION

Apostila Probabilidade

Citation preview

  • Probabilidade e Estatstica

    2015

  • Editorial

    UniSEB Editora Universidade Estcio de STodos os direitos desta edio reservados UniSEB e Editora Universidade Estcio de S.

    Proibida a reproduo total ou parcial desta obra, de qualquer forma ou meio eletrnico, e mecnico, fotogrfi co e gravao ou qualquer outro, sem a permisso expressa do UniSEB e Editora Universidade Estcio de S. A violao dos direitos autorais

    punvel como crime (Cdigo Penal art. 184 e ; Lei 6.895/80), com busca, apreenso e indenizaes diversas (Lei 9.610/98 Lei dos Direitos Autorais arts. 122, 123, 124 e 126).

    Sum

    rio

    Comit EditorialFernando Fukuda

    Simone MarkensonJeferson Ferreira Fagundes

    Autora do OriginalValria Aparecida Ferreira

  • Sum

    rio

    Probabilidade e EstatsticaCaptulo 1: Introduo Estatstica:

    Anlise exploratria de dados ......................... 7Objetivos da sua aprendizagem ................................. 7

    Voc se lembra? ................................................................ 71.1 Breve histrico ................................................................ 8

    1.2 Definio de Estatstica ........................................................ 81.3 Distribuio de frequncias ..................................................... 11

    1.4 Mtodos grficos .......................................................................... 16Atividades ................................................................................................ 24

    Reflexo ...................................................................................................... 26Leitura recomendada ...................................................................................... 27

    Referncias ........................................................................................................ 27No prximo captulo ............................................................................................ 27

    Captulo 2: Medidas de posio ........................................................................... 29Objetivos de sua aprendizagem ................................................................................ 29

    Voc se lembra? .......................................................................................................... 292.1 Mdia .................................................................................................................... 30

    2.2 Mediana (Md) ........................................................................................................ 312.3 Moda (Mo) .............................................................................................................. 322.4 Medidas Separatrizes: Quartis, Decis e Percentis .................................................. 40Atividades ...................................................................................................................... 49Reflexo ......................................................................................................................... 52Leitura recomendada .................................................................................................... 52Referncias .................................................................................................................. 52No prximo captulo .................................................................................................. 53

    Captulo 3: Medidas de disperso ....................................................................... 55Objetivos de sua aprendizagem ........................................................................... 55

    Voc se lembra? ............................................................................................... 553.1 Exemplo Introdutrio ............................................................................ 56

    3.2 Amplitude Total (R) .......................................................................... 573.3 Amplitude interquartil .................................................................... 57

    3.4 Desvio-Padro (s) ...................................................................... 573.5 Varincia (s2) ......................................................................... 59

    3.6 Coeficiente de Variao (cv) ............................................. 59

  • Apr

    esenta

    o3.7 Exemplo de aplicao das medidas de disperso para dados no tabulados ........... 603.8 Desvio-padro para dados tabulados ....................................................................... 633.9 Varincia para dados tabulados ................................................................................ 633.10 Exemplo de aplicao das medidas de disperso para dados tabulados ................ 64Atividades ....................................................................................................................... 69Reflexo .......................................................................................................................... 72Leitura recomendada ....................................................................................................... 72Referncias ...................................................................................................................... 72No prximo captulo ....................................................................................................... 73Captulo 4: Noes de Probabilidade .......................................................................... 75Objetivos da sua aprendizagem ...................................................................................... 75Voc se lembra? .............................................................................................................. 75Introduo ....................................................................................................................... 764.1 Princpio Fundamental da Contagem (PFC) ............................................................ 764.2 Fatorial de um nmero natural ................................................................................. 784.3 Arranjo ..................................................................................................................... 794.4 Permutao ............................................................................................................... 804.5 Combinao ............................................................................................................. 824.6 Breve histrico ......................................................................................................... 834.7 Experimento Aleatrio, Espao Amostral, Evento .................................................. 834.8 Operaes com Eventos ........................................................................................... 844.9 Probabilidade ........................................................................................................... 874.10 Regras Bsicas de Probabilidade ........................................................................... 894.11 Probabilidade Condicional ..................................................................................... 934.12 Independncia de eventos ...................................................................................... 954.13 Teorema de Bayes .................................................................................................. 97Atividades ..................................................................................................................... 100Leitura recomendada ..................................................................................................... 102Referncias .................................................................................................................... 102No prximo captulo .................................................................................................... 103Captulo 5: Variveis aleatrias ................................................................................. 105 Objetivos da sua aprendizagem .................................................................................... 105Voc se lembra? ............................................................................................................ 1055.1 Varivel Aleatria ................................................................................................... 1065.2 Funo discreta de probabilidade ........................................................................... 1065.3 Valor esperado e varincia de uma varivel aleatria discreta ............................... 1095.4 Modelos probabilsticos para variveis aleatrias Discretas ................................. 114Atividades ..................................................................................................................... 118Reflexo ........................................................................................................................ 120Leitura Recomendada ................................................................................................... 121Referncias .................................................................................................................... 121Gabarito ......................................................................................................................... 122

  • Apr

    esenta

    o Prezados(as) alunos(as)Estatstica uma palavra de origem

    latina, que significou por muito tempo cin-cia dos negcios do Estado. Ela pode ser vista

    como uma Matemtica Aplicada, uma disciplina da rea das cincias exatas que tem aplicao em pra-

    ticamente todas as reas de estudo. Esse fato serve para desmistificar o temor vivido pelos alunos com relao ao

    ensino da matemtica em si (aquela que ns aprendemos at o ensino mdio). As dificuldades enfrentadas e a falta de cone-

    xo com a prtica so talvez os fatores que mais contribuem para que este temor ocorra.

    No entanto, o ensino da Estatstica, mesmo provocando sentimentos semelhantes aos estudantes, proporciona a esses uma viso prtica

    do contedo que est sendo abordado. Mais que isso, ele possibilita, a quem o est aplicando, a obteno de importantes informaes do fato que est sendo estudado. O conhecimento mnimo em Estatstica se tornou pr-requisito para ler um jornal ou uma revista conceituada, pois muitas informaes se encontram resumidas em tabelas ou grficos que grande parte da populao no tem condies de interpretar e por isso ignoram (ou no entendem) reportagens importantes para a formao de uma pessoa esclarecida social, econmica e politicamente.Procuramos, aqui, apresentar a Estatstica de forma clara e prtica. No com o intuito de formar especialistas nessa rea, mas sim de proporcio-nar a voc, futuro gestor, uma compreenso dos elementos bsicos que compem essa cincia, visando a aplicao na sua rea de atuao.

    No tivemos a inteno de esgotar o assunto, mas sim de apresentar os elementos necessrios para que voc realize uma leitura satis-

    fatria da realidade que o cerca e das informaes que tm a sua volta.

    Estudaremos duas reas da Estatstica: Estatstica Descriti-va e a Probabilidade. No Captulo 1 apresentaremos os

    conceitos bsicos da Estatstica bem como descrio de tcnicas para organizao e apresentao dos dados.

  • Nos Captulos 2 e 3 aprenderemos a calcular e interpretar as medidas de posio e disperso. E, introduziremos, nos Captulos 4 e 5, conceitos de Probabilidade. Abordaremos o clculo de probabilidades atravs do m-todo clssico e frequencial e estudaremos a distribuio de probabilidade Binomial.Muitos dos exemplos aqui apresentados so hipotticos. So exemplos de situaes que ocorrem de forma semelhante na realidade, mas os dados apresentados no so reais, foram criados apenas para ilustrar a aplicao do contedo apresentado.

  • Cap

    CtuCo

    C Introduo

    Estatstica: Anlise exploratria de dados

    Neste primeiro captulo, apresentaremos al-guns conceitos bsicos utilizados pela Estatstica,

    alm de fornecer recursos de organizao, resumo e apresentao de dados atravs de tabelas e grficos.

    Quando realizamos uma coleta de dados, geralmente estamos lidando com uma quantidade muito grande de in-

    formaes. Portanto, torna-se imprescindvel a utilizao de certas tcnicas visando simplificar a leitura de tais informaes.

    Para que se tenha uma viso do todo (sobre o fenmeno que est sendo estudado) precisamos, por exemplo, dispor as informaes

    em tabelas ou apresent-las em grficos. o que estaremos abor-dando num primeiro momento. Logicamente, h mais tcnicas que

    podem ser aplicadas, mas elas sero vistas nos prximos captulos.

    Objetivos da sua aprendizagemAps o estudo dos conceitos e tcnicas apresentados neste captulo, es-peramos que voc consiga identificar os diferentes tipos de variveis que podem estar presentes em uma pesquisa, bem como, organizar, resumir e apresentar, atravs de tabelas e grficos de frequncias, as informaes contidas em grandes conjuntos de dados.

    Voc se lembra?Voc se lembra de j ter visto tabelas em jornais, livros ou revistas, em que eram utilizados percentuais para indicar as frequncias de ocor-

    rncias de respostas em uma pesquisa? Ou com os percentuais refe-rentes avaliao de um governo? Neste captulo, veremos como

    (e para qu) construir tabelas dessa natureza, alm de elaborar grficos que representam os resultados dessas tabelas.

  • 8

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    C.C Breve histricoO interesse por levantamento de dados no algo que surgiu somen-

    te nos dias atuais. H indcios de que 3000 anos A.C. j se faziam censos na Babilnia, China e Egito. Havia interesse dos governantes das grandes civilizaes antigas por informaes sobre suas populaes e riquezas. Usualmente estas informaes eram utilizadas para taxao de impostos e alistamento militar.

    A palavra Estatstica surgiu, pela primeira vez, no sc. XVIII. Alguns au-tores atribuem esta origem ao alemo Gottfried Achemmel (1719-1772), que teria utilizado pela primeira vez o vo-cbulo Estatstica, em 1746.

    Na sua origem, a Estatstica es-tava ligada ao Estado. Na atualidade, a Estatstica no se limita apenas ao estudo de dados demogrficos e econmicos. Ela empregada em praticamente todas as reas do co-nhecimento, sempre que estiverem envolvidas coleta e anlise de dados.

    C.2 Definio de EstatCstica

    A Estatstica uma cincia que trata de mtodos cientficos para a coleta, organizao, descrio, anlise e interpretao (concluso) de um conjunto de dados, visando a tomada de decises.

    Podemos dividir a aplicao da Estatstica basicamente em trs eta-pas, que so descritas resumidamente a seguir:

    1. Refere-se coleta de dados, na qual devemos utilizar tcnicas estatsticas que garantiro uma amostra representativa da po-pulao.

    2. Depois dos dados coletados, devemos resumi-los em tabelas de frequncias e/ou grficos e, posteriormente, encontrar as medidas de posio e variabilidade (quantidades). Esta etapa tambm conhecida como Estatstica Descritiva ou Dedutiva.

    Conexo:

    Para saber um pouco sobre a evoluo histrica da

    Estatstica, assista ao vdeo His-tria da Estatstica produzido pela

    Fundao Universidade de Tocantins, disponvel em: http://www.youtube.com/watch?v=jCzMPL7Ub2k&featu

    re=related

  • 9

    Introduo Estatstica: Anlise exploratria de dados Captulo 1

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    3. Esta etapa envolve a escolha de um possvel modelo que ex-plique o comportamento dos dados para posteriormente se fazer a inferncia dos dados para a populao de interesse. Esta etapa tambm chamada de Estatstica Inferencial ou Indutiva. Nesta etapa, se faz necessrio um conhecimento mais aprofundado, principalmente no que se refere aos tpicos de probabilidades. A probabilidade fornece mtodos para quantificar a incerteza existente em determinada situao, usando ora um nmero ora uma funo matemtica.

    Podemos citar inmeros exemplos da Estatstica em vrias reas do conhecimento, mas s para convenc-lo da importncia das tcnicas esta-tsticas, vamos dar alguns exemplos:

    1. Se estamos interessados em abrir um supermercado em um determinado local precisamos saber se fatores como sexo, grau de escolaridade, idade, estado civil, renda familiar, entre outros, interferem na abertura deste supermercado e os tipos de produtos que devem ser priorizados nesse estabelecimento, alm de definir as estratgias de marketing mais eficientes.

    2. Uma empresa, quando est interessada em lanar um novo produto no mercado, precisa saber as preferncias dos con-sumidores. Para isso, necessrio realizar uma pesquisa de mercado.

    3. O gestor precisa saber escolher uma amostra representativa de uma populao de interesse para no perder muito tempo e, consequentemente, dinheiro da empresa em que trabalha.

    4. Para se lanar um novo medicamento no mercado farmacuti-co, necessrio a realizao de vrias experincias. O medica-mento deve ser testado estatsticamente quanto sua eficincia no tratamento a que se destina e quanto aos efeitos colaterais que pode causar, antes de ser lanado no mercado.

  • 10

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    5. Para uma empresa, muito importante fazer previses de demanda de seus produtos. Para isto existem vrias tcnicas estatsticas como regresso linear, regresso logstica, anlise de sries temporais, etc.

    6. Controles estatsticos de qualidade (ou controles estatsticos do processo) so indispensveis em todos os tipos de empre-sas. Eles so realizados atravs de um conjunto de tcnicas estatsticas, geralmente aplicadas por engenheiros de produo e administradores, para garantir o nvel de qualidade exigido para a produo (ou servio) dentro de uma indstria.

    So inmeras e diversificadas as aplicaes de tcnicas estatsticas que o gestor pode utilizar. No conseguiremos falar sobre todas elas, mas apresentaremos os principais conceitos e tcnicas que quando utilizados podem auxiliar na tomada de decises.

    Comearemos por apresentar alguns conceitos elementares bastante utilizados no processo estatstico.

    Populao: o conjunto total de elementos (objetos, itens, medi-das, etc.) que tm determinada caracterstica que se deseja estudar.

    Amostra: uma parte da populao de interesse que se tem acesso para desenvolver o estudo estatstico. Se a amostra no for fornecida no estudo, devemos retir-la da populao atravs de tcnicas de amostragem adequadas, para que os resultados fornecidos sejam confiveis.

    Estatstica Descritiva: a parte da estatstica que trata da organi-zao e do resumo do conjunto de dados por meio de grficos, tabelas e medidas descritivas (quantidades).

    Estatstica Indutiva: a parte que se destina a encontrar mtodos para tirar concluses (ou tomar decises) sobre a populao de interesse, geralmente, baseado em informaes retiradas de uma amostra desta po-pulao.

    Varivel: a caracterstica de interesse no estudo. Vamos estudar dois tipos de variveis: quantitativas e qualitativas.

    Variveis quantitativas: so aquelas cujas respostas da varivel so expressas por nmeros (quantidades). Podemos distinguir dois tipos de variveis quantitativas: quantitativa contnua e discreta.

    Variveis quantitativas contnuas: so aquelas que podem assu-mir, teoricamente, infinitos valores entre dois limites (num intervalo), ou

  • 11

    Introduo Estatstica: Anlise exploratria de dados Captulo 1

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    seja, podem assumir valores no inteiros. Por exemplo: altura (em metros) de alunos de uma determinada faixa etria, peso (em kg), salrio, etc.

    Variveis quantitativas discretas: so aquelas que s podem assu-mir valores inteiros. Por exemplo: nmero de filhos por casal, nmero de livros em uma biblioteca, nmero de carros vendidos, etc.

    Variveis qualitativas: so as variveis cujas respostas so expres-sas por um atributo. Podemos distinguir dois tipos de variveis qualitati-vas: nominal e ordinal.

    Variveis qualitativas nominais: definem-se como aquelas em que as respostas so expressas por um atributo (nome) e esse atributo no pode ser ordenado. Por exemplo: tipo sanguneo, religio, estado civil, etc.

    Variveis qualitativas ordinais: tm suas respostas expressas por um atributo (nome) e esse atributo pode ser ordenado. Por exemplo: grau de instruo, classe social, etc.

    C.3 Distribuio de frequncias

    Para entendermos a ideia de distribuio de frequncias, vamos analisar a seguinte situao: quando um pesquisador termina de coletar os dados para sua pesquisa, geralmente fica com muitos questionrios em mos (respondidos pelas pessoas que foram sorteadas para pertencer a sua amostra) ou com os dados digitados em alguma planilha eletrnica. O fato que os dados brutos (sem tratamento) no trazem as informaes de forma clara, por isso devemos tabular esses dados. Quando tabulamos os dados estamos resumindo as informaes para melhor compreenso da varivel em estudo. A esta tabulao damos o nome de distribuio de frequncias (ou tabela de frequncias).

    Distribuio de frequncias uma tabela em que se resumem grandes quantidades de dados, determinando o nmero de vezes que cada dado ocorre (frequncia) e a porcentagem com que aparece (frequncia relativa).

    Para facilitar a contagem do nmero de vezes que cada dado ocorre, podemos ordenar os dados. A uma sequncia ordenada (crescente ou de-crescente) de dados brutos damos o nome de Rol.

    Os tipos de frequncias com os quais iremos trabalhar so:Frequncia absoluta ou simplesmente frequncia (f): o n de

    vezes que cada dado aparece na pesquisa.

  • 12

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Frequncia relativa ou percentual (fr): o quociente da frequn-cia absoluta pelo nmero total de dados. Esta frequncia pode ser expres-sa em porcentagem. O valor de (fr x100) definido como fr (%).

    Frequncia acumulada (fa): a soma de cada frequncia com as que lhe so anteriores na distribuio.

    Frequncia relativa acumulada (fra): o quociente da frequncia acumulada pelo nmero total de dados. Esta frequncia tambm pode ser expressa em porcentagem. O valor de (fra x100) definido como fra (%).

    Exemplo 1.1: Dada a tabela abaixo, vamos definir qual a varivel em estudo e qual o tipo de varivel. Depois, completaremos a tabela de distribuio de frequncias encontrando a frequncia relativa (%).

    Faixa de renda (em salrios mnimos)

    Nmero de operrios (f)

    Frequncia relativa (%) (fr)

    0 | 2 43 39,092 | 4 39 35,454 | 6 16 14,556 | 8 8 7,278 | 10 4 3,64

    Total 110 100

    Tabela 1.1 Distribuio de renda de operrios de uma determinada empresa.

    Em todos os nossos exemplos, na distribuio de frequncias construda com intervalos de classes, vamos considerar que o intervalo de classe fechado esquerda e aberto direita. Por exemplo, no caso dessa tabela, considerando a terceira classe de frequncia, podemos dizer que os 16 operrios que esto nesta classe recebem de 4 a menos que 6 salrios mnimos por ms.

    ResoluoA varivel em estudo a renda dos operrios de uma determinada

    empresa. Esta varivel classificada como quantitativa contnua, pois pode assumir qualquer valor dentro de um intervalo numrico.

    As frequncias absolutas (f) so fornecidas no problema. As frequncias relativas (fr(%)) so encontradas dividindo cada frequncia absoluta (de cada classe de frequncia) pelo total de operrios (110) e multiplicando por 100.

  • 13

    Introduo Estatstica: Anlise exploratria de dados Captulo 1

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Uma distribuio de frequncias apresenta, basicamente, as 3 colu-nas apresentadas na tabela 1.1. Desta maneira, conseguimos organizar de forma resumida um conjunto de dados.

    Em alguns estudos podemos ter interesse em outras quantidades relacionadas tabela, como, por exemplo, a frequncia acumulada ou a frequncia acumulada (%). Veremos mais adiante que a frequncia acu-mulada utilizada na construo de um grfico denominado Ogiva. A tabela 1.2 apresenta a frequncia acumulada e a frequncia relativa acu-mulada (%).

    Faixa de renda (em salrios

    mnimos)

    Nmero de operrios (f) fr(%)

    Frequncia acumulada

    (fa)fra (%)

    0 | 2 43 39,09 43 39,092 | 4 39 35,45 82 75,554 | 6 16 14,55 98 89,096 | 8 8 7,27 106 96,368 | 10 4 3,64 110 100,00

    Total 110 100

    Tabela 1.2 Distribuio das frequncias acumuladas da varivel faixa de renda.

    A coluna frequncia acumulada (fa) de cada classe obtida somando a frequncia da respectiva classe com as que lhe so anteriores e a fra (%) obtida dividindo a fa pelo nmero total de dados e multiplicando por 100.

    Exemplo 1.2: Uma determinada empresa resolveu traar o perfil socioeconmico de seus empregados. Uma das variveis estudadas foi o nmero de filhos, com idade inferior a 18 anos, de cada um dos empre-gados. A tabela 1.3 fornece a frequncia e a frequncia relativa (%) para cada valor obtido.

    Nmero de filhos Nmero de operrios (f) Fr (%)

    0 6 13,331 11 24,442 13 28,893 7 15,564 5 11,11

  • 14

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Nmero de filhos Nmero de operrios (f) Fr (%)

    5 1 2,226 2 4,44

    Total 45 100,00

    Tabela 1.3 Distribuio de frequncias dos empregrados, segundo o nmero de filhos.

    Para encontrarmos a fa e a fra (%) seguimos o mesmo procedimento que foi utilizado na Tabela 1.2.

    C.3.C Agrupamento em cCasses

    Como vimos no exemplo 1.1, para representar a varivel contnua renda, organizamos os dados em classes. Portanto, podemos dizer que a varivel renda foi dividida em 5 classes de frequncias.

    Quando agrupamos em classes de frequncias perdemos informaes, pois no sabemos exatamente quais so os valores que esto contidos em cada uma das classes (a no ser que seja possvel pesquisar esta informao no conjunto de dados brutos). Na anlise das tabelas de frequncias com interva-los de classes podemos identificar os seguintes valores:

    Limite inferior (Li): o menor valor que a varivel pode assumir em uma classe de frequncia.

    Limite superior (Ls): serve de limite para estabelecer qual o maior valor que a varivel pode assumir em uma classe de frequncia, mas, ge-ralmente, os valores iguais ao limite superior no so computados naquela classe e sim na seguinte.

    Ponto mdio (Pm): a mdia aritmtica entre o Li e o Ls da mesma

    classe, ou seja, PL L

    m

    i s=+2

    .

    Amplitude (h): a diferena entre o Ls e o Li da classe, ou seja, h = Ls Li.

    Amplitude total (ht): a diferena entre o LS da ltima classe de frequncia e o Li da primeira classe, ou seja: ht = Ls Li.

  • 15

    Introduo Estatstica: Anlise exploratria de dados Captulo 1

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Na construo de uma distribuio de frequncias com intervalos de classes devemos determinar o nmero de classes que uma tabela deve ter e qual o tamanho (ou a amplitude) destas classes. Podemos usar o bom senso e escolher arbitrariamente quantas classes e qual a amplitude que estas classes devem ter. Em algumas situaes, iremos tabular dados para comparar os resultados com informaes de outras tabelas. Nesse caso, melhor considerar as mesmas classes das tabelas que iremos comparar.

    Quando no tivermos nenhuma referncia sobre qual deve ser o n-mero de classes a se trabalhar, podemos utilizar o critrio que sugerido por vrios autores. Chama-se regra da raiz e ser apresentado a seguir

    Considere:

    k n e hR

    k

    onde k o nmero de classes que vamos construir na tabela de fre-quncias; n o tamanho da amostra que estamos trabalhando; h a ampli-tude de cada uma das classes e R a amplitude total dos dados.

    Os valores de k e h devem ser arredondados sempre para o maior valor. Por exemplo, para uma amostra de tamanho n = 50 cujo menor valor 4 e o maior valor 445 temos que R = 441 (maior valor menor valor). O nmero de clas-ses seria dado por k n = = 50 7 07106 8, (maior inteiro depois de 7) e a amplitude (tamanho) de cada uma das 8 classes acima dever ser

    hR

    k = =

    441

    855 125 56, (maior inteiro depois de 55). Ou seja, dever-

    amos, para este exemplo, montar uma tabela com 8 classes e de amplitude 56. A tabela pode ser iniciada pelo menor valor do conjunto de dados.

    Resumindo, para montar uma tabela de frequncias com intervalos de classes devemos:

    Achar o mnimo e o mximo dos dados. Determinar as classes de frequncias, o que na verdade nada

    mais do que escolher intervalos de mesmo comprimento que cubra a amplitude entre o mnimo e o mximo. Para determinar o nmero de classes, usaremos k n e para determinar o

    tamanho das classes usaremos h RK

    .

  • 16

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Contar o nmero de observaes que pertencem a cada interva-lo de classe. Esses nmeros so as frequncias observadas da classe.

    Calcular as frequncias relativas e acumuladas de cada classe. De modo geral, a quantidade de classes no deve ser inferior a

    5 e nem superior a 25.

    Um outro critrio utilizado para construir distribuio de frequn-cias com intervalos de classes a regra de Sturges.

    Neste critrio, o nmero de classes a serem construdas obtido uti-lizando a seguinte frmula:

    k n + 1 3 3, log

    onde:k:nmero de classesn:total da amostralog n: logaritmo na base 10 de n

    A amplitude de cada intervalo de classe obtida por:

    hamplitude total

    k

    R

    k= =

    Devemos arredondar o valor de k para o nmero inteiro mais prximo, pois o nmero de classes deve ser sempre inteiro. O arredondamento de h deve ser sempre efetuado para cima usando o mesmo nmero de casas decimais dos ele-mentos da amostra para que nenhum elemento fique fora da tabela.

    C.4 Mtodos grficos

    O objetivo da utilizao de grficos em anlise de dados o de fa-cilitar a compreenso do fenmeno estatstico por meio do efeito visual imediato que os grficos proporcionam.

  • 17

    Introduo Estatstica: Anlise exploratria de dados Captulo 1

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    C.4.C Tipos de grficosExistem vrios tipos de grficos. Os mais usados so: grfico em linhas,

    diagramas de rea (como por exemplo: grfico em colunas, grfico em barras e grfico em setores) e grficos para representar as distri-buies de frequncias construdas com intervalos de classes (como por exemplo: polgono de fre-quncias, histograma e ogiva).

    Vamos saber um pouco quando usar e como construir cada um destes grficos.

    C.4.C.C Grfico em Cinhas

    Sempre que os dados estiverem distribu-dos segundo uma varivel no tempo (meses, anos, etc.), assim como sucede com os dados do exemplo 1.3 figura 1.1, os dados podem, tambm, ser descritos atravs de um grfico em linhas. Esse tipo de grfico retrata as mudanas nas quantidades com respeito ao tempo atravs de uma srie de segmentos de reta. muito eficiente para mostrar possveis tendncias no conjunto de dados.

    Exemplo 1.3: A tabela 1.4 fornece uma lista do nmero de assinan-tes de telefones celulares, em milhes, de 1997 a 2007, do pas X. Cons-trua um grfico para resumir os dados da tabela a seguir.

    Ano Assinantes (em milhes)1997 1,11998 1,31999 1,52000 1,92001 2,42002 2,62003 3,12004 7,42005 18,62006 21,52007 29

    Tabela 1.4 Assinantes de telefones celulares, em milhes, de 1997 a 2007.

    Conexo:

    Vamos refletir um pouco sobre a necessidade de

    abordagens pedaggicas para o ensino e a aprendizagem de gr-

    ficos acessando o endereo http://www.ufrrj.br/emanped/paginas/conteudo_producoes/docs_22/

    carlos.pdf.

  • 18

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    O grfico que melhor representa este conjunto de dados o grfico em linhas, j que os dados se reportam a uma srie no tempo (srie tempo-ral). O grfico est ilustrado na figura 1.1.

    35

    30

    25

    20

    15

    10 5

    0 1996 1998 2000 2002 2004 2006 2008

    Assis

    tentes

    (em

    milh

    es)

    1,1 1,3 1,5 1,92,4 2,6 3,1

    7,4

    18,621,5

    29

    Anos

    Figura 1.1 Grfico em linha para os dados de assinantes de telefones celulares.

    C.4.C.2 Grfico (ou Diagrama) em Barras (ou CoCunas)

    Os diagramas em barras (ou colunas) so bastante utilizados quando trabalhamos com variveis qualitativas (dados categricos). No eixo hori-zontal especificamos os nomes das categorias e no eixo vertical construmos uma escala com a frequncia ou a frequncia relativa. As barras tero bases de mesma largura e alturas iguais frequncia ou frequncia relativa. O grfico em barras, quando as barras esto dispostas no sen-tido vertical, tambm chamado de grfico em colunas.

    Exemplo 1.4: Uma grande indstria de materiais de constru-o, com diversas lojas espalhadas pelo pas, fez um levantamento das principais causas de perda de ativos durante o ano de 2007 e as informaes esto dispostas na tabela seguinte.

    Quando construmos o grfico de barras para variveis

    qualitativas e as barras so arranjadas em ordem descendente de altura, a partir da esquerda para a direita, com o atributo que ocorre com maior frequncia apare-cendo em primeiro lugar, denominamos este grfico de barras de Diagrama de

    Pareto.

  • 19

    Introduo Estatstica: Anlise exploratria de dados Captulo 1

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Causas Valor perdido (milhes de reais)M administrao 5,2

    Roubos de funcionrios 3,9Fraudes nas vendas 5,5

    Assaltos s lojas 1,8Perda do estoque 1,6Atendimento ruim 0,8

    Tabela 1.5 Causas de perda de ativos durante o ano de 2007.

    Graficamente, podemos representar este conjunto de dados de trs formas diferentes: grfico em colunas, grfico em barras e o grfico em setores (ou pizza ou circular), que ser apresentado no prximo item.

    6

    4

    2

    0

    M ad

    minis

    tra

    o

    Roub

    os de

    func

    ionr

    ios

    Frau

    des n

    as ve

    ndas

    Assa

    ltos

    s loja

    s

    Perd

    a de e

    stoqu

    e

    Aten

    dimen

    to ru

    im

    Valor

    Per

    dido (

    milh

    es de

    reais

    )

    Figura 1.2a Grfico em colunas para a varivel Causas de perdas de ativos.

    Atendimento ruim

    Perda do estoque

    Assalto s lojas

    Fraudes nas vendas

    Roubos de funcionrios

    M administrao

    0 1 2 3 4 5 6

    Caus

    as

    Valor perdido (milhes de reais)

    Figura 1.2b Grfico em barras para a varivel Causas de perdas de ativos.

  • 20

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    C.4.C.3 Grfico (ou Diagrama) em Setores

    O diagrama em setores, tambm conhecido como grfico de pizza, um dos grficos mais utilizados para representar variveis qualitativas (ou categricas) e bastante apropriado quando se deseja visualizar a propor-o que cada categoria representa do total.

    Vamos utilizar os dados do Exemplo 1.4 para mostrar um grfico em setores.

    Valor Perdido (milhes de reais)

    Perda de estoque8%

    Assaltos s lojas10%

    Fraudes nas vendas29%

    Roubos deFuncionrios 21%

    Atendimento ruim

    M administrao

    Figura 1.3 Grfico em setores para a varivel Causas de perdas de ativos.

    Os grficos que sero apresentados a seguir so grficos construdos segundo uma distribuio de frequncias com intervalos de classes. So eles: o histograma, o polgono de frequncias e a ogiva.

    C.4.C.4 Histograma

    Um histograma semelhante ao diagrama de barras, porm refere-se a uma distribuio de frequncias para dados quantitativos contnuos. Por isso, apresenta uma diferena: no h espaos entre as barras. Os intervalos de classes so colocados no eixo horizontal en-quanto as frequncias so colocadas no eixo vertical. As frequncias podem ser absolutas ou relativas.

  • 21

    Introduo Estatstica: Anlise exploratria de dados Captulo 1

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Exemplo 1.5: A tabela a seguir apresenta o salrio de funcionrios de uma empresa no interior de Minas Gerais.

    Salrio (R$) Freq. Absoluta (f) Freq. Acumulada (fa)400,00 | 800,00 38 38

    800,00 | 1.200,00 18 561.200,00 | 1.600,00 12 681.600,00 | 2.000,00 8 762.000,00 | 2400,00 8 842.400,00 | 2.800,00 5 892.800,00 | 3.200,00 3 923.200,00 | 3.600,00 0 923.600,00 | 4.000,00 2 944.000,00 | 4.400,00 0 944.400,00 | 4.800,00 1 95

    Total 95

    Tabela 1.6 Distribuio de frequncias dos salrios dos funcionrios de uma empresa no interior de Minas Gerais.

    Como os dados da tabela 1.6 esto apresentados em intervalos de clas-ses podemos represent-los graficamente atravs de um histograma ou do polgono de frequncias, como mostram as figuras 1.4 e 1.5, respectivamente.

    40 35 30 25 20 15 10 5 0

    400,0

    0 |

    800,0

    0

    800,0

    0 |

    1200

    ,00

    1200

    ,00 |

    1600

    ,00

    1600

    ,00 |

    2000

    ,00

    2000

    ,00 |

    2400

    ,00

    2400

    ,00 |

    2800

    ,00

    2800

    ,00 |

    3200

    ,00

    3200

    ,00 |

    3600

    ,00

    3600

    ,00 |

    4000

    ,00

    4000

    ,00 |

    4400

    ,00

    4400

    ,00 |

    4800

    ,00

    Salrio (R$)

    Freq

    unc

    ia

    Figura 1.4 Histograma dos salrios dos funcionrios de uma empresa no interior de Minas Gerais.

  • 22

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    C.4.C.5 PoCCgono de Frequncias

    Podemos dizer que o polgono de frequncias um grfico de li-nha de uma distribuio de frequncias. No eixo horizontal so colocados os pontos mdios de cada intervalo de classe e no eixo vertical so colocadas as frequncias absolutas ou relativas (como no histograma). Para se obter as interseces do polgono com o eixo das abscissas, devemos encontrar o ponto mdio da classe ante-rior primeira e o ponto mdio da classe posterior ltima.

    O histograma e o polgono de fre-quncias so grficos alternativos e contm a mesma informao. Fica a critrio de quem est conduzindo o estudo a escolha de qual deles utilizar.

    Considerando os dados do exemplo 1.5, temos o polgono de fre-quncias representado pela figura 1.5.

    40

    35

    30

    25

    20

    15

    10

    5

    0

    38

    18

    12

    8 8

    53

    02

    0 01

    200 600 1000 1400 1800 2200 2600 3000 3400 3800 4200 4600 5000

    Ponto mdio das faixas salariais (R$)

    Freq

    unc

    ia

    Figura 1.5 Polgono de frequncias dos salrios dos funcionrios de uma empresa no interior de Minas Gerais.

    Conexo:

    Para se ter uma ideia da importncia da organizao dos

    dados em tabelas de frequncias e da construo do histograma, leia A

    Estatstica na Prtica em: ANDERSON, David R.; SWEENEY, Denis J.; WILLIA-MS, Thomas A. Estatstica aplicada administrao e economia. So Pau-

    lo: Pioneira Thomson Learning, 2003, pp. 37 e 38.

  • 23

    Introduo Estatstica: Anlise exploratria de dados Captulo 1

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Para finalizarmos o estudo de grficos, vamos apresentar um grfico denominado ogiva.

    C.4.C.6 Ogiva

    Uma ogiva um grfico para uma distribuio de frequncias acu-muladas. Utilizando o exemplo 1.5, a terceira coluna traz a frequncia acumulada dos dados e a ogiva fica representada pela figura 1.6.

    Para construir um grfico de ogiva, devemos usar o limite superior de cada in-tervalo no eixo horizontal e a frequncia acumulada no eixo vertical. A frequncia acumulada relacionada com o limite inferior da primeira classe sempre zero.

    1009080706050403020100

    400 800 1200 1600 2000 2400Salrio (R$)

    Freq

    unc

    ia Ac

    umula

    da

    2800 3200 3600 4000 4400 4800

    Figura 1.6 Ogiva dos salrios dos funcionrios de uma empresa no interior de Minas Gerais.

  • 24

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Atividades

    01. Classifique as variveis a seguir em quantitativas (discretas ou cont-nuas) ou qualitativas (nominal ou ordinal).a) Cor dos olhos.b) Nmero de peas produzidas por hora.c) Dimetro externo.d) Nmero de pontos em uma partida de futebol.e) Produo de algodo.f) Salrios dos executivos de uma empresa.g) Nmero de aes negociadas na bolsa de valores.h) Sexo dos filhos.i) Tamanho de pregos produzidos por uma mquina.j) Quantidade de gua consumida por uma famlia em um ms.k) Grau de escolaridade.l) Nvel social.m) Tipo sanguneo.n) Estado civil.

    02. A seguir temos as idades dos funcionrios de uma determinada em-presa. Fazer uma distribuio de frequncias, agrupando os dados em clas-ses. OBS.: A tabela de distribuio de frequncias deve ser completa com f, fr e fa.

    Idades (dados brutos)

    48 28 37 26 29 59 27 28 30 40 42 35 23 22 3121 51 19 27 28 36 25 40 36 49 28 26 27 41 29

    Baseado na tabela de frequncias construda, responda:a) Quantos so os funcionrios com idade inferior a 33 anos?b) Que porcentagem de funcionrios tem idade igual ou superior a 47 anos?c) Quantos so os funcionrios com idade maior ou igual a 26 anos e no tenham mais que 40 anos?d) Qual a porcentagem de funcionrios com idade abaixo de 40 anos?e) Qual a porcentagem de funcionrios que tm no mnimo 40 anos?

  • 25

    Introduo Estatstica: Anlise exploratria de dados Captulo 1

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    03. Uma agncia de turismo est interessada em saber o perfil dos seus clientes com relao varivel estado civil. Para isso, o gerente desta agn-cia pediu ao funcionrio do setor de vendas para fazer um grfico que resuma estas informaes. Construa o grfico e interprete-o.

    Estado civil Nmero de clientesSolteiro 2600Casado 900Vivo 345

    Separado 1200Outros 1020Total 6065

    04. Um consultor estava interessado em saber quanto, geralmente, cada pessoa gastava em um determinado supermercado no primeiro sbado aps receberem seus pagamentos (salrios). Para isso ele entrevistou 50 clientes que passaram pelos caixas entre 13h e 18h, e anotou os valores gastos por cada um deles. Estes valores esto listados a seguir:

    4,89 11,00 5,60 73,85 24,83 98,00 186,00 234,87 58,00 198,65223,86 341,42 94,76 445,76 82,80 35,00 455,00 371,00 398,60 234,0064,90 54,98 48,80 68,90 120,32 126,98 76,43 6,35 9,98 12,68

    243,00 18,65 134,90 11,10 321,09 290,76 74,00 48,80 74,52 138,6526,00 210,13 15,78 197,45 75,00 76,55 32,78 166,09 105,34 99,10

    Analisando o conjunto de dados, responda os seguintes itens:a) Qual a varivel em estudo? Classifique-a.b) Construa uma tabela de frequncias a partir do conjunto de dados brutos.c) Construa um histograma e um polgono de frequncias para a tabela construda no item b).

  • 26

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    05. Analise o grfico a seguir e responda:

    Salrio (R$)

    Freq

    unc

    ia

    504540353025

    17

    45

    500|

    800

    800|

    110

    0

    1100

    | 14

    00

    1400

    | 17

    00

    1700

    | 21

    00

    2100

    | 24

    00

    2400

    | 27

    00

    12

    4 3 3 2

    201510

    50

    a) Qual a varivel em estudo? Classifique-a.b) Quantos funcionrios ganham entre R$ 800,00 (inclusive) e R$ 1.100,00 (exclusive)?c) Qual o nmero de funcionrios total desta empresa?d) Qual a porcentagem de funcionrios que ganham R$ 1.700,00 ou mais?e) Qual a porcentagem de funcionrios que ganham entre R$ 500,00 (inclusive) e no mais que R$ 1.100,00?f) A partir do histograma, monte uma tabela de distribuio de frequncias.

    RefCexo

    Estamos encerrando nosso primeiro captulo. Vimos, aqui, alguns conceitos que sero fundamentais na compreenso do restante do conte-do de Estatstica. J deve ter dado para perceber que, mesmo estando no incio da disciplina, as aplicaes prticas que voc poder fazer na sua rea de atuao sero muitas. A compreenso e interpretao das mais variadas informaes, com as quais nos deparamos em nosso cotidiano, dependem, em parte, do conhecimento de certos elementos estatsticos.

    Estamos apenas no comeo. Muitas tcnicas (muito interessantes!) ainda sero abordadas. E lembre-se que o conhecimento e o domnio da Es-tatstica certamente levaro voc, futuro gestor, s decises mais acertadas.

  • 27

    Introduo Estatstica: Anlise exploratria de dados Captulo 1

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Leitura recomendadaRecomendamos a leitura do texto Como analisar de forma simples

    um grande nmero de dados?, disponvel no endereo http://www.klick.com.br/materia/20/display/0,5912,POR-20-91-931-,00.html que aborda de maneira clara alguns procedimentos que podem ser utilizados quando nos deparamos com situaes em que precisamos resumir as informaes de grandes conjuntos de dados.

    Referncias

    ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada administrao e economia. So Paulo: Pio-neira Thomson Learning, 2003.

    COSTA NETO, Pedro Luiz de Oliveira. Estatstica, So Paulo: Edgard Blucher, 2002.

    DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.

    FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo estatstica. Rio de Janeiro: LTC, 2003.

    MEMRIA, Jos M. P. Breve Histria da Estatstica. Disponvel em: . Aces-so em: 25 setembro 2014.

    TRIOLA, Mario F.. Introduo estatstica. Rio de Janeiro: LTC, 1999.

    VIEIRA, Sonia. Elementos de estatstica. So Paulo: Atlas, 2003.

    No prximo capCtuCo

    Se at agora vimos como organizar, resumir e apresentar os da-dos (informaes) em tabelas e grficos, no prximo captulo iremos incrementar esse processo atravs da insero das medidas de posio e disperso. So medidas que iro, de certa forma, representar o conjunto

  • 28

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    como um todo. Um exemplo bem conhecido de medida de posio (ou de tendncia central) a mdia e com relao medida de disperso pode-mos citar o desvio-padro. No so raras as situaes em que a mdia utilizada para representar a tendncia central dos dados e o desvio-padro para representar a variabilidade do conjunto de dados.

    Alm destas, veremos outras tambm importantes e com larga apli-cao no estudo dos dados.

  • Cap

    CtuCo

    2 Medidas de posio

    Nesse captulo, aprenderemos como caracterizar um conjunto de dados atra-

    vs de medidas numricas que sejam repre-sentativas de todo o conjunto.

    As medidas de posio, tambm chamadas de medidas de tendncia central, tm o objetivo de repre-

    sentar o ponto central de um conjunto de dados. As mais conhecidas so a mdia, a mediana e a moda. Alm dessas

    medidas, podemos citar outras medidas de posio importan-tes, que no necessariamente so centrais. So ela os quartis, os

    decis e os percentis. Vamos estudar cada uma dessas medidas de posio (estatsticas).

    Primeiramente, vamos fazer um estudo para os dados no tabulados, ou seja, quando os dados no estiverem na forma de distribuio de

    frequncia. Em seguida, as mesmas medidas sero calculadas com base em dados tabulados.

    Objetivos de sua aprendizagemPor meio do estudo deste captulo, esperamos que voc seja capaz de calcular e de interpretar as medidas de posio aplicadas a conjuntos de dados.

    Voc se lembra?Voc se lembra das situaes para as quais j calculou uma mdia? Que tipo de informao essa medida fornece? Para que serve? Para aplicar e interpretar medidas como ela, necessrio conhec-las bem. Vamos,

    ento, realizar um estudo detalhado da mdia e de outras medidas de mesma natureza.

  • 30

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    2.C MdiaA mdia aritmtica a mais comum e mais simples de ser calcula-

    da dentre todas as medidas de posio mencionadas. Para calcul-la, basta fazer a diviso da soma de todos os valores

    (x1, x2, ..., xn ) da varivel pelo nmero deles (n):

    x

    x

    n

    i

    i

    n

    = =

    1 (2.1)

    em que:x = a mdia aritmtica;xi = os valores da varivel;n = o nmero de valores.

    Outro tipo de mdia que podemos encontrar a mdia geomtrica. Ela muito utilizada no clculo da taxa mdia de retorno de investimentos.

    A mdia geomtrica entre nmeros reais x1 x2,,xn definida como sendo a raiz n-sima do produto dos n termos (ou, alternativamente) o pro-duto dos n termos elevado ao inverso do nmero de termos, ou seja:

    G x x x xn

    n= 1 2 3

    ...

    ou

    x x x x xn

    ni

    n

    in

    1 2 3

    1

    1

    1

    ( ) = ( )=...

    em que =in

    ix

    1 indica o produtrio de xi, para i variando de 1 a n.Em algumas circunstncias no faz sentido calcular a mdia geom-

    trica: Quando um dos valores do conjunto de dados for zero. Neste

    caso, o produto dos valores ser zero e, consequentemente, G = 0. Quando o produto dos valores for negativo e o nmero total de

    observaes for par. Neste caso, teramos que calcular uma raiz de ndice de par de um nmero negativo, o que impossvel no conjunto dos nmeros reais.

    A mdia geomtrica ser sempre menor ou igual a mdia aritmtica.

  • 31

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    A mediana a medida de posio mais frequentemente usada quando a varivel em estudo for renda (R$), pois algumas

    rendas extremamente elevadas podem infla-cionar a mdia. Neste caso, a mediana uma

    melhor medida de posio central.

    2.2 Mediana (Md)

    A mediana outra medida de posio, dita mais robusta que a m-dia, pois, da forma como ela determinada, no permite que alguns valores muito altos ou muito baixos interfiram de maneira significativa em seu valor. Desta forma, se o conjunto de dados apresentar alguns poucos valores discrepantes em relao maioria dos valores do conjunto de dados, em geral, aconselhvel usar a mediana em vez da mdia.

    A mediana encontrada or-denando os dados do menor para o maior valor e em seguida identificando o valor central destes dados ordenados. uma medida que divide o conjunto de dados ao meio, deixando a mesma quan-tidade de valores abaixo dela e acima.

    A determinao da mediana difere no caso do tamanho (n) do con-junto de dados ser par ou mpar. Vejamos a seguir.

    Se o nmero de elementos do conjunto de dados for mpar, ento a mediana ser exatamente o valor do meio, ou seja:

    Md xn

    = +

    1

    2

    (2.2)

    Se o nmero de elementos do conjunto de dados for par, ento a me-diana ser exatamente a mdia dos dois valores do meio, isto :

    Md

    x xn n

    =

    +

    +2 2

    1

    2

    (2.3)

    onde x xe

    xn n n

    2

    1

    2 21

    +

    +

    , indicam as posies onde os dados

    se encontram.

  • 32

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    2.3 Moda (Mo)

    A moda de um conjunto de dados o valor (ou valores) que ocorre com maior frequncia. A moda, diferentemente das outras medidas de posio, tambm pode ser encontrada quando a varivel em estudo for qualitativa. Existem conjuntos de dados em que nenhum valor aparece mais vezes que os outros. Neste caso, dizemos que o conjunto de dados no apresenta moda.

    Em outros casos, podem aparecer dois ou mais valores de maior frequncia no conjunto de dados. Nestes casos, dizemos que o conjunto de dados bimodal e multimodal, respectivamente.

    Por conta das definies diferentes, a mdia, a mediana e a moda fornecem, muitas vezes, informaes diferentes sobre o centro de um con-junto de dados, embora sejam todas medidas de tendncia central.

    No exemplo 2.1 apresentaremos os clculos das medidas de posio para dados no tabelados (dados brutos).

    Exemplo 2.1: Um gerente de banco quis estudar a movimentao de pessoas em sua agncia na segunda semana de determinado ms. Ele constatou que no primeiro dia entraram 1.348 pessoas, no segundo dia, 1.260 pessoas, no terceiro, 1.095, no quarto, 832 e no ltimo dia do levan-tamento, 850 pessoas. Encontre a mdia aritmtica, a mediana e a moda para este conjunto de dados e interprete os resultados.

    ResoluoA mdia aritmtica dada por:

    x

    x

    n

    i

    i

    n

    = = + + + + = ==

    11 348 1 260 1 095 832 850

    5

    5 385

    51 077

    . . . ..

    O nmero mdio de pessoas que entraram na agncia bancria na segunda semana do ms foi 1.077 pessoas. Isto quer dizer que, alguns dias entraram menos que 1.077 e outros dias entraram mais, ou seja, 1.077 um valor em torno do qual o nmero de pessoas que entraram na agncia, durante a segunda semana de cada ms, se concentra.

    Para encontrar a mediana, devemos, primeiramente, ordenar os da-dos em ordem crescente (pode ser decrescente tambm):

    832, 850, 1095, 1260, 1348

  • 33

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Como a quantidade de dados (n) um nmero mpar, a mediana exatamente o valor que se encontra no meio do conjunto de dados. Nesse caso, a mediana Md = 1095 pessoas. Isto significa que temos o mesmo nmero de observaes menores ou iguais ao valor da mediana e o mesmo nmero de observaes maiores ou iguais ao valor da mediana.

    Este conjunto de dados no possui moda, pois no existe nenhum valor que aparece com mais frequncia que os outros.

    Agora, vamos fazer um estudo para os dados tabulados, ou seja, quando os dados estiverem na forma de uma distribuio de frequncias.

    Quando os dados estiverem tabulados, ou seja, na forma de distri-buio de frequncias, a maneira de se calcular a mdia aritmtica muda um pouco. Como as frequncias so nmeros que indicam quantas vezes aparece determinado valor ou quantos valores tm em cada classe de fre-quncia, elas funcionaro como fatores de ponderao. Estas situaes sero apresentadas nos exemplos 2.2 e 2.3, respectivamente.

    Mdia AritmticaNo caso de dados tabulados, o clculo da mdia aritmtica dada por:

    x

    x f

    f

    i i

    i

    k

    i

    i

    k=

    =

    =

    1

    1

    (2.4)

    Onde:xi o valor da varivel (ou o ponto mdio de uma classe de frequn-

    cia).fi a frequncia referente a cada valor (ou classe).

    =i

    k

    1

    a soma dos valores das frequncias.

    A expresso (2.4) apresentada anteriormente tambm conhecida como frmula da mdia ponderada.

    No caso de distribuies de frequncias que no apresentam inter-valos de classes, a mediana e a moda so encontradas da maneira descrita nos itens 2.2 e 2.3, respectivamente.

  • 34

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Exemplo 2.2Em um determinado ms, foi computado o nmero x de faltas ao

    trabalho, por motivos de sade, que cada funcionrio de uma determinada empresa teve. Os dados esto apresentados na tabela abaixo:

    Nmero de Faltas f0 311 202 83 24 05 16 1

    Total 63

    Tabela 2.1: Nmero de faltas ao trabalho, por motivos de sade.

    ResoluoMdia Aritmtica

    x

    x f

    f

    i i

    i

    k

    i

    i

    k=

    =

    ( ) + ( ) + ( ) + ( ) + ( ) + ( ) +=

    =

    1

    1

    0 31 1 20 2 8 3 2 4 0 5 1 66 1

    63

    53

    630 84

    ( ) = ,

    ou seja, nesta empresa ocorreram, em mdia, 0,84 faltas por funcio-nrio, por motivo de sade.

    MedianaComo os dados esto tabelados, eles j se encontram ordenados.

    Para ficar mais fcil encontrar o valor da mediana, vamos incluir na distri-buio de frequncias uma coluna com as frequncias acumuladas.

    Nmero de Faltas f fa0 31 311 20 512 8 593 2 614 0 615 1 626 1 63

    Total 63

  • 35

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Agora, identificaremos a frequncia acumulada imediatamente su-perior metade do somatrio das frequncias simples:

    fi

    i

    k

    =

    = =12

    63

    23 15,

    A frequncia acumulada imediatamente superior a 31,5 fa = 51. Portanto, o valor da mediana o valor da varivel associado fa = 51, ou seja,

    Md = 1 falta

    Ento, pelo menos 50% das observaes so maiores ou iguais a 1 falta.

    No caso do valor fi

    i

    k

    =

    12

    ser exatamente igual a uma das frequncias

    acumuladas fa, o clculo da mediana ser a mdia aritmtica entre dois valores da

    varivel: xi e x(i+1).

    O valor da varivel xi ser aquele cujo f

    fai

    i

    k

    =

    =12

    e o valor da varivel xi+1 ser

    aquele que est imediatamente aps xi na distribuio de frequncia.

    ModaO valor que tem a maior frequncia para este

    conjunto de dados de x = 0, ou seja, mais frequente encontrar funcionrios que no faltam.

    No caso do Exemplo 2.3 veremos que os dados esto agrupados em interva-los de classes. Quando o conjunto de da-dos for apresentado sob a forma agrupada perdemos a informao dos valores das

    As medidas re-sumo calculadas quando

    os dados estiverem agrupados em intervalos de classes so

    apenas aproximaes dos verda-deiros valores, pois substitumos os valores das observaes pelo

    ponto do mdio do intervalo de classe.

  • 36

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    observaes. Neste caso, vamos supor que todos os valores dentro de uma classe tenham seus valores iguais ao ponto mdio desta classe.

    Os clculos da mdia, da moda e da mediana para tabelas de frequ-ncias agrupadas em classes esto apresentados a seguir.

    Vale ressaltar que, sempre que possvel, as medidas de posio e disperso devem ser calculadas antes dos dados serem agrupados.

    Exemplo 2.3A tabela abaixo apresenta a distribuio de frequncias do tempo

    de vida de 60 componentes eletrnicos (medido em dias) submetidos experimentao num laboratrio especializado. Calcular as medidas de posio.

    Tempo de vida (dias) f Ponto Mdio (xi) 318 3 10,51833 4 25,5

    Tempo de vida (dias) f Ponto Mdio (xi)3348 4 40,54863 8 55,56378 10 70,57893 28 85,5

    93108 2 100,5108123 1 115,5

    Total 60

    Tabela 2.2: Tempo de vida de componentes eletrnicos.

    ResoluoNeste tipo de tabela, como temos classes de frequncias, devemos

    encontrar um valor que represente cada classe, para que possamos efetuar os clculos. Por exemplo, considerando a primeira classe de frequncia,

    Tempo de vida (dias) f Ponto Mdio (xi)318 3 10,5

    sabemos que 3 componentes eletrnicos tiveram tempo de vida entre 3 e 18 dias, porm, no sabemos exatamente qual foi o tempo de vida de cada um. Se considerarmos o limite inferior da classe (3) para efetuarmos os clculos, estaremos subestimando as estimativas. Por outro lado, se con-

  • 37

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    siderarmos o limite superior da classe (18) estaremos superestimando as estimativas. Portanto, vamos utilizar o ponto mdio de cada classe para podermos fazer os clculos sem grandes prejuzos. A terceira coluna da tabela apresentada contm os pontos mdios calculados para cada inter-valo de classe. O valor do ponto mdio passa a ser o nosso valor xi a ser utilizado nos clculos. Vamos aprender como se faz:

    Mdia Aritmtica

    x

    x f

    f

    i i

    i

    k

    i

    i

    k=

    =

    =( ) + ( ) + ( ) + ( ) +

    =

    =

    1

    1

    10 5 3 25 5 4 40 5 4 55 5 8 7, , , , 00 5 10 85 5 28 100 5 2 115 5 1

    60

    4155

    6069 25

    , , , ,

    ,

    ( ) + ( ) + ( ) + ( )

    = =

    Podemos dizer, atravs da mdia aritmtica, que os componentes eletrnicos tm uma durao mdia de 69 dias e 6 horas (69,25 dias).

    MedianaComo os dados esto tabelados em classes de frequncias, o clculo

    da mediana fica um pouquinho mais complicado. Agora, teremos que en-contrar a mediana atravs da seguinte frmula:

    Md lA

    FFmd

    md

    md

    md= +

    inf

    fi2

    1 (2.5)

    onde:linfmd o limite inferior da classe que contm a mediana;

    fi o nmero total de observaes da distribuio de frequn-cias;Fmd1 a frequncia acumulada da classe anterior classe que contm a mediana;fmd o nmero de observaes da classe que contm a mediana;Amd a amplitude do intervalo de classe que contm a mediana.

    No clculo da mediana para os dados da tabela 2.2 temos que pri-meiramente encontrar a classe que contm a mediana. Esta classe corres-

  • 38

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    ponde classe associada frequncia acumulada imediatamente superior

    fi2

    .

    Como fi = =2

    60

    230 , temos que a classe que contm a mediana

    de 7893 (pois fa = 57).

    3|18 3 10,5 318|33 4 21,5 733|48 4 40,5 1148|63

    Classe quecontm amediana

    Tempode vida

    P Mx1

    f fa

    fa da classeanterior classeque contm a

    Md

    N de observaesda classe que

    contm a mediana

    8 55,5 1963|78 10 70,5 2978|93 28 85,5 5793|108 2 10,5 59108|123 3 115,5 60

    Total 60

    if

    Alm disso, temos:

    fi = nmero total de observaes da distribuio de frequn-

    cias. Portanto, fi = 60 .Fmd1 = frequncia acumulada da classe anterior classe que con-tm a mediana. Portanto, Fmd1 = 29.fmd = nmero de observaes da classe que contm a mediana. Portanto, fmd = 28.Amd = amplitude do intervalo da classe que contm a mediana. Portanto, Amd = 93 78=15.

  • 39

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Agora, basta substituirmos todos os valores encontrados na frmula 2.5 para encontrarmos o valor da mediana:

    Md = +

    = + ( ) = + 78

    15

    28

    60

    229 78

    15

    2830 29 78 0 54 78 5, ,

    Atravs da mediana podemos dizer que pelo menos 50% dos com-ponentes eletrnicos avaliados tm durao igual ou inferior a 78 dias e 12 horas.

    ModaNo clculo da moda para dados agrupados devemos primeira-

    mente identificar a classe modal, ou seja, a classe que apresenta a maior frequncia.

    Aps a identificao da classe modal, utilizaremos a seguinte fr-mula para calcular a moda bruta:

    Ml L

    o =+2

    (2.6)

    onde:l:limite inferior da classe modalL:limite superior da classe modal

    Conexo:Sugerimos os vdeos: Novo Telecurso E. Fundamental Matemtica Aula 34 (parte 1) e Novo Telecurso E. Fundamental Matemtica Aula 34 (parte 2) disponveis, respectivamente em http://www.youtube.com/watch?v=SyWbYOtAIYc&NR=1 e http://www.youtube.com/watch?v=ejMyWfuSO5k que apresenta de modo bem prtico a utilizao das medidas de posio.

    Agora, vamos comentar sobre outras medidas de posio, menos utilizadas, porm importantes em algumas situaes. So elas: quartis, decis e percentis.

  • 40

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Perceba que o 2 quartil, o 5 decil e o 50 percentil representam a prpria media-

    na, ou seja, todas estas medidas separatrizes (Q2, D5, e P50), dividem a distribuio dos da-dos ao meio, deixando 50% dos dados abaixo

    delas e 50% acima.

    2.4 Medidas Separatrizes: Quartis, Decis e Percentis

    Os quartis, decis e percentis so muito similares mediana, uma vez que tambm subdividem a distribuio de dados de acordo com a propor-o das frequncias observadas.

    J vimos que a mediana divide a distribuio em duas partes iguais, ento, os quartis (Q1, Q2 e Q3), como o prprio nome sugere, di-vide a distribuio dos dados or-denados em quatro partes, sendo, Q1 o quartil que separa os 25% valores inferiores dos 75% supe-riores, Q2 o que divide o conjunto ao meio ( igual mediana) e Q3 o que separa os 75% valores inferiores dos 25% superiores. No h um consenso universal sobre um procedimento nico para o clculo dos quartis, e diferentes programas de computador muitas vezes produzem resultados diferentes.

    Os decis, por sua vez, dividem a distribuio dos dados em 10 par-tes (Di, i = 1, 2, ..., 9) e os percentis dividem a distribuio em 100 partes (Pi, i = 1, 2, ..., 99)

    As medidas separatrizes, geralmente, s so calculadas para grandes quantidades de dados.

    No Excel, por exemplo, temos a opo de pedir o clculo de tais medidas.

    Com os clculos dos quartis, jun-tamente com os valores mnimo e m-ximo do conjunto de dados, podemos construir um grfico chamado desenho esquemtico ou boxplot. A anlise deste grfico bastante til no sentido de infor-mar, entre outras coisas, a variabilidade e a simetria dos dados.

    Conexo:

    Para se entender quais so os procedimentos utilizados na

    construo de um boxplot, bem como sua interpretao, leia o texto: Diagra-ma de Caixa (Boxplots) em: TRIOLA,

    Mario F.. Introduo estatstica. 10.ed.Rio de Janeiro: LTC, 2008, pp.98 a 102

  • 41

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    2.4.C CCcuCo dos quartis e dos percentis para dados no agrupados em cCasses

    Como os quartis so medidas separatrizes precisamos, primeira-mente, ordenar o conjunto de dados.

    O primeiro quartil (Q1) ser o valor da varivel que ocupar a po-

    sio n4

    . O segundo quartil (Q2) ser o valor da varivel que ocupar a

    posio 24

    n e o terceiro quartil (Q3) ser o valor da varivel que ocupar

    a posio 34

    n . Quando fazemos estas divises para encontrar as posies

    dos quartis, pode acontecer do resultado ser um nmero inteiro ou um n-

    mero fracionrio. Ento, adotaremos a seguinte conveno:

    Se a diviso resultar num nmero fracionrio, arredonde-o para cima e o valor do quartil ser a resposta da varivel encontrada nesta posio.

    Se a diviso for um nmero inteiro, o quartil ser a mdia arit-mtica da resposta da varivel que ocupar a posio encontrada com a resposta da varivel que ocupar a posio seguinte.

    Exemplo 2.4Um escritrio que presta consultoria em administrao levantou

    os tempos de espera de pacientes que chegam a uma clnica de ortopedia para atendimento de emergncia. Foram coletados os seguintes tempos, em minutos, durante uma semana. Encontre os quartis.

    2 5 10 11 3 14 8 8 7 12 3 4 7 3 4 2 6 7

    Resoluo:Para encontrarmos os quartis, precisamos ordenar o conjunto de

    dados. Ento:2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14

  • 42

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Posio do primeiro quartil (Q1): n

    4

    18

    44 5= = ,

    Como a diviso resultou em um valor fracionrio, vamos arredondar para 5. Portanto, o primeiro quartil o valor que est na quinta posio.

    Q1 = 3

    Ento, pelo menos 25% das observaes so menores ou iguais a 3 minutos.

    Posio do segundo quartil (Q2 ):2

    4

    2 18

    49

    x n x= =

    Como a diviso resultou em um valor inteiro, o segundo quartil ser o resultado da mdia aritmtica entre o valor que est na nona posio e o valor que est na dcima posio.

    Q2

    6 7

    26 5=

    += ,

    Temos que pelo menos 50% das observaes so maiores ou iguais a 6,5 minutos.

    Posio do terceiro quartil (Q3 ): 3

    4

    3 18

    413 5

    x n x= = ,

    Como a diviso resultou em um valor fracionrio, vamos arredondar para 14. Portanto, o terceiro quartil o valor que est na dcima quarta posio.

    Q3 = 8

    Neste conjunto de dados, pelo menos 25% das observaes so maiores ou iguais a 8 minutos.

    Agora que j aprendemos a calcular e interpretar os quartis para da-dos no agrupados, vamos passar para o conceito de percentis.

  • 43

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Da mesma forma que nos quartis, o conjunto de dados deve estar ordenado.

    Quando dividimos o conjunto de dados em 100 partes, obtemos 99 percentis.

    O percentil pk ser a resposta da varivel que ocupar a posio

    k x n( )100

    Adotaremos a seguinte conveno: Se a diviso resultar num nmero fracionrio, arredonde-o para

    cima e o valor do percentil ser a resposta da varivel encontra-da nesta posio.

    Se a diviso for um nmero inteiro, o percentil ser a mdia aritmtica da resposta da varivel que ocupar a posio encon-trada com a resposta da varivel que ocupar a posio seguinte.

    Exemplo 2.5 Vamos encontrar o trigsimo quinto percentil do conjunto de dados

    do exemplo 2.4.2 2 3 3 3 4 4 5 6 7 7 7 8 8 10 11 12 14

    ResoluoO percentil p35 ser a resposta da varivel que ocupar a posio

    35 18

    1006 3

    x( )= , .

    Como a diviso resultou em um valor fracionrio, vamos arredondar para 7. Portanto, o trigsimo quinto percentil o valor que est na stima posio.

    P35 = 4

    Ento, aproximadamente 35% das observaes so menores ou iguais a 4 minutos.

  • 44

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    2.4.2 CCcuCo dos quartis e dos percentis para dados agrupados em cCasses

    Para calcular os quartis quando os dados esto organizados em in-tervalos de classes, utilizaremos o mesmo procedimento descrito para o clculo da mediana (Q2) para dados agrupados em classes.

    Para o clculo do Q1 utilizamos a seguinte frmula:

    Q lA

    fFq

    q

    q

    q1

    1

    1

    1 11 4= +

    inf

    fi (2.7)

    onde:linfq1 o limite inferior da classe que contm o primeiro quartil;

    fi o nmero total de observaes da distribuio de fre-quncias;Fq11 a frequncia acumulada da classe anterior classe que contm o primeiro quartil;fq1 o nmero de observaes da classe que contm o primeiro quartil;Aq1 a amplitude do intervalo de classe que contm o primeiro quartil.

    De maneira semelhante, o clculo do Q3 ser feito utilizando a se-guinte frmula:

    Q lA

    f

    xFq

    q

    q

    q3 13

    3

    3

    3

    3

    4= +

    inf

    fi (2.8)

    onde:linfq3 o limite inferior da classe que contm o terceiro quartil;

    fi o nmero total de observaes da distribuio de fre-quncias;Fq31 a frequncia acumulada da classe anterior classe que contm o terceiro quartil;fq3 o nmero de observaes da classe que contm o terceiro quartil;Aq3 a amplitude do intervalo de classe que contm o terceiro quartil.

  • 45

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Exemplo 2.6Vamos utilizar os dados do exemplo 2.3 para encontrar o primeiro e

    o terceiro quartil.

    Tempode vida f

    P Mxi

    fa 318 3 10,5 31833 4 25,5 73348 4 40,5 114863 8 55,5 196378 10 70,5 297893 28 85,5 57

    93108 2 100,5 59108123 1 115,5 60

    Total 60

    Resoluo

    Primeiramente, temos que encontrar a classe que contm o primeiro

    quartil. Esta classe corresponde classe associada frequncia acumula-

    da imediatamente superior fi4

    .

    Como fi =4

    60

    4

    , temos que a classe que contm o primeiro quartil

    de 4863 (pois fa = 19).

    Alm disso, temos:fi = nmero total de observaes da distribuio de frequn-

    cias. Portanto, fi =60.Fq1 = frequncia acumulada da classe anterior classe que con-tm o primeiro quartil. Portanto, fq1 = 11.fq1 = nmero de observaes da classe que contm o primeiro quartil. Portanto, fq1 = 8.Aq1 = amplitude do intervalo da classe que contm o primeiro quartil. Portanto, Aq1 = 63 48 = 15.

  • 46

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Agora, basta substituirmos todos os valores encontrados na frmula 2.7 e encontrar o valor do primeiro quartil:

    Q1

    4815

    8

    60

    411 48

    15

    815 11 18 7 5 55 5= +

    = + ( ) = + =, ,

    De acordo com o resultado obtido podemos esperar que aproxima-damente 25% dos dados so menores ou iguais a 55,5, ou seja, aproxima-damente 25% dos componentes eletrnicos tm durao inferior a 55 dias e 12 horas.

    Agora, vamos encontrar a classe que contm o terceiro quartil. Esta

    classe corresponde classe associada frequncia acumulada imediata-

    mente superior 34

    x fi .

    Como 34

    3 60

    4

    x xfi = , temos que a classe que contm o tercei-

    ro quartil de 7893 (pois f_a=57).

    Alm disso, temos: fi = nmero total de observaes da distribuio de frequn-

    cias. Portanto, fi = 60.Fq3= frequncia acumulada da classe anterior classe que con-tm o terceiro quartil. Portanto, Fq3 = 29.fq3= nmero de observaes da classe que contm o terceiro quartil. Portanto, fq3 = 28.Aq3 = amplitude do intervalo da classe que contm o terceiro quartil. Portanto, Aq3 = 93 78 = 15.

    Agora, basta substituirmos todos os valores encontrados na frmula 2.8 e encontrar o valor do terceiro quartil:

    Qx

    378

    15

    28

    3 60

    429 78

    15

    2845 29 78 8 57 86 57= +

    = + ( ) = + , ,

  • 47

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    De acordo com o resultado obtido podemos esperar que aproxima-damente 75% dos dados so menores ou iguais a 86,57, ou seja, aproxi-madamente 75% dos componentes eletrnicos tm durao inferior a 86 dias e 14 horas.

    Agora, vamos passar para o clculo dos percentis.No caso dos dados estarem organizados em intervalos de classes, os

    percentis so calculados utilizando a seguinte frmula:

    P lA

    f

    k xFk

    pk

    pk

    pkpk= +

    inf

    fi100

    1

    (2.9)

    em que k = 1,2,,99.

    O procedimento para encontrar as quantidades que devem ser substitu-das na frmula 2.9 so os mesmos que utilizamos para encontrar os quartis.

    Exemplo 2.7Vamos utilizar os dados do exemplo 2.3 para encontrar o dcimo

    quinto percentil.

    Tempode vida f

    P Mxi

    fa 318 3 10,5 31833 4 25,5 73348 4 40,5 114863 8 55,5 196378 10 70,5 297893 28 85,5 57

    93108 2 100,5 59108123 1 115,5 60

    Total 60

  • 48

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Primeiramente, temos que encontrar a classe que contm o dcimo quinto percentil. Esta classe corresponde classe associada frequncia

    acumulada imediatamente superior 15100

    x fi .

    Como 15100

    15 60

    1009

    x xfi = = , temos que a classe que contm o

    dcimo quinto percentil de 3348 (pois fa = 11).Alm disso, temos:

    fi = nmero total de observaes da distribuio de frequn-

    cias. Portanto, fi = 60.Fp15 = frequncia acumulada da classe anterior classe que con-tm o dcimo quinto percentil. Portanto, Fp15 = 7.fp15 = nmero de observaes da classe que contm o dcimo quinto percentil. Portanto,fp15 = 4.Ap15= amplitude do intervalo da classe que contm o dcimo quinto percentil. Portanto, Ap15 = 48 33=15.

    Agora, basta substituirmos todos os valores encontrados na frmula 2.9 e encontrar o valor do dcimo quinto percentil:

    Px

    1533

    15

    4

    15 60

    1007 33

    15

    49 7 33 7 5 40 5= +

    = + ( ) = + =, ,

    De acordo com o resultado obtido podemos esperar que aproxima-damente 15% dos dados so menores ou iguais a 40,5, ou seja, aproxima-damente 15% dos componentes eletrnicos tm durao inferior a 40 dias e 12 horas.

    Conexo:Agora que j abordamos como se calcula os quartis e percentis, faa uma leitu-ra do texto: Decis (Dk) em TIBONI, Conceio G.R. Estatstica bsica - para os cursos de Administrao, Cincias Contbeis, Tecnolgicos e de Gesto. So Paulo: Atlas, 2010.

  • 49

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Atividades

    01. Os dados abaixo referem-se ao nmero de horas extras de trabalho de uma amostra de 64 funcionrios de uma determinada empresa localizada na capital paulista.

    10 10 12 14 14 14 15 16

    18 18 18 18 18 19 20 20

    20 20 20 21 22 22 22 22

    22 22 22 22 22 22 22 22

    23 23 24 24 24 24 24 24

    24 25 25 25 25 26 26 26

    26 26 26 27 27 27 28 28

    29 30 30 32 35 36 40 41

    Pede-se:a) Calcule e interprete as seguintes medidas descritivas calculadas para os dados brutos (dados no tabulados): mdia aritmtica; mediana; moda.b) Construir uma distribuio de frequncias completa (com freq. abso-luta, freq. relativa, freq. acumulada e ponto mdio).c) Com a tabela construda no item b), encontre as seguintes medidas: mdia aritmtica; mediana; moda; 1 quartil; 7 decil; 99 percentil. Inter-prete os resultados.d) Construa o histograma para este conjunto de dados.

  • 50

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    02. Os dados abaixo representam as vendas mensais (em milhes de re-ais) de vendedores de gnero alimentcios de uma determinada empresa.

    Vendas mensais (em milhes de reais) Nmero de vendedores

    0 1 6

    1 2 12

    2 3 20

    3 4 48

    4 5 14

    5 6 10

    Total 110

    a) Qual a varivel em estudo? Que tipo de varivel esta?b) Encontre a mdia, a mediana e a moda e interprete os resultados.c) Encontre as medidas separatrizes Q3, D1, e P80 e interprete os resul-tados.d) Qual a porcentagem de vendedores com vendas mensais inferiores a 2 milhes de reais?e) Qual a porcentagem de vendedores com vendas mensais superiores a 4 milhes de reais?f) Qual a porcentagem de vendedores com vendas mensais entre 3 (in-clusive) e 5 (exclusive) milhes de reais?g) Qual a porcentagem de vendedores que vendem, pelo menos, 3 mi-lhes de reais mensais?

    03. Numa pesquisa realizada com 91 famlias, levantaram-se as seguintes informaes com relao ao nmero de filhos por famlia:

    nmero de filhos 0 1 2 3 4 5frequncia de famlias 19 22 28 16 2 4

    Calcule e interprete os resultados da:a) mdia aritmticab) medianac) moda

  • 51

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    04. O histograma abaixo representa a distribuio das idades dos fun-cionrios de uma agncia bancria. Com base no histograma abaixo, responda:

    Histograma

    Idade

    161514131211109876543210

    20 | 25 25 | 30 30 | 35 35 | 40 40 | 45 45| 50

    Freq

    unc

    ia

    a) Qual a varivel em estudo? b) Quantos funcionrios trabalham nesta agncia bancria?c) Quais so a mdia, a mediana e a moda para a idade dos funcionrios desta agncia? Interprete os resultados.d) Qual o valor do primeiro quartil? Interprete o resultado.e) Quantos funcionrios tm menos que 30 anos?f) Qual a porcentagem de funcionrios com mais de 45 anos?g) Qual a porcentagem de funcionrios com no mnimo 30 anos?

    05. Define-se a mdia aritmtica de n nmeros dados como o resultado da diviso por n da soma dos n nmeros dados. Sabe-se que 4,2 a mdia aritmtica de 2.7; 3.6; 6.2; e x. Determine o valor de x.

  • 52

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    RefCexoQue a mdia a medida de posio mais utilizada em nosso dia a

    dia talvez nem seria necessrio dizer. Mas preciso tomar certo cuidado quando utilizamos a mdia como parmetro de um conjunto de dados. Voc sabe que, se a mdia de sua turma em Estatstica for igual a 7,0 (por exemplo), no quer dizer que toda ela, ou a maioria, teve bom desempe-nho nem que metade da turma teve desempenho igual ou superior a 7,0. Outras medidas, como vimos, podem complementar as informaes dadas pela mdia.

    Leitura recomendadaComo a mdia uma medida descritiva muito utilizada no dia a dia,

    sugerimos que voc oua o udio Mdias que interessam, da Srie: Pro-blemas e Solues. H dois mdulos cujos contedos alertam par ao cui-dado que se deve ter na interpretao da mdia, mostram uma aplicao da mdia ponderada e fazem uma anlise crtica da utilizao da mdia como uma informao nica. O endereo para acesso : http://m3.ime.unicamp.br/recursos/1315.

    Referncias

    ANDERSON, David R.; SWEENEY, Denis J.; WILLIAMS, Thomas A. Estatstica aplicada administrao e economia. So Paulo: Pio-neira Thomson Learning, 2003.

    BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatstica bsica. So Paulo: Saraiva, 2003.

    COSTA NETO, Pedro Luiz de Oliveira. Estatstica. So Paulo: Edgard Blucher, 2002.

    DOWNING, Douglas; CLARK, Jeffrey. Estatstica aplicada. So Paulo: Saraiva, 2002.

    FARIAS, Alfredo Alves de; SOARES, Jos Francisco; CSAR, Cibele Comini. Introduo estatstica. Rio de Janeiro: LTC, 2003.

  • 53

    Medidas de posio Captulo 2

    EAD

    -15-

    Prob

    abili

    dade

    e E

    stat

    stic

    a

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    TIBONI, Conceio G. Rebelo. Estatstica Bsica - para os cursos de Administrao, Cincias Contbeis, Tecnolgicos e de Gesto. So Paulo: Atlas, 2010.

    No prximo capCtuCoAt agora estudamos estatsticas importantes de um conjunto de

    dados, tais como mdia, moda, mediana e medidas separatrizes. Estas medidas nos do noo de posio central ou divisria do conjunto. No entanto, para que tenhamos informao mais completa do conjunto, necessrio estudar a sua variabilidade. As estatsticas que tm essa funo so denominadas medidas de variabilidade ou de disperso e sero abor-dadas no prximo captulo.

  • 54

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    Minhas anotaes:

  • Cap

    CtuCo

    3 Medidas de disperso

    Estas medidas servem para indicar o quanto os dados se apresentam disper-

    sos em torno da regio central. Fornecem, portanto, o grau de variao existente no con-

    junto de dados. Dois ou mais conjuntos de dados podem, por exemplo, ter a mesma mdia, porm os

    valores podero estar muito mais dispersos num con-junto do que no outro. Ou seja, podem ter maior ou menor

    grau de homogeneidade.

    Objetivos de sua aprendizagemPor meio do estudo deste captulo, esperamos que voc seja capaz

    de calcular e interpretar as medidas de disperso aplicadas a conjun-tos de dados, com o objetivo de avaliar o grau de homogeneidade.

    Voc se lembra?Voc se lembra de alguma vez em que saiu de casa tendo quase certeza de que ficaria preso em um engarrafamento no trnsito? No preciso ser muito observador para perceber que, em determinadas horas do dia, dependendo do dia da semana, o trnsito (nas grandes e nas mdias ci-dades) estar congestionado. Talvez o melhor seria deixar para sair outra hora (se isto for possvel). O fluxo de veculos, nesses momentos, apre-senta certa homogeneidade, ou seja, quase sempre est intenso. Dificil-mente, num dia como esses, voc ter um fluxo acentuadamente menor (ou maior) do que o que voc verifica todos os dias. Vamos estudar situaes como essas, em que a informao sobre o grau de homoge-

    neidade (ou heterogeneidade) nos ajudar a tomar a deciso mais adequada.

  • 56

    Probabilidade e Estatstica

    Proi

    bida

    a r

    epro

    du

    o

    U

    niSEB

    As medidas de disperso indicam o grau de variabilidade das observaes. Estas

    medidas possibilitam que faamos distino entre conjuntos de observaes quanto sua homogeneidade. Quanto menor as medidas de disperso, mais homogneo o conjunto

    de dados.

    3.C ExempCo IntrodutrioVamos analisar um exemplo bem simples que nos d a ideia da im-

    portncia de se conhecer as medidas de disperso para a tomada de algu-mas decises.

    Exemplo 3.1: Imagine que estamos interessados em fazer uma via-gem para Honolulu (Hava) ou Houston (Texas) e para arrumar as malas necessitamos saber se a localidade a ser visitada faz calor, faz frio ou ambos. Se tivssemos apenas a informao de que a temperatura mdia di-ria (medida durante um ano) das duas localizaes fosse igual a 25 C, poderamos colocar na mala apenas roupas de vero? A resposta no. Por exemplo, se estivssemos interessados em viajar para o Hava (em Honolulu), podera-mos levar apenas roupas de vero, pois a temperatura mnima observada durante um ano foi de 21 C e a mxima foi de 29 C. Porm, se resolvermos ir ao Texas (Houston), devemos tomar cuidado com a poca, pois as temperaturas, durante um ano, variaram de 4 C (mnima) a 38 C (mxima). Com estas informaes, conclumos que as temperaturas em Ho-nolulu variam pouco em torno da mdia diria, ou seja, podemos levar uma mala apenas com roupas leves. Porm, em Houston, as temperaturas variam muito, com perodos de muito frio ou muito calor. Portanto, para ir Houston sem perigo de sofrer com a temperatura, devemos analisar o perodo do ano para saber se a temperatura estar alta ou baixa.

    Percebemos, atravs desse exemplo bem simples, que uma simples medida