Estatística Descritiva

Embed Size (px)

Citation preview

  • SILVIO [email protected](14) 3533-3272/9124-4812Estatstica Aplicada Administrao

  • EmentaConceitos preliminares: Estatstica; Populao; Amostra. Estatstica indutiva e dedutiva. Tabelas e grficos. Distribuio de freqncia. Estatstica Aplicada qualidade. Dimenses da Qualidade; GQT e custo da qualidade. Planejamento e Controle de Projetos. Just in Time; Kanban; Brainstorm; Ishikawa; Benchmarking; PDCA; Kaisen e 5W1H.

    ObjetivoProporcionar ao discente esmerar-se na aplicabilidade de ferramentas estatsticas essenciais fundamentao de projetos, com vistas a melhor viabilizar o processo decisrio nas organizaes.

    **

  • Metodologia

    Mostrar inicialmente aos alunos os objetivos da disciplina, o contedo programtico, cretrios de avaliao e a forma como as atividades sero conduzidas. Como suporte as aulas expositivas, sero utilizados material impresso, lousa e recursos multimedia. Sero desenvolvidas atividades de estudo de caso para avalio continuada e reteno dos conceitos apresentados. No final de cada mdulo ser feita um resumo dos conceitos para fixao de conhecimento, entendimento prtico do contedo e preparao para as provas regimentais. Sero incentivadas apresentaes de uso profissional das ferramentas desenvolvidas para aprendizado prtico.**

  • Contedo ProgramticoEstatstica DescritivaDados BrutosRolAmplitude TotalClassesFrequnciasApresentao de Dados e Grficos EstatsticosHistograma e Polgonos de frequnciaCurvas de frequnciaDistribuio de frequncias cumulativasGrfico de pontosGrficos de ParetoGrficos de Barras e LinhasGrficos CorridosGrficos de Pizza**

  • Contedo ProgramticoEstatstica Aplicada qualidadeDimenses da QualidadeGerenciamento da Qualidade Total (GQT)Custos da QualidadePlanejamento e Controle de ProjetosConceituaoElementos de um projetoProcesso de Planejamento Controle de projetoAplicaes Estatstica Tomada de DecisoJust in TimeKanbanBrainstormIshikawaBenchmarkingPDCAKainsen5W1H

    **

  • Critrios de Avaliao

    Nota final: Trabalho (0 a 3) + Prova (0 a 7)

    Bibliografia

    MONTGOMERY, D. C. Introduo ao Controle Estatstico da Qualidade. Rio de Janeiro: Editora LTC (Livros Tcnicos e Cientficos), 2004.KAZMIER, L. J. Estatstica Aplicada Administrao e Economia. Porto Alegre: Editora Bookman, 2007.TAVARES, M. Estatstica Aplicada Administrao. Sistema Universidade Aberta do Brasil, 2007.

    **

  • Trabalho 1 Bimestre

    Elaborar trabalho sobre 3 tipos de Grficos Estatsticos dos elencados abaixo: Histograma e Polgonos de frequnciaCurvas de frequnciaDistribuio de frequncias cumulativasGrfico de pontosGrficos de ParetoGrficos de Barras e LinhasGrficos CorridosGrficos de PizzaTrabalho terico (Word ou PDF) e apresentao Prtica (Power Point)

    **

  • ARTIGO O PAPEL DA ESTATSTICA NA LEITURA DO MUNDO: O LETRAMENTO ESTATSTICO.

    **

  • **

  • **

  • **

  • **

  • Estatstica DescritivaA estatstica descritiva preocupa-se com a forma pela qual podemos apresentar um conjunto de dados em tabelas e grficos, e tambm resumir as informaes contidas nestes dados mediante a utilizao de medidas estatsticas. necessrio ter em mente que a estatstica uma ferramenta para o gestor ou executivo, nas respostas dos porqus de seus problemas que podem ser explicados por uma anlise de dados. Para ela ser bem usada, necessrio conhecer os seus fundamentos e princpios, e acima de tudo que o gestor ou executivo desenvolva um esprito crtico e jamais deixe de pensar. Pois fcil mentir usando a estatstica, o difcil falar a verdade sem usar a estatstica.Atualmente, as empresas tm procurado profissionais como executivos que tenham um nvel de conhecimento de estatstica alto, pois este conhecimento tem feito uma diferena grande nos processos decisrios em empresas.**

  • Objetivo

    Esta Unidade tem por objetivo fazer com que voc tenha condies de descrever e apresentar os resultados de um conjunto de observaes de forma clara, objetiva e passando o mximo de informaes possveis. Para tal objetivo, sero abordadas as distribuies de freqncias, anlises grficas, medidas de posio e disperso.**

  • Qualquer conjunto de dados, tais como o tempo de uma ligao telefnica, a velocidade de processamento de um computador, a proporo de participao no mercado das empresas de um determinado setor, suscetibilidade de empresas a uma determinada mudana no mercado, opinio dos alunos quanto didtica de um professor, etc., contm informao sobre algum grupo de indivduos. As possveis diferenas entre indivduos determinam a variao que est sempre presente na anlise de dados.

    Uma caracterstica que pode assumir diferentes valores de indivduo para indivduo denominada varivel, pois de outra forma seria denominada constante.**

  • Tipos de variveisVarivel a caracterstica de interesse que medida em cada elemento da amostra ou populao. Como o nome diz, seus valores variam de elemento para elemento. As variveis podem ter valores numricos ou no numricos. Variveis podem ser classificadas da seguinte forma:

    Variveis QuantitativasVariveis discretasVariveis contnuas

    Variveis Qualitativas Variveis nominaisVariveis ordinais

    **

  • Variveis Quantitativas So as caractersticas que podem ser medidas em uma escala quantitativa, ou seja, apresentam valores numricos que fazem sentido. Podem ser contnuas ou discretas. Variveis discretas Caractersticas mensurveis que podem assumir apenas um nmero finito ou infinito contvel de valores e, assim, somente fazem sentido valores inteiros. Geralmente so o resultado de contagens. Exemplos: nmero de filhos, nmero de bactrias por litro de leite, nmero de cigarros fumados por dia. Variveis contnuasCaractersticas mensurveis que assumem valores em uma escala contnua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas atravs de algum instrumento. Exemplos: peso (balana), altura (rgua), tempo (relgio), presso arterial, idade.

    **

  • Variveis Qualitativas (ou categricas)So as caractersticas que no possuem valores quantitativos, mas, ao contrrio, so definidas por vrias categorias, ou seja, representam uma classificao dos indivduos. Podem ser nominais ou ordinais. Variveis nominaisNo existe ordenao dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/no fumante, doente/sadio. Variveis ordinaisExiste uma ordenao entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estgio da doena (inicial, intermedirio, terminal), ms de observao (janeiro, fevereiro,..., dezembro).

    **

  • Quando voc coleta os dados para uma pesquisa, estas observaes so chamadas de dados brutos. Um exemplo de dados brutos corresponde ao tempo em minutos que consumidores de uma determinada operadora de telefonia celular utilizariam em um ms (dados simulados pelo autor a partir de um caso real). Os dados foram obtidos em uma pesquisa de mercado e apresentados na forma em que foram coletados (Tabela 1), por este motivo so denominados dados brutos.

    **Colocar Tempos em Ordem CrescenteDados Brutos: dados na forma em que foram coletados, sem nenhum tratamento

  • Como voc pode observar na Tabela 1, a simples organizao dos dados em um rol aumenta muito a capacidade de informao destes. Na Tabela 2, voc pode verificar que o menor tempo observado foi 82 minutos, e o maior, 210 minutos, o que nos fornece uma amplitude total de variao da ordem de 128 minutos.Outra informao que podemos obter nos dados por meio da Tabela 2 (organizada em rol crescente) que alguns tempos, como 122 min, 132 min, 138 min e 142 min, foram os mais freqentes, ou seja, os mais citados na pesquisa.

    **

  • Como voc pode organizar os dados de uma forma mais eficiente, na qual se possa apresentar uma quantidade maior de informaes?Uma maneira de organizar um conjunto de dados para voc melhor represent-lo por meio de uma tabela de distribuio de freqncias (tabela onde so apresentadas as freqncias de cada uma das classes).Distribuindo-se os dados observados em classes e contando-se o nmero de observaes contidas em cada classe, obtm-se a freqncia de classe. Veja que a disposio tabular dos dados agrupados em classes, juntamente com as freqncias correspondentes, se denomina distribuio de freqncias.Glossrio EstatsticaRol a mais simples organizao numrica. a ordenao dos dados em ordem crescente ou decrescente.Amplitude Total corresponde diferena entre o maior e o menor valor observado em um conjunto de dados. Classes so intervalos nos quais os valores da varivel analisada so agrupados.**

  • Por exemplo, para o caso do tempo em minutos do uso de celulares, pode-se desejar incluir em uma nica classe todos os indivduos que possuam tempo entre 128 e 138 minutos assim, a classe ir variar de 128 a 138 minutos.

    Para identificar uma classe, deve-se conhecer os valores dos limites inferior e superior da classe, que delimitam o intervalo de classe. Neste ponto, surge uma dvida.

    Indivduos que apresentem tempo exatamente iguais a 128 ou a 138 minutos pertencem ou no a esta classe? (128 a 138)**

  • **Glossrio Estatstica

    Intervalos abertos so os limites da classe (inferior e superior) que no pertencem a ela.

    Intervalos fechados so os limites de classe (superior e inferior) que pertencem classe em questo.

    Intervalos mistos so um dos limites que pertence classe, e o outro, no.

  • Para elaborar uma distribuio de freqncias necessrio que primeiramente, se determine o nmero de classes (k) em que os dados sero agrupados. Por questes de ordem prtica e esttica, sugere-se utilizar de 5 a 20 classes. O nmero de classes (k) a ser utilizado, pode ser calculado em funo do nmero de observaes (n).Na pesquisa, como temos n = 40 consumidores, teremos, ento, o nmero de classes definido por e como o nmero de classes inteiro, usaremos 6 classes. O arredondamento utilizado neste material o padro de algarismos significativos (como foi aprendido no Ensino Mdio). O nmero de classes pode tambm ser definido de uma forma arbitrria sem o uso desta regra.**

  • Aps determinar o nmero de classes (k) em que os dados sero agrupados, deve-se, ento, determinar a amplitude do intervalo de classe (c).Para calcularmos a amplitude do intervalo de classe, vamos primeiramente calcular a amplitude total dos dados (A), que corresponde diferena entre o maior valor observado e o menor valor observado. No nosso caso, teremos A = 210 82 =128 mm.

    Existem outros procedimentos para determinao da amplitude do intervalo de classe que podem ser encontrados na literatura.**

  • Conhecida a amplitude de classes, voc deve determinar os intervalos de classe. O limite inferior e o superior das classes devem ser escolhidos de modo que o menor valor observado esteja localizado no ponto mdio (PM) da primeira classe. O limite inferior da primeira classe :

    Definindo, ento, o limite inferior da primeira classe, para obtermos as classes da nossa distribuio, basta que somemos a amplitude do intervalo de classe a cada limite inferior.**

  • A freqncia absoluta (fa) corresponde ao numero de observaes que temos em uma determinada classe ou em um determinado atributo de uma varivel qualitativa e a freqncia relativa (fr) corresponde proporo do nmero de observaes em uma determinada classe em relao ao total de observaes que temos. Esta freqncia pode ser expressa em termos porcentuais. Para isto, basta multiplicar a freqncia relativa obtida por 100.

    **

  • Na tabela, aparece uma nova denominao chamada freqncia. Podem ter freqncias chamadas de freqncia absoluta (fa), freqncia relativa (fr) e freqncia acumulada. O clculo da freqncia relativa obtido por meio da seguinte expresso:

    Apresentando os dados na forma de distribuio de freqncia, voc consegue sintetizar as informaes contidas neles, alm de facilitar sua visualizao. Na Tabela apresentada a seguir, temos as freqncias (fa e fr) relacionadas ao tempo de utilizao do aparelho celular.**

  • Como ficaria, ento, a interpretao da distribuio de freqncias?**

  • Os tempos de utilizao do celular das 40 pessoas avaliadas em questo esto concentrados nas 2 , 3 e 4 classes. A apresentao dos dados em forma de distribuio de freqncia facilita ainda o clculo manual de vrias medidas estatsticas de interesse e sua apresentao grfica.**

  • Alm das freqncias absolutas e relativas, muitas vezes pode-se estar interessado na quantidade de observaes que existe acima ou abaixo de um determinado ponto na distribuio. Desta forma, podemos trabalhar com a freqncia acumulada.

    Glossrio EstatsticaFreqncia Acumulada corresponde soma da freqncia daquela classe s freqncias de todas as classes abaixo dela.

    **

  • Abaixo do limite superior da primeira classe, temos trs pessoas que esto presentes nesta classe, como pode ser visto na Tabela 3 da distribuio de freqncias absoluta. Quando consideramos a segunda classe, a freqncia acumulada corresponde ao nmero de pessoas que temos abaixo do limite superior desta classe, ou seja, as oito pessoas da segunda classe mais as trs pessoas da primeira classe, totalizando 11 pessoas abaixo de 120,4 minutos. Para as outras classes, o raciocnio semelhante.

    **

  • Para verificar qual a porcentagem de pessoas que utilizam o celular por um tempo inferior a 146 minutos, basta consultar diretamente a Tabela 4 e verificar a freqncia acumulada abaixo deste valor (67,5%), pois o valor 146 minutos corresponde a um dos limites de classe apresentados nesta tabela.

    **

  • E para saber a proporo de pessoas que utilizam o celular por menos de 150 minutos?

    Para podermos obter esta freqncia, necessrio que venhamos a pressupor que os tempos de utilizao estejam uniformemente distribudos dentro das classes. O clculo baseado nos dados da Tabela 4 e so apresentados a seguir.

    Freq. acumulada relativa abaixo da classe imediatamente inferior a 150 (abaixo de 146) = 0,675; Freq. acumulada relativa abaixo da classe imediatamente superior a 150 (abaixo de 171,6) = 0,850;

    **

  • **

  • **

    Calcule a proporo de pessoas que utilizam o celular por menos de 180 minutos.Proporo de consumidores com tempo de uso abaixo de 171,6 min = 0,850

    Proporo de consumidores com tempo de uso abaixo de 197,20 min = 0,950

  • **Freq. Entre 171,6 min e 197,20 = 0,10 (0,95 0,85)De 171,6 a 197,20 min so 25,6 minDe 171,6 a 180,00 min so 8,4 min

    25,6 min -------------------------------------------- 0,108,4 min ------------------------------------------------- X

    X = 8,4 x 0,10X = 0,032825,6Portanto, como abaixo de 171,6 min existe uma proporo de 0,85 e entre 171,6 e 180 min existe uma proporo de 0,0328, conclui-se, ento, que abaixo de 180 min existe uma proporo de 0,8828 (0,85 + 0,0328). Em termos porcentuais, isto corresponde a 88,28 % dos consumidores.

  • **Quando voc trabalha com variveis qualitativas, os atributos so as variaes nominativas da varivel. A construo da tabela consiste em contar as ocorrncias de cada atributo. O resultado da contagem define a freqncia absoluta do atributo. Para podermos entender isto, tomemos como exemplo uma pesquisa na qual se procurou avaliar o nmero de pessoas de diferentes sexos em uma determinada empresa. Estes resultados so apresentados na Tabela 6.

  • **No caso de uma varivel aleatria discreta, realizou-se no SAC (Servio de Atendimento ao Consumidor) de uma empresa um estudo referente ao nmero de reclamaes (N.R.) atendidas diariamente, durante um certo ms, obtendo os seguintes resultados:

  • **Podemos, ento, apresentar a seguir estes dados em uma distribuio de freqncias. Neste caso, no necessrio definir intervalos de classes, porque a variao dos valores pequena.

  • **Verificamos que os valores da varivel discreta correspondem a cada uma das classes. Surge, ento, uma pergunta:

  • **Os histogramas so grficos utilizados para representar tabelas intervalares.

    GlossrioHistogramas: so constitudos por um conjunto de retngulos, com as bases assentadas sobre um eixo horizontal, tendo o centro da mesma no ponto mdio da classe que representa, e cuja altura proporcional freqncia da classe.

  • **Polgono de freqncia se obtm pela simples unio dos pontos mdios dos topos dos retngulos de um histograma. Completa-se o polgono unindo as extremidades da linha que ligam os pontos representativos das freqncias de classe aos pontos mdios das classes, imediatamente, anterior e posterior s classes extremas, que tm freqncia nula.

    Polgono de freqncias um grfico de anlise no qual as freqncias das classes so localizadas sobre perpendiculares levantadas nos pontos mdios das classes.

  • **Quando temos uma tabela de varivel qualitativa, um tipo de grfico adequado para apresentar os resultados corresponde ao grfico de setores, tambm popularmente conhecido como grfico tipo pizza. Sua construo simples: sabe-se que o ngulo de 360 equivale a 100% da rea da circunferncia; assim, para obter-se o ngulo do setor cuja rea representa uma determinada freqncia, basta resolver uma regra de trs simples, como a apresentada a seguir:

  • **(Vunesp-SP) O grfico publicado pela revista Veja, de 28/7/99, mostra como so divididos os 188 bilhes de reais do oramento da Unio entre os setores de Sade, Educao, Previdncia e outros, sendo:

    Sade: 19 BilhesEducao: 15 BilhesPrevidncia: 46 BilhesOutros: 108 Bilhes Faa um grfico de pizza calculando o percentual correspondente de participao de cada setor.

  • **Os grficos chamados de ogivas correspondem a um polgono de freqncias acumuladas, nas quais estas freqncias so localizadas sobre perpendiculares levantadas nos limites inferiores ou superiores das classes, dependendo se a ogiva representar as freqncias acumuladas.

  • **Leia o texto Quais so as principais medidas de tendncia Central e responda:

    Explique o que Mediana e d uma aplicao prtica para o conceito.Explique o que Mdia e d uma aplicao prtica para a Mdia.Explique o que Moda e d uma aplicao prtica para a Moda.Explique a correlao entre Mediana, Mdia e Moda.

  • **Medidas de posioAs medidas de posio ou de tendncia central constituem uma forma mais sinttica de apresentar os resultados contidos nos dados observados, pois representam um valor central, em torno do qual os dados se concentram. As medidas de tendncia central mais empregadas so a mdia, a mediana e a moda.A mdia aritmtica a mais usada das trs medidas de posio mencionadas, por ser a mais comum e compreensvel delas, bem como pela relativa simplicidade do seu clculo, alm de prestar-se bem ao tratamento algbrico.GlossrioA mdia aritmtica, ou simplesmente mdia de um conjunto de n observaes, x1, x2,...,xn definida como:O somatrio () corresponde soma de todos os valores obtidos.

  • **

  • **MODANo caso do nmero de reclamaes no SAC, verifica-se que o que mais ocorre zero, ou seja, em vrios dias no ocorre nenhuma reclamao. Assim, podemos, ento, definir a moda (Mo) como sendo o valor em um conjunto de dados que ocorre com maior freqncia. Um conjunto de dados pode ser unimodal (uma moda) ou amodal (no possuir moda, pois no existe nenhum valor que ocorre com maior freqncia) ou multimodal (possui mais de uma moda).

  • **

  • **

  • **

  • **

  • **Leia o artigo Quais as principais medidas de Disperso e responda:Qual a relao entre variabilidade, mximo, mnimo e amplitude de variao?O que varincia amostral e qual sua utilidade?Qual a utilidade do desvio padro no estudo da varincia?

  • **SEPARATRIZESA principal caracterstica das medidas separatrizes consiste na separao da srie em partes iguais que apresentam o mesmo nmero de valores. As principais so os quartis, decis e percentis. Os quartis so valores de um conjunto de dados ordenados, que os dividem em quatro partes iguais. necessrio, portanto, trs quartis (Q1, Q2 e Q3) para dividir um conjunto de dados ordenados em quatro partes iguais.Q1 : deixa 25% dos elementos abaixo dele.Q2 : deixa 50% dos elementos abaixo dele e coincide com a mediana.Q3 : deixa 75% dos elementos abaixo dele.

  • **Medidas de DispersoConsidere o valor (em reais) ganho por dia de trs grupos de empregados (A: 70, 70, 70, 70, 70; B: 50, 60, 70, 80, 90; C: 5, 15, 50, 120, 160). Podemos verificar que, apesar de apresentarem a mesma mdia (70), os trs grupos apresentam comportamento diferenciado, pois o grupo A o mais homogneo, e o grupo C o que apresenta maior variao de ganho por dia. Portanto, devemos sempre inserir junto a uma medida de posio uma medida que avalie esta distribuio, ou seja, a variabilidade de um conjunto de dados. Portanto, quanto maior a variabilidade, maior ser a disperso das observaes. Amplitude TotalNo caso dos ganhos dirios, podemos obter os seguintes resultados:

  • **Varincia

  • **Desvio Padro

    *