29
APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva

APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

  • Upload
    others

  • View
    45

  • Download
    0

Embed Size (px)

Citation preview

Page 1: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

APOSTILA DE ESTATÍSTICA BÁSICA Parte 1

Prof. Msc. Jorge Wilson Pereira da Silva

Page 2: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 2

SUMÁRIO

Capítulo 1. Conceitos Básicos 3

1.1. Introdução 3 1.2. População e Amostra 3 1.3. Processos Estatísticos de Abordagem 4 1.4. A Natureza dos Dados Estatísticos 5 1.5. Estatística Descritiva 6

Capítulo 2. Medidas e Erros Estatísticos 7 2.1. Introdução 7 2.2. Medidas – Precisão e Exatidão 7 2.3. Erro Experimental 8 Capítulo 3. Estatística Descritiva 10 3.1. Apresentação dos Dados Estatísticos 10 3.2. Distribuição de Frequências 11 3.3. Frequências Acumuladas 15 3.4. Medidas Descritivas 15 3.4.1. Média Aritmética 15 3.4.2. Mediana 17 3.4.3. Moda 18 3.4.4. Variância 19 3.4.5. Desvio-Padrão 19 3.5. Representação Gráfica dos Dados Estatísticos 20 3.5.1. Histograma para variável discreta 20 3.5.2. Histograma para variável contínua 21 3.6. Medidas Separatrizes 23 3.6.1. Cálculo das Medidas Separatrizes para Dados Brutos ou Rol 23 3.6.2. Cálculo das Medidas Separatrizes para Variável Discreta 24 3.6.3. Cálculo das Medidas Separatrizes para Variável Contínua 24 3.7. Medidas de Assimetria 25 3.8. Curtose 26

Page 3: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 3

CAPÍTULO 1. CONCEITOS BÁSICOS

1.1. INTRODUÇÃO O termo Estatística provém da palavra Estado e foi utilizado originalmente para denominar levantamento de dados, cuja finalidade era orientar o Estado em suas decisões. A primitiva utilização da Estatística envolvia compilações de dados e gráficos que descreviam vários aspectos de um estado ou país. Em 1662, John Graunt publicou informes estatísticos sobre nascimentos e mortes. O trabalho de Graunt foi secundado por estudos de mortalidade, tamanho de populações, rendas e taxas de desemprego. As famílias e as empresas se apoiam largamente em dados estatísticos. Assim é que as taxas de desemprego, de inflação, os índices do consumidor, as taxas de natalidade e mortalidade são calculados cuidadosamente a intervalos regulares, e seus resultados são utilizados por empresários para tomarem decisões que afetam a futura contratação de empregados, níveis de produção e expansão para futuros mercados. Atualmente, a Estatística é definida da seguinte forma:

A Estatística é uma coleção de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. Ou ainda, é um conjunto de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los e interpretá-los e deles extrair conclusões.

A Estatística teve acelerado desenvolvimento a partir do século XVII, com os resultados de Bernoulli, Fermat, Pascal, Laplace, Gauss, Galton, Person, Fisher, Poisson e outros que estabeleceram suas características atuais. Ela não alcançou ainda um estado definitivo. Continua a progredir na razão direta do desejo de investigação dos fenômenos coletivos. A Estatística é considerada por alguns autores como ciência no sentido do estudo de uma população e método quando utilizada como instrumento por outra ciência. A Estatística mantém com a Matemática uma relação de dependência, solicitando-lhe auxílio, sem o qual não poderia desenvolver-se. Com as outras ciências mantém uma relação de complemento, quando utilizada como instrumento de pesquisa. Em especial esta última é a relação que a Estatística mantém com a Engenharia, Administração, Economia e Ciências Contábeis, servindo como instrumento auxiliar na tomada de decisões. 1.2. POPULAÇÃO E AMOSTRA A Estatística tem como objetivo o estudo dos fenômenos coletivos, ou seja, ela abrange muito mais do que simples traçado de gráficos e cálculo de médias, é importante aprender como tirar conclusões gerais que vão além dos dados originais. Em Estatística utiliza-se extensamente os termos população e amostra, que estão definidos a seguir:

População: conjunto de todos os itens (pessoas, coisas, objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma característica. Amostra: subconjunto de elementos extraídos de uma população.

Uma característica numérica estabelecida para toda uma população é denominada parâmetro, enquanto que, uma característica numérica estabelecida para uma amostra é denominada estimador. Por exemplo, no fenômeno coletivo eleição para governador no estado de São Paulo, a população é o conjunto de todos os eleitores habilitados no Estado de São Paulo. Um parâmetro é a proporção de votos do candidato A. Uma amostra é um grupo de 1000 eleitores selecionados em todo o estado. Um estimador é a proporção de votos do

Page 4: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 4

candidato A obtida na amostra. Em aplicações efetivas, o número de elementos componentes de uma amostra é bastante reduzido em relação ao número de elementos componentes da população. 1.3. PROCESSOS ESTATÍSTICOS DE ABORDAGEM Quando solicitados a estudar um fenômeno coletivo pode-se optar entre os seguintes processos estatísticos:

Censo: é uma avaliação direta de um parâmetro, utilizando-se todos os componentes da população. Estimação: é uma avaliação indireta de um parâmetro, com base em um estimador através do cálculo de probabilidades.

Propriedades Principais do Censo Propriedades Principais da Estimação

Admite erro processual zero e tem confiabilidade de 100%

Admite erro processual positivo e tem confiabilidade menor que 100%

É caro É barata É lento É rápida

É quase sempre desatualizado É atualizada Nem sempre é viável É sempre viável

Admitindo-se que se possa retirar do censo todo tipo de erro de natureza humana (erro de cálculo, de avaliação, de anotação, etc.) restará apenas outro tipo de erro devido ao procedimento empregado. Este erro é chamado erro processual. No caso de um Censo, o erro processual é zero, pois avalia-se um por um, todos os elementos componentes da população. Como o erro processual na avaliação é zero, a confiabilidade no parâmetro obtido é 100%. A precisão no Censo é total. Na estimação, como avalia-se apenas parte e não todos os elementos que compõem a população, admiti-se um erro processual positivo na avaliação do valor numérico e por consequência uma confiabilidade menor que 100%, sendo portanto, menos precisa que o Censo. Como o número de elementos que compõem uma amostra é consideravelmente menor que o número de elementos que compõem uma população, a estimação é sempre bem mais barata que o Censo, é concluída mais rapidamente que o Censo e, portanto, mais atualizada. Se a maneira de avaliar um elemento é um teste destrutivo, o Censo se torna um processo inviável, pois destruiria a população objeto de estudo. Na maioria das vezes em que o Censo é considerado inviável é por razões econômicas e de tempo. Na sociedade moderna, a maioria dos problemas exigem decisões de curto prazo. Por isso, as informações estatísticas úteis à resolução destes problemas devem ser obtidas rapidamente. Pela rapidez e facilidade da obtenção destas informações, a estimação tem sido cada vez mais utilizada como procedimento estatístico.

Page 5: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 5

1.4. A NATUREZA DOS DADOS ESTATÍSTICOS Normalmente, no trabalho estatístico o pesquisador se vê obrigado a lidar com grande quantidade de valores numéricos resultantes de um Censo ou de uma estimação. Estes valores são chamados dados estatísticos. No sentido de disciplina, a Estatística ensina métodos racionais para a obtenção de informações a respeito de um fenômeno coletivo, além de obter conclusões válidas para o fenômeno e também permitir tomada de decisões, através de dados estatísticos observados. Desta forma a Estatística pode ser dividida em duas áreas:

Estatística Descritiva: é a parte da Estatística que tem por objetivo descrever os dados observados, sem tirar quaisquer conclusões sobre um grupo maior. Estatística Indutiva: é a parte da Estatística que tem por objetivo obter e generalizar conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. O cálculo de probabilidade é que viabiliza a inferência estatística.

Alguns conjuntos de dados consistem em números, enquanto que outros são não numéricos, aplicando-se as expressões dados quantitativos e dados qualitativos para distinguir esses dois tipos.

Dados Quantitativos: consistem em números que representam contagens ou medidas. Dados Qualitativos: (ou dados categóricos, ou atributos) podem ser separados em diferentes categorias que se distinguem por alguma característica não numérica.

Pode-se ainda descrever os dados quantitativos distinguindo entre os tipos discreto e contínuo.

Dados Discretos: resultam de um conjunto finito de valores possíveis, ou de um conjunto enumerável desses valores. Dados Contínuos: resultam de número finito de valores possíveis que podem ser associados a pontos em uma escala contínua de tal maneira que não haja lacunas ou interrupções.

Quando os dados representam contagens, são discretos; quando representam mensurações, são contínuos. O número de crianças em cada uma de 1000 famílias é um exemplo de dados discretos, enquanto o peso de 100 estudantes universitários é um exemplo de dados contínuos. Muitas vezes é conveniente estender o conceito de variável a entidades não numéricas. Por exemplo, a cor C de um arco-íris é uma variável que pode tomar os “valores” vermelho, laranja, amarelo, verde, azul, anil e violeta. Geralmente, é possível substituir essas variáveis por quantidades numéricas, como atribuir 1 ao vermelho, 2 ao laranja, etc.. Quando se faz n observações diretas em um fenômeno coletivo ou observa-se as respostas a uma pergunta em uma coleção de n questionários, obtém-se uma sequência de n valores numéricos denominada dados brutos. Representando por X a característica observada no fenômeno coletivo ou na pergunta dos questionários, então 1x representa o valor da característica obtida na primeira observação do fenômeno coletivo

ou o valor da característica observado no primeiro questionário; 2x representa o valor da característica obtida

na segunda observação do fenômeno coletivo ou o valor da característica observado no segundo questionário e

assim sucessivamente. Desta forma os dados brutos podem representados por nxxxxX ,...,,: 321 . Esta sequência

assim obtida apresenta-se completamente desordenada, de modo geral pode-se afirmar que os dados brutos são uma sequência de valores numéricos não organizados, obtidos diretamente da observação de um fenômeno coletivo. Quando ordena-se na forma crescente ou decrescente, os dados brutos passam a se chamar rol. Portanto rol é uma sequência ordenada de dados brutos. Por exemplo, no final do ano letivo, um aluno obteve as seguintes notas bimestrais em Matemática: 4;8;7.5;6.5. Neste exemplo X representa nota bimestral e pode ser apresentada na seguinte forma: Dados Brutos: 5.6;5.7;8;4:X Rol: 8;5.7;5.6;4:X

Page 6: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 6

1.5. ESTATÍSTICA DESCRITIVA A Estatística Descritiva, na sua função de descrição dos dados, tem as seguintes atribuições: Obtenção ou coleta dos dados: é normalmente feita através de um questionário ou de observação direta de

uma amostra. Organização dos dados: consiste na ordenação e crítica quanto à correção dos valores observados, falhas

humanas, omissões, abandono de dados duvidosos, etc.. Redução dos dados: o entendimento e compreensão de grande quantidade de dados através de simples

leitura de seus valores individuais é uma tarefa extremamente árdua e difícil mesmo para o mais experimentado pesquisador. A Estatística descritiva apresenta duas formas básicas para a redução do número de dados com os quais deve-se trabalhar, chamadas variáveis discretas e contínuas.

Representação dos dados: os dados estatísticos podem ser mais facilmente compreendidos quando apresentados através de uma representação gráfica, o que permite uma visualização instantânea de todos os dados. Os gráficos quando bem representativos, tornam-se importantes instrumentos de trabalho.

É ainda atributo da Estatística Descritiva a obtenção de algumas informações como médias, proporções, dispersões, tendências, índices, taxas, coeficientes, que facilitam a descrição dos fenômenos observados. Completando o processo estatístico, no caso de uma Estimação, a Estatística Indutiva estabelece parâmetros a partir de estimadores usando o cálculo de probabilidade. Esta última etapa será desenvolvida posteriormente. 1a LISTA DE EXERCÍCIOS

1) O que é estatística? 2) O que é população? 3) O que é amostra? 4) O que é parâmetro? 5) O que é estimador? 6) Qual a diferença entre censo e estimação? 7) O que é Estatística Descritiva e quais as suas tarefas? 8) O que é Estatística Indutiva? 9) Qual a diferença entre Dados Brutos e Rol?

Page 7: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 7

CAPÍTULO 2. MEDIDAS E ERROS ESTATÍSTICOS

2.1 - INTRODUÇÃO

Uma medida experimental é satisfatoriamente representada quando, a esta medida é atribuído um erro, ao qual a medida está sujeita.

Quando efetuamos uma medida ou várias medidas (nas mesmas condições, de uma mesma grandeza), o valor dessa grandeza deve ser expresso pela relação:

unidadexxx

Para os casos onde é realizada uma única medida x é a própria medida e para várias medidas é a média dos valores medidos. O é chamado de desvio para várias medidas, para uma única medida é chamado de incerteza, e tem o valor da metade da menor medida do instrumento.

Por maior cuidado que se tenha ao efetuar uma medição, mesmo que se utilizem equipamentos “topo de gama” em condições ambientais bem controladas, os resultados que se obtém virão afetados por diversos erros.

Nada nem ninguém são perfeitos. Como tal os resultados das medições, dos ensaios e das análises também não podem ser perfeitos. Isto não é novidade para ninguém.

Uma das principais tarefas de um experimentador é identificar as fontes de erro que podem afetar o processo de medição, e quantificar essas fontes de erro. Essa “falta de perfeição” é designada, atualmente, por “incerteza”. A palavra “erro”, que durante largos anos foi utilizada com esse mesmo significado, está hoje em dia reservada para designar o afastamento entre o valor obtido numa medição e o correspondente valor verdadeiro, o qual é, em geral, desconhecido. 2.2 – MEDIDAS – PRECISÃO E EXATIDÃO

As medidas podem ser classificadas em dois tipos, diretas e indiretas suas definições são especificadas a seguir.

Medidas diretas → São aquelas obtidas diretamente do instrumento de medida. Como exemplos podem ser citados: comprimento e tempo, sendo realizadas diretamente de trenas e cronômetros, respectivamente.

Medidas indiretas → São aquelas obtidas a partir das medidas diretas, com o auxílio de equações. Por exemplo: a área de uma superfície, volume de um corpo ou a vazão de um rio ou canal.

Precisão é quando, pressupõe-se que, se a mesma for repetida várias vezes a variação da mesma em relação ao valor médio medido é baixa. A exatidão (ou acurácia) está associada a ausência de erros sistemáticos, mantendo as medidas em torno do valor real.

Portanto, quando o conjunto de medidas realizadas se afasta muito da média, a medida é pouco precisa e o conjunto de valores medidos tem alta dispersão (Figura 2.1 (a, b)). Quando as mesmas estão mais concentradas em torno da média diz-se que a precisão da medida é alta (Figura 2.1 (c, d)), e os valores medidos tem uma distribuição de baixa dispersão.

a) Baixa precisão e

baixa exatidão

b) Baixa precisão e

alta exatidão

c) Alta precisão e

baixa exatidão

d) Alta precisão e

alta exatidão

Figura 2.1: Representação da precisão e exatidão em medidas experimentais

Page 8: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 8

2.3 - ERRO EXPERIMENTAL

Conceitualmente, o erro experimental é a diferença entre o real valor de uma grandeza física (peso, área, velocidade...) e o respectivo valor dessa grandeza obtido através de medições experimentais.

Mesmo que o experimento seja realizado com o máximo de cuidado, há sempre fontes de erro que podem afetá-la. Os erros experimentais podem ser de dois tipos: erros sistemáticos e erros aleatórios.

Erros grosseiros – Ocorrem devido à falta de atenção, pouco treino ou falta de perícia do operador. Por exemplo, uma troca de algarismos ao registar um valor lido. São geralmente fáceis de detectar e eliminar.

Erros Sistemáticos - São os que afetam os resultados sempre no mesmo sentido. Exemplo: incorreto posicionamento do “zero” da escala, afetando todas as leituras feitas com esse instrumento. Devem ser compensados ou corrigidos convenientemente. São causados por fontes identificáveis, e -em princípio- podem ser eliminados ou compensados. Estes erros fazem com que as medidas feitas estejam consistentemente acima ou abaixo do valor real, prejudicando a exatidão da medida. Decorre de uma imperfeição no equipamento de medição ou no procedimento de medição, pode ser devido a um equipamento não calibrado.

Erros aleatórios - Estes erros decorrem de fatores imprevisíveis. São flutuações, para cima ou para baixo, que fazem com que aproximadamente a metade das medidas realizadas esteja desviada para mais, e a outra metade esteja desviada para menos, afetando a precisão da medida. Decorre da limitação do equipamento ou do procedimento de medição, que impede que medidas exatas sejam tomadas. Nem sempre é possível identificar as fontes de erros aleatórios. Associados à natural variabilidade dos processos físicos, levando a flutuações nos valores medidos. São imprevisíveis e devem ser abordados com métodos estatísticos.

Page 9: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 9

É ainda possível falar-se em erros absolutos e em erros relativos, de acordo com a forma como são calculados. Antes de os definirmos, convém introduzir o conceito de “valor verdadeiro” de uma grandeza. Dado que, como vimos já, todas as medições estão afetadas por erros, por mais rigorosos que procuremos ser, nunca poderemos esperar que os resultados obtidos sejam exatos. Para nos podermos referir ao grau de afastamento entre tais resultados e os resultados ideais, definimos “valor verdadeiro” como sendo o valor que obteríamos numa medição ideal, feita em condições perfeitas com instrumentos perfeitos e por operadores perfeitos. Esse valor, meramente utópico, permite-nos introduzir, entre outros, os conceitos de erro absoluto e erro relativo. Os “erros absolutos” correspondem à diferença algébrica (com sinal “+” ou “-”) entre o valor obtido e o valor verdadeiro:

Dizemos que uma medição tem um erro positivo (erro com sinal “+”, ou medição “adiantada”) se o seu valor for superior ao valor que obteríamos na tal medição ideal. Pelo contrário, se obtivermos um valor inferior ao

ideal, diremos que o erro é negativo (erro com sinal “-”, ou medição “atrasada”). Por vezes é muito útil apresentar valores relativos, quando se exprimem erros de medições. A forma mais usual de apresentação é

indicar os erros relativos em percentagem (%):

________________________________________________

2a LISTA DE EXERCÍCIOS 1- Faça a leitura dos instrumentos de medida abaixo, escrevendo as medidas com seus respectivos erros instrumentais e unidades.

2- Uma esfera é lançada horizontalmente de uma mesa e aterrissa no chão a uma distância d da mesma. A posição de queda é registrada em um papel sobre o chão e a distância d é medida com uma régua como ilustrado na figura. O experimento é realizado 3 vezes partindo sempre das mesmas condições iniciais. A régua é graduada em milímetros.

Page 10: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 10

a) Qual a distância d percorrida em cada lançamento? Indique o erro de leitura em sua resposta. Considere o centro da mancha como a posição de queda da esfera. b) Se você tivesse que escrever um único valor para representar a melhor estimativa para a distância d, o que escreveria? Qual seria a incerteza em d? Justifique sua resposta. 3 - Estabeleça qual o número de algarismos significativos para cada um dos seguintes resultados experimentais. a) 0,001000 b) 2500 c) 0,000000305 d) 0,2045 e) 75400 f) 0,007 g) 809738000 h) 0,005550 4 - Faça o arredondamento dos seguintes valores experimentais para que contenham quatro, três e dois algarismos significativos. a) 12,9994 b) 3,00828 c) 38655 d) 4702801 e) 0,0030452 5 - Uma analogia interessante para se compreender a diferença entre erros estatísticos e erros sistemáticos é através do resultado de um experimento onde foram atirados projéteis em um alvo. A máquina é ajustada para atingir o centro “verdadeiro” ou “absoluto” da grandeza que pretende-se medir. A imagem abaixo mostra o alvo e o seu centro e onde os projéteis atingiram quando quatro instrumentos distintos foram usados com o mesmo objetivo: atingir o alvo no centro. Use esta imagem para discutir os conceitos de erro absoluto, erro aleatório, erro sistemático, exatidão e precisão.

Page 11: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 11

CAPÍTULO 3. ESTATÍSTICA DESCRITIVA

3.1. APRESENTAÇÃO DOS DADOS ESTATÍSTICOS Ao se analisar um conjunto de dados é necessário determinar em primeiro lugar se eles tratam de uma amostra ou de uma população. Essa determinação afetará não somente os métodos utilizados, mas também as conclusões a que se chegam. Utilizam-se métodos de Estatística Descritiva para resumir ou descrever as características importantes de um conjunto conhecido de dados populacionais. Recorre-se à Estatística Inferêncial quando utilizam-se dados amostrais para fazer inferências, ou generalizações, sobre uma população. Quando um professor calcula a média final de um exame para uma determinada turma, o resultado é um exemplo de Estatística Descritiva se a toda a turma é considerada a população. Mas, se o resultado for considerado uma estimativa da média do exame final de todas as turmas, está-se fazendo uma inferência que ultrapassa o âmbito dos dados coletados. Com os recursos da Estatística Descritiva, pode-se entender melhor um conjunto de dados através de suas características. As três características seguintes são extremamente importantes e proporcionam uma visão bastante satisfatória: A natureza ou forma da distribuição de dados, como forma de sino, uniforme ou assimétrica; Um valor representativo, como uma média; Uma medida de dispersão ou variação. Quando lida-se com poucos valores numéricos, o trabalho estatístico fica sensivelmente reduzido. No entanto, normalmente, tem-se que trabalhar com grandes quantidades de dados. Um dos objetivos da Estatística Descritiva neste caso, é obter uma significativa redução na quantidade de dados com os quais deve-se operar diretamente A Estatística Descritiva trabalha tanto quanto possível, com modelos, que nada mais são que ferramentas teóricas de organização dos dados, às quais procuram adaptar os dados reais. Esses modelos são chamados de Distribuições Teóricas de Probabilidade. Antes que esses modelos sejam apresentados é interessante que se aprenda algumas técnicas de organização dos dados, sem a preocupação de adaptá-los a nenhum modelo. 3.2. DISTRIBUIÇÕES DE FREQUÊNCIAS Suponha que se observam as notas de 30 alunos em uma prova e obtêm-se os seguintes valores: X: 3,5; 5; 4,5; 4; 4,5; 5; 3,5; 4; 4; 5; 2; 3; 4,5; 3,5; 4; 4,5; 3; 4; 3; 4; 3,5; 3,5; 3,5; 4; 4; 3; 4; 4; 5; 3. (1) Se entender como frequência simples de um elemento o número de vezes que este elemento figura no conjunto de dados, pode-se reduzir significativamente o número de elementos com os quais deve-se trabalhar. Para isto organiza-se o conjunto de dados na forma de uma série estatística chamada variável discreta. A distribuição de frequência para uma variável discreta é uma representação tabular de um conjunto de valores em que se coloca na primeira coluna em ordem crescente apenas os valores distintos da série e na segunda os valores das frequências simples correspondentes. Usando f para representar frequência simples, a

sequência 1 pode ser representado por:

Deve-se optar por uma variável discreta na representação de uma série de valores quando o número de elementos distintos da série for pequeno.

Page 12: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 12

ix if

2 1 3 5

3,5 6 4 10

4,5 4 5 4

30

Dentro de um trabalho de levantamento de informações, a obtenção de dados em um número muito elevado é fato dos mais corriqueiros. O procedimento mais óbvio seria o de dividir os dados em classes ou faixas, contando-se então o número de casos que se enquadram em cada uma das classes. Suponha, por exemplo, que a observação das notas de 30 alunos em uma prova conduzisse aos seguintes valores:

X: 3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7; 7,5; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5; 5; 5,5; 4,5; 4; 7,5; 6,5; 5; 6; 6,5; 6. (02)

Observando estes valores nota-se um grande número de elementos distintos, o que significa que neste caso a variável discreta não é aconselhável na redução de dados. Nesta situação é conveniente agrupar os dados por faixas de valores, ficando a série (02) com a apresentação abaixo. Esta representação é denominada variável contínua. Quando agrupa-se os dados na disposição de uma variável contínua, passa-se a trabalhar com os dados sem o conhecimento de seus valores individuais.

Classe Notas if

1 2-4 4 2 4-6 12 3 6-8 10 4 8-10 4

30

Deve-se optar por uma variável contínua na representação de uma série de valores quando o número de elementos distintos da série for grande.

De uma maneira geral, uma Distribuição de Frequências de certa grandeza consiste em um conjunto de valores (ou faixa de valores) da grandeza, associado ao número de ocorrências de cada valor (ou de cada faixa de valores). Ao número de ocorrências para cada valor ou faixa de valores da grandeza dá-se ao nome de Frequência Absoluta ou Simples. Se cada frequência absoluta for dividida pelo total das frequências absolutas, o resultado será a Frequência Relativa, que pode ser deixada na forma de fração ou colocada na forma de porcentagem. Quando a grandeza de interesse é numérica a distribuição de frequências é chamada de quantitativa. Não há necessidade, numa distribuição quantitativa, que a grandeza compareça na forma de classe, ela pode apresentar-se com valores isolados, como para as variáveis discretas. Por outro lado, existem distribuições onde a grandeza é apresentada em categorias, neste caso, a distribuição é dita qualitativa ou categórica. A tabela

Page 13: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 13

seguinte ilustra uma distribuição de frequências categórica.

Área de Formação Frequência Absoluta (no de formandos)

Humanas 2.113 Exatas 1.292

Biológicas 509 Outras 295

4209

Se a grandeza de interesse vier na forma categórica ou com valores isolados, a montagem da distribuição não apresenta maiores dificuldades. Basta contar o número de casos. As dificuldades maiores acontecem quando dispõem-se de um conjunto numérico de muitos valores que devem ser transformados em classes. Deve-se determinar quantas classes serão usadas e também a sua amplitude. Como não há uma solução única para este problema, algumas regras empíricas são as vezes sugeridas, entre elas: As classes têm que conter todos os dados; Cada valor da grandeza só pode pertencer a uma única classe; Tanto quanto possível, os intervalos das classes devem ter a mesma amplitude; Tentar fazer com que o número de classes seja maior ou igual a 6 e menor ou igual a 15. Existe ainda uma regra mais precisa sobre o número de classes: regra da raiz quadrada. Segundo essa regra o número de classes deve ser próximo à raiz quadrada do número de observações coletadas para a grandeza. Portanto, se a sequência estatística contém n elementos e se K representar o número de classes a ser utilizado, pelo critério da raiz, tem-se que:

nK

A amplitude do intervalo da classe, h, é determinada da seguinte forma:

K

Ah t

Page 14: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 14

Exemplo 1) Foram feitas 98 observações diárias sobre o tempo de parada de um equipamento, seja por manutenção, seja

por troca de ferramentas. Os resultados obtidos estão fornecidos em minutos. Elaborar a distribuição de frequências dos tempos de parada do equipamento.

13 56 35 48 19 57 24 29 13 18 34 30 31 46 60 53 27 41 36 30 31 45 12 33 41 27 35 16 39 24 9 21 12 25 63 38 53 27 20 6 82 23 72 25 48 21 24 31 25 18 35 17 14 27 52 19 46 33 5 21 35 38 24 46 29 25 23 39 41 21 17 86 28 58 24 37 16 25 43 51 42 25 20 44 57 63 37 31 72 35 25 62 51 28 26 49 18 52

Amplitude Total: Número de Classes: Intervalo das Classes:

Tempos de Parada

ix

Frequência Absoluta

if

Frequência Relativa (fração)

irf

Frequência Relativa (porcentagem)

irf

Page 15: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 15

3.3. FREQUÊNCIAS ACUMULADAS Para muitos propósitos práticos, é mais conveniente trabalhar com uma distribuição de frequências acumuladas por classe do que com as frequências absolutas ou relativas de cada classe isolada. Existem dois tipos fundamentais de frequências acumuladas: a) Frequências acumuladas do tipo “ou menos”: para o limite superior de cada classe, somam-se à frequência

da classe, as frequências absolutas ou relativas de todas as classes anteriores; b) Frequências acumuladas do tipo “ou mais”: para o limite inferior de cada classe, somam-se à frequência da

classe, as frequências absolutas ou relativas de todas as classes posteriores; Exemplo 2) Frequências Acumuladas – Tempo de Parada

Tempos de Parada

ix

Frequência Absoluta

if

Frequência Acumulada

(“ou menos”)

iF

Frequência Acumulada (“ou mais”)

iF

Frequência Acumulada

Relativa (“ou menos”)

iF

0-10 3 10-20 14 20-30 29 30-40 21 40-50 13 50-60 10 60-70 4 70-80 2 80-90 2

98

3.4. MEDIDAS DESCRITIVAS Para melhor interpretar uma distribuição de frequências é necessário definir algumas propriedades de ordem geral e a forma de medi-las. Essas propriedades enquadram-se no que se denomina Medidas Descritivas, onde existem duas categorias: Medidas de tendência central: servem para dar uma idéia acerca dos valores médios da grandeza. Entre

elas estão: Média Aritmética, ou simplesmente média, Mediana e Moda. Em resumo, a medida de tendência central procura estabelecer um número no eixo horizontal em torno do qual a série se concentra.

Medidas de Dispersão: servem para dar uma idéia acerca da maior ou menor concentração dos valores da grandeza. Serão vistos: Variância e Desvio Padrão. É fácil perceber a importância das medidas de dispersão analisando as três séries abaixo:

X: 10; 1; 18; 20; 35; 3; 7; 15; 11; 10. Y: 12; 13; 13; 14; 12; 14; 12; 14; 13; 13. Z: 13;13;13;13;13;13;13;13;13;13. Na sequência Z os dados estão totalmente concentrados sobre a média 13. Não há dispersão de dados. Na sequência Y há forte concentração de dados sobre a média 13, mas há fraca dispersão. Já na série X há fraca concentração de dados sobre a média 13 e forte dispersão de dados em relação a média 13. Quando as medidas de tendência central e as dispersões são calculadas sobre toda a população, ou seja, sobre todos os valores possíveis da grandeza, elas são chamadas de parâmetros. De uma forma geral, um parâmetro de uma população é qualquer medida característica dessa população, obtida considerando-se todos os seus elementos. Por outro lado, quando as medidas são obtidas considerando-se amostras elas são chamadas de

Page 16: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 16

estatísticas. Uma estatística é, pois, o valor de uma medida tomada sobre uma amostra. As estatísticas, na prática, são tomadas como estimativas dos parâmetros, quando não for possível trabalhar com as populações. 3.4.1. MÉDIA ARITMÉTICA A média aritmética é definida como a soma dos valores de uma grandeza, dividida pelo número de observações.

n

x

x

N

ii

1

Se a cada valor ix estiver associado uma frequência dada if então a média será:

n

xf

x

N

iii

1

Se os valores das grandezas estão agrupados em classes, a média será obtida com o auxílio dos pontos médios,

im , de cada classe:

n

fm

x

K

iii

1

Exemplo 3) Média do número de defeitos por peça.

Número de Defeitos

ix

Frequência Absoluta

if ii xf

0 156 1 102 2 74 3 40 4 21 5 7

400

Page 17: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 17

4) Média do Tempo de Parada de um Equipamento.

Tempos de Parada

ix

Frequência Absoluta

if

Ponto Médio

im

ii fm

0-10 3 10-20 14 20-30 29 30-40 21 40-50 13 50-60 10 60-70 4 70-80 2 80-90 2

98

3.4.2. MEDIANA A mediana é o valor central de um conjunto de números colocados em ordem crescente, tal que 50% dos valores caem abaixo e 50% caem acima da mediana.

4 5 6 6 12 14 17

Mediana

Se o conjunto tiver um número par de valores, existirão dois valores em posição média como no caso: 13 15 21 24 25 25

os pontos médios são 21 e 24 e qualquer número entre esses dois valores satisfaz à definição de mediana. Por convenção, adota-se como mediana o ponto médio entre os dois valores centrais:

5,222

2421Md

Quando a grandeza assume valores discretos aos quais estão associadas às frequências respectivas, a

mediana será o número tal que contenha a frequência acumulada dada por 2

1n .

Exemplo 5) Cálculo da Mediana:

Valor Frequência Frequência Acumulada

3 25 25 8 15 40 10 27 67 12 3 70 22 2 72

72

O valor 36,5 está contido na frequência acumulada 40, que corresponde ao valor 8 que é, portanto, a mediana. Quando os valores da grandeza são colocados em classes a classe onde cair a observação de número

2

1n é chamada de classe mediana. A estimativa da mediana será um valor da grandeza dentro da classe

Page 18: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 18

mediana, dado por:

ac

md

Fn

f

hLMd

2inf

onde:

infL = limite inferior da classe mediana.

h = intervalo da classe mediana;

mdf = frequência da classe mediana.

n = soma total das frequências.

acF = frequência acumulada até a classe que precede imediatamente a classe mediana.

Exemplo 6) Calculo da mediana para o tempo de parada de um equipamento.

Tempos de Parada Frequência Absoluta Frequência Acumulada

0-10 3 3 10-20 14 17 20-30 29 46 30-40 21 67 40-50 13 80 50-60 10 90 60-70 4 94 70-80 2 96 80-90 2 98

98

2

1n

infL =

h =

mdf =

n =

acF =

Md

3.4.3. MODA A moda é o valor da grandeza que ocorre mais frequentemente. Quando os valores da grandeza estão agrupados em classes com frequências determinadas define-se a classe modal como aquela que apresenta a maior frequência. A moda é adotada então como sendo o ponto médio da classe modal.

Page 19: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 19

Para os dados agrupados de forma contínua, a moda pode ser calculada utilizando a fórmula de Pearson:

xMdMo 23

MODA DE CZUBER:

3.4.4. VARIÂNCIA Define-se a variância como sendo a soma dos quadrados das diferenças entre cada medida e a sua média, dividida pelo número de observações menos 1:

11

2

2

n

fxx

s

N

iii

Para o caso em que os dados estão agrupados em classe:

Page 20: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 20

11

2

2

n

xmf

s

K

iii

3.4.5. DESVIO-PADRÃO

O desvio-padrão é definido como a raiz quadrada positiva da variância. 2ss

Exemplo 7) Cálculo da Variância e do Desvio-Padrão para os tempos de parada de um equipamento.

Tempos de

Parada

ix

Frequência Absoluta

if

Ponto Médio

im

xmi

2ii xmf

0-10 3 10-20 14 20-30 29 30-40 21 40-50 13 50-60 10 60-70 4 70-80 2 80-90 2

98

Page 21: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 21

3.5. REPRESENTAÇÃO GRÁFICA DE SÉRIES ESTATÍSTICAS Existem muitas formas de se representar graficamente uma série estatística. Pode-se citar entre elas: gráfico em linhas, em colunas, em barras, em setores em porcentagens, etc.. No entanto, a maioria deles, são simplesmente gráficos de apresentação, que o interessado com pequeno esforço poderá compreender. O interesse maior estará completamente voltado para os gráficos de análise da série estatística que são: Histograma e Polígono de Frequência. 3.5.1. HISTOGRAMA PARA VARIÁVEL DISCRETA É um conjunto de hastes, representadas em um sistema de coordenadas cartesiana que tem por base os

valores distintos da série ix e por altura, valores proporcionais as frequências simples correspondentes destes

elementos if .

Exemplo 8) Considerando a série:

ix if

2 1 3 4 5 8 6 6 7 2

O histograma assume a forma:

Figura 3.1. Histograma para variável discreta.

Page 22: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 22

3.5.2. HISTOGRAMA PARA VARIÁVEL CONTÍNUA É um conjunto de retângulos justapostos, representado em um sistema de coordenadas cartesianas, cujas bases são os intervalos de classe e cujas alturas são valores proporcionais às frequências simples correspondentes. Exemplo 9) Considerando a série:

Classe Int. cl. if

1 0-2 3 2 2-4 6 3 4-6 8 4 6-8 5 5 8-10 2

O Histograma assume a forma:

Figura 3.2. Histograma para variável contínua. Observe que não se coloca o zero no eixo horizontal na origem do sistema por uma questão de clareza da representação gráfica. Deixa-se intencionalmente, um espaço igual a um intervalo da classe no início e no final da representação gráfica. Considerando este espaçamento inicial e final como sendo classes fictícias com frequência zero e unindo o os pontos médios das bases superiores destes retângulos, obtém-se uma nova figura chamada Polígono de Frequência. A área do polígono de frequência é a mesma área do histograma.

Page 23: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 23

3a LISTA DE EXERCÍCIOS 1) O que é uma Distribuição de Frequências? O que é Frequência Absoluta? O que é Frequência Relativa? 2) Cite algumas regras básicas na divisão de valores de uma grandeza em classes. 3) Definir limites, ponto médio e intervalo de uma classe. 4) O que são Distribuições de Frequência Acumuladas? 5) Quais são as mais importantes medidas de tendência central? Como são calculadas para o caso dos dados

estarem divididos em classes? 6) Como são calculados a Variâncias e o Desvio Padrão? 7) Uma pesquisa sobre a idade, em anos de uma classe de calouros de uma faculdade revelou os seguintes

valores: 18 17 18 20 21 19 20 18 17 19 20 18 19 18 19 21 18 19 18 18 19 19 21 20 17 19 19 18 18 19 18 21 18 19 19 20 19 18 18 20 18 19 19 18 20 20 18 19 19 18

Agrupe estes dados por frequência. Dê as distribuições de frequência acumuladas “ou mais” e “ou menos”, assim como as frequências relativas. Calcule a média, a moda, a mediana, a variância e o desvio padrão. Interprete os valores colocados na 3a linha da distribuição de frequências.

8) Uma empresa automobilística selecionou ao acaso uma amostra de 40 revendedores autorizados em todo o Brasil e anotou em determinado mês o número de unidades adquiridas por estes revendedores. Obteve os seguintes dados:

10 15 25 21 6 23 15 21 26 32 9 14 19 20 32 18 16 26 24 20 7 18 17 28 35 22 19 39 18 21 15 18 22 20 25 28 30 16 12 20

Agrupe estes dados por frequência. Dê as distribuições de frequência acumuladas “ou mais” e “ou menos”, assim como as frequências relativas. Calcule a média, a moda, a mediana, a variância e o desvio padrão. Interprete os valores colocados na 3a linha da distribuição de frequências.

9) Construa o histograma para o exemplo 1, tempo de parada de um equipamento, e para o exercício 8. 10) Abaixo é dado o número de unidades vendidas de um certo produto, para 50 semanas consecutivas:

49 41 45 52 47 46 48 42 43 46 45 36 56 44 61 68 54 58 51 44 47 49 42 48 53 48 41 65 45 52 58 50 55 45 43 72 63 45 38 43 42 47 43 49 46 57 49 44 47 48

Calcule: construa as distribuições de frequências absoluta, acumulada e relativa, calcule a média e a mediana, assim como o desvio padrão, construa o histograma e o polígono de frequência, Determinar a porcentagem de semanas em que são vendidas 50 ou mais unidades do produto.

Page 24: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 24

3.6. MEDIDAS SEPARATRIZES As medidas separatrizes são números reais que dividem a sequência ordenada de dados em partes que contêm a mesma quantidade de elementos da série. Desta forma, a mediana que divide a sequência ordenada em dois grupos, cada um contendo 50% dos valores da sequência, é também uma medida separatriz. Além da mediana, as outras medidas separatrizes são: quartis, quintis, decis e percentis. Dividindo a série ordenada em quatro partes, cada uma ficará com 25% de seus elementos. Os elementos que separam este grupo são chamados de quartis. Assim, o primeiro quartil, indicado por 1Q , separa a sequência

ordenada, deixando 25% de seus valores à esquerda e 75% à direita. O segundo quartil, indicado por 2Q , separa

a sequência ordenada, deixando 50% de seus valores à esquerda e 50% à direita. Note que 2Q é a mediana da

série. O terceiro quartil, indicado por 3Q , separa a sequência ordenada, deixando 75% de seus valores à

esquerda e 25% à direita. Dividindo a sequência ordenada em cinco partes, cada uma ficará com 20% de seus elementos. Os elementos que separam este grupo são chamados de quintis. Assim, o primeiro quintil, indicado por 1K , separa

a sequência ordenada, deixando à sua esquerda 20% de seus elementos e à sua direita 80% de seus valores. De modo análogo são definidos os outros quintis. Se a sequência for dividida em dez partes, cada uma ficará com 10% de seus valores. Os elementos que separam estes valores são chamados de decis. Assim o primeiro decil, 1D , separa a sequência ordenada,

deixando à sua esquerda 10% dos valores e à sua direita 90%. Se dividir a sequência em 100 partes, cada uma ficará com 1% dos elementos. Os elementos que separam estes grupos são chamados de centis ou percentis.. Assim o primeiro percentil, indicado por 1P , separa

a sequência ordenada deixando 1% de seus valores à esquerda e 99% à sua direita. De modo análogo são definidos os outros percentis.

Deve-se notar que o 4Q , 5P , 10D e 100P são elementos que deixam à sua esquerda 100% dos valores da

sequência ordenada e correspondem diretamente ao último valor da sequência. Além disso, observando que os quartis, decis e os decis são múltiplos dos percentis, então basta estabelecer a fórmula de cálculo de percentis, pois todas as outras medidas podem ser identificadas como percentis. Desta forma:

753

502

251

PQ

PQ

PQ

804

603

402

201

PK

PK

PK

PK

909

808

707

606

505

404

303

202

101

PD

PD

PD

PD

PD

PD

PD

PD

PD

3.6.1. CÁLCULO DAS MEDIDAS SEPARATRIZES PARA DADOS BRUTOS OU ROL Deve-se ordenar os elementos, caso sejam dados brutos obtendo o rol. Identifica-se a medida que se quer

obter com o percentil correspondente, iP . Calcula-se %i de n , ou seja:

100

nirolnoipercentildoPosição

n é o número de elementos

Em seguida, identifica-se o elemento que ocupa esta posição. Se 100

ni for um número inteiro, então iP

que está-se procurando identificar é um dos elementos da sequência ordenada. Caso contrário, isto significa que

o iP é um elemento intermediário entre os elementos que ocupam as posições aproximadas, sendo a média

destes valores.

Page 25: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 25

Exemplos 10) Calcule o 1Q da sequência X: 2; 5; 8; 5; 5; 10; 1; 12; 12; 11; 13; 15.

11) Calcule o 3K da sequência X: 2; 8; 7,5; 6; 10; 12; 2; 9.

3.6.2. CÁLCULO DAS MEDIDAS SEPARATRIZES PARA VARIÁVEL DISCRETA Se os dados estão apresentados na forma de uma variável discreta, eles já estão naturalmente ordenados.

Sendo assim, identifica-se a medida que se quer obter com o percentil correspondente, iP . Calcula-se %i de n ,

ou seja:

100

nisérienapercentildoPosição

Em seguida utiliza-se a frequência cumulada da série para identificar o elemento que ocupa esta posição. Exemplo 12) Calcule o 4D para a série:

ix if iF

2 3 4 5 5 8 7 6 10 2

3.6.3. CÁLCULO DAS MEDIDAS SEPARATRIZES PARA VARIÁVEL CONTÍNUA Se os dados estão apresentados na forma de uma variável contínua, eles já estão naturalmente ordenados e o número de elementos da série é n . Obtém-se uma fórmula geral para o cálculo dos percentis através da generalização da fórmula para o cálculo da mediana:

iac

iii F

ni

f

hLP

100inf

Exemplo

13) Calcule 3Q da série abaixo.

Classe Int. Classe

if iF

1 0-10 16 2 10-20 18 3 20-30 24 4 30-40 35 5 40-50 12

Page 26: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 26

3.7. MEDIDAS DE ASSIMETRIA Diz-se que uma distribuição é simétrica quando MoMdx . Se isto de fato ocorrer, a curva de frequência tem a característica gráfica apresentada na Figura 3.4. Se uma distribuição não é simétrica, será classificada como assimétrica, podendo ser positiva Fig. 3.5.a, e negativa 3.5.b.

Figura 3.4. Distribuição de frequência simétrica.

(a) (b)

Figura 3.5. (a) Distribuição de frequência assimétrica positiva; (b) Distribuição de frequência assimétrica negativa.

Pode-se calcular a assimetria de uma curva utilizando o Coeficiente de Pearson, dado por:

s

MoxAs

Se 1As então a distribuição é assimétrica negativa forte. Se 01 As então a distribuição é assimétrica negativa fraca Se 0As então a distribuição é simétrica. Se 10 As então a distribuição é assimétrica positiva fraca Se 1As então a distribuição é assimétrica positiva forte. Exemplo 14) Classifique quanto a assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.

ix if ii fx ii fxx 2

1 2 2 10 3 6 4 4 5 2 6 1

Page 27: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 27

3.8. CURTOSE Observando os valores de uma série em torno de sua moda, pode-se observar três situações especiais: 1o Caso: Os dados são fortemente concentrados em torno da sua moda, o que faria a curva de frequência ser bastante afilada. Este tipo de curva é classificada como Leptocúrtica. 2o Caso: Os dados são razoavelmente concentrados em torno da moda, o que faria a curva de frequência ser razoavelmente afilada, Este tipo de curva é classificada como Mesocúrtica. 3o Caso: Os dados estão fracamente concentrados em torno da moda, o que faria a curva de frequência ser fracamente afilada, ou bastante achatada em sua área central. Este tipo de curva é classificada como platicúrtica.

Para classificar uma distribuição quanto a sua curtose, pode-se utilizar o coeficiente de curtose dados por:

314

4

s

n

fxx

K

ii

Se 0K a distribuição é mesocúrtica. Se 0K a distribuição é leptocúrtica. Se 0K a distribuição é platicúrtica. Para variáveis aleatórias contínuas trocar xi por mi. Exemplo 15) Classifique quanto à curtose, a distribuição abaixo:

Classe Int. Classe if im ii fm ii fxm 2 ii fxm 4

1 3-5 1 2 5-7 2 3 7-9 13 4 9-11 3 5 11-13 1

Page 28: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 28

4a LISTA DE EXERCÍCIOS

1) Uma empresa produz caixas de papelão para embalagens e afirma que o número de defeitos por caixa se distribui conforme a tabela abaixo:

Número de Defeitos

Número de Caixas

0 32 1 28 2 11 3 4 4 3 5 1

Pede-se: a) As distribuições de frequências relativas e acumuladas. b) A porcentagem de caixas com dois defeitos, com menos três defeitos e com mais que três defeitos. c) Amplitude total. d) O histograma. e) O número médio de defeitos por caixa. f) O número mediano de defeitos por caixa. g) A moda. h) A variância e o desvio padrão. i) 9061031 ,,, PeDPQQ .

j) O percentual de elementos da série situados entre 1Q e 4K .

k) Classifique quanto a assimetria e curtose.

Page 29: APOSTILA DE ESTATÍSTICA BÁSICA - Castela · APOSTILA DE ESTATÍSTICA BÁSICA Parte 1 Prof. Msc. Jorge Wilson Pereira da Silva . Estatística Básica 2 SUMÁRIO Capítulo 1. Conceitos

Estatística Básica 29

2) Uma amostra aleatória de 250 residências de famílias de classe média, com dois filhos, revelou a seguinte distribuição do consumo mensal de energia elétrica.

Classe Consumo

Mensal (kWh)

Número de

Famílias

1 0-50 2 2 50-100 15 3 100-150 32 4 47 5 50 6 80 7 24

Pede-se: a) As distribuições de frequências relativas e acumuladas. b) A porcentagem de famílias com consumo mensal maior ou igual a 200 e menor que 250kWh. c) A porcentagem de famílias com consumo mensal menor que 200kWh. d) A porcentagem de famílias com consumo mensal maior ou igual a 250kWh. e) A amplitude total f) O histograma. g) O consumo médio por residência. h) O consumo mediano. i) A moda de Pearson. j) A variância e o desvio padrão. k) 9061031 ,,, PeDPQQ .

l) O percentual de famílias classificadas 1Q e 4K .

m) Classifique quanto a assimetria e curtose.