IPE - Aula 1 - Data 15-09-2015.pdf

Embed Size (px)

Citation preview

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    1/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 1

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    2/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 2

    A P R E S E N T A Ç Ã O :

    Prof.: EWERTON SANCHES MORAES

    Graduação em Estatística pela Faculdade e Ciência e Tecnologia / UNESP

    Curso : Introdução à Probabilidade e Estatística

    Departamento Responsável : Laboratório de Engenharia de Produção / LEPROD

    Carga Horária: 68 horas/aula e Créditos: 4

    Sistema de Avaliação: (P1 + P2)/2= N (Nota). Se N

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    3/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 3

    BIBLIOGRAFIA

    1. BUSSAB.W.O. ,Estatística Básica serie de Métodos Quantitativos V. 3. Atual

    Editora. São Paulo, 1997.

    2. MORETIN P. A. ,A Introdução a Estatística para Ciência Exata. Atual Editora.

    3. LAPPONI J.C. ,Estatística usando Excel. Lapponi Editora, 2000.

    4. MEYER P.L. ,Probabilidade Aplicações a Estatística. Editora LTC.

    5. SPIEGEL M. R. ,Probabilidade e Estatística. Makron Books.

    6. LIPZCHUTZ S. ,Probabilidade. Makron Books.

    7. Montgomery, D.C. ; Runger, G.C., John Willey and Sons, “Applied Statistics And

    Probability for Engineers”, New York, 1994

    8. Pedro Luiz de Oliveira Costa Neto , Estatística.

    9. Bhattacharyya – Johnson, “Statistics: Principles and Methods”,.

    10. Bethe – Duran – Bullion, “Statistical Methods for engineers and scientists”,

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    4/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 4

    A palavra estatística é do latim e significa “estado”. Este termo provém do

    primeiro uso da estatística e tinha como função o registro de dados (nº de habitantesda população, nº de casamentos...) e a elaboração de tabelas e gráficos paradescrever resumidamente um determinado país em números.

    Passado muito tempo a estatística evoluiu, tornando-se uma ampla e

    complexa ciência, tirando conclusões sobre o conjunto todo a partir de amostrasrepresentativas.

     A arte de torturar os números

    até que eles confessem!

    Uma boa definição de estatística é a de ser um conjunto de métodosespecialmente apropriados à coleta, à apresentação (organização, resumo edescrição), à análise e à interpretação de dados de observação, tendo como objetivo

    a compreensão de uma realidade específica para a tomada da decisão.

    Definição ESTATÍSTICA

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    5/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 5

    Mais precisamente a estatística se preocupa com:

    1. A coleta, a organização, a sintetização e a apresentação de dados;

    2. A medição da variação nos dados;

    3. A estimativa dos parâmetros da população e a determinação da precisão dasestimativas;

    4. A aplicação dos testes de hipótese em relação aos parâmetros;

    5. A análise da relação entre duas ou mais variáveis.

    A estatística trabalha com dois conjuntos de dados: o

    universo e a

    amostra. Apesarde a estatística se preocupar em obter informações sobre a população,dificilmente ela estuda todos os componentes da mesma (censo).

    Definição ESTATÍSTICA

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    6/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 6

    Estatística experimental: é a parte que fornece os métodos de análise einterpretação dos resultados dos experimentos.

    Obs. Experimento é uma pesquisa de forma ordenadae controlada que visa gerar informações, obtendo

    novos dados ou confirmações para hipóteses jáexistentes.

    Definição ESTATÍSTICA

    A estatística pode ser dividida em duas:

    Estatística descritiva: é a parte que procura os melhores métodos para coletar,ordenar e sumarizar os dados dos experimentos.

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    7/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 7

    Variáveis de dados qualitativos e quantitativos;variáveis discretas e contínuas.

    Grandes áreas da Estatística

    Para fins de apresentação, é usual se dividir a estatística em três

    grandes áreas, embora não se trate de ramos isolados:

    • Estatística Descritiva e Amostragem – Conjunto de técnicas que objetivam

    coletar, organizar, apresentar, analisar e sintetizar os dados numéricos de uma

    população, ou amostra;

    • Estatística Inferencial – Processo de se obter informações sobre uma população

    a partir de resultados observados na amostra;

    • Probabilidade - Modelos matemáticos que explicam os fenômenos estudados

    pela Estatística em condições normais de experimentação.

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    8/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 8

    Em estatística, utilizamos extensamente os termos: população, amostra,

    censo, parâmetros, estatística, dados discretos, dados contínuos, dados

    quantitativos e dados qualitativos; que estaremos definindo abaixo para maior

    compreensão.

    • População: é uma coleção completa de todos os elementos a serem estudados.

    • Amostra: é uma subcoleção de elementos extraídos de uma população.

    • Censo: é uma coleção de dados relativos a todos os elementos de uma

    população.

    • Parâmetros: é uma medida numérica que descreve uma característica de uma

    população.

    • Estatística: é uma medida numérica que descreve uma característica de uma

    amostra.

    Variáveis de dados qualitativos e quantitativos;variáveis discretas e contínuas.

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    9/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 9

    • Dados qualitativos: podem ser separados em diferentes categorias que se

    distinguem por alguma característica não-numérica.

    Variáveis de dados qualitativos e quantitativos;variáveis discretas e contínuas.

    • Dados contínuos: resultam de um número infinito de valores possíveis que podem

    ser associados a pontos em uma escala contínua de tal maneira que não haja

    lacunas.

    • Dados discretos: resultam de um conjunto finito de valores possíveis, ou de um

    conjunto enumerável de valores.

    • Dados quantitativos: consistem em números que representam contagens ou

    medidas.

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    10/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 10

    Variáveis de dados qualitativos

    Variáveis Qualitativas - Nominais e Ordinais

    São aquelas que se baseiam em qualidades e não podem ser mensuradasnumericamente. Uma variável é qualitativa quando seus possíveis valores sãocategorias.

    Variável Qualitativa Ordinal: São aquelas que podem ser colocadas em ordem, por exemplo,a classe social (A,B,C,D, ou E).

    Variável Qualitativa Nominal: São aquelas que não podem ser hierarquizadas ou

    ordenadas,não tem nenhuma ordem de variações, como a cor dos olhos, o local denascimento, sexo, carreira, região onde mora.

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    11/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 11

    Variáveis de dados qualitativos

    Iniciaremos essa apresentação com os dados de natureza qualitativa, que são osmais fáceis de tratar do ponto de vista da análise descritiva.

    Exemplo: Experimento de observação de Ursos numa determinada região dos EUA

    No exemplo dos ursos, uma das duas variáveis qualitativas presentes é o sexo dos

    animais.

    Para organizar os dados provenientes de uma variável qualitativa, é usual fazer umatabela de frequências, como a Tabela 1, onde estão apresentadas as freqüenciascom que ocorrem cada um dos sexos no total dos 97 ursos observados.

    Cada categoria da variável sexo (feminino, masculino) é representada numa linha databela.

    http://leg.ufpr.br/~silvia/CE055/node10.htmlhttp://leg.ufpr.br/~silvia/CE055/node10.html

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    12/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 12

    Variáveis de dados qualitativos

    Há uma coluna com as contagens de ursos em cada categoria (frequência absoluta)

    e outra com os percentuais que essas contagens representam no total de ursos(frequência relativa).

    Esse tipo de tabela representa a distribuição de frequências dos ursos segundo avariável sexo.

    Como a variável sexo é qualitativa nominal, isto é, não há uma ordem natural emsuas categorias, a ordem das linhas da tabela pode ser qualquer uma.

    Tabela 1: Distribuição de freqüências dos ursos segundo sexo.

    SexoFrequência

     Absoluta

    Frequência

    Relativa (%)Feminino 35 36,1

    Masculino 62 63,9

    Total 97 100,0

    Quando a variáveltabelada for dotipo qualitativaordinal, as linhas da

    tabela defrequências devemser dispostas naordem existentepara as categorias.

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    13/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 13

    Variáveis de dados qualitativos

    A Tabela 2 mostra a distribuição de frequências dos ursos segundo o mês deobservação, que é uma variável qualitativa ordinal.

    Nesse caso, podemos acrescentar mais duas colunas com as frequênciasacumuladas (absoluta e relativa), que mostram, para cada mês, a frequência de

    ursos observados até aquele mês.

    Por exemplo, até o mês de julho, foram observados 31 ursos, o que representa32% do total de cursos estudados.

    http://leg.ufpr.br/~silvia/CE055/node10.htmlhttp://leg.ufpr.br/~silvia/CE055/node10.html

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    14/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 14

    Variáveis de dados qualitativos

    Tabela 2: Distribuição de frequências dos ursos segundo mês de observação.

    Mês de

    Observação

    Frequências Simples Frequências Acumuladas

    Frequência

    Absoluta

    Frequência

    Relativa (%)

    Frequência

    Absoluta

    Acumulada

    Frequência

    Relativa

    Acumulada

    Abril 8 8,3 8 8,3

    Maio 6 6,2 14 14,5

    Junho 6 6,2 20 20,7

    Julho 11 11,3 31 32,0

    Agosto 23 23,7 54 55,7

    Setembro 20 20,6 74 76,3Outubro 14 14,4 88 90,7

    Novembro 9 9,3 97 100,0

    Total 97 100,0 --- ---

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    15/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 15

    Variáveis Quantitativas

    São aquelas que são numericamente mensuráveis, ou seja, que seus possíveisvalores podem ser numéricos ou de contagem.

    Variáveis de dados quantitativos:discretas e contínuas.

    Variável Quantitativa Discreta: o conjunto de resultados possíveis podem serfinito ou enumerável. Exemplo: número de filhos, alunos numa escola e etc.

    Estas ainda se subdividem em:

    Variável Quantitativa Contínua: os valores formam um intervalo ou união denúmeros reais. Exemplo: peso, altura, pressão sistólica, nível de açúcar nosangue.

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    16/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 16

    Tabela 3: Distribuição de frequências do número de filhos por

    família em uma localidade (25 lares).

    Número defilhos

    FrequênciaAbsoluta

    FrequênciaRelativa (%)

    Freq. RelativaAcumulada (%)

    0 1 4,0 4,0

    1 4 16,0 20,0

    2 10 40,0 60,0

    3 6 24,0 84,0

    4 2 8,0 92,0

    5 2 8,0 100,0

    Total 25 100 ---

    A Tabela 3 apresenta a distribuição de frequências do número de

    filhos por família em uma localidade, que, nesse caso, assumiu apenas seisvalores distintos.

    Analisando aTabela 3, podemosperceber que asfamílias mais

    frequentes são as dedois filhos (40%),seguida pelasfamílias de trêsfilhos. Apenas 16%

    das famílias têm maisde três filhos, massão ainda maiscomuns do quefamílias sem filhos.

    Variáveis de dados quantitativos: discretas

    http://leg.ufpr.br/~silvia/CE055/node11.htmlhttp://leg.ufpr.br/~silvia/CE055/node11.htmlhttp://leg.ufpr.br/~silvia/CE055/node11.htmlhttp://leg.ufpr.br/~silvia/CE055/node11.html

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    17/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 17

    A Figura 1 mostra a representação gráfica da Tabela 3 no gráfico à esquerda e a distribuição defrequências do número de filhos por família na localidade B no gráfico à direita.

    Como o número de famílias estudadas em cada localidade é diferente, a frequência utilizadaem ambos os gráficos foi a relativa (em porcentagem), tornando os dois gráficos comparáveis.

    Comparando os dois gráficos, notamos que a localidade B tende a ter famílias menosnumerosas do que a localidade A. A maior parte das famílias da localidade B (cerca de 70%)têm um ou nenhum filho.

    Figura 1: Distribuição de frequências do número de filhos por família na localidade A (25 lares) e B (36 lares).

    Variáveis de dados quantitativos: discretas

    http://leg.ufpr.br/~silvia/CE055/node11.htmlhttp://leg.ufpr.br/~silvia/CE055/node11.html

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    18/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 18

    Quando a variável em estudo é do tipo contínua, que assume muitos valoresdistintos, o agrupamento dos dados em classes será sempre necessário naconstrução das tabelas de frequências.

    A Tabela 4 apresenta a distribuição de frequências para o peso dos ursos machos.

    A construção das classes da tabela de frequências é feita de modo a facilitar ainterpretação da distribuição de frequências, como discutido anteriormente.Geralmente, usamos tamanhos e limites de classe múltiplos de 5 ou 10.

    Isso ocorre porque estamos acostumados a pensar no nosso sistema numérico,

    que é o decimal. Porém, nada nos impede de construirmos classes de outrostamanhos (inteiros ou fracionários) desde que isso facilite nossa visualização einterpretação da distribuição de frequências da variável em estudo.

    Variáveis de dados quantitativos: contínuas

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    19/5928/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 19

    Tabela 4: Distribuição de frequências dos ursos machos segundo peso

    Peso (kg) FrequênciaAbsoluta

    FrequênciaRelativa (%)

    Freq. Abs.Acumulada

    Freq. Rel.Acumulada (%)

    0 - 2 5 3 4,8 3 4,8

    26 - 50 11 17,7 14 22,6

    51 - 75 15 24,2 29 46,8

    76 - 100 11 17,7 40 64,5

    101 - 125 3 4,8 43 69,4

    126 - 150 4 6,5 47 75,8

    151 - 175 8 12,9 55 88,7

    176 - 200 5 8,1 60 96,8

    201 - 225 1 1,6 61 98,4

    226 - 250 1 1,6 62 100,0

    Total 62 100,0 - -

    Variáveis de dados quantitativos: contínuas

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    20/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 20

    A representação gráfica da distribuição de frequências de uma variável contínua é

    feita através de um gráfico chamado histograma, mostrado na Figura 2.

    O histograma nada mais é do que o gráfico de barras verticais, porém construídocom as barras unidas, devido ao caráter contínuo dos valores da variável.

    Figura 2: Histograma para a distribuição de frequências (absolutas e relativas) de pesos de ursos machos

    Variáveis de dados quantitativos: contínuas

    http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    21/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 21

    Os histogramas da Figura 2 têm a mesma forma, apesar de serem construídosusando as frequências absolutas e relativas, respectivamente.

    O objetivo dessas figuras é mostrar que a escolha do tipo de frequência a ser usada nãomuda a forma da distribuição. Entretanto, o uso da frequência relativa torna o histogramacomparável a outros histogramas, mesmo que os conjuntos de dados tenham tamanhos

    diferentes (desde a mesma escala seja usada!)

    Analisando o histograma para o peso dos ursos machos, podemos perceber que há doisgrupos de ursos: os mais leves, com pesos em torno de 50 a 75 Kg, e os mais pesados, compesos em torno de 150 a 175 Kg.

    Essa divisão pode ser devida a uma outra característica dos ursos, como idades ou hábitosalimentares diferentes, por exemplo.

    Variáveis de dados quantitativos: contínuas

    http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    22/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 22

    A Tabela 5 apresenta a distribuição de frequências para o peso dos ursos fêmeas,representada graficamente pelo histograma à esquerda na Figura 3.

    Apesar de não haver, neste conjunto de dados, fêmeas com peso maior de que175 Kg, as três últimas classes foram mantidas para que pudéssemos compararmachos e fêmeas quanto ao peso.

    Variáveis de dados quantitativos: contínuas

    http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    23/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 23

    Tabela 5: Distribuição de frequências dos ursos fêmeas segundo peso.

    Peso (kg)Frequência

    Absoluta

    Frequência

    Relativa (%)

    Freq. Abs.

    Acumulada

    Freq. Rel.

    Acumulada (%)

    0 - 25 3 8,6 3 8,6

    26 - 50 5 14,3 8 22,9

    51 - 75 18 51,4 26 74,376 - 100 5 14,3 31 88,6

    101 - 125 2 5,7 33 94,3

    126 - 150 1 2,9 34 97,1

    151 - 175 1 2,9 35 100,0

    175 - 200 0 0 35 100,0

    201 - 225 0 0 35 100,0

    226 - 250 0 0 35 100,0

    Total 35 100,0 - -

    Variáveis de dados quantitativos: contínuas

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    24/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 24

    A Figura 3 também mostra o histograma para o peso dos ursos machos (à direita).

    Note que ele tem a mesma forma dos histogramas da Figura 2, porém com asbarras mais achatadas, devido à mudança de escala no eixo vertical para torná-locomparável ao histograma das fêmeas.

    Comparando as distribuições dos pesos dos ursos machos e fêmeas, podemosconcluir que as fêmeas são, em geral, menos pesadas do que os machos,distribuindo-se quase simetricamente em torno da classe de 50 a 75 Kg . O pesodas fêmeas é mais homogêneo (valores mais próximos entre si) do que o peso dosursos machos.

    Variáveis de dados quantitativos: contínuas

    http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    25/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 25

    Figura 3: Histograma para a distribuição de frequências de pesos de ursos fêmeas (esquerda) e machos (direita)

    Variáveis de dados quantitativos: contínuas

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    26/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 26

    Muitas vezes, a análise da distribuição de frequências acumuladas é mais

    interessante do que a de frequências simples, representada pelo histograma.

    O gráfico usado na representação gráfica da distribuição de frequências acumuladasde uma variável contínua é a ogiva, apresentada na Figura 4.

    Para a construção da ogiva, são usadas as frequências acumuladas (absolutas ourelativas) no eixo vertical e os limites superiores de classe no eixo horizontal.

    Variáveis de dados quantitativos: contínuas

    http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    27/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 27

    Figura 4: Ogivas para a distribuição de frequências de

     pesos de ursos machos e fêmeas

    O primeiro ponto da ogiva éformado pelo limite inferior daprimeira classe e o valor zero,indicando que abaixo do limiteinferior da primeira classe nãoexistem observações. Daí pordiante, são usados os limites

    superiores das classes e suasrespectivas frequênciasacumuladas, até a última classe,que acumula todas asobservações. Assim, uma ogiva

    deve começar no valor zero e, sefor construída com asfrequências relativasacumuladas, terminar com ovalor 100.

    Variáveis de dados quantitativos: contínuas

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    28/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 28

    A ogiva permite que sejam respondidas perguntas do tipo:

    a) Qual o percentual de ursos têm peso de até 125 Kg?Na Figura 5(a), traçamos uma linha vertical partindo do ponto 120 kg

    até cruzar com cada ogiva (fêmeas e machos). A partir deste ponto decruzamento, traçamos uma linha horizontal até o eixo das frequênciasacumuladas, encontrando o valor de 70% para os machos e 95% para as

    fêmeas. Assim, 95% das fêmeas têm até 125 kg, enquanto 70% dos machostêm até 125 kg. É o mesmo que dizer que apenas 5% das fêmeas pesam maisque 125 kg, enquanto 30% dos machos pesam mais que 125 kg.

    b) Qual o valor do peso que deixa abaixo (e acima) dele 50% dos ursos?

    Na Figura 5(b), traçamos uma linha horizontal partindo da frequênciaacumulada de 50% até encontrar as duas ogivas. A partir destes pontos deencontro, traçamos uma linha vertical até o eixo do valores de peso,encontrando o valor de 80 kg para os machos e 65 kg para as fêmeas.

    Variáveis de dados quantitativos: contínuas

    http://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.htmlhttp://leg.ufpr.br/~silvia/CE055/node12.html

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    29/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 29

    Figura 5: Ogivas para a distribuição de frequências de pesos de ursos machos e fêmeas

    Assim, metade dos machos pesam até 80 kg (e metade pesam mais que80 kg), enquanto metade das fêmeas pesam até 65 kg.

    Variáveis de dados quantitativos: contínuas

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    30/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 30

    CONSTRUINDO TABELAS DE FREQUÊNCIAS E GRÁFICOS

    Uma das formas de organizar e resumir a informação contida emdados observados é por meio de tabela de frequências e gráficos.

    Tabela de frequência: relaciona categorias (ou classes) de valores, juntamente com contagem (ou frequências) do número devalores que se enquadram em cada categoria ou classe.

    1. Variáveis qualitativas: Podemos construir tabela de frequênciaque os quantificam por categoria de classificação e suarepresentação gráfica é mediante a construção de histograma,gráfico de barras, gráfico setorial ou em forma de pizza.

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    31/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 31

    Uma tabela quemostra classes ouintervalos de dados

    com uma contagemdo número deentradas em cadaclasse

    A frequência, f, deuma classe é onúmero de entradasde dados na classe

    Classe Frequência, f 

    1 – 5 5

    6 – 10 8

    11 – 15 6

    16 – 20 8

    21 – 25 526 – 30 4

    Limite inferior daclasse

    Limite superior daclasse

    Tamanho daclasse 6 – 1 = 5

    DISTRIBUIÇÃO DE FREQUÊNCIA

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    32/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 32

    Exemplo: construindo uma distribuição de frequência

    A amostra seguinte lista o número de minutos que 50usuários da internet passaram conectados durante asessão mais recente. Construa uma distribuição de

    frequência para as sete classes.50 40 41 17 11 7 22 44 28 21 19 23 37 51 54 42 8641 78 56 72 56 17 7 69 30 80 56 29 33 46 31 39 20

    18 29 34 59 73 77 36 39 30 62 54 67 39 31 53 44

    1. Número de classes = 7 (dados)2. Encontre o tamanho da classe

    max min 86 711.29

    #classes 7

    Arredondando paracima: 12

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    33/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 33

    Escolha o número de classes (k)Não existe uma regra universal para a escolha do número de

    classes em um histograma. A sugestão é que seja usada a

    seguinte tabela:

    DICA

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    34/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 34

    Limitemínimo

    Limitemáximo

    7Tamanhoda classe =

    12

    3. Use 7 (valor mínimo)como o primeiro limitemínimo. Adicione otamanho da classe, 12,

     para definir o limitemínimo da próximaclasse.

    7 + 12 = 19

    19

    31

    43

    55

    6779

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    35/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 35

    O limite máximo daprimeira classe é 18 (um amenos que o limitemínimo da segunda

    classe).Some o tamanho daclasse, 12, para definir olimite máximo da próxima

    classe.18 + 12 = 30

    Limitemínimo

    Limitemáximo

    7

    1931

    43

    55

    67

    79

    Tamanho daclasse = 12

    30

    42

    54

    66

    78

    90

    18

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    36/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 36

    4. Faça um registro para cada entrada de dado na fileira da

    classe apropriada.5. Conte os registros para encontrar a frequência total f para

    cada classe.

    Classe Registro Frequência, f  

    7  – 18 IIII I 6

    19  – 30 IIII IIII 10

    31  – 42 IIII IIII III 13

    43  – 54 IIII III 8

    55  – 66 IIII 5

    67  – 78 IIII I 6

    79  – 90 II 2

    Σ f  = 50

    Tabela de freqüência

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    37/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 37

    Ponto médio de uma classe

    Classe Ponto médio Frequência, f  

    7 – 18 6

    19 – 30 10

    31 – 42 13

    7 1812.5

    2

    19 3024.5

    2

    31 4236.5

    2

    Tamanho da classe = 12

    (Limite mínimo da classe) + (Limite máximo da classe)

    2

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    38/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 38

    Frequência relativa de uma classePorção da porcentagem dos dados que se encaixaem um classe em particular

    Classe Frequência, f   Frequência relativa

    7 – 18 6

    19 – 30 10

    31 – 42 13

    60.12

    50

    100.20

    50

    130.26

    50

    Frequência relativa =

    Frequência da classe

    Tamanho da amostragem   n  f  

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    39/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 39

    Frequência acumulada de uma classeA soma das frequências daquela classe e de

    todas as classes anteriores.

    Classe Frequência, f   Frequência acumulada

    7  – 18 6

    19  – 30 10

    31  – 42 13

    +

    +

    6

    16

    29

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    40/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 40

    Classe Frequência, f  

    Ponto

    médio

    Frequência

    relativa

    Frequência

    acumulada

    7 – 18 6 12.5 0.12 6

    19 – 30 10 24.5 0.20 16

    31 – 

    42 13 36.5 0.26 2943 – 54 8 48.5 0.16 37

    55 – 66 5 60.5 0.10 42

    67 – 78 6 72.5 0.12 48

    79 – 90 2 84.5 0.04 50

    Σ f  = 50

    Tabela de freqüência

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    41/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 41

    Diagrama de barras para a variável

    grau de instrução

    33,33%

    50,00%

    16,70%

    0,00%

    10,00%

    20,00%

    30,00%

    40,00%

    50,00%

    60,00%

    1o Grau 2o Grau Superior  

    Representação gráfica de variáveis qualitativas

    • Gráfico de Barras

    • Diagrama circular, de setores ou em forma de “pizza”

    Diagrama circular para a variável grau de

    instrução

    1o Grau

    33%

    2o Grau

    50%

    Superior 

    17%

    33%

    50%

    17%

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    42/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 42

    André Michel Guerry nasceu em 1802 na França, era um advogado eestudioso da estatística.

    Os Histogramas foram apresentados pela primeira vez por A. M.GUERRY, em 1833, para descrever sua análise estatísticas sobre crimescontra a população em Paris. Faleceu em 1866.

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    43/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 43

    Histograma de frequência Um gráfico de barras que representa a distribuição da frequência

    O eixo horizontal é quantitativo e mede os valores dos dados

    O eixo vertical mede as frequências das classes

    Barras consecutivas precisam se tocar

     Valores dos dados

           F     r     e     q     u       ê     n

         c       i     a

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    44/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 44

    Na estatística um histograma é uma representaçãográfica da distribuição de frequências de uma massa demedições, normalmente um gráfico de barras verticais.

    Método gráfico para representar dispersão (variação) deum conjunto de dados.

    É aconselhável que o número de dados (n) seja superior a30 para que tenhamos um histograma representativo.

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    45/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 45

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    46/59

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    47/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 47

    ClasseFronteiras de

    classesFrequência,

    f  

    7 – 18 6.5  – 18.5 6

    19 – 30 18.5  – 30.5 10

    31 – 42 30.5  – 42.5 13

    43 – 54 42.5  – 54.5 8

    55 – 66 54.5  – 66.5 5

    67 – 

    78 66.5  – 78.5 679 – 90 78.5  – 90.5 2

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    48/59

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    49/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 49

    Solução: histograma de frequência

    (usando pontos médios)Uso de Internet

            F      r      e      q      u         ê      n      c        i      a

    Tempo on-line (em minutos)

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    50/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 50

    6.5 18.5 30.5 42.5 54.5 66.5 78.5 90.5

    É visível que mais da metade dos assinantes passaram entre 19 e 54minutos na Internet em sua sessão mais recente.

    Uso de Internet

            F      r      e      q      u         ê      n      c        i      a

    Tempo on-line (em minutos)

    Solução: histograma de

    frequência (usando fronteiras de classes)

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    51/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 51

    Histograma de frequência relativaTem o mesmo formato e eixo horizontal que ohistograma de frequência correspondente

    O eixo vertical mede as frequências relativas e nãoas frequências

    Valores dos dados

           F     r     e     q     u       ê     n

         c       i     a

         r     e       l     a      t       i     v

         a

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    52/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 52

    Construa um histograma de frequência relativa paraa distribuição da frequência do uso de Internet.

    Classe

    Fronteiras de

    classes

    Frequência,

    f  

    Frequênci

    a relativa

    7 – 18 6.5 – 18.5 6 0.12

    19 – 30 18.5 – 30.5 10 0.20

    31 – 42 30.5 – 42.5 13 0.26

    43 – 54 42.5 – 54.5 8 0.16

    55 – 66 54.5 – 66.5 5 0.10

    67 – 78 66.5 – 78.5 6 0.12

    79 – 90 78.5 – 90.5 2 0.04

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    53/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 53

    6.5 18.5 30.5 42.5 54.5 66.5 78.5 90.5

    A partir do gráfico, pode-se perceber que 20% dos assinantes

    de Internet passaram entre 18,5 minutos e 30,5 minutos

    conectados.

    Uso de Internet

            F      r      e      q

          u         ê      n      c        i      a

    Tempo on-line (em minutos)

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    54/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 54

    Histograma

    Bases iguais

    Construir um retângulo para cada classe, com base igual aotamanho da classe e altura proporcional à frequência da classe(f).

    Agrupar os dados em intervalos de classes(distribuição de frequências)

    Bases diferentes

    Construir um retângulo para cada classe, com base igual ao tamanhoda classe e área do retângulo igual a frequência relativa da classe(fr).A altura será dada por

    h = fr/base (densidade de frequência).

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    55/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 55

    Classe de altura f fr

    60,25 ⊢ 61,75

    61,75 ⊢ 63,25

    63,25 ⊢ 64,7564,75 ⊢ 66,25

    66,25 ⊢ 67,75

    67,75 ⊢ 69,25

    69,25 ⊢ 70,75

    70,75 ⊢ 72,2572,25 ⊢ 73,75

    73,75 ⊢ 75,25

    Total

    1

    10

    213

    7

    20

    7

    159

    8

    92

    0,011

    0,109

    0,0220,141

    0,076

    0,217

    0,076

    0,1630,098

    0,087

    1

    Bases iguais

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    56/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 56

    Bases diferentes (Classes diferentes)

    Classes (meses) f fr h

    0 |- 3 140 0,28 0,093

    3 |- 12 100 0,20 0,022

    12 |-24 80 0,16 0,013

    24 |-60 180 0,36 0,010

    Total 500 1,00

    Distribuição das idades (em meses) de uma amostra de 500 criançasvacinadas

    0 3 12 24 60

    h0,10

    0,02

    0,04

    0,06

    0,08

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    57/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 57

    Um polígono de frequência é um gráfico que se realiza

    através da união dos pontos mais altos das colunas num

    histograma de frequência (que utiliza colunas verticais para

    mostrar as frequências).

    Polígono de Frequência

    Os polígonos de frequência para dados agrupados,

    por sua vez, constroem-se a partir da marca de classe que

    coincide com o ponto médio de cada coluna do histograma.

    Quando são representadas as frequências acumuladas deuma tabela de dados agrupados, obtém-se um histograma de

    frequências acumuladas, que permite dispor em diagrama o

    seu polígono correspondente.

    http://conceito.de/poligono-de-frequenciahttp://conceito.de/poligono-de-frequencia

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    58/59

    28/04/2015 Introdução à Probabilidade e Estatística – LEPROD/UENF 58

    Geralmente, os polígonos de frequência sãousados quando se pretende mostrar mais de uma distribuição

    ou a classificação cruzada de uma variável quantitativa

    contínua com uma qualitativa ou quantitativa discreta num

    mesmo gráfico.

    O ponto que tiver mais altura num polígono de

    frequência representa a maior frequência, ao passo que a

    área abaixo da curva inclui a totalidade dos dados existentes.

    Convém lembrar que a frequência é a repetição menor oumaior de uma ocorrência, ou a quantidade de vezes que um

    processo periódico se repete por unidade de tempo.

    http://conceito.de/poligono-de-frequenciahttp://conceito.de/poligono-de-frequencia

  • 8/18/2019 IPE - Aula 1 - Data 15-09-2015.pdf

    59/59