40
Qwertyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyuiopasd fghjklzxcvbnmqwertyuiopasdfghjklzx cvbnmqwertyuiopasdfghjklzxcvbnmq wertyuiopasdfghjklzxcv bnmqwertyuiopasdfghjklzxcvbnmqw ertyuiopasdfghjklzxcvbnmqwertyuio pasdfghjklzxcvbnmqwertyuiopasdfgh jklzxcvbnmqwertyuiopasdfghjklzxcv bnmqwertyuiopasdfghjklzxcvbnmqw ertyuiopasdfghjklzxcvbnmqwertyuio pasdfghjklzxcvbnmqwertyuiopasdfgh jklzxcvbnmqwertyuiopasdfghjklzxcv bnmqwertyuiopasdfghjklzxcvbnmqw ertyuiopasdfghjklzxcvbnmrtyuiopasd fghjklzxcvbnmqwertyuiopasdfghjklzx cvbnmqwertyuiopasdfghjklzxcvbnmq wertyuiopasdfghjklzxcvbnmqwertyui

Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Embed Size (px)

Citation preview

Page 1: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Qwertyuiopasdfghjklzxcvbnmqwerty

uiopasdfghjklzxcvbnmqwertyuiopasd

fghjklzxcvbnmqwertyuiopasdfghjklzx

cvbnmqwertyuiopasdfghjklzxcvbnmq

wertyuiopasdfghjklzxcv

bnmqwertyuiopasdfghjklzxcvbnmqw

ertyuiopasdfghjklzxcvbnmqwertyuio

pasdfghjklzxcvbnmqwertyuiopasdfgh

jklzxcvbnmqwertyuiopasdfghjklzxcv

bnmqwertyuiopasdfghjklzxcvbnmqw

ertyuiopasdfghjklzxcvbnmqwertyuio

pasdfghjklzxcvbnmqwertyuiopasdfgh

jklzxcvbnmqwertyuiopasdfghjklzxcv

bnmqwertyuiopasdfghjklzxcvbnmqw

ertyuiopasdfghjklzxcvbnmrtyuiopasd

fghjklzxcvbnmqwertyuiopasdfghjklzx

cvbnmqwertyuiopasdfghjklzxcvbnmq

wertyuiopasdfghjklzxcvbnmqwertyui

Page 2: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Conceitos O que é Estatística?

“A Estatística é um conjunto de métodos destinados à coleta, organização, resumo, apresentação e análise de dados de observação, bem como da tomada de decisões razoáveis baseadas em tais análises”. “A Estatística é um conjunto de processos ou técnicas empregadas na investigação e análise de fenômenos coletivos ou de massa”.

“A Estatística é a matemática aplicada aos dados de observação”.

Divisão da Estatística A Estatística divide-se em duas partes Geral e Aplicada:

Visa elaborar métodos gerais aplicáveis a todas as fases do estudo dos fenômenos de massa. A estatística

matemática é a parte da estatística geral que tem por finalidade o estudo das propriedades matemáticas dos

fenômenos de massa e a dedução e demonstração rigorosa dos procedimentos e fórmulas usadas. A estatística geral

ainda pode ser dividida em dois grandes campos: estatística descritiva e estatística inferencial.

A estatística descritiva trata da coleta, organização, classificação, apresentação e descrição dos dados

observados. Refere-se à maneira de apresentar um conjunto de dados em tabelas e gráficos e à maneira de resumir,

através de certas medidas (medidas descritivas), as informações contidas nestes dados.

A estatística inferencial (ou indutiva) visa tirar conclusões sobre a população a partir de amostras. Refere-se

à maneira de estabelecer conclusões para toda uma população quando se observar apenas parte desta população.

Envolve o cálculo de probabilidades para quantificar a incerteza existente em determinada situação.

Estatística aplicada

É todo o ramo do conhecimento científico que proceda, única ou principalmente, por intermédio da

metodologia estatística. Exemplos:

Biometria: ciência que trata da mensuração da vida e dos processos vitais, estatística aplicada no estudo das características físicas ou comportamentais dos seres vivos;

Demografia: ciência que estuda a dinâmica populacional humana, estatística aplicada no estudo dos diferentes aspectos de uma população;

Econometria: estatística aplicada no estudo da relação entre variáveis econômica;

Mecânica Estatística (ou física estatística): estatística aplicada á física, que estuda o comportamento de sistemas com elevado número de entidades constituintes a partir do comportamento destas entidades;

Page 3: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Sociometria: estatística aplicada no estudo de interações entre grupos, ou seja, é uma ciência que estuda a maneira como as pessoas vivem, sua cultura, opiniões e atitudes, assim como o relacionamento de uns com os outros;

Qualimetria: estatística aplicada à qualidade, geralmente relacionada à área industrial.

Geoestatística (ou estatística espacial): estatística aplicada à área da geografia, ou seja, estuda a distribuição estatística dos dados no espaço.

Conceitos Básicos

Antes de começarmos a trabalhar com estatística propriamente dita, é necessário conhecer alguns conceitos

básicos, a fim de evitar a utilização de termos errados e de análises equivocadas. Serão definidos conceitos de

população e amostra, censo e amostragem, variáveis e séries estatísticas.

População e Amostra

População (N) é o conjunto de todos os elementos relativos a um determinado fenômeno que possuem pelo

menos uma característica em comum. A população é o Universo (totalidade das observações) e pode ser finita ou

infinita.

Uma população finita é aquela que apresenta um número limitado de observações, possível de ser contado.

Exemplos: os habitantes de Francisco Beltrão, os estudantes da Unioeste, as residências no bairro vila nova,

pacientes internados em um hospital, quantidade de gado em uma propriedade.

Uma população infinita é aquela que apresenta um número ilimitado de observações que é impossível de se

contar e geralmente está associada a processos. Exemplos: quantidade de refrigerantes produzidos na fábrica da

Coca-Cola, número de parafusos produzidos em uma fábrica.

Amostra (n): É um subconjunto (ou uma parte) da população. Sempre será considerada finita. Pode ser ou

não representativa da população. Para que os métodos da estatística inferencial sejam válidos, a amostra deverá ser

representativa da população, ou seja, deve ser selecionada seguindo certos critérios (técnicas de amostragem,

cálculo do tamanho da amostra), de modo que ela represente adequadamente todas as características da

população.

Censo e Amostragem

Quando a pesquisa estatística é baseada nos dados de todos os elementos da população, dizemos que foi

realizado um censo. Portanto, censo é a coleta exaustiva de informações das N unidades populacionais. Nessas

Page 4: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

situações, não se utilizam técnicas de amostragem nem estatística inferencial, pois se sabe exatamente o valor

populacional da característica estudada, não sendo necessário estimá-la. Esse valor populacional é chamado de

parâmetro, e só é conhecido se for realizado um censo.

Quando a pesquisa estatística é baseada nos dados de uma parte da população, dizemos que foi realizada

uma amostragem. Portanto, amostragem é o processo de retirada de informações dos n elementos amostrais, o qual

deve seguir um método criterioso e adequado (técnicas de amostragem e cálculo do tamanho da amostra). Nessas

situações, a estatística inferencial é utilizada, pois não se sabe exatamente o valor populacional da característica

estudada, mas se tem uma estimativa para esse valor obtido pela amostra. Esse valor amostral é chamado de

estimativa, a qual depende da amostra que fez parte da pesquisa. Em geral, a maioria das pesquisas é feita por meio

de amostragem, pois o custo e o tempo de execução são menores do que no censo e é possível conseguir boas

estimativas para o parâmetro. Censos são utilizados geralmente quando a população é pequena ou quando se

requer que a precisão seja a maior possível.

Variáveis São as características observadas, geralmente representadas por um símbolo, sujeitas à variação quantitativa ou qualitativa, ou seja, que podem assumir um valor ou um atributo dentro de um conjunto valores ou atributos ou de um intervalo de valores. Se a variável assume somente um valor, então ela é uma constante. As variáveis podem ser classificadas em:

quantitativas numéricas (discretas ou contínuas)

qualitativas ou categorizadas (nominais ou ordinais). As variáveis quantitativas são resultados de uma contagem ou de uma medição, enquanto que as variáveis qualitativas são resultados de uma classificação ou de uma atribuição. Variáveis quantitativas discretas: são aquelas que podem assumir qualquer valor dentro de um conjunto de valores. Em geral, são resultados de uma contagem. Exemplo: idade, número de crianças numa escola, número de lápis Variáveis quantitativas contínuas: aquelas que podem assumir qualquer valor dentro de um intervalo de valores. Em geral, são resultados de uma medição. Exemplo: dosagens, comprimento, área, volume, altura, peso, temperatura

Page 5: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Variáveis qualitativas ordinais: Referem-se a uma variável que classifica os indivíduos de acordo com as categorias de uma características, as quais podem ser ordenadas. Os dados podem ser representados por qualquer coisa que denote uma ordenação (números, letras ou nomes). Exemplo: baixa, média, alta. Variáveis qualitativas nominais: são aquelas que envolvem frequência e não medidas. Nesse tipo de variável, os indivíduos são agrupados em categorias e conta-se a frequência com que ocorrem. Quando a variável nominal possui apenas duas categorias que não possuem nenhuma relação hierárquica entre si, chama-se dicotômica ou binária Exemplo: feminino/masculino, curado e não curado, grávida/ou não grávida, vivo/morto, abaixo de 60 anos de idade/acima de 60 anos de idade. Quando a variável nominal possui três ou mais categorias são chamadas politômicas ou polinomiais Exemplo: Sistema do grupo sanguíneos A B O em quatro categorias( A,B, AB e O),

Representação Tabular e Gráfica Os dados podem ser representados em formas de tabelas ou gráficos. Nessa seção, serão apresentados alguns tipos

de tabelas e gráficos.

Tabelas

A representação tabular consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. A

elaboração de tabelas obedece à Resolução n° 886, de 26 de outubro de 1966, do Conselho Nacional de Estatística.

As normas de apresentação são editadas pelo Instituto Brasileiro de Geografia e Estatística (IBGE). Essas normas

estabelecem, por exemplo, que uma tabela não pode ser “fechada” nas extremidades, conforme mostra a tabela b

da Figura 1. Segundo as normas, a tabela b, não é uma tabela.

Produto Quantidade

A 10

B 18

C 21

a) Tabela correta

Produto Quantidade

A 10

B 18

C 21

b) Tabela incorreta

Page 6: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Figura 1. Exemplos de tabela correta e incorreta

Título: O quê; Onde; Quando

Cabeçalho Total

Coluna Indicadora

Corpo da tabela

Total

:Nota

*

:Fonte

Rodapé

Figura - Esquema de uma tabela com os seus elementos

Uma tabela deve possuir os seguintes elementos:

Título: Acima da tabela, deve responder as seguintes questões: o O que? (Assunto a ser representado (Fato)); o -Onde? (O lugar onde ocorreu o fenômeno (local)); o Quando? (A época em que se verificou o fenômeno (tempo)).

Cabeçalho: parte da tabela na qual é designada a natureza do conteúdo de cada coluna. Geralmente é a primeira linha.

Corpo: parte da tabela composta por linhas e colunas. o Linhas: parte do corpo que contém uma seqüência horizontal de informações. o Colunas: parte do corpo que contém uma seqüência vertical de informações. o Coluna Indicadora: coluna que contém as discriminações correspondentes aos valores distribuídos

pelas colunas numéricas. Geralmente é a primeira coluna. o Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma coluna Faz parte do

corpo da tabela.

Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas as notas de natureza informativa:

o Fonte: refere-se à entidade que organizou ou forneceu os dados expostos. o Nota: é um esclarecimento geral;

Page 7: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

o Chamada: é um esclarecimento específico em relação a uma célula específica.

Um exemplo de tabela simples para uma variável qualitativa é apresentado tabela abaixo.

Quantidade e percentual de funcionários da Empresa ABC, segundo o grau de instrução

Grau de Instrução Quantidade Percentual

Fundamental 600 33,3%

Médio 1000 55,5%

Superior * 200 22,2%

TOTAL 1800 100%

Fonte: Empresa ABC

* Inclui pós graduação

Exemplo de tabela cruzada (dupla entrada) com duas variáveis qualitativas é apresentado na tabela.

Opinião dos funcionários da Empresa ABC em relação a um projeto de lei salarial, segundo o grau

de instrução (em quantidade)

Grau de Instrução

Opinião Fundamental Médio Superior * Total

A favor 200 500 150 850

Contra 400 500 50 950

TOTAL 600 1000 200 1800

Fonte: Empresa ABC

* Inclui pós graduação

Page 8: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

TIPOS DE SÉRIES ESTATÍSTICAS

Série estatística é uma sucessão de dados estatísticos que medem a intensidade do fenômeno, segundo

suas características qualitativas ou quantitativas.

As séries estatísticas serão classificadas de acordo com a variação de três elementos: tempo, local e o fato.

São elas:

• Série Histórica - É aquela em que o elemento que serve como base de classificação é a fração do tempo,

como o dia, o mês, o ano, o século, etc.. Ex: : Taxa de mortalidade infantil nos últimos 10 anos na cidade do

Salvador-Ba.

• Série Geográfica - É aquela que apresenta como elemento variável somente o local (fator geográfico). Ex:

A produção de cereais no Brasil, em 1996, segundo os Estados produtores.

• Série Específica - É aquela série que apresenta como elemento ou caráter variável o fato(ou espécie),

permanecendo fixos a época e o local. Ex: Os alunos de uma Faculdade, em determinado ano, classificados

segundo o tipo sanguíneo.

• Série Mista - refere-se às séries que são combinações de outros tipos de séries já estudadas. Classificação

da população brasileira segundo as Unidades da Federação e o sexo.

Gráficos Os gráficos são uma forma de apresentação visual dos dados. Normalmente, contém menos informações

que as tabelas, mas são de mais fácil leitura. O tipo de gráfico depende da variável analisada. As normas da ABNT

tratam os gráficos como Figuras, cujo título (assim como a fonte) é descrito abaixo dela.

Classificação dos Gráficos

Page 9: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Classificação dos Gráficos

Os gráficos podem ser classificados segundo sua forma e sua utilidade.

Podemos considerar segundo sua função os gráficos podem ser:

Gráfico de Informação: por ponto, linha, colunas e barras, setores, cartograma e pictograma.

Gráfico de Análise: histograma, polígono de frequência e ogivas

Gráfico Especiais: dispersão, ramo e folhas.

Page 10: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

1.Gráfico por Ponto.( Dot plot)

O gráfico de pontos é a forma mais simples de apresentar um conjunto de dados tal que:

• as variáveis sejam numéricas, e

• a amostra seja pequena.

Exemplo:

Gráficos de linha, como o da Figura 2 e o da Figura 3 são indicados para séries temporais (uma ou mais variáveis

observadas ao longo do tempo).

Figura 2. Produção de Petróleo Bruto no Brasil de 1976 a 1980 (x 1000 m³)

Page 11: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Fonte: Conjuntura Econômica (Fev. 1983)

Anos

Figura 3. População Urbana do Brasil por Região de 1940 a 1980 (x 1000) Fonte: Anuário Estatístico (1984)

Gráficos de colunas (Figura 4) e de barras (Figura 5) são equivalentes e adequados para variáveis nominais e

ordinais, onde todas as barras devem ter a mesma largura e devem existir espaços entre as barras. Em geral, são

utilizados para ilustrar qualquer tipo de série e podem ser expressos em quantidades ou percentuais.

Figura 4. População Urbana do Brasil em 1980 (x 1000) Fonte: Anuário Estatístico (1984)

Page 12: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Gráficos de Barras

Figura 5. População Urbana do Brasil em 1980 (x 1000) Fonte: Anuário Estatístico (1984)

Histograma - é uma representação gráfica (um gráfico de barras verticais) da distribuição de frequências de um conjunto de dados quantitativos contínuos.

A partir do histograma pode-se construir o polígono de frequência, que consiste em unir através de segmento de reta as

ordenadas correspondentes aos pontos médios das bases superiores dos retângulos correspondentes a cada uma das

classes.

Page 13: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Polígono de frequência.

O polígono de frequência é um gráfico em linha, sendo que as freqüências absolutas são marcadas sobre

perpendiculares ao eixo horizontal, levantadas a partir do ponto médio de cada classe, no caso de freqüências

simples e à partir do limite superior do intervalo de classe, no caso de freqüências acumuladas crescentes.

Exemplo:

Gráfico Ogiva de Galton

É um gráfico de linha que representa as frequências acumuladas.

O gráfico se inicia com a fronteira interior da primeira classe e termina com a fronteira superior da ultima

classe.

Page 14: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

O gráfico de colunas justapostas, como o da Figura 6, apresenta visualmente os dados provenientes de

tabelas cruzadas com duas variáveis qualitativas.

Figura 6. População Urbana do Brasil por Região de 1940 a 1980 (x 1000) Fonte: Anuário Estatístico (1984)

O gráfico de colunas sobrepostas, como o da Figura 7 é outra alternativa para a apresentação visual de

dados de de tabelas cruzadas com duas variáveis qualitativas, porém apresenta os valores acumulados (sobrepostos)

de frequência.

Figura 7. População Urbana do Brasil por Região de 1940 a 1980 (x 1000) Fonte: Anuário Estatístico (1984)

Page 15: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

O gráfico circulares ou de setores (gráfico de “pizza”), como apresentado na Figura 8 é adequado para

representar graficamente a frequência relativa (percentagem) de cada categoria da variável. Este gráfico é utilizado

para variáveis nominais e ordinais. A área do gráfico equivale à totalidade de casos (100%) e cada “fatia” representa

a percentagem de cada categoria. Não é adequada para variáveis que podem receber mais de uma resposta mesmo

tempo, já que o percentual, nesses casos, ultrapassa os 100%.

Figura 8. População Urbana do Brasil em 1980 (x 1000) Fonte: Anuário Estatístico (1984)

O gráfico Pictorial, também conhecido como Pictograma (Figura 9 e Figura 10), tem por objetivo chamar a

atenção do público em geral e geralmente utiliza a arte na apresentação dos dados.

Figura 9. Evolução da frota nacional de carros à álcool de 1979 à 1987 Fonte: Lopes et al (2008)

Page 16: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Figura 10. Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes entrevistados no

Canadá Fonte: Lopes et al (2008)

O gráfico polar (Figura 11) é adequado para representar séries temporais cíclicas. Eis um roteiro para

construir um gráfico polar:

1) Traça-se uma circunferência de raio arbitrário (preferencialmente, a um raio de

comprimento proporcional a média dos valores da série);

2) Constrói-se uma semi-reta (de preferência horizontal) partindo do ponto 0 (pólo) e

com uma escala (eixo polar);

3) Divide-se a circunferência em tantos arcos forem as unidades temporais;

4) Traça -se semi-retas a partir do ponto 0 (pólo) passando pelos pontos de divisão;

5) Marca-se os valores correspondentes da variável, iniciando pela semi-reta horizontal

(eixo polar);

6) Ligam-se os pontos encontrados com segmentos de reta;

7) Para fechar o polígono obtido, emprega-se uma linha interrompida.

Page 17: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Figura 11. Precipitação pluviométrica do município de Santa Maria – RS- 1999 Fonte: Base Aérea de Santa Maria

Cartograma (Figura 12) é a representação de uma carta geográfica. Este tipo de gráfico é empregado quando

o objetivo é o de vingular os dados estatísticos diretamente relacionados com as áreas geográficas ou políticas.

Quando os dados são a frequência absoluta, usa-se pontos proporcionais, e quando os dados são a frequência

relativa, usa-se hachaduras.

a) frequência absoluta b) frequência relativa

Figura 12. População e densidade populacional da Região Sul do Brasil – 1990 Fonte: Lopes et al (2008)

Page 18: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Box- Plot – é um tipo de gráfico que objetiva apresentar diversas informações sobre o comportamento dos dados e ainda manter uma forma compacta. O boxplot é formado pelo primeiro e terceiro quartil e pela mediana. As hastes inferiores e superiores se estendem, respectivamente, do quartil inferior até o menor valor não inferior ao limite inferior e do quartil superior até o maior valor não superior ao limite superior. Os limites são calculados da forma abaixo

Limite inferior: .

Limite superior: .

Para este caso, os pontos fora destes limites são considerados valores discrepantes (outliers) e são denotados por asterisco (*). A Figura a seguir apresenta um exemplo do formato de um boxplot.

O boxplot pode ainda ser utilizado para uma comparação visual entre dois ou mais grupos. Por exemplo,

duas ou mais caixas são colocadas lado a lado e se compara a variabilidade entre elas, a mediana e assim por diante.

Outro ponto importante é a diferença entre os quartis que é uma medida da variabilidade dos dados.

Page 19: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Exemplo: Os gráficos corresponde as temperaturas médias mensais das cidades de Itu e Campinas na

última década. 2007.

Gráfico de ramo e folhas- Técnica de análise exploratória de dados quantitativos respeitando uma ordem.

Page 20: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Distribuições de Frequências Uma distribuição de frequência é uma tabela que reúne o conjunto de dados, conforme as frequências ou as

repetições de seus valores. No capítulo anterior, vimos como são feitas essas tabelas quando a variável é qualitativa.

Nesse capítulo, veremos como montar essas tabelas quando a variável é quantitativa.

Podemos agrupar os dados segundo cada valor observado (distribuição de frequências por intervalo) quando

a variável é discreta e possui poucos valores distintos, ou em classes de valores (distribuição de frequências por

intervalo) quando a variável é contínua ou discreta e possui muitos valores distintos.

Etapas para a construção de uma distribuição de frequências por ponto

Estabelecer o rol crescente (opcional)

Rol é uma lista, onde as observações são dispostas de forma ordenada crescente ou decrescente. O objetivo da

ordenação é tornar possível a visualização das variações ocorridas, uma vez que os valores extremos são percebidos

de imediato, e também facilitar a construção da distribuição de frequências, entretanto essa etapa é opcional, ou

seja, a distribuição de frequências pode ser feita independente do rol.

1.1.1. Contar a ocorrência de cada valor

Deve-se contar a ocorrência de cada valor diferente dos dados brutos (valores Originais). Essa contagem é

chamada de frequência absoluta ( if ). Os diferentes valores observados são colocados na primeira coluna, enquanto

que as frequências absolutas são colocadas na segunda coluna.

1.1.2. Calcular as frequências acumuladas, relativas e relativas acumuladas

Frequência absoluta acumulada ( iF ) é a soma de todas as frequências anteriores até o valor observado

atual. Essas frequências são colocadas na terceira coluna.

Page 21: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

A frequência relativa ( rf ) é calculada pela razão entre a frequência absoluta e o número total de

observações (n) e pode ser expressa em termos percentuais. Essas frequências são colocadas na quarta coluna.

Frequência relativa acumulada ( riF ) é a soma de todas as frequências relativas anteriores até o valor

observado atual e pode ser expressa em termos percentuais. Também pode ser calculada pela razão entre a

frequência absoluta acumulada e o número total de observações (n). Essas frequências são colocadas na quinta

coluna.

1.2. Etapas para a construção de uma distribuição de frequências por intervalo

1.2.1. Estabelecer o rol crescente (opcional)

É realizado da mesma forma descrita anteriormente para o caso da distribuição de frequências por ponto.

1.2.2. Calcular a Amplitude Total

A Amplitude Total (H) é a diferença entre entre o maior e o menor valor observado da variável em estudo,

ou seja, MINMAX xxH .

1.2.3. Calcular o número de classes

Classe é cada um dos grupos ou intervalos de valores em que se subdividirá a amplitude total do conjunto de

tamanho n. A classe i, onde i = 1, 2,..., k

Para a determinação do número de classes (k), não há uma fórmula exata e existem diversos métodos,

dentre os quais, destaca-se a regra de Sturges, que estabelece que o número de classes (k) é calculado por:

Page 22: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

nk log3,31 .

Outro método, chamado de Método da Raiz, estabelece que, se 25n , 5k , e se 25n , nk .

Esses métodos não necessariamente dão os mesmos resultados. não são obrigatórias, ou seja, são apenas

uma sugestão para se obter uma quantidade adequada de classes. O pesquisador deverá ter em mente que a

escolha do número de classes dependerá da natureza dos dados e da unidade de medida em que eles forem

expressos, e poderá arredondar o valor calculado de k para cima ou para baixo, conforme lhe convir. Em geral,

recomenda-se considerar 124 k .

1.2.4. Calcular a amplitude das classes

A amplitude (h) de cada classe é calculada por:

kHh / .

Quando a distribuição de freqüências já existe, a amplitude (h) de cada classe é obtida pela diferença entre o

limite superior e o limite inferior da classe, ou seja:

ii lLh .

1.2.5. Estabelecer as classes

Os dois valores extremos de cada classe são: o limite inferior (Linf.), que é o menor valor da classe

considerada, e o limite superior (Lsup.), que é o maior valor da classe considerada.

Normalmente, a primeira classe inicia com o primeiro valor bruto observado, mas o pesquisador pode iniciar

com um valor anterior (mesmo que não existe), se lhe for conveniente.

Cada classe deverá ter a mesma amplitude (h), entretanto, por causa dos arredondamentos nos cálculos, a

última classe poderá ser mais ampla que as demais, a fim de contemplar todos os dados brutos.

Page 23: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Entre os limites inferior e superior, utiliza-se o símbolo |–, que significa que a classe i contém o valor do

limite inferior, mas não contém o valor do limite superior, o qual entrará na última classe. A única exceção poderá

ser a última classe, que poderá utilizar o símbolo |–|, onde o valor do limite superior também estará incluído na

classe.

1.2.6. Contar as ocorrências em cada classe

Deve-se contar a ocorrência de todos os valores que estão contidos dentro de cada classe. Essa contagem é

chamada de frequência absoluta ( if ). Os diferentes valores observados são colocados na primeira coluna, enquanto

que as frequências absolutas são colocadas na segunda coluna.

1.2.7. Calcular as frequências acumuladas, relativas e relativas acumuladas

É realizado da mesma forma descrita anteriormente para o caso da distribuição de frequências por ponto.

1.3. Gráficos para distribuições de frequências

Existem gráficos adequados para apresentar as frequências de variáveis quantitativas. São eles: o

histograma, o polígono de frequências e a ogiva.

Histograma (Figura 13) é um gráfico de colunas justapostas, cujas alturas são proporcionais às freqüências

absolutas e cujas bases correspondem ao intervalo de classe da distribuição.

Page 24: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Figura 13. Exemplo de Histograma Fonte: Lopes et al (2008)

Polígono de freqüências (Figura 14) é um gráfico de linha, cujos vértices são proporcionais às freqüências

absolutas e correspondem aos pontos médios das classes da distribuição.

Figura 14. Exemplo de Polígono de Frequência Fonte: Lopes et al (2008)

Page 25: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Gráfico Ogiva (Figura 15) é um gráfico de linha, cujos vértices são proporcionais às freqüências acumuladas e

correspondem aos limites inferiores das classes da distribuição.

Figura 15. Exemplo de Ogiva crescente e decrescente Fonte: Lopes et al (2008)

Estatística Descritiva

A estatística descritiva tem o objetivo descrever os dados disponíveis da forma mais completa. As medidas

descritivas básicas mais importantes são as de posição, as de dispersão ou variabilidade e as de forma. A ênfase aqui

está sendo dada para o cálculo das medidas para os dados brutos.

Às vezes, não conseguimos obter os dados brutos, mas os dados já tabelados. Quando isso acontece, não é

possível calcular algumas as medidas descritivas da mesma forma que fazemos com os dados brutos. Nesses casos,

algumas fórmulas diferem da forma de calcular dos dados brutos. Quando isso acontecer, haverá um destaque no

texto (um quadro) para as fórmulas utilizadas no caso de dados já tabelados.

Page 26: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

1.4. Medidas de Posição

Quando se trabalha com dados numéricos, podemos calcular medidas relacionadas com a posição dos

dados. Podemos calcular medidas de posição central (por exemplo, média, mediana, moda) ou de outras posições

(por exemplo, quartis, decis, percentis) observa-se uma tendência destes de se agruparem em torno de um valor

central. Isto indica que algum valor central é característica dos dados e que o mesmo pode ser usado para descrevê-

los e representá-los.

1.4.1. Média

A média aritmética (ou simplesmente média) á a mais utilizada das medidas de tendência central. Consiste

na soma de todas as observações dividida pelo total de observações do grupo. Se esse grupo for uma amostra, o

total de observações é dado por n, porém se esse grupo for uma população, o total de observações é dado por N. A

média de uma amostra ( x ) é dada por:

n

x

n

xxxx

n

i

i

n

121 ...

,

ou simplesmente:n

xx

.

A média de uma população () é dada por:

N

x

N

xxx

N

i

i

N

121 ...

ou simplesmente:

N

x .

Page 27: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Propriedades da média1 (amostral ou populacional):

A soma dos desvios em relação à média é nula: 0xxi .

A média de uma constante é igual à constante: kkx )( .

A média do produto de uma constante por uma variável é igual ao produto da constante pela média da

variável: )()( ii xxkkxx ..

A soma dos quadrados dos desvios em relação à média é um mínimo: xaaxxx ii ,22

.

No caso de dados tabelados por ponto, ix é o próprio valor da classe; porém no caso

de dados tabelados por intervalo ix é o ponto médio da classe i, e a média de uma amostra

( x ) é dada por:

n

fx

n

fxfxfxx

k

i

ii

kk

12211 ).(...).().(

ou simplesmente:

n

fxx

.

.

A média de uma população () é dada por:

N

fx

N

fxfxfx

k

i

ii

kk

12211

.).(...).().(

ou simplesmente:

N

fx

. .

1 Representaremos aqui a média amostral, embora essas propriedades matemáticas sejam válidas também para a média

populacional.

Page 28: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

1.4.2. Mediana

A mediana (Md ou x~ ) divide em duas partes (ao meio) o conjunto das observações ordenadas (rol).

Colocando-se os valores em ordem crescente ou decrescente, a mediana é o elemento que ocupa o valor central. É

utilizada quando o conjunto de dados possui observações que se comportam de forma diferente dos demais dados

do conjunto ou quando os dados não seguem uma Distribuição Normal2. Também pode ser utilizada no caso de

variáveis qualitativas ordinais com escalas do tipo likert.

Para encontrar a posição da mediana MdP , fazemos o seguinte cálculo:

Se o número de elementos3 (n ou N) for ímpar, a mediana será o elemento central que ocupa a posição

2

1

nPMd do rol;

Se o número de elementos (n ou N) for par, a mediana será a média aritmética entre os dois elementos

centrais que ocupam as posições 2

1

nP Md e 1

22

nP Md do rol.

Após encontrar a posição da mediana dMP , basta localizar essa posição e encontrar o valor correspondente

no rol, se n for impar. Se n for par, basta encontrar os valores correspondentes no rol das duas posições calculadas

dMP1 e dMP2 e calcular a média entre eles.

No caso de dados tabelados por ponto, a posição da mediana é calculada da mesma forma

que nos dados brutos e o rol é a própria tabela de frequências.

No caso de dados tabelados por intervalo, a posição da mediana é dada por:

2

nPMd .

A Mediana é calculada por:

2 Em muitas situações práticas, os dados seguem uma Distribuição Normal, ou seja, eles podem ser ajustados por essa

distribuição. Essa distribuição será vista no capítulo de Probabilidades. 3 Utilizaremos nas fórmulas a simbologia n, que representa a quantidade total de observações de uma amostra. As fórmulas são as

mesmas para o caso em que a quantidade total de observações se refere à população, N.

Page 29: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

Md

MdMdMd

f

FPhlMd 1

.

1.4.3. Moda

A moda (Mo) de um grupo de observações é definida como a medida de freqüência máxima, ou seja, o valor

que se repete com maior frequência. Pode ser utilizada para variáveis qualitativas.

Há situações em que o conjunto de dados pode possuir mais de uma moda (bimodal, trimodal, plurimodal ou

multimodal), ou, ainda, não apresentar moda (amodal).

No caso de dados tabelados por ponto, a moda é o valor da classe de maior frequência

(classe modal).

No caso de dados tabelados por intervalo, podemos estimar a moda de várias formas

diferentes. No Método Rudimentar, a moda é o ponto médio da classe de maior frequência

(classe modal), ou seja:

Mo

MoMo xlL

Mo

2

No Método de Czuber, que leva em consideração as frequências anteriores e posteriores à

classe modal, a moda é dada por:

11

1

2 MoMoMo

MoMo

Mofff

fflMo .

O método da Fórmula de Pearson é uma boa aproximação para a Moda quando a

distribuição apresenta razoável simetria em relação à média, e é dada por:

xxMo 2~3 .

Page 30: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

1.4.4. Separatrizes

São valores de posição, que dividem o rol. As principais medidas separatrizes são: mediana, quartis, decis e

percentis (ou centis).

Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:

0% 25% 50% 75% 100%

|--------------------|--------------------|--------------------|--------------------|

Q1 Q2 =Md Q3

onde:

1Q é o primeiro quartil, que separa os primeiros 25% dos 75% restantes;

2Q é o segundo quartil, que é a mediana (Md) vista anteriormente, e separa o conjunto de dados em 2 partes iguais;

3Q é o terceiro quartil, que separa os primeiros 75% dos 25% restantes.

De forma análoga, Os decis dividem um conjunto de dados em dez partes iguais. Assim:

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

|--------|--------|---------|--------|---------|---------|---------|---------|

D1 D2 D3 D4 D5=Md D6 D7 D8 D9

onde:

1D é o primeiro decil, que separa os primeiros 10% dos 90% restantes;

2D é o segundo decil, que separa os primeiros 20% dos 80% restantes;

Page 31: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

9D é o nono decil, que separa os primeiros 90% dos 10% restantes.

Nota-se que o quinto decil é igual ao segundo quartil, que é igual à mediana.

De forma análoga, os percentis (ou centis) dividem um conjunto de dados em cem partes iguais. Assim:

0% 1% 2% 99% 100%

|-------|-----------------------------------------------------------------|

P1 P2 P99

1P é o primeiro percentil, que separa os primeiros 1% dos 99% restantes;

2P é o segundo percentil, que separa os primeiros 2% dos 98% restantes;

99P é o nonagésimo nono percentil, que separa os primeiros 99% dos 1% restantes.

Nota-se que o qüinquagésimo percentil é igual ao quinto decil, que é igual ao segundo quartil, e que é igual à

mediana.

Há divergências entre os autores na forma de calcular as separatrizes. Alguns consideram que a Separatriz

será o elemento que ocupa a posição S

niP

iS

. do rol, onde:

4S , e a separatriz for um quartil, e i indica a ordem do quartil;

10S , e a separatriz for um decil, e i indica a ordem do decil;

100S , e a separatriz for um percentil, e i indica a ordem do percentil do rol

Outros consideram que a Separatriz será o elemento que ocupa a posição S

niP

iS

)1( do rol. Essas duas

formas de calcular entram em conflito com o cálculo da mediana. A forma mais garantida é estabelecer o rol e

procurar a Separatriz diretamente ou utilizar softwares.

Page 32: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

No caso de dados tabelados, a posição de uma separatriz é dada por:

S

niP

iS

. ,

onde:

4S , e a separatriz for um quartil, e i indica a ordem do quartil;

10S , e a separatriz for um decil, e i indica a ordem do decil;

100S , e a separatriz for um percentil, e i indica a ordem do percentil.

A separatriz é calculada por:

i

ii

i

S

SS

Sif

FPhlS 1

.

1.5. Medidas de dispersão

O objetivo das medidas de dispersão é descrever os dados no sentido de informar o grau de dispersão ou

afastamento dos valores observados em torno de um valor central. Elas indicam se um conjunto é homogêneo

(pouca ou nenhuma variabilidade) ou heterogêneo (muita variabilidade). Há muitas aplicações dessas medidas na

estatística inferencial.

1.5.1. Amplitude

A amplitude (H) ou desvio extremo é a diferença entre o maior e o menor valor do conjunto, é de grande

instabilidade porque considera somente os valores extremos do conjunto. Utiliza-se muito em gráficos de controle

para monitorar a variabilidade através da amplitude e para construir distribuições de frequências por intervalo.

Obtém-se por:

MINMAX XXH .

Page 33: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

1.5.2. Variância

A variância é uma medida de variabilidade quadrática. A variância populacional ( 2 ) é dada por:

N

xx

N

xxxxxx

N

i

i

N

1

2

22

2

2

12

)()(...)()(

e também pode ser calculada por:

N

N

xx

N

xi

ii

2

222

2

.

A variância populacional ( 2s ) é dada por:

1

)(

1

)(...)()( 1

2

22

2

2

12

n

xx

n

xxxxxxs

n

i

i

n

mas também pode ser calculada por:

11

2

222

2

n

n

xx

n

xxs

i

ii

.

Propriedades da variância4 (amostral ou populacional):

A variância de uma constante é zero: 0)(2 ks .

4 Representaremos aqui a variância amostral, embora essas propriedades matemáticas sejam válidas também para a média

populacional.

Page 34: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

A variância da soma ou diferença de uma constante k com uma variável é igual a variância da variável:

)()( 22 xsxks .

A variância da soma de variáveis independentes é igual a soma das variâncias das variáveis:

)()()( 222 ysxsyxs .

A variância do produto de uma constante por uma variável é igual ao produto do quadrado da constante

pela variância da variável: )(.).( 222 xskxks .

No caso de dados tabelados, a variância populacional ( 2 ) é dada por:

N

fxx

N

fxxfxxfxx

k

i

ii

kk

1

2

2

2

2

21

2

12

)()(...)()(

e também pode ser calculada por:

N

N

fxfx

N

fxii

iiii

2

222

2

.

A variância populacional ( 2s ) é dada por:

1

)(

1

)(...)()( 1

2

2

2

2

21

2

12

n

fxx

n

fxxfxxfxxs

k

i

ii

kk

mas também pode ser calculada por:

11

2

222

2

n

n

fxfx

n

xfxs

ii

iiii

..

1.5.3. Desvio Padrão

O desvio padrão é a raiz quadrada da variância. O objetivo do desvio padrão é remover o efeito quadrático

da variância. O desvio padrão populacional () é dada por:

Page 35: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

2 .

O desvio padrão populacional (s) é dada por:

2ss .

1.5.4. Coeficiente de Variação

O coeficiente de variação (CV) é uma medida de dispersão relativa. É útil quando se deseja comparar a

variação de conjuntos de dados que apresentem diferentes unidades de medição e ou tamanhos diferentes, pois o

coeficiente de variação independe da unidade de medida dos dados. O coeficiente de variação (pode também ser

expresso como percentagem), para a amostra é dado por

x

sCV ou 100.%

x

sCV

e para a população

CV ou 100.%

CV .

1.6. Medidas de Forma

As medidas de assimetria e curtose complementam as medidas de posição e de dispersão no sentido de

proporcionar uma descrição e compreensão mais completa das distribuições de freqüências. Estas distribuições não

diferem apenas quanto ao valor médio e à variabilidade, mas também quanto a sua forma (assimetria e curtose).

Existem várias formas de se calcular a assimetria e a curtose de um conjunto de dados.

1.6.1. Assimetria

Assimetria é o grau de desvio, afastamento da simetria ou grau de deformação de um conjunto de dados. Se

a curva de freqüências de uma distribuição tem uma "cauda" mais longa à direita da ordenada máxima do que à

esquerda, diz-se que a distribuição é desviada para a direita ou que ela tem assimetria positiva. Se ocorrer o inverso,

diz-se que ela é desviada para a esquerda ou tem assimetria negativa. Se não ocorrer nenhuma dessas situações, ou

Page 36: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

seja, se a distribuição tiver o mesmo comportamento para ambos os lados, dizemos que a distribuição é simétrica.

Exemplos de distribuições simétricas e assimétricas são apresentadas na Figura 16 e na Figura 17, respectivamente.

(a) MoMdx 5 (b) MoMdx 6

Figura 16. Exemplos de distribuições simétricas Fonte: Lopes et al (2008)

(a) xMdMo 7 (b) MoMdx

Figura 17. Exemplos de distribuições assimétricas: (a) assimetria positiva (ou à direita) e (b) assimetria

negativa (ou à esquerda) Fonte: Lopes et al (2008)

O 1° coeficiente de assimetria de Pearson, para dados amostrais, é dado por: 5 Espera-se que isso ocorra quando a distribuição tiver essa forma. No entanto, na prática, os valores podem sofrer uma pequena

variação. 6 Nesse caso, tem-se duas modas (distribuição bimodal), e nenhuma delas será igual à média ou à mediana.

7 Em geral, essa relação ocorre. Na prática, porém, nem sempre ocorre assim.

Page 37: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

s

MoxAs

,

e para dados populacionais, é dado por:

MoAs

.

O 2° coeficiente de assimetria de Pearson, para dados amostrais, é dado por:

13

31~2

QQ

xQQAs

.

Tanto para o primeiro quanto para o segundo coeficientes de assimetria, a interpretação, segundo Fonseca e

Martins (1996), é:

As < 0: distribuição Assimétrica Negativa;

As > 0: distribuição Assimétrica Positiva;

As = 0: distribuição Simétrica.

Coeficiente momento de assimetria ( 3 ) é o terceiro momento abstrato. O momento abstrato r é dado

por:

r

rr

s

M ,

onde rM é o momento de ordem r centrado na média, e é dado por:

No caso de dados tabelados, rM é dado por:

n

fxxM

i

r

i

r

)(.

Page 38: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

n

xxM

r

i

r

)(.

Assim, o coeficiente momento de assimetria ( 3 ) é dado por:

3

33

s

M .

A interpretação para 3 é:

2,03 ⇒ distribuição Assimétrica Negativa;

2,03 ⇒ distribuição Assimétrica Positiva;

2,02,0 3 ⇒ distribuição Simétrica.

1.6.2. Curtose

As medidas de Curtose, ou de Achatamento, têm por finalidade nos mostrar até que ponto a curva

representativa de uma distribuição é mais aguda ou mais achatada, do que uma curva normal. Curtose mede o grau

de achatamento (afilamento) de uma curva em relação à curva normal.

Quanto à curtose, uma distribuição pode ser classificada, conforme a Figura 18, como:

Platicúrtica: a curva é mais achatada do que a normal (variabilidade alta);

Mesocúrtica: a curva é normal (variabilidade média);

Leptocúrtica: a curva é mais alta do que a normal (variabilidade pequena).

Figura 18. Comparação entre três distribuições com mesma média, porém diferente variabilidade. Fonte: Lopes et al (2008)

Page 39: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

O Coeficiente centílico de curtose é dado por:

)(2 19

13

DD

QQK

.

A interpretação para K é:

263,0K , curva leptocúrtica;

263,0K , curva mesocúrtica;

263,0K , curva platicúrtica.

Coeficiente momento de curtose ( 4 ) é o quarto momento abstrato. Assim, o coeficiente momento de

curtose ( 4 ) é dado por:

4

44

s

M

A interpretação para 4 é:

34 ⇒curva platicúrtica;

34 ⇒curva mesocúrtica;

34 ⇒curva leptocúrtica.

Page 40: Qwertyuiopasdfghjklzxcvbnmqwerty ... · de dados de observação, bem como da tomada de ... estatística descritiva e estatística inferencial. ... Serão definidos conceitos de população

Módulo I : Introdução-Estatística Descrita Curso: Administração

Disciplina: Estatística

BIBLIOGRAFIA

FONSECA, J.S. da.; MARTINS, G.A. Curso de Estatística. 6ª Ed. São Paulo: Atlas, 1996

TRIOLA, M. F. Introdução à Estatística. 7a Ed. Rio de Janeiro: LTC, 1999.

W. de O.; MORETIN, P.A. Estatística Básica. 5ª Ed. São Paulo: Saraiva, 2004.

COSTA NETTO, P. L.O. Estatística. 2a. Ed. São Paulo: Edgard Blücher LTDA, 2002.

MORETTIN, L.G. Estatística Básica: Inferência. São Paulo: Pearson Makron Books, 2000