Introdução à Estatística Análise de Dados. O que é estatística...... É uma área da...

Preview:

Citation preview

Introdução à Estatística

Análise de Dados

O que é estatística...

... É uma área da Matemática que trabalha com a coleta de informações, bem como a sua organização e análise. Com a análise dos dados coletados, pode-se tomar decisões e realizar planejamentos com mais segurança.

Conceitos básicos

População: todos os elementos de um conjunto que têm pelo menos uma característica em comum.

Amostra: é um subconjunto formado por elementos extraídos de uma dada população.

Variável: característica estudada de uma população.

Conceitos básicos

Variável

Quantitativa Qualitativa

Discreta Contínua

Conceitos básicos

Quantitativa discreta: expressa por um número inteiro. Por exemplo, número de irmãos, quantidade de computadores, número de animais.

Quantitativa contínua: expressa por um número real e proveniente de uma medida. Por exemplo, massa, idade, altura, temperatura, volume.

Exercício

Pag. 3981) Identifique as variáveis e classifique-as em quantitativa

discreta, quantitativa contínua ou qualitativa.

a) Classificação das colunas de um jornal, por seu editor, como excelentes, boas ou ruins.

b) Os números de telefone de uma lista telefônica.c) Grau de escolaridade dos governantes dos estados brasileiros.d) Vendas anuais de uma empresa do setor da telefonia celular.e) Marcas de desodorante.

Distribuição de frequências

Frequência absoluta: quantidade de vezes que o valor de uma variável é citado.

Frequência Relativa: razão entre a frequência absoluta e o número total de observações. Representada também na forma de porcentagem.

Distribuição de frequências

Frequência absoluta acumulada: soma das frequências absolutas, até determinado dado.

Frequência relativa acumulada: soma das frequências relativas acumuladas, até determinado dado. Corresponde à proporção da frequência acumulada em relação ao total da tabela.

Exemplo

Preço (R$) Frequência absoluta Frequência relativa (%) Frequência absoluta acumulada

Frequência relativa acumulada (%)

2.000  6  30 %  6  30%

2.500  x y  10=6+4 50%=30%+20%

2.600  10 w  z  k

Total  20 100%   20  100%

if rf iF rF

Exercício

Pag. 4006) Os conceitos dos alunos de uma turma de pós-graduação em Administração de Empresas foram os seguintes:

a) Construa uma tabela com todas as frequências.

C A B C A B CA E D C A C EB B D E C D BC D C B D E CC B B C A C A

ExercícioNota Frequência absoluta Frequência relativa (%) Frequência absoluta

acumulada Frequência relativa acumulada (%)

A

B

C

D

E

Total

if rf iF rF

ExercícioNota Frequência absoluta Frequência relativa (%) Frequência absoluta

acumulada Frequência relativa acumulada (%)

A

6 17,14 % 6   17,41%

B

8  22,85 % 14   39,99%

C

12   34,28% 26 74,27% 

D

4  11,42%   30 85,69% 

E

 5 14,31%   35 100% Total

 35  100%  35  100%

if rf iF rF

Exercício

b) Quantos alunos obtiveram nota A?

c) Sabendo que a média de aprovação é o conceito C, quantos alunos estão reprovados?

d) Qual é a porcentagem de alunos que obtiveram conceito C?

e) Qual é a porcentagem de alunos que obtiveram conceitos D ou E?

f) Qual é a porcentagem de alunos que obtiveram conceitos A ou b?

Distribuição de frequências para dados agrupados por intervalos

As vezes a quantidade de medidas ou observações feitas é muito grande, ficando difícil a interpretação dos dados. A solução é agrupá-los em intervalos de classes, ou simplesmente classes

Distribuição de frequências para dados agrupados por intervalos

Como determinar os intervalos de classe?

1 – Calcular a diferença entre o maior e o menor dado indicado, obtendo o que chamamos de amplitude .

2 – Escolher um número conveniente maior ou igual o número da amplitude, dividir pelo número de intervalos que desejamos, obtendo a amplitude de cada intervalo.

3 – A partir do menor valor some a amplitude do intervalo e encontre cada classe.

Distribuição de frequências para dados agrupados por intervalos

É importante salientar que a escolha da amplitude de classe depende do bom senso. Se os intervalos forem muito pequenos, teremos um número muito grande deles, e isso pode significar que os dados não foram resumidos. Se forem muito grandes, pode significar que houve excessiva perda de informações.

Exercício

Pag. 4028) Observe as diárias de um grande hotel:

Diária (R$) Número de apartamentos

[150, 180[ 3

[180, 210[ 8

[210, 240[ 10

[240, 270[ 13

[270, 300[ 33

[300, 330[ 40

[330, 360[ 35

[360, 390[ 30

[390, 420[ 16

[420, 450[ 12

Total 200

Exercício

Complete a tabela com as frequências: absoluta acumulada, relativa e relativa acumulada.

Diária (R$) Número de apartamentos Frequência relativa Frequência Absoluta acumulada

Frequência relativa acumulada

[150, 180[ 3

[180, 210[ 8

[210, 240[ 10

[240, 270[ 13

[270, 300[ 33

[300, 330[ 40

[330, 360[ 35

[360, 390[ 30

[390, 420[ 16

[420, 450[ 12

Total 200

Exercício

Diária (R$) Número de apartamentos Frequência relativa Frequência Absoluta acumulada

Frequência relativa acumulada

[150, 180[ 3 0,015 3  0,015[180, 210[ 8 0,04 11  0,055[210, 240[ 10 0,05 21  0,105[240, 270[ 13 0,065 34  0,170[270, 300[ 33 0,165 67  0,335[300, 330[ 40 0,2 107  0,535[330, 360[ 35 0,175 142  0,71[360, 390[ 30 0,15 172 0,86 [390, 420[ 16 0,08 188 0,94 [420, 450[ 12 0,06 200  1Total 200 1 200  1

Exercício

a) Qual é o extremo inferior da 6ª classe?

b) Que intervalo apresenta as diárias mais comuns?

c) Qual é a porcentagem de apartamentos cujas diárias são menores que R$ 270,00?

d) Quantos apartamentos têm diárias menores que R$ 390,00?

e) Quantos apartamentos têm diárias a partir de RS 390,00?

Representações Gráficas

Catego

ria 1

Catego

ria 3

05

1015

Série 3Série 2Série 1

Catego

ria 1

Catego

ria 2

Catego

ria 3

Catego

ria 4

048

12

Série 3Série 2Série 1

024

Série 1Série 1Série 2Série 3

Vendas1º Tri2º Tri3º Tri4º Tri

Representações Gráficas

Gráfico de colunas

O gráfico de colunas apresentam os dados por meio de colunas (retângulos) dispostas em posição vertical. A altura de cada coluna equivale à frequência (absoluta ou relativa) dos valores observados.

Representações Gráficas

Representações Gráficas

Gráfico de barras

Esse tipo de gráfico utiliza as barras (retângulos) dispostas em posição horizontal. Os comprimentos das barras correspondem à frequência (absoluta ou relativa) dos valores observados.

Representações Gráficas

Representações Gráficas

Gráfico de segmentos

Conhecido também como gráfico de linha é bastante utilizado para representar duas grandezas que se relacionam. Para sua construção, adotamos um referencial parecido ao plano cartesiano. Marcamos os pontos e em seguida os unimos por meio de segmento de reta.

Representações Gráficas

Representações Gráficas

Gráfico de setores

Os gráficos de setores apresentam os dados por meio de um círculo, no qual cada setor indica a quantidade (ou frequência relativa) de um valor observado.Obs: A área e o ângulo de cada setor são diretamente proporcionais à porcentagem que representam em relação ao todo.

Representações Gráficas

Representações Gráficas

Gráficos múltiplos

Quando é necessário representar simultaneamente duas ou mais características de uma amostra pode-se construir gráficos múltiplos.

Representações Gráficas

Histograma

O histograma é um gráfico formado por retângulos cujas bases são construídas sobre o eixo das abscissas. As larguras correspondem à amplitude de cada intervalo e as alturas indicam a frequência (absoluta ou relativa) de cada intervalo.

Histograma

Exemplo:

Em um concurso público realizado pela prefeitura de certo município, 200 candidatos foram submetidos a uma prova escrita. A distribuição de frequência segundo as notas obtidas pelos candidatos está representada na tabela a seguir.

Histograma

Histograma

Histograma

Polígono de Frequências

Os dados de uma tabela de frequências também podem ser representados por um tipo de gráfico denominado polígono de frequências.

Polígono de Frequências

Polígono de Frequências

Note que o polígono de frequências foi obtido ligando-se, por meio de segmentos de reta, os pontos médios das bases superiores das barras do histograma. Cada um desses pontos representa a média do intervalo de classe correspondente. Além disso, note que foram utilizados pontos equidistantes correspondentes à média de uma classe imediatamente inferior e de uma classe imediatamente superior.

Medidas estatísticas

As medidas estatísticas que descrevem a tendência que os dados têm de agrupamento em torno de certos valores recebem o nome de medidas de tendência central.

Média Aritmética

Exercício

Média Aritmética Ponderada

Exercício

Moda

Indicaremos por moda (Mo), o número que aparecer em maior quantidade de vezes no conjunto de valores observados.

Exercício

Mediana

A mediana (Md) é um valor que divide um conjunto de dados ordenados em dois grupos com o mesmo número de valores: um grupo terá valores menores ou iguais à mediana e o outro grupo terá valores maiores ou iguais a ela.

Mediana

Exemplo : Quantidade ímpar de valores

Mediana

Exemplo : Quantidade par de observações

Exercício

Recommended