28
Página 1 de 28 ESTÁTISTICA DESCRITIVA

ESTATÍSTICA DESCRITIVA

Embed Size (px)

Citation preview

Page 1: ESTATÍSTICA DESCRITIVA

Página 1 de 28

ESTÁTISTICA DESCRITIVA

Page 2: ESTATÍSTICA DESCRITIVA

Página 2 de 28

Módulo 1. Estatística Descritiva. Introdução.

Conteúdo 1. Classificação. População e Amostra.

1. Estatística: Definição e Classificação.

2. População e Amostra.

População: é um conjunto de elementos que possuem, em comum, determinada

característica.

Amostra: subconjunto da população.

3. Técnicas de Amostragem.

Amostragem Casual Simples.

Amostragem sistemática.

Amostragem Estratificada.

Amostragem por conveniência.

4. Dados

Os dados são as informações obtidas através de observações, medidas, respostas

de pesquisas ou contagens em geral.

Page 3: ESTATÍSTICA DESCRITIVA

Página 3 de 28

Os dados podem ser classificados em:

Dados qualitativos: classificação por tipos ou atributos.

Exemplo: A cor dos olhos (azuis, castanhos, verdes, etc.) das modelos de uma

determinada agência.

Dados quantitativos: quando seus valores são expressos em números.

Exemplo: O peso líquido de cada um dos sabonetes produzidos por uma empresa.

Exercício Resolvido

Considere as afirmações a seguir e assinale a alternativa correta.

I. A qualidade de um produto, defeituoso ou não defeituoso, trata de um dado

qualitativo.

II. A altura dos atletas do time de basquetebol da escola “Aprender”, trata de um

dado qualitativo.

III. O diâmetro dos parafusos produzidos por certa máquina trata de um dado

quantitativo.

a) Todas as afirmações estão corretas.

b) Apenas a afirmação I está correta.

c) Apenas as afirmações I e III estão corretas.

d) Todas as afirmações estão incorretas.

e) Apenas a afirmação III está correta.

Resposta Correta: C

Justificativa: A altura dos atletas do time de basquetebol da escola “Aprender” trata

de um dado QUANTITATIVO.

Conteúdo 2. Representação dos dados em Tabelas e Gráficos.

I. Representação em Tabelas (Dados isolados).

Área das regiões do Brasil (em km2)

Região Área (em km2) Norte 3 851 560

Nordeste 1 556 001 Sul 575 316

Sudeste 927 286

Page 4: ESTATÍSTICA DESCRITIVA

Página 4 de 28

Centro-Oeste 1 604 852 Total 55.942.047

Fonte: http://pt.wikipedia.org/wiki/Regi%C3%B5es_do_Brasil

A tabela acima mostra a área em cada uma das regiões do Brasil, este número é

denominado frequência.

Podemos também encontrar a frequência relativa para cada modalidade, para

isso basta dividir a freqüência de cada modalidade pelo total de frequências (n).

Área das regiões do Brasil (em km2)

Região Área (em km2) Frequência relativa Norte 3.851.560 0,45

Nordeste 1.556.001 0,18 Sul 575.316 0,07

Sudeste 927.286 0,11 Centro-Oeste 1.604.852 0,19

Total 8.515.015 1

Fonte: http://pt.wikipedia.org/wiki/Regi%C3%B5es_do_Brasil

II. Gráfico (Dados isolados).

Para construção do gráfico utilizamos o sistema de eixos cartesianos. No eixo das

abscissas (x) ou ordenadas (y) representamos as variáveis em estudo, no outro

eixo (abscissas ou ordenadas) ainda não utilizado, representamos as frequências.

Exercícios Resolvidos.

1. A vídeo-locadora “ALUGUE JÁ” anotou as locações do dia 18/01/2011, obtendo

os dados da tabela abaixo:

Tabela 10. Número de filmes locados na locadora “ALUGUE JÁ” por gênero,

em 24/12/2007.

Gênero de filme frequência

Page 5: ESTATÍSTICA DESCRITIVA

Página 5 de 28

Drama 12

Comédia 10

Ficção 8

Suspense 6

Outros 4

Total 40

Para a tabela, pedem-se:

a) as freqüências relativas.

Gênero de filme freqüência freqüência relativa

Drama 12 0,30

Comédia 10 0,25

Ficção 8 0,20

Suspense 6 0,15

Outros 4 0,10

Total 40 1

b) construir um gráfico com a frequência relativa.

Módulo 2. Distribuições de Frequências.

Conteúdo 1. Distribuições de Frequências. Tabelas.

Page 6: ESTATÍSTICA DESCRITIVA

Página 6 de 28

Uma distribuição de frequência é uma tabela de intervalos de classes com o número

total de entradas de dados em cada classe.

A frequência de uma classe é o número de entrada de dados na classe.

Veja o exemplo.

A tabela a seguir ilustra os salários, em reais, de 100 funcionários de um

determinado setor de uma empresa automobilística.

Classes de salários

Classes de

salários (em reais)

Número de funcionários

500 |— 1000 10

1000|— 1500 8

1500 |— 2000 12

2000 |— 2500 20

2500 |— 3000 25

3000 |— 3500 10

3500 |— 4000 15

Total = 100

A frequência neste caso é o número de funcionários que estão incluídos na classe

de salários.

Usamos a notação 500 |—1000, onde o intervalo é fechado à esquerda (pertencem

à classe os valores iguais ao extremo inferior) e aberto à direita (não pertencem à

classe os valores iguais ao extremo superior).

Amplitude do intervalo de uma classe é a diferença entre o limite superior e

inferior.

Temos no exemplo 1000-500=500, logo a amplitude do intervalo de classe é de

500 reais.

O Ponto médio de um intervalo de classe é a metade da soma do limite inferior e o

limite superior.

Veja o exemplo:

Classes de salários e pontos médios

Classes de

salários (em

reais)

Número de

funcionários

Ponto Médio

500 |— 1000 10 750

1000|— 1500 8 1250

Page 7: ESTATÍSTICA DESCRITIVA

Página 7 de 28

1500 |— 2000 12 1750

2000 |— 2500 20 2250

2500 |— 3000 25 2750

3000 |— 3500 10 3250

3500 |— 4000 15 3750

Total = 100

A frequência relativa de uma classe é a frequência desta classe dividida pelo total

de elementos da amostra(n).

Classes de Salários e frequências relativas.

Classes de

salários (em

reais)

Número de

funcionários

Frequências

Freqüências

Relativas

500 |— 1000 10 0,10

1000|— 1500 8 0,08

1500 |— 2000 12 0,12

2000 |— 2500 20 0,20

2500 |— 3000 25 0,25

3000 |— 3500 10 0,10

3500 |— 4000 15 0,15

Total: Total = 100 Total=1

A Frequência Acumulada de uma classe é a soma da freqüência daquela classe com

a de todas as classes anteriores.

Veja o exemplo:

Classes de salários e frequências acumuladas.

Classes de

salários (em

reais)

Número de

funcionários

Frequências

Frequências

Acumuladas

500 |— 1000 10 10

1000|— 1500 8 18

1500 |— 2000 12 30

2000 |— 2500 20 50

2500 |— 3000 25 75

3000 |— 3500 10 85

3500 |— 4000 15 100

Total = 100

Exercício Resolvido:

Page 8: ESTATÍSTICA DESCRITIVA

Página 8 de 28

1. Considere a tabela a seguir:

Rendimento, em reais de famílias de uma determinada

comunidade. Classes de

rendimentos (em

reais)

Número de famílias

500|—1000 6 1000|—1500 4 1500|—2000 7 2000|—2500 5 2500|—3000 3 3000|—3500 5

Total 30

a) Encontre os pontos médios de cada intervalo de classe.

b) Encontre as frequências relativas.

c) Encontre as frequências acumuladas.

Conteúdo 2. Histograma e Polígono de Frequências.

Page 9: ESTATÍSTICA DESCRITIVA

Página 9 de 28

Histograma.

O histograma é um gráfico composto por retângulos justapostos em que a base de

cada um deles corresponde ao intervalo de classe e a sua altura à respectiva

freqüência. No exemplo abaixo usamos o ponto médio de cada classe para constriur

o histograma.

Classes de

salários (em reais)

Número de funcionários

500 |— 1000 10

1000|— 1500 8

1500 |— 2000 12

2000 |— 2500 20

2500 |— 3000 25

3000 |— 3500 10

3500 |— 4000 15

Total = 100

Polígono de Frequências.

Os dados apresentados em tabelas de distribuição de freqüências, também podem

ser representados em um polígono de freqüências.

A construção de um polígono de frequências é bastante simples, a partir do

histograma, basta ligar os pontos médios de cada classe. Para fechar o polígono

unimos os extremos da figura com o eixo horizontal, no ponto médio da classe

anterior a primeira e no ponto médio da posterior a ultima classe.

Exercício Resolvido:

Construir um histograma da situação ilustrada na tabela a seguir:

Rendimento, em reais de famílias de uma determinada

comunidade. Classes de

rendimentos (em

reais)

Número de famílias

500|—1000 6 1000|—1500 4 1500|—2000 7 2000|—2500 5 2500|—3000 3 3000|—3500 5

Total 30

Page 10: ESTATÍSTICA DESCRITIVA

Página 10 de 28

Módulo 3. Medidas de tendência central.

Conteúdo 1. Média Aritmética, Mediana e Moda.

1. Média aritmética (Dados isolados)

.

Veja o exemplo a seguir:

Uma amostra contendo dez preços de etanol foi extraída em diversos postos no dia

01/02/2011. Os preços em reais são:

Page 11: ESTATÍSTICA DESCRITIVA

Página 11 de 28

Preço, em reais, do etanol

em 10 postos de combustível

(01/02/2011)

1,75 1,70 1,74 1,52 1,56

1,70 1,45 1,42 1,70 1,86

A média é calculada da seguinte maneira:

2. Mediana

A mediana é uma medida de tendência central. Ela divide um conjunto ordenado de

dados em duas partes com igual número de elementos.

Se a amostra é constituída por um número ímpar de elementos, a mediana é o

valor que fica no centro dos dados ordenados.

Exemplo: 12, 15, 20, 21, 32.

A mediana é 20.

Se a amostra é constituída por um número par de elementos, a mediana é a média

aritmética dos dois valores centrais dos dados ordenados.

Exemplo: 12, 15, 15, 20, 21 e 32

A mediana é .

3. Moda

A moda de um conjunto de dados é o valor que ocorre com maior frequência.

Uma amostra contendo dez preços de etanol foi extraída em diversos postos no dia

01/02/2011. Os preços em reais são:

Preço, em reais, do etanol em 10

postos de combustível

Page 12: ESTATÍSTICA DESCRITIVA

Página 12 de 28

(01/02/2011)

1,75 1,70 1,74 1,52 1,56

1,70 1,45 1,42 1,70 1,86

A moda neste caso é 1,70 reais.

Exercício Resolvido.

Conteúdo 2. Média Aritmética (Distribuição de Frequências).

Cálculo da média para distribuição de frequências:

Veja o exemplo a seguir:

Page 13: ESTATÍSTICA DESCRITIVA

Página 13 de 28

Em uma amostra de 20 parafusos produzidos por uma metalúrgica, foram medidos

os diâmetros, em milímetros, conforme a tabela abaixo. Qual é a medida média do

diâmetro?

Diâmetro do parafuso, em

milímetros.

Nº de parafusos (fi)

1,5 2

1,8 4

2 3

2,4 6

2,6 5

Total 20

Neste caso utilizamos a fórmula: , pois a tabela mostra que existem 2

parafusos com diâmetro igual a 1,5 mm, 4 parafusos de

diâmetro 1,8 mm e assim por diante.

Diâmetro do

parafuso, em

milímetros.

xi

número de

parafusos

xi.fi

1,5 2 3

1,8 4 7,2

2 3 6

2,4 6 14,4

2,6 5 13

Total 20 43,6

Page 14: ESTATÍSTICA DESCRITIVA

Página 14 de 28

Veja o exemplo a seguir:

Classes

de salários (em

reais)

Ponto Médio

Número de

funcionários

xi.fi

500 |— 1000 750 10 7.500

1000|— 1500 1250 8 10.000

1500 |— 2000 1750 12 21.000

2000 |— 2500 2250 20 45.000

2500 |— 3000 2750 25 68.750

3000 |— 3500 3250 10 32.500

3500 |— 4000 3750 15 56.250

Total = 100 Total=241.000

Exercício Resolvido

Page 15: ESTATÍSTICA DESCRITIVA

Página 15 de 28

Módulo 4. Medidas de Dispersão.

Conteúdo 1. Medidas de Dispersão (Dados Isolados).

Quando descrevemos nossos dados através das medidas de tendência central,

necessitamos muitas vezes de complementos que são denominadas de medidas de

dispersão. As medidas de dispersão utilizadas são a amplitude, a variância, o

desvio-padrão e o coeficiente de variação.

As medidas de dispersão indicam o quanto os dados variam em torno da região

central.

1. Amplitude.

A amplitude é a diferença entre o maior e o menor dado observado.

Por utilizar apenas os extremos, a amplitude não é uma boa medida de dispersão.

2. Variância.

Page 16: ESTATÍSTICA DESCRITIVA

Página 16 de 28

A variância é definida como a soma dos quadrados dos desvios dividida pelo

tamanho da amostra menos 1.

O desvio em relação à média é a diferença entre cada dado e a média do conjunto.

Veja o exemplo a seguir:

Preço, em reais, do etanol em 10

postos de combustível

(01/02/2011)

1,75 1,70 1,74 1,52 1,56

1,70 1,45 1,42 1,70 1,86

A variância é calculada da seguinte maneira:

Page 17: ESTATÍSTICA DESCRITIVA

Página 17 de 28

4. Coeficiente de Variação (CV).

O coeficiente de variação é o quociente entre o desvio padrão e a média.

.

Podemos expressar o coeficiente de variação na forma de porcentagem.

Exercício Resolvido.

Page 18: ESTATÍSTICA DESCRITIVA

Página 18 de 28

Conteúdo 2. Medidas de Dispersão (Distribuição de frequências).

No caso de uma distribuição de frequências usamos a fórmula:

, onde xi é o ponto médio do intervalo de classe e fi é a

frequência de cada classe.

Diâmetro do parafuso, em

milímetros.

Número de parafusos (fi)

1,5 2 0,9248

1,8 4 0,5776

2 3 0,0972

2,4 6 0,2904

2,6 5 0,882

Total 20 2,772

Page 19: ESTATÍSTICA DESCRITIVA

Página 19 de 28

Para o calculo da variância, desvio-padrão e coeficiente de variação para classes de

frequências, temos:

Exercício Resolvido

Page 20: ESTATÍSTICA DESCRITIVA

Página 20 de 28

Page 21: ESTATÍSTICA DESCRITIVA

Página 21 de 28

Módulo 5. Probabilidades.

Conteúdo 1. Espaço amostral e Evento.

Em um experimento aleatório, temos:

Espaço Amostral (S) é o conjunto de todos os resultados possíveis.

Exemplo: No lançamento de um dado honesto de 6 faces temos: S1= {1, 2, 3, 4, 5,

6}

O número de elementos do espaço amostral é dado por n(S). No exemplo, temos

n(S) =6

Evento (E) é qualquer subconjunto de um espaço amostral.

Exemplos: No lançamento de um dado honesto de 6 faces, podem ocorrer os

eventos:

E: sair ponto ímpar.

E= {1, 3, 5} n(E) =3

F: sair ponto maior ou igual a 3.

F= {3, 4, 5, 6} n(F) =4

Dentre os eventos, devemos considerar os seguintes: S, considerado evento

certo, pois sempre ocorre e Φ, considerado evento impossível, pois nunca

ocorre.

Exercício Resolvido

No lançamento de um dado honesto de seis faces, determinar:

a) o espaço amostral.

S={1, 2, 3, 4, 5, 6}

b) sair número par.

E= {2, 4, 6}

c) sair número maior que 3.

F= {4, 5, 6}

d) sair número par e maior que 3.

Page 22: ESTATÍSTICA DESCRITIVA

Página 22 de 28

G= {4, 6}

Conceito de Probabilidade.

A probabilidade P(E) de ocorrer um evento E é o quociente entre o número de

elementos de E e o número de elementos de S, ondeS é difrente do conjunto vazio.

Exemplos:

a) No lançamento de um dado honesto de 6 faces, qual a probabilidade de ocorrer

ponto ímpar?

S= {1, 2, 3, 4, 5,6} n(S) =6

E= {1, 3, 5} n(E) =3

P(E)=3/6=0,5.

b) Em um baralho comum de 52 cartas, qual a probabilidade de se retirar uma

carta de copas?

Em um baralho comum de 52 cartas temos 13 cartas de copas. Considerando F

como sendo o evento sair carta de copas, então: n(S) =52 e n(F) =13

P(F)=13/52=1/4

Page 23: ESTATÍSTICA DESCRITIVA

Página 23 de 28

Exercício Resolvido.

No lançamento de um dado honesto de 6 faces, qual a probabilidade de ocorrer

ponto maior que 5?

S= {1, 2, 3, 4, 5,6} n(S) =6

E= {6} n(E) =1

P(E)=1/6

Distribuição Binomial:

Problemas que envolvem situações onde um experimento aleatório com dois

resultados possíveis é repetido independentemente várias vezes.

Suponha que n repetições independentes sejam realizadas e que a probabilidade de

sucesso em qualquer repetição seja p. Seja x o número total de sucessos dentre

as n repetições. Então a distribuição de probabilidade da variável x é dada pela

fórmula:

p: probabilidade do sucesso

q = 1- p: probabilidade do fracasso.

Exemplo: Se 18% das peças produzidas por uma máquina são defeituosas, qual é

a probabilidade de que, entre 10 peças escolhidas ao acaso,

Page 24: ESTATÍSTICA DESCRITIVA

Página 24 de 28

a) duas peças sejam defeituosas?

n=10

p: probabilidade do sucesso (ser defeituosa) = 18%=0,18.

q: probabilidade do fracasso (não ser defeituosa) = 1 – 0,18=0,82.

b) no máximo 2 serem defeituosas?

No máximo 2 serem defeituosas significa que poderá haver nenhuma (zero), uma

ou duas peças defeituosas.

P(máximo duas peças defeituosas) =P(0) + P(1) + P(2).

c) no mínimo 2 peças defeituosas?

No mínimo 2 serem defeituosas significa 2, 3, 4,...10 peças defeituosas.

P(mínimo 2 peças defeituosas)=P(2)+P(3)+P(4)+P(5)+...+P(10) ou

Page 25: ESTATÍSTICA DESCRITIVA

Página 25 de 28

Distribuição de Poisson

A distribuição de Poisson é uma distribuição de probabilidades para eventos que

ocorrem em um intervalo de tempo ou de espaço.

Page 26: ESTATÍSTICA DESCRITIVA

Página 26 de 28

Distribuição Normal

Características da Distribuição Normal.

(1) A variável aleatória pode assumir qualquer valor real.

(2) O gráfico é uma curva em forma de sino. A curva é simétrica em relação a

média ( μ).

(3) A área sob a curva normal é igual a 1. Essa área corresponde a probabilidade

de a variável aleatória assumir qualquer valor real.

Page 27: ESTATÍSTICA DESCRITIVA

Página 27 de 28

Exercício Resolvido

A vida média da bateria tipo I da empresa “Dura Mais” é distribuída normalmente

com uma média de 600 dias e desvio padrão de 75 dias. Qual a probabilidade de

uma bateria retirada ao acaso da produção desta empresa durar:

a) menos de 450 dias?

v

Page 28: ESTATÍSTICA DESCRITIVA

Página 28 de 28