Upload
rafael-mendes
View
229
Download
1
Embed Size (px)
Citation preview
Página 1 de 28
ESTÁTISTICA DESCRITIVA
Página 2 de 28
Módulo 1. Estatística Descritiva. Introdução.
Conteúdo 1. Classificação. População e Amostra.
1. Estatística: Definição e Classificação.
2. População e Amostra.
População: é um conjunto de elementos que possuem, em comum, determinada
característica.
Amostra: subconjunto da população.
3. Técnicas de Amostragem.
Amostragem Casual Simples.
Amostragem sistemática.
Amostragem Estratificada.
Amostragem por conveniência.
4. Dados
Os dados são as informações obtidas através de observações, medidas, respostas
de pesquisas ou contagens em geral.
Página 3 de 28
Os dados podem ser classificados em:
Dados qualitativos: classificação por tipos ou atributos.
Exemplo: A cor dos olhos (azuis, castanhos, verdes, etc.) das modelos de uma
determinada agência.
Dados quantitativos: quando seus valores são expressos em números.
Exemplo: O peso líquido de cada um dos sabonetes produzidos por uma empresa.
Exercício Resolvido
Considere as afirmações a seguir e assinale a alternativa correta.
I. A qualidade de um produto, defeituoso ou não defeituoso, trata de um dado
qualitativo.
II. A altura dos atletas do time de basquetebol da escola “Aprender”, trata de um
dado qualitativo.
III. O diâmetro dos parafusos produzidos por certa máquina trata de um dado
quantitativo.
a) Todas as afirmações estão corretas.
b) Apenas a afirmação I está correta.
c) Apenas as afirmações I e III estão corretas.
d) Todas as afirmações estão incorretas.
e) Apenas a afirmação III está correta.
Resposta Correta: C
Justificativa: A altura dos atletas do time de basquetebol da escola “Aprender” trata
de um dado QUANTITATIVO.
Conteúdo 2. Representação dos dados em Tabelas e Gráficos.
I. Representação em Tabelas (Dados isolados).
Área das regiões do Brasil (em km2)
Região Área (em km2) Norte 3 851 560
Nordeste 1 556 001 Sul 575 316
Sudeste 927 286
Página 4 de 28
Centro-Oeste 1 604 852 Total 55.942.047
Fonte: http://pt.wikipedia.org/wiki/Regi%C3%B5es_do_Brasil
A tabela acima mostra a área em cada uma das regiões do Brasil, este número é
denominado frequência.
Podemos também encontrar a frequência relativa para cada modalidade, para
isso basta dividir a freqüência de cada modalidade pelo total de frequências (n).
Área das regiões do Brasil (em km2)
Região Área (em km2) Frequência relativa Norte 3.851.560 0,45
Nordeste 1.556.001 0,18 Sul 575.316 0,07
Sudeste 927.286 0,11 Centro-Oeste 1.604.852 0,19
Total 8.515.015 1
Fonte: http://pt.wikipedia.org/wiki/Regi%C3%B5es_do_Brasil
II. Gráfico (Dados isolados).
Para construção do gráfico utilizamos o sistema de eixos cartesianos. No eixo das
abscissas (x) ou ordenadas (y) representamos as variáveis em estudo, no outro
eixo (abscissas ou ordenadas) ainda não utilizado, representamos as frequências.
Exercícios Resolvidos.
1. A vídeo-locadora “ALUGUE JÁ” anotou as locações do dia 18/01/2011, obtendo
os dados da tabela abaixo:
Tabela 10. Número de filmes locados na locadora “ALUGUE JÁ” por gênero,
em 24/12/2007.
Gênero de filme frequência
Página 5 de 28
Drama 12
Comédia 10
Ficção 8
Suspense 6
Outros 4
Total 40
Para a tabela, pedem-se:
a) as freqüências relativas.
Gênero de filme freqüência freqüência relativa
Drama 12 0,30
Comédia 10 0,25
Ficção 8 0,20
Suspense 6 0,15
Outros 4 0,10
Total 40 1
b) construir um gráfico com a frequência relativa.
Módulo 2. Distribuições de Frequências.
Conteúdo 1. Distribuições de Frequências. Tabelas.
Página 6 de 28
Uma distribuição de frequência é uma tabela de intervalos de classes com o número
total de entradas de dados em cada classe.
A frequência de uma classe é o número de entrada de dados na classe.
Veja o exemplo.
A tabela a seguir ilustra os salários, em reais, de 100 funcionários de um
determinado setor de uma empresa automobilística.
Classes de salários
Classes de
salários (em reais)
Número de funcionários
500 |— 1000 10
1000|— 1500 8
1500 |— 2000 12
2000 |— 2500 20
2500 |— 3000 25
3000 |— 3500 10
3500 |— 4000 15
Total = 100
A frequência neste caso é o número de funcionários que estão incluídos na classe
de salários.
Usamos a notação 500 |—1000, onde o intervalo é fechado à esquerda (pertencem
à classe os valores iguais ao extremo inferior) e aberto à direita (não pertencem à
classe os valores iguais ao extremo superior).
Amplitude do intervalo de uma classe é a diferença entre o limite superior e
inferior.
Temos no exemplo 1000-500=500, logo a amplitude do intervalo de classe é de
500 reais.
O Ponto médio de um intervalo de classe é a metade da soma do limite inferior e o
limite superior.
Veja o exemplo:
Classes de salários e pontos médios
Classes de
salários (em
reais)
Número de
funcionários
Ponto Médio
500 |— 1000 10 750
1000|— 1500 8 1250
Página 7 de 28
1500 |— 2000 12 1750
2000 |— 2500 20 2250
2500 |— 3000 25 2750
3000 |— 3500 10 3250
3500 |— 4000 15 3750
Total = 100
A frequência relativa de uma classe é a frequência desta classe dividida pelo total
de elementos da amostra(n).
Classes de Salários e frequências relativas.
Classes de
salários (em
reais)
Número de
funcionários
Frequências
Freqüências
Relativas
500 |— 1000 10 0,10
1000|— 1500 8 0,08
1500 |— 2000 12 0,12
2000 |— 2500 20 0,20
2500 |— 3000 25 0,25
3000 |— 3500 10 0,10
3500 |— 4000 15 0,15
Total: Total = 100 Total=1
A Frequência Acumulada de uma classe é a soma da freqüência daquela classe com
a de todas as classes anteriores.
Veja o exemplo:
Classes de salários e frequências acumuladas.
Classes de
salários (em
reais)
Número de
funcionários
Frequências
Frequências
Acumuladas
500 |— 1000 10 10
1000|— 1500 8 18
1500 |— 2000 12 30
2000 |— 2500 20 50
2500 |— 3000 25 75
3000 |— 3500 10 85
3500 |— 4000 15 100
Total = 100
Exercício Resolvido:
Página 8 de 28
1. Considere a tabela a seguir:
Rendimento, em reais de famílias de uma determinada
comunidade. Classes de
rendimentos (em
reais)
Número de famílias
500|—1000 6 1000|—1500 4 1500|—2000 7 2000|—2500 5 2500|—3000 3 3000|—3500 5
Total 30
a) Encontre os pontos médios de cada intervalo de classe.
b) Encontre as frequências relativas.
c) Encontre as frequências acumuladas.
Conteúdo 2. Histograma e Polígono de Frequências.
Página 9 de 28
Histograma.
O histograma é um gráfico composto por retângulos justapostos em que a base de
cada um deles corresponde ao intervalo de classe e a sua altura à respectiva
freqüência. No exemplo abaixo usamos o ponto médio de cada classe para constriur
o histograma.
Classes de
salários (em reais)
Número de funcionários
500 |— 1000 10
1000|— 1500 8
1500 |— 2000 12
2000 |— 2500 20
2500 |— 3000 25
3000 |— 3500 10
3500 |— 4000 15
Total = 100
Polígono de Frequências.
Os dados apresentados em tabelas de distribuição de freqüências, também podem
ser representados em um polígono de freqüências.
A construção de um polígono de frequências é bastante simples, a partir do
histograma, basta ligar os pontos médios de cada classe. Para fechar o polígono
unimos os extremos da figura com o eixo horizontal, no ponto médio da classe
anterior a primeira e no ponto médio da posterior a ultima classe.
Exercício Resolvido:
Construir um histograma da situação ilustrada na tabela a seguir:
Rendimento, em reais de famílias de uma determinada
comunidade. Classes de
rendimentos (em
reais)
Número de famílias
500|—1000 6 1000|—1500 4 1500|—2000 7 2000|—2500 5 2500|—3000 3 3000|—3500 5
Total 30
Página 10 de 28
Módulo 3. Medidas de tendência central.
Conteúdo 1. Média Aritmética, Mediana e Moda.
1. Média aritmética (Dados isolados)
.
Veja o exemplo a seguir:
Uma amostra contendo dez preços de etanol foi extraída em diversos postos no dia
01/02/2011. Os preços em reais são:
Página 11 de 28
Preço, em reais, do etanol
em 10 postos de combustível
(01/02/2011)
1,75 1,70 1,74 1,52 1,56
1,70 1,45 1,42 1,70 1,86
A média é calculada da seguinte maneira:
2. Mediana
A mediana é uma medida de tendência central. Ela divide um conjunto ordenado de
dados em duas partes com igual número de elementos.
Se a amostra é constituída por um número ímpar de elementos, a mediana é o
valor que fica no centro dos dados ordenados.
Exemplo: 12, 15, 20, 21, 32.
A mediana é 20.
Se a amostra é constituída por um número par de elementos, a mediana é a média
aritmética dos dois valores centrais dos dados ordenados.
Exemplo: 12, 15, 15, 20, 21 e 32
A mediana é .
3. Moda
A moda de um conjunto de dados é o valor que ocorre com maior frequência.
Uma amostra contendo dez preços de etanol foi extraída em diversos postos no dia
01/02/2011. Os preços em reais são:
Preço, em reais, do etanol em 10
postos de combustível
Página 12 de 28
(01/02/2011)
1,75 1,70 1,74 1,52 1,56
1,70 1,45 1,42 1,70 1,86
A moda neste caso é 1,70 reais.
Exercício Resolvido.
Conteúdo 2. Média Aritmética (Distribuição de Frequências).
Cálculo da média para distribuição de frequências:
Veja o exemplo a seguir:
Página 13 de 28
Em uma amostra de 20 parafusos produzidos por uma metalúrgica, foram medidos
os diâmetros, em milímetros, conforme a tabela abaixo. Qual é a medida média do
diâmetro?
Diâmetro do parafuso, em
milímetros.
Nº de parafusos (fi)
1,5 2
1,8 4
2 3
2,4 6
2,6 5
Total 20
Neste caso utilizamos a fórmula: , pois a tabela mostra que existem 2
parafusos com diâmetro igual a 1,5 mm, 4 parafusos de
diâmetro 1,8 mm e assim por diante.
Diâmetro do
parafuso, em
milímetros.
xi
número de
parafusos
xi.fi
1,5 2 3
1,8 4 7,2
2 3 6
2,4 6 14,4
2,6 5 13
Total 20 43,6
Página 14 de 28
Veja o exemplo a seguir:
Classes
de salários (em
reais)
Ponto Médio
Número de
funcionários
xi.fi
500 |— 1000 750 10 7.500
1000|— 1500 1250 8 10.000
1500 |— 2000 1750 12 21.000
2000 |— 2500 2250 20 45.000
2500 |— 3000 2750 25 68.750
3000 |— 3500 3250 10 32.500
3500 |— 4000 3750 15 56.250
Total = 100 Total=241.000
Exercício Resolvido
Página 15 de 28
Módulo 4. Medidas de Dispersão.
Conteúdo 1. Medidas de Dispersão (Dados Isolados).
Quando descrevemos nossos dados através das medidas de tendência central,
necessitamos muitas vezes de complementos que são denominadas de medidas de
dispersão. As medidas de dispersão utilizadas são a amplitude, a variância, o
desvio-padrão e o coeficiente de variação.
As medidas de dispersão indicam o quanto os dados variam em torno da região
central.
1. Amplitude.
A amplitude é a diferença entre o maior e o menor dado observado.
Por utilizar apenas os extremos, a amplitude não é uma boa medida de dispersão.
2. Variância.
Página 16 de 28
A variância é definida como a soma dos quadrados dos desvios dividida pelo
tamanho da amostra menos 1.
O desvio em relação à média é a diferença entre cada dado e a média do conjunto.
Veja o exemplo a seguir:
Preço, em reais, do etanol em 10
postos de combustível
(01/02/2011)
1,75 1,70 1,74 1,52 1,56
1,70 1,45 1,42 1,70 1,86
A variância é calculada da seguinte maneira:
Página 17 de 28
4. Coeficiente de Variação (CV).
O coeficiente de variação é o quociente entre o desvio padrão e a média.
.
Podemos expressar o coeficiente de variação na forma de porcentagem.
Exercício Resolvido.
Página 18 de 28
Conteúdo 2. Medidas de Dispersão (Distribuição de frequências).
No caso de uma distribuição de frequências usamos a fórmula:
, onde xi é o ponto médio do intervalo de classe e fi é a
frequência de cada classe.
Diâmetro do parafuso, em
milímetros.
Número de parafusos (fi)
1,5 2 0,9248
1,8 4 0,5776
2 3 0,0972
2,4 6 0,2904
2,6 5 0,882
Total 20 2,772
Página 19 de 28
Para o calculo da variância, desvio-padrão e coeficiente de variação para classes de
frequências, temos:
Exercício Resolvido
Página 20 de 28
Página 21 de 28
Módulo 5. Probabilidades.
Conteúdo 1. Espaço amostral e Evento.
Em um experimento aleatório, temos:
Espaço Amostral (S) é o conjunto de todos os resultados possíveis.
Exemplo: No lançamento de um dado honesto de 6 faces temos: S1= {1, 2, 3, 4, 5,
6}
O número de elementos do espaço amostral é dado por n(S). No exemplo, temos
n(S) =6
Evento (E) é qualquer subconjunto de um espaço amostral.
Exemplos: No lançamento de um dado honesto de 6 faces, podem ocorrer os
eventos:
E: sair ponto ímpar.
E= {1, 3, 5} n(E) =3
F: sair ponto maior ou igual a 3.
F= {3, 4, 5, 6} n(F) =4
Dentre os eventos, devemos considerar os seguintes: S, considerado evento
certo, pois sempre ocorre e Φ, considerado evento impossível, pois nunca
ocorre.
Exercício Resolvido
No lançamento de um dado honesto de seis faces, determinar:
a) o espaço amostral.
S={1, 2, 3, 4, 5, 6}
b) sair número par.
E= {2, 4, 6}
c) sair número maior que 3.
F= {4, 5, 6}
d) sair número par e maior que 3.
Página 22 de 28
G= {4, 6}
Conceito de Probabilidade.
A probabilidade P(E) de ocorrer um evento E é o quociente entre o número de
elementos de E e o número de elementos de S, ondeS é difrente do conjunto vazio.
Exemplos:
a) No lançamento de um dado honesto de 6 faces, qual a probabilidade de ocorrer
ponto ímpar?
S= {1, 2, 3, 4, 5,6} n(S) =6
E= {1, 3, 5} n(E) =3
P(E)=3/6=0,5.
b) Em um baralho comum de 52 cartas, qual a probabilidade de se retirar uma
carta de copas?
Em um baralho comum de 52 cartas temos 13 cartas de copas. Considerando F
como sendo o evento sair carta de copas, então: n(S) =52 e n(F) =13
P(F)=13/52=1/4
Página 23 de 28
Exercício Resolvido.
No lançamento de um dado honesto de 6 faces, qual a probabilidade de ocorrer
ponto maior que 5?
S= {1, 2, 3, 4, 5,6} n(S) =6
E= {6} n(E) =1
P(E)=1/6
Distribuição Binomial:
Problemas que envolvem situações onde um experimento aleatório com dois
resultados possíveis é repetido independentemente várias vezes.
Suponha que n repetições independentes sejam realizadas e que a probabilidade de
sucesso em qualquer repetição seja p. Seja x o número total de sucessos dentre
as n repetições. Então a distribuição de probabilidade da variável x é dada pela
fórmula:
p: probabilidade do sucesso
q = 1- p: probabilidade do fracasso.
Exemplo: Se 18% das peças produzidas por uma máquina são defeituosas, qual é
a probabilidade de que, entre 10 peças escolhidas ao acaso,
Página 24 de 28
a) duas peças sejam defeituosas?
n=10
p: probabilidade do sucesso (ser defeituosa) = 18%=0,18.
q: probabilidade do fracasso (não ser defeituosa) = 1 – 0,18=0,82.
b) no máximo 2 serem defeituosas?
No máximo 2 serem defeituosas significa que poderá haver nenhuma (zero), uma
ou duas peças defeituosas.
P(máximo duas peças defeituosas) =P(0) + P(1) + P(2).
c) no mínimo 2 peças defeituosas?
No mínimo 2 serem defeituosas significa 2, 3, 4,...10 peças defeituosas.
P(mínimo 2 peças defeituosas)=P(2)+P(3)+P(4)+P(5)+...+P(10) ou
Página 25 de 28
Distribuição de Poisson
A distribuição de Poisson é uma distribuição de probabilidades para eventos que
ocorrem em um intervalo de tempo ou de espaço.
Página 26 de 28
Distribuição Normal
Características da Distribuição Normal.
(1) A variável aleatória pode assumir qualquer valor real.
(2) O gráfico é uma curva em forma de sino. A curva é simétrica em relação a
média ( μ).
(3) A área sob a curva normal é igual a 1. Essa área corresponde a probabilidade
de a variável aleatória assumir qualquer valor real.
Página 27 de 28
Exercício Resolvido
A vida média da bateria tipo I da empresa “Dura Mais” é distribuída normalmente
com uma média de 600 dias e desvio padrão de 75 dias. Qual a probabilidade de
uma bateria retirada ao acaso da produção desta empresa durar:
a) menos de 450 dias?
v
Página 28 de 28